KR20240012377A - 염기 편집기의 자기-불활성화용 조성물 및 방법 - Google Patents
염기 편집기의 자기-불활성화용 조성물 및 방법 Download PDFInfo
- Publication number
- KR20240012377A KR20240012377A KR1020237039212A KR20237039212A KR20240012377A KR 20240012377 A KR20240012377 A KR 20240012377A KR 1020237039212 A KR1020237039212 A KR 1020237039212A KR 20237039212 A KR20237039212 A KR 20237039212A KR 20240012377 A KR20240012377 A KR 20240012377A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- intron
- polynucleotide
- domain
- base editor
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 152
- 239000000203 mixture Substances 0.000 title claims description 60
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 353
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 353
- 239000002157 polynucleotide Substances 0.000 claims abstract description 353
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 259
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 254
- 229920001184 polypeptide Polymers 0.000 claims abstract description 253
- 108020005067 RNA Splice Sites Proteins 0.000 claims abstract description 108
- 108700026244 Open Reading Frames Proteins 0.000 claims abstract description 50
- 108091033409 CRISPR Proteins 0.000 claims description 464
- 150000007523 nucleic acids Chemical class 0.000 claims description 205
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 186
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 184
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 182
- 102000039446 nucleic acids Human genes 0.000 claims description 176
- 108020004707 nucleic acids Proteins 0.000 claims description 176
- 210000004027 cell Anatomy 0.000 claims description 172
- 108020005004 Guide RNA Proteins 0.000 claims description 155
- 125000000539 amino acid group Chemical group 0.000 claims description 147
- 108020004414 DNA Proteins 0.000 claims description 125
- 108090000623 proteins and genes Proteins 0.000 claims description 110
- 239000012634 fragment Substances 0.000 claims description 91
- 125000003729 nucleotide group Chemical group 0.000 claims description 82
- 239000002773 nucleotide Substances 0.000 claims description 81
- 230000035772 mutation Effects 0.000 claims description 76
- 239000013598 vector Substances 0.000 claims description 73
- 230000003197 catalytic effect Effects 0.000 claims description 68
- 230000000694 effects Effects 0.000 claims description 68
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 61
- 101710096438 DNA-binding protein Proteins 0.000 claims description 56
- 210000004900 c-terminal fragment Anatomy 0.000 claims description 50
- 210000004898 n-terminal fragment Anatomy 0.000 claims description 45
- 230000014509 gene expression Effects 0.000 claims description 41
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 37
- 230000008859 change Effects 0.000 claims description 35
- 239000013607 AAV vector Substances 0.000 claims description 27
- 108020004705 Codon Proteins 0.000 claims description 25
- 101000613577 Homo sapiens Paired box protein Pax-2 Proteins 0.000 claims description 24
- 102100040852 Paired box protein Pax-2 Human genes 0.000 claims description 24
- 230000004075 alteration Effects 0.000 claims description 24
- 108091092195 Intron Proteins 0.000 claims description 22
- 102000007530 Neurofibromin 1 Human genes 0.000 claims description 22
- 108010085793 Neurofibromin 1 Proteins 0.000 claims description 22
- 102100030801 Elongation factor 1-alpha 1 Human genes 0.000 claims description 21
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 claims description 21
- 210000004899 c-terminal region Anatomy 0.000 claims description 19
- 108020004999 messenger RNA Proteins 0.000 claims description 17
- 108010093662 Member 11 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 claims description 16
- 238000001727 in vivo Methods 0.000 claims description 16
- 230000004048 modification Effects 0.000 claims description 16
- 238000012986 modification Methods 0.000 claims description 16
- 108700004991 Cas12a Proteins 0.000 claims description 13
- 101000998139 Homo sapiens Interleukin-32 Proteins 0.000 claims description 13
- 101001067168 Homo sapiens Plexin-B3 Proteins 0.000 claims description 13
- 102100033501 Interleukin-32 Human genes 0.000 claims description 13
- 102100034390 Plexin-B3 Human genes 0.000 claims description 13
- 108091000532 Protein-Arginine Deiminase Type 1 Proteins 0.000 claims description 13
- 102100023222 Protein-arginine deiminase type-1 Human genes 0.000 claims description 13
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 12
- 102100030831 Fibrocystin-L Human genes 0.000 claims description 12
- 102100028887 Hemicentin-2 Human genes 0.000 claims description 12
- 101000583237 Homo sapiens Fibrocystin-L Proteins 0.000 claims description 12
- 101000839056 Homo sapiens Hemicentin-2 Proteins 0.000 claims description 12
- 101001056452 Homo sapiens Keratin, type II cytoskeletal 6A Proteins 0.000 claims description 12
- 101000934774 Homo sapiens Keratin, type II cytoskeletal 6C Proteins 0.000 claims description 12
- 102100025383 Keratin, type II cytoskeletal 6C Human genes 0.000 claims description 12
- 101000794043 Homo sapiens Serine/threonine-protein kinase BRSK2 Proteins 0.000 claims description 11
- 101000798696 Homo sapiens Transmembrane protease serine 6 Proteins 0.000 claims description 11
- 108091007629 SLC50A1 Proteins 0.000 claims description 11
- 102100029891 Serine/threonine-protein kinase BRSK2 Human genes 0.000 claims description 11
- 102100036280 Sugar transporter SWEET1 Human genes 0.000 claims description 11
- 102100032452 Transmembrane protease serine 6 Human genes 0.000 claims description 11
- 229940126836 transmembrane protease serine 6 synthesis reducer Drugs 0.000 claims description 11
- 101000961156 Homo sapiens Immunoglobulin heavy constant gamma 1 Proteins 0.000 claims description 10
- 102100039345 Immunoglobulin heavy constant gamma 1 Human genes 0.000 claims description 10
- 102100031313 Anthrax toxin receptor-like Human genes 0.000 claims description 9
- 101000796062 Homo sapiens Anthrax toxin receptor-like Proteins 0.000 claims description 9
- 241000282414 Homo sapiens Species 0.000 claims description 8
- 239000008194 pharmaceutical composition Substances 0.000 claims description 8
- 102100021519 Hemoglobin subunit beta Human genes 0.000 claims description 7
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 claims description 7
- 102100026846 Cytidine deaminase Human genes 0.000 claims description 6
- 241000124008 Mammalia Species 0.000 claims description 6
- 239000013603 viral vector Substances 0.000 claims description 5
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 4
- 241000702421 Dependoparvovirus Species 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 239000013604 expression vector Substances 0.000 claims description 4
- 238000000338 in vitro Methods 0.000 claims description 4
- 102220041204 rs35962811 Human genes 0.000 claims description 4
- 102200001903 rs762590894 Human genes 0.000 claims description 4
- 102220118477 rs886044767 Human genes 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 3
- 239000002105 nanoparticle Substances 0.000 claims description 3
- 241000711408 Murine respirovirus Species 0.000 claims description 2
- 239000003085 diluting agent Substances 0.000 claims description 2
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 2
- 230000001177 retroviral effect Effects 0.000 claims description 2
- 241001529453 unidentified herpesvirus Species 0.000 claims description 2
- 102000001479 Member 11 Subfamily B ATP Binding Cassette Transporter Human genes 0.000 claims 6
- 230000037442 genomic alteration Effects 0.000 claims 2
- 125000003473 lipid group Chemical group 0.000 claims 2
- 102220319450 rs1554378297 Human genes 0.000 claims 2
- 229940065638 intron a Drugs 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 9
- 230000017156 mRNA modification Effects 0.000 abstract 1
- 239000002585 base Substances 0.000 description 408
- 102000005381 Cytidine Deaminase Human genes 0.000 description 175
- 102000053602 DNA Human genes 0.000 description 123
- 235000001014 amino acid Nutrition 0.000 description 83
- 102000004169 proteins and genes Human genes 0.000 description 83
- 235000018102 proteins Nutrition 0.000 description 80
- 108020001507 fusion proteins Proteins 0.000 description 64
- 102000037865 fusion proteins Human genes 0.000 description 64
- 125000003275 alpha amino acid group Chemical group 0.000 description 58
- 150000001413 amino acids Chemical class 0.000 description 57
- 101710163270 Nuclease Proteins 0.000 description 56
- 229940024606 amino acid Drugs 0.000 description 56
- 230000027455 binding Effects 0.000 description 49
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 49
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 48
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 46
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 46
- 229920002477 rna polymer Polymers 0.000 description 38
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 36
- 230000002829 reductive effect Effects 0.000 description 27
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 24
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 24
- 238000006481 deamination reaction Methods 0.000 description 24
- 229930024421 Adenine Natural products 0.000 description 23
- 229960000643 adenine Drugs 0.000 description 23
- 229940104302 cytosine Drugs 0.000 description 23
- 230000009615 deamination Effects 0.000 description 23
- 102000005962 receptors Human genes 0.000 description 23
- 108020003175 receptors Proteins 0.000 description 23
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 22
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 22
- 229960005305 adenosine Drugs 0.000 description 22
- 201000010099 disease Diseases 0.000 description 21
- 238000006467 substitution reaction Methods 0.000 description 20
- 230000000295 complement effect Effects 0.000 description 19
- 230000037431 insertion Effects 0.000 description 19
- 238000003780 insertion Methods 0.000 description 19
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 18
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 17
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 17
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 17
- 238000003776 cleavage reaction Methods 0.000 description 17
- UHDGCWIWMRVCDJ-XVFCMESISA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-XVFCMESISA-N 0.000 description 17
- 102220009977 rs80358820 Human genes 0.000 description 17
- 230000007017 scission Effects 0.000 description 17
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 16
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 15
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 15
- -1 cell Substances 0.000 description 15
- 208000035475 disorder Diseases 0.000 description 15
- 230000005782 double-strand break Effects 0.000 description 15
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 15
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 14
- 230000006780 non-homologous end joining Effects 0.000 description 14
- 230000008685 targeting Effects 0.000 description 14
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 238000012217 deletion Methods 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 12
- 230000008439 repair process Effects 0.000 description 12
- 102000004533 Endonucleases Human genes 0.000 description 11
- 108010042407 Endonucleases Proteins 0.000 description 11
- 239000000370 acceptor Substances 0.000 description 11
- 230000001413 cellular effect Effects 0.000 description 11
- 238000001638 lipofection Methods 0.000 description 11
- 239000011780 sodium chloride Substances 0.000 description 11
- 102100028282 Bile salt export pump Human genes 0.000 description 10
- 108010080611 Cytosine Deaminase Proteins 0.000 description 10
- 102000000311 Cytosine Deaminase Human genes 0.000 description 10
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 10
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 10
- 239000012636 effector Substances 0.000 description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 230000001404 mediated effect Effects 0.000 description 10
- 239000002777 nucleoside Substances 0.000 description 10
- 239000001509 sodium citrate Substances 0.000 description 10
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 10
- 229940038773 trisodium citrate Drugs 0.000 description 10
- 230000007018 DNA scission Effects 0.000 description 9
- 230000004568 DNA-binding Effects 0.000 description 9
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- 229940035893 uracil Drugs 0.000 description 9
- 108010052875 Adenine deaminase Proteins 0.000 description 8
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 8
- 241000193996 Streptococcus pyogenes Species 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 230000001717 pathogenic effect Effects 0.000 description 8
- 229940113082 thymine Drugs 0.000 description 8
- 238000010361 transduction Methods 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 230000000051 modifying effect Effects 0.000 description 7
- 230000026683 transduction Effects 0.000 description 7
- 108091079001 CRISPR RNA Proteins 0.000 description 6
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 6
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 6
- 235000004279 alanine Nutrition 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- 230000001225 therapeutic effect Effects 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 5
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 5
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 5
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical group OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 230000000415 inactivating effect Effects 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- 241000825009 Bacillus hisashii Species 0.000 description 4
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 4
- 241001495667 Bacillus thermoamylovorans Species 0.000 description 4
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 4
- 101150106478 GPS1 gene Proteins 0.000 description 4
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 4
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 4
- 229930010555 Inosine Natural products 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- 241000191967 Staphylococcus aureus Species 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 125000004429 atom Chemical group 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 4
- 108020001778 catalytic domains Proteins 0.000 description 4
- 239000013078 crystal Substances 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 229960003786 inosine Drugs 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 229940104230 thymidine Drugs 0.000 description 4
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 3
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 3
- 108700040115 Adenosine deaminases Proteins 0.000 description 3
- 241001063273 Alicyclobacillus acidiphilus Species 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 3
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 3
- 108020004485 Nonsense Codon Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 241000194020 Streptococcus thermophilus Species 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 239000012491 analyte Substances 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 3
- 101150055766 cat gene Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 229940029575 guanosine Drugs 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 230000003301 hydrolyzing effect Effects 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 230000017730 intein-mediated protein splicing Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 238000009126 molecular therapy Methods 0.000 description 3
- 230000030648 nucleus localization Effects 0.000 description 3
- 230000009437 off-target effect Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108020001580 protein domains Proteins 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 3
- 229940045145 uridine Drugs 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 2
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 2
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 2
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 102220607933 C-reactive protein_E59K_mutation Human genes 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 101150018129 CSF2 gene Proteins 0.000 description 2
- 101150069031 CSN2 gene Proteins 0.000 description 2
- 102100022641 Coagulation factor IX Human genes 0.000 description 2
- 101150074775 Csf1 gene Proteins 0.000 description 2
- 238000010442 DNA editing Methods 0.000 description 2
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 241000589601 Francisella Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 101100412102 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) rec2 gene Proteins 0.000 description 2
- 101100356020 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) recA gene Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101100170937 Mus musculus Dnmt1 gene Proteins 0.000 description 2
- 101100042680 Mus musculus Slc7a1 gene Proteins 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 108091005461 Nucleic proteins Chemical group 0.000 description 2
- 241000605861 Prevotella Species 0.000 description 2
- 101150044917 Prl3b1 gene Proteins 0.000 description 2
- 101150113550 Prl3d1 gene Proteins 0.000 description 2
- 229930185560 Pseudouridine Natural products 0.000 description 2
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 2
- 238000010357 RNA editing Methods 0.000 description 2
- 230000026279 RNA modification Effects 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 2
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000033590 base-excision repair Effects 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 101150055601 cops2 gene Proteins 0.000 description 2
- 101150037603 cst-1 gene Proteins 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000002716 delivery method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000009881 electrostatic interaction Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 2
- 125000004219 purine nucleobase group Chemical group 0.000 description 2
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000005783 single-strand break Effects 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 229940075420 xanthine Drugs 0.000 description 2
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 description 1
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 1
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- 241000193412 Alicyclobacillus acidoterrestris Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 102100021954 Alpha-tubulin N-acetyltransferase 1 Human genes 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 1
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 description 1
- 101100412103 Arabidopsis thaliana REC3 gene Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 238000011725 BALB/c mouse Methods 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 241000616876 Belliella baltica Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000918600 Corynebacterium ulcerans Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 108091028709 DNA adenine Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 208000037595 EN1-related dorsoventral syndrome Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000010337 G2 phase Effects 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 1
- 108050008753 HNH endonucleases Proteins 0.000 description 1
- 102000000310 HNH endonucleases Human genes 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108010015268 Integration Host Factors Proteins 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- UBORTCNDUKBEOP-UHFFFAOYSA-N L-xanthosine Natural products OC1C(O)C(CO)OC1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UHFFFAOYSA-N 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 102100022742 Lupus La protein Human genes 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241001135221 Prevotella intermedia Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241000577544 Psychroflexus torquis Species 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- 230000009948 RNA mutation Effects 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 101100528972 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPD3 gene Proteins 0.000 description 1
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241001606419 Spiroplasma syrphidicola Species 0.000 description 1
- 241000203029 Spiroplasma taiwanense Species 0.000 description 1
- 241000194056 Streptococcus iniae Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 1
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 1
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 150000001408 amides Chemical group 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- HNYOPLTXPVRDBG-UHFFFAOYSA-N barbituric acid Chemical compound O=C1CC(=O)NC(=O)N1 HNYOPLTXPVRDBG-UHFFFAOYSA-N 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000000981 bystander Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000009614 chemical analysis method Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 108700010039 chimeric receptor Proteins 0.000 description 1
- 210000004756 chromatid Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012866 crystallographic experiment Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000003804 extraction from natural source Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000009429 hemophilia B Diseases 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000008076 immune mechanism Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 150000002632 lipids Chemical group 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 230000037230 mobility Effects 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 102000044158 nucleic acid binding protein Human genes 0.000 description 1
- 108700020942 nucleic acid binding protein Proteins 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000016434 protein splicing Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000003583 retinal pigment epithelium Anatomy 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 102220258017 rs1553619274 Human genes 0.000 description 1
- 102220278924 rs864622656 Human genes 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 235000019527 sweetened beverage Nutrition 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 229940065721 systemic for obstructive airway disease xanthines Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- SOBHUZYZLFQYFK-UHFFFAOYSA-K trisodium;hydroxy-[[phosphonatomethyl(phosphonomethyl)amino]methyl]phosphinate Chemical compound [Na+].[Na+].[Na+].OP(O)(=O)CN(CP(O)([O-])=O)CP([O-])([O-])=O SOBHUZYZLFQYFK-UHFFFAOYSA-K 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- UBORTCNDUKBEOP-UUOKFMHZSA-N xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
Abstract
본 발명은 데아미나아제 또는 napDNAbp를 코딩하는 오픈 리딩 프레임에 삽입된 인트론을 포함하는 데아미아나제 또는 napDNAbp 폴리펩티드를 코딩하는 폴리뉴클레오티드가 여기에 개시되며, 추가로 여기서 인트론은 mRNA 편집의 스플라이싱을 감소시키는 기능을 하는 변경된 스플라이스 수용체 또는 스플라이스 공여체 부위를 가진다. 또한 인트론을 포함하는 염기 편집기 오픈 리딩 프레임을 코딩하는 폴리뉴클레오티드가 개시되며, 여기서 염기 편집기는 napDNAbp 도메인 또는 데아미나아제 도메인을 포함한다.
Description
본 발명은 염기 편집기의 자기-불활성화용 조성물 및 그 방법에 관한 것이다.
관련 출원에 대한 상호 참조
본 출원은 2021년 5월 28일에 출원된 미국 특허 가출원 번호 63/194,431의 우선권 및 이익을 주장하며, 이들 내용 모두는 그 전문이 본원에 참조로 포함된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 함유하고 있으며 그 전문이 참조로 포함된다. 2022년 5월 27일에 생성된 ASCII 사본의 이름은 180802-049001PCT_SL.txt이고 크기는 2,089,884바이트이다.
진핵생물에 CRISPR-Cas 시스템을 적용하고 염기 편집의 출현과 같은 유전자 편집 기술의 발전으로 다양한 세포 유형과 유기체에서 게놈을 효율적으로 편집할 수 있게 되었으며, 인간의 유전질환을 치료하기 위한 사용가능한 접근법이 빠르게 확장되었다. CRISPR-Cas 시스템과 염기 편집은 관심 게놈 표적에 대해 고도로 특이적일 수 있으나, 발현이 장기간 지속될 경우 발생할 가능성이 더 높은 잠재적 표적 외의 편집 현상을 완화하기 위하여 세포에서 게놈 변형 툴의 일시적 발현이 선호된다. 따라서 특히 아데노-연관 바이러스(AAV) 형질도입, DNA 형질감염, 또는 기타 방법을 통한 것과 같이 장기간 발현을 초래할 수 있는 전달 방법을 활용하는 경우, 성공적인 표적 편집 이후에 편집 활동을 억제하거나 중단하는 방법은 특히 광범위한 관심을 끌고 있다.
아래 기술된 바와 같이, 본 발명은 자기-불활성화 염기 편집기 및 관련 조성물 및 방법을 특징으로 한다.
발명의 요약
일 측면에서, 본 개시 발명은 데아미나아제 도메인 또는 핵산 프로그래밍 가능한 DNA 결합 단백질 (napDNAbp) 도메인 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 특징으로 한다. 폴리뉴클레오티드는 인트론을 함유한다. 인트론은 데아미나아제, napDNAbp 또는 이의 단편을 코딩하는 오픈 리딩 프레임에 삽입된다.
또 다른 측면에서, 본 개시 발명은 인트론을 함유하는 데아미나아제 도메인 또는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 오픈 리딩 프레임을 코딩하는 폴리뉴클레오티드를 특징으로 한다. 인트론은 스플라이스 수용체 또는 스플라이스 공여체 부위에 변경(alteration)을 포함한다. 변경은 염기 편집기 mRNA의 스플라이싱을 감소시키거나 제거하여 염기 편집기 폴리펩티드의 발현을 감소시키거나 제거한다.
또 다른 측면에서, 본 개시 발명은 염기 편집기 폴리펩티드 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 특징으로 한다. 폴리뉴클레오티드는 인트론을 함유한다. 인트론은 염기 편집기 폴리펩티드 또는 이의 단편을 코딩하는 오픈 리딩 프레임에 삽입된다.
또 다른 측면에서, 본 개시 발명은 인트론을 함유하는 염기 편집기 오픈 리딩 프레임을 함유하는 폴리뉴클레오티드를 특징으로 한다. 인트론에는 스플라이스 수용체 또는 스플라이스 공여체 부위에 변경이 포함되어 있다. 변경은 염기 편집기 mRNA의 스플라이싱을 감소시키거나 제거하여 염기 편집기 폴리펩티드의 발현을 감소시키거나 제거한다.
또 다른 측면에서, 본 개시 발명은 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 또는 데아미나아제 도메인을 함유하는 염기 편집기를 코딩하는 폴리뉴클레오티드를 특징으로 한다. 폴리뉴클레오티드는 인트론을 함유한다. 인트론은 napDNAbp 도메인 또는 데아미나아제 도메인을 코딩하는 오픈 리딩 프레임에 삽입된다.
또 다른 측면에서, 본 개시 발명은 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인, 및 데아미나아제 도메인, 또는 이의 단편을 함유하는 염기 편집기를 코딩하는 폴리뉴클레오티드를 특징으로 한다. 폴리뉴클레오티드는 인트론을 함유하는 염기 편집기 오픈 리딩 프레임을 함유한다. 인트론은 스플라이스 수용체 또는 스플라이스 공여체 부위에 변경을 함유한다. 변경은 염기 편집기 mRNA의 스플라이싱을 감소시킨다.
또 다른 측면에서, 본 개시 발명은 (i) 데아미나아제 도메인 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드를 함유하되, 여기서 napDNAbp 도메인의 N-말단 단편은 스플릿된 인테인-N와 융합되는 것인 조성물을 특징으로 한다. 조성물은 또한 (ii) napDNAbp 도메인의 C-말단 단편을 코딩하는 제2 폴리뉴클레오티드를 함유하되, 여기서 napDNAbp 도메인의 C-말단 단편은 스플릿된 인테인-C와 융합되는 것인, 조성물을 함유한다. 제1 또는 제2 폴리뉴클레오티드는 인트론을 함유하고, 여기서 인트론은 폴리뉴클레오티드의 오픈 리딩 프레임에 삽입된다.
또 다른 측면에서, 본 개시 발명은 (i) 데아미나아제 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드를 함유하되, 여기서 데아미나아제 도메인의 N-말단 단편은 스플릿된 인테인-N과 융합되는 것인, 조성물을 특징으로 한다. 조성물은 또한 (ii) 데아미나아제 도메인의 C-말단 단편 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인을 코딩하는 제2 폴리뉴클레오티드를 함유하되, 여기서 데아미나아제 도메인의 C-말단 단편은 스플릿된 인테인-C와 융합되는 것인, 조성물을 포함한다. 제1 또는 제2 폴리뉴클레오티드는 인트론을 함유하고, 여기서 인트론은 폴리뉴클레오티드의 오픈 리딩 프레임에 삽입된다.
또 다른 측면에서, 본 개시 발명은 (i) 데아미나아제 도메인 또는 이의 단편을 함유하는 염기 편집기를 코딩하는 폴리뉴클레오티드를 함유하는 염기 편집기 시스템을 특징으로 한다. 염기 편집기 시스템은 또한 (ii) 세포의 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 함유한다. 염기 편집기는 (iii) 염기 편집기가 염기 편집기를 코딩하는 폴리뉴클레오티드를 편집하도록 지시하는 하나 이상의 가이드 RNA를 추가로 포함한다. 편집은 코딩된 염기 편집기의 활성 및/또는 발현의 감소를 초래한다.
또 다른 측면에서, 본 개시 발명은 (i) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 함유하는 염기 편집기 시스템을 특징으로 하며, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 함유한다. 염기 편집기 시스템은 (ii) 자기-불활성화 염기 편집기가 세포 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 추가로 함유한다. 염기 편집기 시스템은 또한 (iii) 자기-불활성화 염기 편집기가 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 포함한다.
또 다른 측면에서, 본 개시 발명은 (i) 염기 편집기를 코딩하는 상기 측면 중 어느 하나의 폴리뉴클레오티드를 함유하는 염기 편집기 시스템을 특징으로 한다. 염기 편집기 시스템은 또한 (ii) 염기 편집기가 세포 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 함유한다. 염기 편집 시스템은 또한 (iii) 염기 편집기가 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 함유한다.
또 다른 측면에서, 본 개시 발명은 (i) 염기 편집기를 코딩하는 상기 측면 중 임의의 조성물을 함유하는 염기 편집기 시스템을 특징으로 한다. 염기 편집기 시스템은 또한 (ii) 염기 편집기가 세포 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 함유한다. 염기 편집 시스템은 또한 (iii) 염기 편집기가 (i)의 조성물의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 함유한다.
또 다른 측면에서, 본 개시 발명은 (i) 데아미나아제 도메인을 코딩하는 제1 폴리뉴클레오티드 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인의 N-말단 단편을 포함하는 염기 편집기 시스템을 특징으로 하며, 여기서 N-말단 단편은 napDNAbp 도메인의 스플릿된 인테인-N에 융합된다. 염기 편집기 시스템은 또한 (ii) napDNAbp 도메인의 C-말단 단편을 코딩하는 제2 폴리뉴클레오티드를 포함하며, 여기서 napDNAbp 도메인의 C-말단 단편은 스플릿된 인테인-C에 융합된다. 제1 또는 제2 폴리뉴클레오티드는 인트론을 함유하며, 여기서 인트론은 오픈 리딩 프레임에 삽입되고, 제1 및 제2 폴리뉴클레오티드는 염기 편집기를 코딩한다. 염기 편집기 시스템은 (iii) 염기 편집기가 세포 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 추가로 포함한다. 염기 편집기 시스템은 또한 (iv) 염기 편집기가 (i) 또는 (ii)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 포함한다.
또 다른 측면에서, 본 개시 발명은 (i) 데아미나아제 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드를 함유하는 염기 편집기 시스템을 특징으로 하며, 여기서 데아미나아제 도메인의 N-말단 단편은 스플릿된 인테인-N과 융합된다. 염기 편집기 시스템은 또한 (ii) 데아미나아제 도메인의 C-말단 단편과 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인을 코딩하는 제2 폴리뉴클레오티드를 포함하며, 여기서 데아미나아제 도메인의 C-말단 단편은 스플릿된 인테인-C에 융합된다. 제1 또는 제2 폴리뉴클레오티드는 인트론을 함유하며, 여기서 인트론은 오픈 리딩 프레임에 삽입되고, 제1 및 제2 폴리뉴클레오티드는 염기 편집기를 코딩한다. 염기 편집기 시스템은 또한 (iii) 염기 편집기가 세포 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 포함한다. 염기 에디터 시스템은 또한 (iv) 염기 편집기가 (i) 또는 (ii)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 포함한다.
또 다른 측면에서, 본 개시 발명은 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 함유하는 벡터를 특징으로 한다. 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 함유한다.
또 다른 측면에서, 본 개시 발명은 상기 측면 중 임의의 것의 폴리뉴클레오티드, 또는 그의 구현예, 또는 상기 측면 중 임의의 것의 염기 편집기 시스템, 또는 그의 구현예를 함유하는 벡터를 특징으로 한다.
또 다른 측면에서, 본 개시 발명은 상기 측면 중 어느 하나의 조성물의 제1 폴리뉴클레오티드 및/또는 제2 폴리뉴클레오티드를 함유하는 벡터를 특징으로 한다.
또 다른 측면에서, 본 개시 발명은 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 함유하는 벡터를 함유하는 세포를 특징으로 한다. 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 함유한다.
또 다른 측면에서, 본 개시 발명은 상기 측면 중 임의의 것의 폴리뉴클레오티드 또는 그의 구현예, 상기 측면 중 임의의 것의 조성물 또는 그의 구현예, 상기 측면 중 임의의 것의 염기 편집기 시스템을 함유하는 세포, 또는 이의 실시예, 또는 상기 측면 중 임의의 것의 벡터, 또는 이의 실시예를 특징으로 한다.
또 다른 측면에서, 본 개시 발명은 상기 측면 중 임의의 것의 폴리뉴클레오티드 또는 그의 구현예, 상기 측면 중 임의의 것의 염기 편집기 시스템 또는 그의 구현예, 상기 측면 중 임의의 것의 벡터를 함유하는 약제학적 조성물, 또는 이의 실시예, 또는 상기 측면 중 임의의 것의 세포, 또는 이의 실시예를 특징으로 한다.
또 다른 측면에서, 본 개시 발명은 임의의 상기 측면의 폴리뉴클레오티드, 조성물, 염기 편집기 시스템, 벡터, 세포 또는 약제학적 조성물, 또는 그의 구현예를 함유하는 키트를 특징으로 한다.
또 다른 측면에서, 본 개시 발명은 자기-불활성화 염기 편집기의 발현을 감소시키거나 제거하는 방법을 특징으로 한다. 이 방법은 (a) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 제공하는 단계를 포함하며, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 함유한다. 이 방법은 또한 (b) 폴리뉴클레오티드를 가이드 RNA 및 자기-불활성화 염기 편집기 폴리펩티드와 접촉시키는 단계를 포함하며, 여기서 가이드 RNA는 염기 편집기가 인트론의 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하여 자기-불활성화 염기 편집기의 발현을 감소시키거나 제거하는 변경을 생성한다.
또 다른 측면에서, 본 개시 발명은 염기 편집을 자기-불활성화하는 방법을 특징으로 한다. 이 방법은 (a) 데아미나아제 도메인 또는 이의 단편을 함유하는 염기 편집기를 코딩하는 폴리뉴클레오티드를 세포에서 발현시키는 것을 포함한다. 이 방법은 또한 (b) 염기 편집기가 세포 게놈의 한 부위를 편집하도록 지시하여 세포 게놈에 변경을 발생시키는 제1 가이드 RNA와 세포를 접촉시키는 단계를 포함한다. 이 방법은 (c) 염기 편집기가 염기 편집기를 코딩하는 폴리뉴클레오티드를 편집하도록 지시하는 제2 가이드 RNA와 세포를 접촉시키는 단계를 추가로 포함하며, 여기서 편집으로 인해 코딩된 염기 편집기의 활성 및/또는 발현이 감소하여 염기 편집기의 발현을 감소시키거나 제거하는 변경이 생성된다.
또 다른 측면에서, 본 개시 발명은 염기 편집을 자기-불활성화하는 방법을 특징으로 한다. 이 방법은 (a) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 세포에서 발현시키는 단계를 포함하며, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 함유한다. 이 방법은 또한 (b) 자기-불활성화 염기 편집기가 세포 게놈 부위를 편집하도록 지시하여 세포 게놈에 변경을 일으키는 제1 가이드 RNA와 세포를 접촉시키는 단계를 포함힌다. 이 방법은 추가로 (c) 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 세포를 접촉시켜 자기-불활성화 염기 편집기의 발현을 감소시키거나 제거하는 변경을 생성하는 것을 포함한다.
또 다른 측면에서, 본 개시 발명은 유기체의 게놈을 편집하는 방법을 특징으로 한다. 이 방법은 (a) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 유기체의 세포에서 발현시키는 단계를 포함하며, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 함유한다. 이 방법은 또한 (b) 자기-불활성화 염기 편집기가 세포 게놈 부위를 편집하도록 지시하여 세포 게놈에 변경을 일으키는 제1 가이드 RNA와 세포를 접촉시키는 단계를 포함한다. 이 방법은 추가로 (c) 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 세포를 접촉시켜 자기-불활성화 염기 편집기의 발현을 감소시키거나 제거하는 변경을 생성하는 것을 포함한다.
또 다른 측면에서, 본 개시 발명은 대상체를 치료하는 방법을 특징으로 한다. 이 방법은 (a) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 대상체의 세포에서 발현시키는 단계를 포함하며, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 함유한다. 이 방법은 (b) 자기-불활성화 염기 편집기가 세포 게놈 부위를 편집하도록 지시하는 제1 가이드 RNA와 세포를 접촉시켜 대상체를 치료하기 위한 세포 게놈의 변경을 생성하는 단계를 추가로 포함한다. 이 방법은 또한 (c) 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 세포를 접촉시켜 자기-불활성화 염기 편집기의 발현을 감소시키거나 제거하는 변경을 생성하는 것을 포함한다.
또 다른 측면에서, 본 개시 발명은 대상체를 치료하는 방법을 특징으로 한다. 방법은 상기 측면 중 임의의 것의 염기 편집기 시스템, 벡터, 세포 또는 약제학적 조성물, 또는 그의 구현예를 대상체에게 투여하여 대상체를 치료하는 단계를 포함한다.
또 다른 측면에서, 본 개시 발명은 유기체의 게놈을 편집하는 방법을 특징으로 한다. 이 방법은 (a) 데아미나아제 도메인을 코딩하는 제1 폴리뉴클레오티드 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인의 N-말단 단편, 및 napDNAbp 도메인의 C-말단 단편을 코딩하는 제2 폴리뉴클레오티드를 유기체의 세포에서 발현시키는 단계를 포함하며, 여기서 napDNAbp 도메인의 N-말단 단편은 스플릿된 인테인-N에 융합되고, 여기서, napDNAbp 도메인의 C-말단 단편은 스플릿된 인테인-C에 융합된다. 제1 또는 제2 폴리뉴클레오티드는 인트론을 함유한다. 인트론은 오픈 리딩 프레임에 삽입된다. 세포에서 제1 및 제2 폴리뉴클레오티드가 발현되면 자기-불활성화 염기 편집기가 형성된다. 이 방법은 또한 (b) 자기-불활성화 염기 편집기가 세포 게놈의 한 부위를 편집하도록 지시하여 세포 게놈에 변경을 일으키는 제1 가이드 RNA와 세포를 접촉시키는 단계를 포함한다. 이 방법은 또한 (c) 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 세포를 접촉시켜 자기-불활성화 염기 편집기의 발현을 감소시키거나 제거하는 변경을 생성하는 것을 포함한다.
또 다른 측면에서, 본 개시 발명은 유기체의 게놈 편집 방법을 특징으로 한다. 이 방법은 (a) 데아미나아제 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드, 및 데아미나아제 도메인의 C-말단 단편 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인을 코딩하는 제2 폴리뉴클레오티드를 유기체 세포에 발현하는 단계를 포함하며, 여기서 데아미나아제 도메인의 N-말단 단편은 스플릿된 인테인-N과 융합되고, 여기서 데아미나아제 도메인의 C-말단 단편은 스플릿된 인테인-C와 융합된다. 제1 또는 제2 폴리뉴클레오티드는 인트론을 함유하며, 여기서 인트론은 오픈 리딩 프레임에 삽입된다. 세포에서 제1 및 제2 폴리뉴클레오티드 발현되면 자기-불활성화 염기 편집기가 형성된다. 이 방법은 또한 (b) 자기-불활성화 염기 편집기가 세포 게놈의 한 부위를 편집하도록 지시하여 세포 게놈에 변경을 일으키는 제1 가이드 RNA와 세포를 접촉시키는 단계를 포함한다. 이 방법은 또한 (c) 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 세포를 접촉시켜 자기-불활성화 염기 편집기의 발현을 감소시키거나 제거하는 변경을 생성하는 것을 포함한다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 염기 편집기는 게놈 DNA에서 높은 편집 효율을 갖는다. 임의의 상기 측면 또는 그의 구현예에서, 염기 편집기는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 또는 데아미나아제 도메인을 함유한다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 데아미나아제 도메인은 사이티딘 데아미나아제 도메인 또는 아데노신 데아미나아제 도메인이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 데아미나아제 도메인은 TadA 도메인이다.
임의의 상기 측면 또는 그의 구현예에서, napDNAbp 도메인은 Cas9, Cas12a/Cpf1, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 및 Cas12j/CasΦ도메인 중 하나 이상으로부터 선택되는 Cas 도메인이다.
임의의 상기 측면, 또는 그의 구현예 중 임의의 것에서, 인트론은 NF1, PAX2, EEF1A1, HBB, IGHG1, SLC50A1, ABCB11, BRSK2, PLXNB3, TMPRSS6, IL32, ANTXRL, PKHD1L1, PADI1, KRT6C, 및 HMCN2 중 하나 이상으로부터 선택되는 서열로부터 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 NF1에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 PAX2에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 EEF1A1에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 HBB에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 IGHG1에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 SLC50A1에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 ABCB11에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 BRSK2에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 PLXNB3에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 TMPRSS6에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 IL32에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 PKHD1L1에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 PADI1에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 KRT6C에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 HMCN2에서 유래한 것이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 포유동물 유전자에 자연적으로 존재하는 인트론에 대해 적어도 약 85%의 핵산 서열 상동성을 갖는다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 비포유동물 유전자에 자연적으로 존재하는 인트론에 대해 적어도 약 85%의 핵산 서열 상동성을 갖는다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 인트론은 합성 인트론이다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 다음 중 하나와 적어도 약 85% 핵산 서열 상동성을 갖는 서열을 함유한다:
a) GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG (서열번호: 226);
b) GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG (서열번호: 227);
c) GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG (서열번호: 228);
d) GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG (서열번호: 229);
e) GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG (서열번호: 230);
f) GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG (서열번호: 231);
g) GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG (서열번호: 232);
h) GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG (서열번호: 233);
i) GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG (서열번호: 234);
j) GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG (서열번호: 235);
k) GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG (서열번호: 236);
l) GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG (서열번호: 237);
m) GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG (서열번호: 238);
n) GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG (서열번호: 239);
o) GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG (서열번호: 240);
p) GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG (서열번호: 241); 또는
q) GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG (서열번호: 242).
임의의 상기 측면 또는 그의 구현예에서, 인트론은 다음 중 하나로부터의 핵산 서열을 함유한다:
a) GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG (서열번호: 226);
b) GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG (서열번호: 227);
c) GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG (서열번호: 228);
d) GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG (서열번호: 229);
e) GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG (서열번호: 230);
f) GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG (서열번호: 231);
g) GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG (서열번호: 232);
h) GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG (서열번호: 233);
i) GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG (서열번호: 234);
j) GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG (서열번호: 235);
k) GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG (서열번호: 236);
l) GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG (서열번호: 237);
m) GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG (서열번호: 238);
n) GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG (서열번호: 239);
o) GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG (서열번호: 240);
p) GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG (서열번호: 241); 또는
q) GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG (서열번호: 242).
상기 측면 또는 그의 구현예 중 임의의 것에서, 인트론은 약 10개 염기쌍 내지 약 500개 염기쌍을 함유한다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 약 70개 내지 150개의 염기쌍을 함유한다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 약 100개 염기쌍 내지 200개 염기쌍을 함유한다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 인트론은 프로토스페이서 서열에 근접하게 삽입된다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 인트론은 프로토스페이서 서열의 약 10 내지 30개 염기쌍 내에 삽입된다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 프로토스페이서 서열은 NGG 또는 NNGRRT이다.
임의의 상기 측면 또는 그의 구현예에서, 데아미나아제 도메인은 TadA 도메인을 함유한다.
임의의 상기 측면 또는 그의 구현예에서, 인트론은 TadA의 코돈 18, 23, 59, 62, 87 또는 129 내부 또는 바로 뒤에 삽입된다. 임의의 상기 측면 또는 그의 구현예에서, 인트론은 TadA의 코돈 87 바로 뒤에 삽입된다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 변경은 단일 염기 편집이다. 위의 측면 또는 그 실시예 중 임의의 것에서, 단일 염기 편집은 A에서 G로의(A-to-G) 염기 편집이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 단일 염기 편집은 C에서 T로의(C-to-T) 염기 편집이다.
임의의 상기 측면 또는 그의 구현예에서, 폴리뉴클레오티드는 링커를 코딩하는 폴리뉴클레오티드 서열을 추가로 함유한다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 인트론은 링커를 코딩하는 폴리뉴클레오티드 서열 내에 삽입된다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 프로그래밍 가능한 DNA 결합 단백질 도메인은 Cas9 도메인이다. 임의의 상기 측면 또는 그의 구현예에서, Cas9 도메인은 Cas9의 Asn309 및 Thr310에 상응하는 아미노산 잔기 사이에서 스플릿되고, 잔기 310은 Thr310Cys로 돌연변이된다.
임의의 상기 측면 또는 그의 구현예에서, 인트론은 스플라이스 수용체 또는 스플라이스 공여체 부위에 변경을 함유하며, 여기서 변경은 염기 편집기 mRNA의 스플라이싱을 감소시키거나 제거한다.
임의의 상기 측면 또는 그의 구현예에서, napDNAbp 도메인은 Cas9 도메인이다. 임의의 상기 측면 또는 그의 구현예에서, Cas9 도메인의 N- 및 C-말단 도메인은 아미노산 잔기 Asn309와 Thr310 사이에 스플릿된다. 임의의 상기 측면 또는 그의 구현예에서, Cas9 도메인은 돌연변이 Thr310Cys를 함유한다.
임의의 상기 측면 또는 그의 구현예에서, 조성물은 링커 폴리뉴클레오티드 서열을 추가로 함유한다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 인트론은 링커 폴리뉴클레오티드 서열 내에 삽입된다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 편집은 데아미나아제 도메인의 촉매 잔기를 변경시킨다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 데아미나아제 도메인은 아데노신 데아미나아제 도메인이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 데아미나아제 도메인은 사이티딘 데아미나아제 도메인이다. 임의의 상기 측면 또는 그의 구현예에서, 데아미나아제 도메인의 변경된 촉매 잔기는 다음 참조 서열의 His57(H57), Glu59(E59), Cys87(C87) 또는 Cys90(C90): MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD (서열번호: 1) 또는 또 다른 아데노신 데아미나아제의 상응하는 위치이다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 변경된 촉매 잔기는 E59이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 촉매 잔기에 대한 변경은 E59G이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 변경된 촉매 잔기는 H57이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 촉매 잔기에 대한 변경은 H57R이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 변경된 촉매 잔기는 C87이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 촉매 잔기에 대한 변경은 C87R이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 변경된 촉매 잔기는 C90이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 촉매 잔기에 대한 변경은 C90R이다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 염기 편집기 시스템은 다음으로부터 선택된 폴리뉴클레오티드 서열을 함유한다:
a) gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 191);
b) gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 192);
c) gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 193);
d) GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 194);
e) gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 195);
f) gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 196);
g) gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 197);
h) GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 198);
i) GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 190);
j) gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 200);
k) gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 201);
l) GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 202);
m) gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 203);
n) gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 204);
o) gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 205);
p) GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 206);
q) gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 207);
r) gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 208);
s) gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 209);
t) gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 210);
u) gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 211);
v) gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 212);
w) gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 213);
x) gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 214);
y) GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 215);
z) gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 216);
aa) gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 217);
bb) gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 218);
cc) GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 219);
dd) gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 220);
ee) gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 221);
ff) gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 222);
gg) gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 223);
hh) gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 224);
ii) gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 225);
jj) gCACCAUGAGCGAGGUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 524);
kk) gGCCACCAUGAGCGAGGUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 525);
ll) GUGUCGAAGUUCGCCCUGGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 526);
mm) gAUGCCGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 527);
nn) gAUGCCGAGAUAAUGGCCCUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 528);
oo) gAUGCCGAGAUCAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 529);
pp) gAUGCCGAGAUCAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 530);
qq) gAUGCCGAGAUCAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 531);
rr) gAUGCCGAGAUCAUGGCGCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 532);
ss) gAUGCCGAGAUCAUGGCGCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 533);
tt) gAUGCCGAGAUCAUGGCGUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 534);
uu) gAUGCCGAGAUUAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 535);
vv) gAUGCCGAGAUUAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 536);
ww) gAUGCCGAGAUUAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 537);
xx) gAUGCCGAGAUUAUGGCACUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 538);
yy) gAUGCCGAGAUUAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 539);
zz) gAUGCCGAGAUUAUGGCUCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 540);
aaa) gAUGCGGAGAUCAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 541);
bbb) gAUGCUGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 542);
ccc) gAACCGCACAUGCCGAAAUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 543);
ddd) gGCAGGUGUCGACAUAUCUAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 544);
eee) gAUGCCGAAAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 545);
fff) gACACAUGACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 546); 또는
ggg) gGCCCCAGCACACAUGACACAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 547).
임의의 상기 측면 또는 그의 구현예에서, 발현 벡터는 포유동물 발현 벡터이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 벡터는 지질 나노입자이다. 임의의 상기 측면 또는 그의 구현예에서, 벡터는 아데노 관련 바이러스(AAV), 레트로바이러스 벡터, 아데노바이러스 벡터, 렌티바이러스 벡터, 센다이 바이러스 벡터 및 헤르페스 바이러스 벡터 중 하나 이상으로부터 선택된 바이러스 벡터이다. 임의의 상기 측면 또는 그의 구현예에서, 벡터는 AAV 벡터이다. 임의의 상기 측면 또는 그의 구현예에서, AAV 벡터는 AAV2 또는 AAV8이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 벡터는 프로모터를 함유한다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 프로모터는 CMV 프로모터이다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 세포는 in vitro 또는 in vivo 이다.
임의의 상기 측면 또는 그의 구현예에서, 조성물 또는 약제학적 조성물은 약제학적으로 허용되는 부형제, 희석제 또는 담체를 추가로 함유한다.
임의의 상기 측면 또는 이의 구현예에서, 키트는 임의의 상기 측면 또는 이의 구현예의 방법에 사용하기 위한 지시서를 포함한다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 방법은 in vivo 에서 수행된다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 제1 폴리뉴클레오티드 및/또는 제2 폴리뉴클레오티드는 벡터에 의해 세포에서 발현된다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드는 별개의 벡터에 의해 세포에서 발현된다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 제1 가이드 RNA 및/또는 제2 가이드 RNA는 벡터에 의해 세포로 전달된다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 제1 가이드 RNA 및/또는 제2 가이드 RNA는 제1 폴리뉴클레오티드 및/또는 제2 폴리뉴클레오티드와 동일한 벡터로 세포에 전달된다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 제1 가이드 RNA 및/또는 제2 가이드 RNA는 제1 폴리뉴클레오티드 및/또는 제2 폴리뉴클레오티드와는 다른 벡터로 세포에 전달된다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 벡터는 바이러스 벡터이다.
임의의 상기 측면 또는 그의 구현예에서, 염기 편집기는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 및 데아미나아제 도메인을 함유한다. 임의의 상기 측면 또는 그의 구현예에서, 인트론을 함유하는 오픈 리딩 프레임은 napDNAbp 도메인 또는 데아미나아제 도메인에 존재한다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 자기-불활성화 염기 편집기 폴리펩티드는 게놈 DNA에서 높은 편집 효율을 유지한다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 데아미나아제 도메인은 사이티딘 데아미나아제 도메인 또는 아데노신 데아미나아제 도메인이다. 임의의 상기 측면 또는 그의 구현예에서, 변경은 인트론의 5' 말단에 있는 컨센서스 스플라이스 공여체 부위 또는 인트론의 3' 말단에 있는 컨센서스 스플라이스 수용체 서열에 있다.
임의의 상기 측면 또는 그의 구현예에서, 인트론은 다음 중 하나와 적어도 약 85%, 90%, 95% 또는 99% 핵산 서열 상동성을 갖는 서열을 함유한다:
a) GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG (서열번호: 226);
b) GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG (서열번호: 227);
c) GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG (서열번호: 228);
d) GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG (서열번호: 229);
e) GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG (서열번호: 230);
f) GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG (서열번호: 231);
g) GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG (서열번호: 232);
h) GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG (서열번호: 233);
i) GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG (서열번호: 234);
j) GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG (서열번호: 235);
k) GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG (서열번호: 236);
l) GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG (서열번호: 237);
m) GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG (서열번호: 238);
n) GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG (서열번호: 239);
o) GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG (서열번호: 240);
p) GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG (서열번호: 241); 또는
q) GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG (서열번호: 242).
상기 측면 또는 그의 구현예 중 임의의 것에서, 제2 가이드 RNA는 다음으로부터 선택된 폴리뉴클레오티드 서열을 함유한다:
a) gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 191);
b) gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 192);
c) gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 193);
d) GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 194);
e) gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 195);
f) gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 196);
g) gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 197);
h) GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 198);
i) GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 190);
j) gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 200);
k) gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 201);
l) GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 202);
m) gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 203);
n) gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 204);
o) gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 205);
p) GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 206); 또는
q) gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 207);
r) gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 208);
s) gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 209);
t) gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 210);
u) gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 211);
v) gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 212);
w) gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 213);
x) gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 214);
y) GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 215);
z) gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 216);
aa) gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 217);
bb) gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 218);
cc) GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 219);
dd) gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 220);
ee) gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 221);
ff) gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 222);
gg) gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 223);
hh) gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 224);
ii) gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 225);
jj) gCACCAUGAGCGAGGUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 524);
kk) gGCCACCAUGAGCGAGGUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 525);
ll) GUGUCGAAGUUCGCCCUGGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 526);
mm) gAUGCCGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 527);
nn) gAUGCCGAGAUAAUGGCCCUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 528);
oo) gAUGCCGAGAUCAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 529);
pp) gAUGCCGAGAUCAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 530);
qq) gAUGCCGAGAUCAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 531);
rr) gAUGCCGAGAUCAUGGCGCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 532);
ss) gAUGCCGAGAUCAUGGCGCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 533);
tt) gAUGCCGAGAUCAUGGCGUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 534);
uu) gAUGCCGAGAUUAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 535);
vv) gAUGCCGAGAUUAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 536);
ww) gAUGCCGAGAUUAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 537);
xx) gAUGCCGAGAUUAUGGCACUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 538);
yy) gAUGCCGAGAUUAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 539);
zz) gAUGCCGAGAUUAUGGCUCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 540);
aaa) gAUGCGGAGAUCAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 541);
bbb) gAUGCUGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 542);
ccc) gAACCGCACAUGCCGAAAUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 543);
ddd) gGCAGGUGUCGACAUAUCUAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 544);
eee) gAUGCCGAAAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 545);
fff) gACACAUGACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 546); 또는
ggg) gGCCCCAGCACACAUGACACAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 547).
임의의 상기 측면 또는 그의 구현예에서, 폴리뉴클레오티드는 링커 폴리뉴클레오티드 서열을 추가로 함유한다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 인트론은 링커 폴리뉴클레오티드 서열 내에 삽입된다.
상기 측면 또는 그의 구현예 중 임의의 것에서, 대상체 또는 유기체는 인간이다. 상기 측면 또는 그의 구현예 중 임의의 것에서, 대상체 또는 유기체는 포유동물이다. 임의의 상기 측면 또는 그의 구현예에서, 포유동물은 인간이다.
본 발명은 염기 편집기의 자기-불활성화용 조성물 및 그 방법을 제공한다.
도 1A는 염기 편집기의 자기-불활성화 메커니즘을 나타내는 개략도를 제공한다. 2개의 gRNA는 염기 편집이 호스트 게놈의 표적 부위와 염기 편집기의 코딩 영역 내에서 동시에 발생하도록 지시한다. 사용 중인 염기 편집기가 ABE(Adenine Base Editor)인 경우 데아미나아제 도메인(His57(H57), Glu59(E59), Cys87(C87) 또는 Cys90(C90))의 촉매 잔기는 단일 A에서 G로의(A-to-G) 편집을 통해 각 부위에 각각 Arg, Gly, Arg 또는 Arg를 설치하여 불활성화할 수 있다. 사용 중인 염기 편집기가 CBE(Cytosine Base Editor)인 경우 편집기 내의 모든 Arg, Gln 또는 Trp 잔기에서 단일 C에서 T로의(C-to-T) 편집을 통해 조기-종결 코돈을 설치할 수 있다.
도 1B는 게놈 부위(ABCA4 c.5882G>A) 및 두 개의 gRNA를 사용한 TadA (His57, Glu59, Cys87 또는 Cys90)의 자기-불활성화 부위에서, 미리 설치된 TadA 돌연변이(His57Arg, Glu59Gly, Cys87Arg 또는 Cys90Arg)를 포함하는 ABE7.10-m 및 ABE7.10-m 변이체의 리포펙션 후 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다.
도 1C는 TadA 코딩 영역 내 자기-불활성화 표적 부위인 His57 및 Glu59의 DNA 서열을 도시하는 개략도를 제공한다. 3' PAM 서열은 회색으로 강조되어 있고, 각 서열의 프로토스페이서 내 표적 뉴클레오티드와 그 위치는 굵은 글씨로 표시되어 있다. 도 1C에 제공된 뉴클레오티드 서열은 위에서 아래(top-to-bottom) 발생순서대로 서열번호 458-459에 해당한다. 도 1C에 제공된 아미노산 서열은 위에서 아래 발생순서대로 서열번호 460-461에 해당한다.
도 1D는 TadA의 게놈 부위(ABCA4 c.5882G>A) 및 자기-불활성화 부위 Glu59를 표적화하는 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 리포펙션 후 HEK293T 세포에서의 염기 편집 활성을 나타내는 그래프를 제공한다. 변이체의 활성을 자기-불활성화 gRNA가 제공되지 않은 ABE8.5-m의 활성과 비교하였다.
도 1E 및 1F는 ARPE-19 세포의 게놈 부위 및 ABE의 TadA 촉매 잔기에서 AAV2에 의해 전달된 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 염기 편집의 동역학을 보여주는 막대 그래프를 제공한다. 도 1E는 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 AAV2 전달 후 게놈 부위(ABCA4 c.5882G>A)에서의 염기 편집의 5주 시간 경과를 나타내는 막대 그래프를 제공한다. 도 1F는 5주 시간 과정의 동일 샘플에서 자기-불활성화 부위(TadA의 아미노산 잔기 His57 또는 잔기 Glu59)에서의 편집을 나타내는 막대 그래프를 제공한다.
도 1G 및 1H는 ARPE-19 세포의 게놈 부위 및 ABE의 TadA 촉매 잔기에서 AAV2에 의해 전달된 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 염기 편집 동역학을 보여주는 막대 그래프를 제공하며, 여기서 자기-불활성화 편집은 두 가지 상이한 방법으로 평가되었다. 도 1G는 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 AAV2 전달 2주 후 게놈 부위(ABCA4 c.5882G>A)에서의 염기 편집을 나타내는 막대 그래프를 제공한다. 도 1H는 동일한 실험에서 세포 용해물로부터의 DNA 또는 기술적인 복제 샘플의 mRNA로부터 생성된 cDNA의 표적화된 서열분석에 의해 평가된 자기-불활성화 비율을 나타내는 막대 그래프를 제공한다.
도 2A는 ABE 시작 코돈의 변경을 통해 편집기를 비활성화하기 위해 TadA에 만들어진 돌연변이의 다이어그램을 제공한다. DNA 및 단백질 서열의 돌연변이는 검은색으로 강조 표시된다. 대체로, 프레임 외부 시작 코돈(out-of-frame start codon)은 회색 상자로 식별된다. 도 2A에 제공된 뉴클레오티드 서열은 위에서 아래 발생순서대로 서열번호 462-466에 해당한다. 도 2A에 제공된 아미노산 서열은 위에서 아래 발생순서대로 서열번호 467-469에 해당한다.
도 2B는 미리 설치된 시작 코돈 돌연변이를 함유하는 ABE8.5-m 변이체의 리포펙션 후 HEK293T 세포의 게놈 부위 ABCA4 c.5882G>A에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 2C는 TadA의 Met1에서 염기 편집이 일어나도록 하는 PAM 서열(NGG)을 혼입하기 위해 ABE8.5-m에 만들어진 돌연변이를 보여주는 다이어그램을 제공한다. 도 2C에 제공된 뉴클레오티드 서열은 위에서 아래 발생순서대로 서열번호 470-476에 해당한다. 도 2C에 제공된 아미노산 서열은 위에서 아래 발생순서대로 서열번호 477-480에 해당한다.
도 2D는 돌연변이되지 않은 대조군과 비교하여 TadA에 설치된 PAM 서열을 함유하는 ABE8.5-m 변이체의 리포펙션 후 HEK293T 세포의 게놈 부위 ABCA4 c.5882G>A에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 2E는 두 개의 gRNA를 사용하여 TadA의 게놈 부위(ABCA4 c.5882G>A) 및 자기-불활성화 부위 Met1에서 ABE8.5-m 및 ABE8.5-m 변이체의 리포펙션 후 HEK293T 세포에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다..
도 3A는 ABE(Adenine Base Editor)의 DNA에 인트론의 혼입을 통한 염기 편집기의 자기-불활성화 메커니즘을 보여주는 개략도를 제공한다.
도 3B 및 3C는 TadA의 특정 코돈(잔기) 뒤 또는 내에 코딩 서열에 인트론을 함유하는 ABE 변이체의 리포펙션 후 HEK293T 세포에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 도 3B는 TadA의 잔기 87(NF1, PAX2, EEF1A1, 키메라, SLC50A1, ABCB11, BRSK2, PLXNB3, TMPRSS6, IL32) 뒤, 잔기 62(키메라, ABCB11, PLXNB3, IL32) 뒤 또는 잔기 23(Chimera, ABCB11, PLXNB3, IL32) 내의 인트론의 혼입 이후 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 도 3B는 NF1, PAX2 및 EEF1A1 외에 잔기 87(ANTXRL, PKHD1L1, PADI1, KRT6C, HMCN2, HMCN2-Salmon 또는 ENPEP-Gecko) 뒤에 일부 추가 인트론을 혼입한 후 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 3D는 스플라이스 수용체 부위 또는 스플라이스 공여체 부위에 사전 설치된 편집이 있는 인트론을 포함하는 ABE 변이체의 리포펙션 후 HEK293T 세포의 염기 편집 활동을 나타내는 막대 그래프를 제공한다. 인트론은 TadA 잔기 87(NF1 수용체, PAX2 수용체, EEF1A1 수용체, 키메라 수용체, ANTXRL 수용체, PKHK1L1 수용체, PADI1 수용체, KRT6C 수용체, HMCN2 수용체, ENPEP-Gecko 수용체, HMCN2-Salmon 수용체, NF1 공여체, PAX2 공여체, EEF1A1 공여체, 또는 키메라 공여체) 뒤에 위치했다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 3E는 스플라이스 수용체 부위 또는 스플라이스 공여체 부위에 사전 설치된 편집을 갖는 인트론을 함유하는 ABE 변이체의 리포펙션 후 HEK293T 세포에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 인트론은 TadA 잔기 129(NF1 수용체, PAX2 수용체, EEF1A1 수용체), 59(NF1 수용체, PAX2 수용체, EEF1A1 수용체), 18(NF1 수용체, PAX2 수용체, EEF1A1 수용체) 및 62(ABCB11 수용체) 뒤, 또는 잔기 23 내(ABCB11 공여체)에 위치했다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 3F는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87 뒤 TadA 내에 배치된 인트론의 수용체 부위(NF1 또는 PAX2)에서 리포펙션된 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다.
도 3G는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87(NF1, PAX2 및 EEF1A1) 뒤 및 잔기 62(ABCB11) 뒤의 TadA 내에 배치된 인트론의 수용체 부위에서 리포펙션된 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다.
도 3H는 스플라이스 수용체 부위에서 미리 설치된 돌연변이가 존재하거나 존재하지 않는 경우, TadA 내의 다양한 위치(잔기 87, 129, 59 또는 18 이후)에서 인트론(NF1, PAX2 또는 EEF1A1)을 함유하는 ABE8.5-m 변이체의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 3I는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87, 129, 59 및 18 뒤 TadA 내에 배치된 인트론의 수용체 부위(NF1, PAX2 및 EEF1A1)에서 리포펙션된 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다.
도 3J는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87 뒤 TadA 내에 배치된 인트론 NF1, PAX2, EEF1A1 ANTXRL, PKHD1L1, PADI1 및 ENPEP-Gecko의 게놈 부위 및 수용체 부위에서 리포펙션된 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 도 3K, 3L 및 3M은 자기-불활성화 gRNA, 게놈 부위를 표적으로 하는 gRNA 및 TadA의 서열 코딩에서의 인트론을 포함하는 ABE 변이체를 코딩하는 플라스미드 DNA의 플라스미드 리포펙션 후 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프와 누적 막대 그래프를 제공합니다.
도 3K는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87 이후 TadA 내에 배치된 인트론 NF1 또는 PAX2의 수용체 부위에서의 염기 편집 활성을 묘사하는 막대 그래프를 제공하며, 여기서 편집은 세포 용해물로부터 DNA의 표적화된 서열분석에 의해 평가되었다. 도 3L 및 3M은 전체 mRNA의 RNA-seq에 의해 평가된 ABE8.5-m mRNA 내의 스플라이스 변이체의 비율을 묘사하는 누적 막대 그래프를 제공한다. 도 3K, 3L 및 3M에서의 모든 분석은 동일한 실험에서 기술적으로 반복하여 수행되었다.
도 3N은 스플라이스 수용체 부위를 표적으로 하는 자기-불활성화 gRNA, 게놈 부위를 표적으로 하는 gRNA, 및 잔기 87에 있는 TadA의 코딩 서열에 NF1 인트론을 함유하는 ABE 변이체의 AAV2 전달 후 2주째에 ARPE-19 세포에서의 염기 편집 활성을 묘사하는 막대 그래프를 제공한다. 편집은 게놈 DNA의 표적화된 시퀀싱에 의해 게놈 부위에서 측정되었으며 자기-불활성화 부위에서의 편집은 회수된 AAV 게놈의 표적화된 시퀀싱 및 세포의 전체 mRNA의 RNAseq에 의해 측정된다. 모든 측정은 동일한 실험에서 기술적으로 반복하여 수행되었다.
도 4A-4C는 A>G 염기 전환이 망막 색소 상피에서 유래한 ARPE-19 세포에서 1주차, 3주차 및 5주차(x-축)에 측정된 5주 AAV2 형질도입 실험을 보여주는 막대 그래프를 제공한다. 도 4A는 게놈 부위(ABCA4 c.5882G>A)에서의 편집을 보여주는 막대 그래프를 제공한다. 도 4B는 DNA 서열 분석에 의해 측정된 TadA 촉매 잔기 또는 인트론 스플라이스 수용체 부위에서의 편집을 보여주는 막대 그래프를 제공한다. 도 4C는 RNA 앰플리콘 서열분석을 통한 동일한 유전자좌의 편집 측정을 보여주는 막대 그래프를 제공한다. 도 4a-4c에서 "_scrmbl"이라는 용어는 자기 비활성화 가이드 시퀀스가 스크램블되었음을 나타낸다. 도 4A-4C에서, NF1 및 PAX2 스플라이스 수용체 부위는 각각 가이드 g235 및 g239를 사용하여 편집되었다(표 1C 참조).
도 5A 및 5B는 형질도입 후 표시된 날짜(x-축)에 ARPE-19 세포에서 2주 AAV2 형질도입 실험을 보여주는 막대 그래프를 제공한다. 막대 그래프는 각각 세포 형질도입을 위해 추가된 바이러스 게놈의 수(높음, 중간 또는 낮음)를 나타낸다. 세포 형질도입을 위해 추가된 바이러스 게놈의 수는 높음(89k vg/세포), 중간(17k vg/세포) 또는 낮음(9k vg/세포)이었다. 도 5A는 첨가된 바이러스 양에 대한 형질도입 후 3일, 7일 및 14일째에 게놈 부위(ABCA4 c.5882G>A)의 편집 속도를 보여주는 막대 그래프를 제공한다. 도 5B는 표시된 시점에서 DNA 서열 분석에 의해 측정된 TadA 촉매 잔기 또는 인트론 스플라이스 수용체 부위에서의 편집을 보여주는 막대 그래프를 제공한다.
도 6A 및 6B는 편집이 4일, 7일 및 14일에 측정된 ARPE-19 세포에서의 2주 AAV2 시간 경과 형질도입 실험을 보여주는 막대 그래프를 제공한다. 도 6A는 차세대 시퀀싱을 통해 측정된 게놈 부위(ABCA4 c.5882G>A)를 도 6B는 RNA 앰플리콘 서열 분석을 통해 측정된 TadA 촉매 잔기 또는 인트론 스플라이스 수용체의 편집을 보여주는 막대 그래프를 제공한다.
도 7A 및 7B는 리포펙션 후 2일 및 7일에 측정된 편집 속도에 따른 HEK293T 세포에서의 플라스미드 리포펙션 결과를 보여주는 막대 그래프를 제공한다. 도 7A는 차세대 시퀀싱을 통해 측정된 게놈 부위(ABCA4 c.5882G>A)의 편집을 보여주는 막대 그래프를 제공한다. 도 7B는 RNA 앰플리콘 서열 분석을 통해 측정된 TadA 촉매 잔기 또는 인트론 스플라이스 수용체 부위의 편집을 보여주는 막대 그래프를 제공한다. 도에서. 도 7a 및 도 7b에서 _scrmbl은 자기 불활성화 가이드 시퀀스가 스크램블되었음을 나타낸다.
도 8A 및 8B는 BALB/c 마우스에서 AAV8의 IV 꼬리 정맥 주사 후 수집된 편집 데이터를 보여주는 막대 그래프를 제공한다. 도 8A는 1주 후 DNA 및 RNA 앰플리콘 서열분석을 통해 측정된 게놈 부위(ABCA4 c.5882G>A)에서의 편집뿐만 아니라 TadA 촉매 잔기 또는 인트론 스플라이스 수용자 부위의 편집을 보여주는 그래프를 제공한다. 도 8B는 4주 후 동일한 결과를 보여주는 그래프를 제공한다. 도 8A 및 8B에서, 게놈 부위의 편집은 왼쪽 y-축에 표시되고, TadA 촉매 잔기 또는 인트론 스플라이스 수용체의 편집은 오른쪽 y축에 표시된다. 도 8a 및 도 8b에서 '_scrmbl'이라는 용어는 자기 불활성화 가이드 시퀀스가 스크램블되었음을 나타낸다.
도 1B는 게놈 부위(ABCA4 c.5882G>A) 및 두 개의 gRNA를 사용한 TadA (His57, Glu59, Cys87 또는 Cys90)의 자기-불활성화 부위에서, 미리 설치된 TadA 돌연변이(His57Arg, Glu59Gly, Cys87Arg 또는 Cys90Arg)를 포함하는 ABE7.10-m 및 ABE7.10-m 변이체의 리포펙션 후 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다.
도 1C는 TadA 코딩 영역 내 자기-불활성화 표적 부위인 His57 및 Glu59의 DNA 서열을 도시하는 개략도를 제공한다. 3' PAM 서열은 회색으로 강조되어 있고, 각 서열의 프로토스페이서 내 표적 뉴클레오티드와 그 위치는 굵은 글씨로 표시되어 있다. 도 1C에 제공된 뉴클레오티드 서열은 위에서 아래(top-to-bottom) 발생순서대로 서열번호 458-459에 해당한다. 도 1C에 제공된 아미노산 서열은 위에서 아래 발생순서대로 서열번호 460-461에 해당한다.
도 1D는 TadA의 게놈 부위(ABCA4 c.5882G>A) 및 자기-불활성화 부위 Glu59를 표적화하는 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 리포펙션 후 HEK293T 세포에서의 염기 편집 활성을 나타내는 그래프를 제공한다. 변이체의 활성을 자기-불활성화 gRNA가 제공되지 않은 ABE8.5-m의 활성과 비교하였다.
도 1E 및 1F는 ARPE-19 세포의 게놈 부위 및 ABE의 TadA 촉매 잔기에서 AAV2에 의해 전달된 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 염기 편집의 동역학을 보여주는 막대 그래프를 제공한다. 도 1E는 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 AAV2 전달 후 게놈 부위(ABCA4 c.5882G>A)에서의 염기 편집의 5주 시간 경과를 나타내는 막대 그래프를 제공한다. 도 1F는 5주 시간 과정의 동일 샘플에서 자기-불활성화 부위(TadA의 아미노산 잔기 His57 또는 잔기 Glu59)에서의 편집을 나타내는 막대 그래프를 제공한다.
도 1G 및 1H는 ARPE-19 세포의 게놈 부위 및 ABE의 TadA 촉매 잔기에서 AAV2에 의해 전달된 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 염기 편집 동역학을 보여주는 막대 그래프를 제공하며, 여기서 자기-불활성화 편집은 두 가지 상이한 방법으로 평가되었다. 도 1G는 ABE8.5-m 코돈 변이체 및 2개의 gRNA의 AAV2 전달 2주 후 게놈 부위(ABCA4 c.5882G>A)에서의 염기 편집을 나타내는 막대 그래프를 제공한다. 도 1H는 동일한 실험에서 세포 용해물로부터의 DNA 또는 기술적인 복제 샘플의 mRNA로부터 생성된 cDNA의 표적화된 서열분석에 의해 평가된 자기-불활성화 비율을 나타내는 막대 그래프를 제공한다.
도 2A는 ABE 시작 코돈의 변경을 통해 편집기를 비활성화하기 위해 TadA에 만들어진 돌연변이의 다이어그램을 제공한다. DNA 및 단백질 서열의 돌연변이는 검은색으로 강조 표시된다. 대체로, 프레임 외부 시작 코돈(out-of-frame start codon)은 회색 상자로 식별된다. 도 2A에 제공된 뉴클레오티드 서열은 위에서 아래 발생순서대로 서열번호 462-466에 해당한다. 도 2A에 제공된 아미노산 서열은 위에서 아래 발생순서대로 서열번호 467-469에 해당한다.
도 2B는 미리 설치된 시작 코돈 돌연변이를 함유하는 ABE8.5-m 변이체의 리포펙션 후 HEK293T 세포의 게놈 부위 ABCA4 c.5882G>A에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 2C는 TadA의 Met1에서 염기 편집이 일어나도록 하는 PAM 서열(NGG)을 혼입하기 위해 ABE8.5-m에 만들어진 돌연변이를 보여주는 다이어그램을 제공한다. 도 2C에 제공된 뉴클레오티드 서열은 위에서 아래 발생순서대로 서열번호 470-476에 해당한다. 도 2C에 제공된 아미노산 서열은 위에서 아래 발생순서대로 서열번호 477-480에 해당한다.
도 2D는 돌연변이되지 않은 대조군과 비교하여 TadA에 설치된 PAM 서열을 함유하는 ABE8.5-m 변이체의 리포펙션 후 HEK293T 세포의 게놈 부위 ABCA4 c.5882G>A에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 2E는 두 개의 gRNA를 사용하여 TadA의 게놈 부위(ABCA4 c.5882G>A) 및 자기-불활성화 부위 Met1에서 ABE8.5-m 및 ABE8.5-m 변이체의 리포펙션 후 HEK293T 세포에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다..
도 3A는 ABE(Adenine Base Editor)의 DNA에 인트론의 혼입을 통한 염기 편집기의 자기-불활성화 메커니즘을 보여주는 개략도를 제공한다.
도 3B 및 3C는 TadA의 특정 코돈(잔기) 뒤 또는 내에 코딩 서열에 인트론을 함유하는 ABE 변이체의 리포펙션 후 HEK293T 세포에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 도 3B는 TadA의 잔기 87(NF1, PAX2, EEF1A1, 키메라, SLC50A1, ABCB11, BRSK2, PLXNB3, TMPRSS6, IL32) 뒤, 잔기 62(키메라, ABCB11, PLXNB3, IL32) 뒤 또는 잔기 23(Chimera, ABCB11, PLXNB3, IL32) 내의 인트론의 혼입 이후 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 도 3B는 NF1, PAX2 및 EEF1A1 외에 잔기 87(ANTXRL, PKHD1L1, PADI1, KRT6C, HMCN2, HMCN2-Salmon 또는 ENPEP-Gecko) 뒤에 일부 추가 인트론을 혼입한 후 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 3D는 스플라이스 수용체 부위 또는 스플라이스 공여체 부위에 사전 설치된 편집이 있는 인트론을 포함하는 ABE 변이체의 리포펙션 후 HEK293T 세포의 염기 편집 활동을 나타내는 막대 그래프를 제공한다. 인트론은 TadA 잔기 87(NF1 수용체, PAX2 수용체, EEF1A1 수용체, 키메라 수용체, ANTXRL 수용체, PKHK1L1 수용체, PADI1 수용체, KRT6C 수용체, HMCN2 수용체, ENPEP-Gecko 수용체, HMCN2-Salmon 수용체, NF1 공여체, PAX2 공여체, EEF1A1 공여체, 또는 키메라 공여체) 뒤에 위치했다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 3E는 스플라이스 수용체 부위 또는 스플라이스 공여체 부위에 사전 설치된 편집을 갖는 인트론을 함유하는 ABE 변이체의 리포펙션 후 HEK293T 세포에서의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 인트론은 TadA 잔기 129(NF1 수용체, PAX2 수용체, EEF1A1 수용체), 59(NF1 수용체, PAX2 수용체, EEF1A1 수용체), 18(NF1 수용체, PAX2 수용체, EEF1A1 수용체) 및 62(ABCB11 수용체) 뒤, 또는 잔기 23 내(ABCB11 공여체)에 위치했다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 3F는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87 뒤 TadA 내에 배치된 인트론의 수용체 부위(NF1 또는 PAX2)에서 리포펙션된 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다.
도 3G는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87(NF1, PAX2 및 EEF1A1) 뒤 및 잔기 62(ABCB11) 뒤의 TadA 내에 배치된 인트론의 수용체 부위에서 리포펙션된 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다.
도 3H는 스플라이스 수용체 부위에서 미리 설치된 돌연변이가 존재하거나 존재하지 않는 경우, TadA 내의 다양한 위치(잔기 87, 129, 59 또는 18 이후)에서 인트론(NF1, PAX2 또는 EEF1A1)을 함유하는 ABE8.5-m 변이체의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 이 실험에서는 자기-불활성화 gRNA가 제공되지 않았다.
도 3I는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87, 129, 59 및 18 뒤 TadA 내에 배치된 인트론의 수용체 부위(NF1, PAX2 및 EEF1A1)에서 리포펙션된 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다.
도 3J는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87 뒤 TadA 내에 배치된 인트론 NF1, PAX2, EEF1A1 ANTXRL, PKHD1L1, PADI1 및 ENPEP-Gecko의 게놈 부위 및 수용체 부위에서 리포펙션된 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프를 제공한다. 도 3K, 3L 및 3M은 자기-불활성화 gRNA, 게놈 부위를 표적으로 하는 gRNA 및 TadA의 서열 코딩에서의 인트론을 포함하는 ABE 변이체를 코딩하는 플라스미드 DNA의 플라스미드 리포펙션 후 HEK293T 세포의 염기 편집 활성을 나타내는 막대 그래프와 누적 막대 그래프를 제공합니다.
도 3K는 게놈 부위(ABCA4 c.5882G>A) 및 잔기 87 이후 TadA 내에 배치된 인트론 NF1 또는 PAX2의 수용체 부위에서의 염기 편집 활성을 묘사하는 막대 그래프를 제공하며, 여기서 편집은 세포 용해물로부터 DNA의 표적화된 서열분석에 의해 평가되었다. 도 3L 및 3M은 전체 mRNA의 RNA-seq에 의해 평가된 ABE8.5-m mRNA 내의 스플라이스 변이체의 비율을 묘사하는 누적 막대 그래프를 제공한다. 도 3K, 3L 및 3M에서의 모든 분석은 동일한 실험에서 기술적으로 반복하여 수행되었다.
도 3N은 스플라이스 수용체 부위를 표적으로 하는 자기-불활성화 gRNA, 게놈 부위를 표적으로 하는 gRNA, 및 잔기 87에 있는 TadA의 코딩 서열에 NF1 인트론을 함유하는 ABE 변이체의 AAV2 전달 후 2주째에 ARPE-19 세포에서의 염기 편집 활성을 묘사하는 막대 그래프를 제공한다. 편집은 게놈 DNA의 표적화된 시퀀싱에 의해 게놈 부위에서 측정되었으며 자기-불활성화 부위에서의 편집은 회수된 AAV 게놈의 표적화된 시퀀싱 및 세포의 전체 mRNA의 RNAseq에 의해 측정된다. 모든 측정은 동일한 실험에서 기술적으로 반복하여 수행되었다.
도 4A-4C는 A>G 염기 전환이 망막 색소 상피에서 유래한 ARPE-19 세포에서 1주차, 3주차 및 5주차(x-축)에 측정된 5주 AAV2 형질도입 실험을 보여주는 막대 그래프를 제공한다. 도 4A는 게놈 부위(ABCA4 c.5882G>A)에서의 편집을 보여주는 막대 그래프를 제공한다. 도 4B는 DNA 서열 분석에 의해 측정된 TadA 촉매 잔기 또는 인트론 스플라이스 수용체 부위에서의 편집을 보여주는 막대 그래프를 제공한다. 도 4C는 RNA 앰플리콘 서열분석을 통한 동일한 유전자좌의 편집 측정을 보여주는 막대 그래프를 제공한다. 도 4a-4c에서 "_scrmbl"이라는 용어는 자기 비활성화 가이드 시퀀스가 스크램블되었음을 나타낸다. 도 4A-4C에서, NF1 및 PAX2 스플라이스 수용체 부위는 각각 가이드 g235 및 g239를 사용하여 편집되었다(표 1C 참조).
도 5A 및 5B는 형질도입 후 표시된 날짜(x-축)에 ARPE-19 세포에서 2주 AAV2 형질도입 실험을 보여주는 막대 그래프를 제공한다. 막대 그래프는 각각 세포 형질도입을 위해 추가된 바이러스 게놈의 수(높음, 중간 또는 낮음)를 나타낸다. 세포 형질도입을 위해 추가된 바이러스 게놈의 수는 높음(89k vg/세포), 중간(17k vg/세포) 또는 낮음(9k vg/세포)이었다. 도 5A는 첨가된 바이러스 양에 대한 형질도입 후 3일, 7일 및 14일째에 게놈 부위(ABCA4 c.5882G>A)의 편집 속도를 보여주는 막대 그래프를 제공한다. 도 5B는 표시된 시점에서 DNA 서열 분석에 의해 측정된 TadA 촉매 잔기 또는 인트론 스플라이스 수용체 부위에서의 편집을 보여주는 막대 그래프를 제공한다.
도 6A 및 6B는 편집이 4일, 7일 및 14일에 측정된 ARPE-19 세포에서의 2주 AAV2 시간 경과 형질도입 실험을 보여주는 막대 그래프를 제공한다. 도 6A는 차세대 시퀀싱을 통해 측정된 게놈 부위(ABCA4 c.5882G>A)를 도 6B는 RNA 앰플리콘 서열 분석을 통해 측정된 TadA 촉매 잔기 또는 인트론 스플라이스 수용체의 편집을 보여주는 막대 그래프를 제공한다.
도 7A 및 7B는 리포펙션 후 2일 및 7일에 측정된 편집 속도에 따른 HEK293T 세포에서의 플라스미드 리포펙션 결과를 보여주는 막대 그래프를 제공한다. 도 7A는 차세대 시퀀싱을 통해 측정된 게놈 부위(ABCA4 c.5882G>A)의 편집을 보여주는 막대 그래프를 제공한다. 도 7B는 RNA 앰플리콘 서열 분석을 통해 측정된 TadA 촉매 잔기 또는 인트론 스플라이스 수용체 부위의 편집을 보여주는 막대 그래프를 제공한다. 도에서. 도 7a 및 도 7b에서 _scrmbl은 자기 불활성화 가이드 시퀀스가 스크램블되었음을 나타낸다.
도 8A 및 8B는 BALB/c 마우스에서 AAV8의 IV 꼬리 정맥 주사 후 수집된 편집 데이터를 보여주는 막대 그래프를 제공한다. 도 8A는 1주 후 DNA 및 RNA 앰플리콘 서열분석을 통해 측정된 게놈 부위(ABCA4 c.5882G>A)에서의 편집뿐만 아니라 TadA 촉매 잔기 또는 인트론 스플라이스 수용자 부위의 편집을 보여주는 그래프를 제공한다. 도 8B는 4주 후 동일한 결과를 보여주는 그래프를 제공한다. 도 8A 및 8B에서, 게놈 부위의 편집은 왼쪽 y-축에 표시되고, TadA 촉매 잔기 또는 인트론 스플라이스 수용체의 편집은 오른쪽 y축에 표시된다. 도 8a 및 도 8b에서 '_scrmbl'이라는 용어는 자기 불활성화 가이드 시퀀스가 스크램블되었음을 나타낸다.
정의
달리 정의되지 않는 한, 본원에 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 공통으로 이해되는 의미를 갖는다. 다음 참조는 본 발명에서 사용되는 많은 용어의 일반적인 정의를 당업자에게 제공한다: Singleton 등, Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger 등 (eds.), Springer Verlag (1991); 및 Hale & Marham, The Harper Collins Dictionary of Biology (1991).여기서 사용되는 바와 같이, 달리 특정하지 않는 한 다음 용어들은 하기에 기술된 의미를 갖는다.
"아데닌" 또는 "9H-퓨린-6-아민"은 구조를 갖고, CAS 번호 73-24-5에 상응하는 분자식 C5H5N5를 갖는 퓨린 핵염기를 의미한다.
“아데노신" 또는 "4-아미노-1-[(2R,3R,4S,5R)-3,4-디하이드록시-5-(하이드록시메틸)옥솔란-2-일]피리미딘-2(1H)-온"은 구조를 갖고, CAS 번호 65-46-3에 상응하는 글리코시드 결합을 통해 리보스 당에 부착된 아데닌 분자를 의미한다. 이의 분자식은 C10H13N5O4이다.
"아데노신 데아미나아제" 또는 "아데닌 데아미나아제"는 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매할 수 있는 폴리펩티드 또는 이의 기능성 단편을 의미한다. 용어 “아데닌 데아미나아제” 및 “아데노신 데아미나아제”는 본원 전반에 걸쳐 상호교환적으로 사용된다. 일부 구현예에서, 데아미나아제 또는 데아미나아제 도메인은 아데노신에서 이노신으로 또는 데옥시 아데노신에서 데옥시이노신으로의 가수분해성 탈아미노화를 촉매하는 아데노신 데아미나아제이다. 일부 구현예에서, 아데노신 데아미나아제는 데옥시리보핵산(DNA)에서 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매화한다. 본원에 제공된 아데노신 데아미나아제(예를 들어, 조작된 아데노신 데아미나아제, 진화된 아데노신 데아미나아제)는 조류, 박테리아, 진균, 식물, 무척추동물(예를 들어, 곤충) 및 척추동물(예를 들어, 양서류, 포유동물)을 포함하지만 이에 제한되지 않는 임의의 유기체(예를 들어, 진핵, 원핵생물)로부터 유래될 수 있다. 일부 구현예에서, 아데노신 데아미나아제는 하나 이상의 변경을 갖는 아데노신 데아미나아제 변이체이고, 표적 폴리뉴클레오티드(예를 들어, DNA, RNA)에서 아데닌 및 사이토신 둘 모두를 탈아민화시킬 수 있다. 일부 구현예에서, 표적 폴리뉴클레오티드는 단일 또는 이중 가닥이다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 DNA 내의 아데닌 및 사이토신 둘 모두를 탈아민화시킬 수 있다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 단일 가닥 DNA 내의 아데닌 및 사이토신 둘 모두를 탈아민화시킬 수 있다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 RNA에서 아데닌 및 사이토신 둘 모두를 탈아민화시킬 수 있다.
"아데노신 탈아미노화 활성"은 폴리뉴클레오티드에서 아데닌 또는 아데노신에서 구아닌으로의 탈아미노화를 촉매하는 것을 의미한다. 일부 구현예에서, 본원에 제공된 바와 같은 아데노신 데아미나아제 변이체는 아데노신 데아미나아제 활성(예를 들어, 참조 아데노신 데아미나아제의 활성(예를 들어, TadA*8.20 또는 TadA*8.19)의 적어도 약 30%, 40%, 50%, 60%, 70%, 80%, 90% 이상)을 유지한다.
"아데노신 염기 편집기(ABE)"는 아데노신 데아미나아제를 포함하는 염기 편집기를 의미한다.
“아데노신 염기 편집기(ABE) 폴리뉴클레오티드”는 ABE를 코딩하는 폴리뉴클레오티드를 의미한다. "아데노신 염기 편집기 8(ABE8) 폴리펩티드" 또는 "ABE8"은 아데노신 데아미나아제 또는 표 14에 나열된 변경 중 하나 이상, 나열된 변경 조합 중 하나, 또는 표 14의 아미노산 위치 82 및/또는 166에서 변경을 포함하는 아데노신 데아미나아제 변이체를 포함하는, 본원에 정의된 염기 편집기를 의미하며, 이러한 변경은 다음 참조 서열의 참조 서열에 대한 것 또는 또 다른 아데노신 데아미나아제의 상응하는 위치에 대한 것이다:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열번호: 1).
일부 구현예에서, ABE8은 참조 서열에 대해 본원에 기재된 바와 같은 변경을 추가로 포함한다.
"아데노신 염기 편집기 8(ABE8) 폴리뉴클레오티드"는 ABE8 폴리펩티드를 코딩하는 폴리뉴클레오티드를 의미한다.
"투여"는 환자 또는 대상체에게 본원에 기재된 하나 이상의 조성물을 제공하는 것으로 본원에서 지칭된다.
"제제"는 임의의 소분자 화학 화합물, 항체, 핵산 분자, 또는 폴리펩티드, 또는 이의 단편을 의미한다.
"변경"은 본원에 기재된 것과 같은 표준 기술 공지된 방법에 의해 검출되는 바와 같은 분석물, 유전자 또는 폴리펩티드의 수준, 구조, 또는 활성의 변화(증가 또는 감소)를 의미한다. 본원에서 사용된 바와 같이, 변경은 발현 수준의 10% 변화, 25% 변화, 40% 변화, 및 50% 변화 이상을 포함한다. 일부 구현예에서, 변경에는 핵염기 또는 아미노산의 삽입, 결실 또는 치환이 포함된다.
"개선하다"는 질환의 발달 또는 진행을 감소, 억제, 약화, 축소, 저지 또는 안정화시키는 것을 의미한다.
"유사체"는 동일하지 않지만 유사한 기능적 또는 구조적 특성을 갖는 분자를 의미한다. 예를 들어, 폴리펩티드 유사체는 상응하는 자연 발생 폴리펩티드의 생물학적 활성을 보유하는 한편, 자연 발생 폴리펩티드에 대해 유사체의 기능을 향상시키는 특정 생화학적 변형을 갖는다. 이러한 생화학적 변형은 예를 들어 리간드 결합을 변경시키지 않으면서 DNA에 대한 유사체의 프로테아제 내성, 막 투과성, 또는 반감기를 증가시킬 수 있다. 유사체는 비자연 아미노산을 포함할 수 있다.
"염기 편집기(BE)" 또는 "핵염기 편집기 폴리펩티드(NBE)"는 폴리뉴클레오티드에 결합하고 핵염기 변형 활성을 갖는 제제를 의미한다. 다양한 구현예에서, 염기 편집기는 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA(gRNA))와 함께 핵염기 변형 폴리펩티드(예를 들어, 데아미나아제) 및 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9 또는 Cpf1)을 포함한다. 염기 편집기의 대표적인 핵산 및 단백질 서열은 서열목록에 서열번호: 2-11로 제공된다.
"염기 편집 활성"은 폴리뉴클레오티드 내의 염기를 화학적으로 변경하도록 작용하는 것을 의미한다. 일 구현예에서, 제1 염기는 제2 염기로 변환된다. 일 구현예에서, 염기 편집 활성은 사이티딘 데아미나아제 활성, 예를 들어 표적 CㆍG를 TㆍA로 전환시키는 것이다. 또 다른 구현예에서, 염기 편집 활성은 아데노신 또는 아데닌 데아미나아제 활성, 예를 들어 AㆍT를 GㆍC로 전환시키는 것이다.
용어 "염기 편집기 시스템"은 표적 뉴클레오티드 서열의 핵염기를 편집하기 위한 분자간 복합체를 지칭한다. 다양한 구현예에서, 염기 편집기(BE) 시스템은 (1) 표적 뉴클레오티드 서열에서 핵염기를 탈아미노화하기 위한 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인, 데아미나아제 도메인(예를 들어, 사이티딘 데아미나아제 도메인 또는 아데노신 도메인); 및 (2) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인과 함께 하나 이상의 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)를 포함한다. 다양한 구현예에서, 염기 편집기(BE) 시스템은 아데노신 데아미나아제 또는 사이티딘 데아미나아제로부터 선택된 핵염기 편집기 도메인, 및 핵산 서열 특이적 결합 활성을 갖는 도메인을 포함한다. 일부 구현예에서, 염기 편집기 시스템은 (1) 표적 뉴클레오티드 서열에서 하나 이상의 핵염기를 탈아미노화하기 위한 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인 및 데아미나아제 도메인을 포함하는 염기 편집기(BE); 및 (2) 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인과 함께 하나 이상의 가이드 RNA를 포함한다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인이다. 일부 구현예들에서, 염기 편집기는 사이티딘 염기 편집기(CBE)이다. 일부 구현예에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기(ABE)이다. 일부 구현예에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기(ABE) 또는 사이티딘 또는 사이토신 염기 편집기(CBE)이다.
용어 "Cas9" 또는 "Cas9 도메인"은 Cas9 단백질, 또는 이의 단편(예를 들어, Cas9의 활성, 비활성, 또는 부분적으로 활성 DNA 절단 도메인, 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는 RNA 가이드된 뉴클레아제를 지칭한다. Cas9 뉴클레아제는 또한 때때로 casnl 뉴클레아제 또는 CRISPR(클러스터링된 규칙적 간격의 짧은 회문 반복부) 연관 뉴클레아제를 지칭한다.
용어 "보존적 아미노산 치환" 또는 "보존적 돌연변이"는 하나의 아미노산을 공통 특성을 갖는 또 다른 아미노산으로 대체하는 것을 지칭한다. 개별 아미노산 사이의 공통 특성을 정의하는 기능적 방식은 상동성 유기체의 상응하는 단백질 사이의 표준화된 아미노산 변화의 빈도를 분석하는 것이다(Schulz, G. E. 및 Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979)). 이러한 분석에 따르면, 아미노산의 그룹은 그룹 내의 아미노산이 서로 우선적으로 교환되고, 따라서 전반적인 단백질 구조에 대한 이들의 영향이 서로 가장 유사한 것으로 정의될 수 있다(상기 Schulz, G. E. 및 Schirmer, R. H.). 보존적 돌연변이의 비-제한적인 예는 아미노산의 아미노산 치환, 예를 들어, 양전하가 유지될 수 있도록 아르기닌을 리신으로 및 그 반대로; 음전하가 유지될 수 있도록 아스파르트산을 글루탐산으로 및 그 반대로; 유리 -OH가 유지될 수 있도록 트레오닌을 세린으로; 및 유리 -NH2가 유지될 수 있도록 아스파라긴을 글루타민으로 치환하는 것을 포함한다.
본원에서 상호교환적으로 사용된 바와 같은 용어 "코딩 서열" 또는 "단백질 코딩 서열"은 단백질을 코딩하는 폴리뉴클레오티드의 분절을 지칭한다. 코딩 서열은 또한 개방 판독 프레임으로 지칭될 수 있다. 영역 또는 서열은 시작 코돈에 의해 5' 말단에 더 가깝고, 종결 코돈에 의해 3' 말단에 더 가깝게 결합된다. 본원에 기재된 염기 편집기에 유용한 종결 코돈은 다음을 포함한다:
글루타민
CAG →TAG 종결 코돈
CAA →TAA
아르기닌
CGA → TGA
트립토판
TGG → TGA
TGG →TAG
TGG →TAA
"복합체"는 상호작용이 분자간 힘에 의존하는 2개 이상의 분자의 조합을 의미한다. 분자간 힘의 비제한적인 예는 공유 및 비공유 상호작용을 포함한다. 비공유 상호작용의 비제한적인 예는 수소 결합, 이온 결합, 할로겐 결합, 소수성 결합, 반 데르 발스 상호작용(예를 들어, 쌍극자-쌍극자 상호작용, 쌍극자-유도 쌍극자 상호작용, 및 런던 분산력), 및 π효과를 포함한다. 일 구현예에서, 복합체는 폴리펩티드, 폴리뉴클레오티드, 또는 하나 이상의 폴리펩티드와 하나 이상의 폴리뉴클레오티드의 조합을 포함한다. 일 구현예에서, 복합체는 염기 편집기(예를 들어, Cas9와 같은 핵산 프로그래밍 가능한 DNA 결합 단백질 및 데아미나아제를 포함하는 염기 편집기) 및 폴리뉴클레오티드(예를 들어, 가이드 RNA)를 형성하기 위해 연관되는 하나 이상의 폴리펩티드를 포함한다. 일 구현예에서, 복합체는 수소 결합에 의해 함께 유지된다. 염기 편집기의 하나 이상의 구성요소(예를 들어, 데아미나아제, 또는 핵산 프로그래밍 가능한 DNA 결합 단백질)은 공유적으로 또는 비공유적으로 연관될 수 있다는 것을 이해하여야 한다. 일 예로서, 염기 편집기는 핵산 프로그래밍 가능한 DNA 결합 단백질에(예를 들어, 펩티드 결합에 의해) 공유적으로 연결된 데아미나아제를 포함할 수 있다. 대안적으로, 염기 편집기는 데아미나아제 및 비공유적으로 연관되는 핵산 프로그래밍 가능한 DNA 결합 단백질을 포함할 수 있다(예를 들어, 염기 편집기의 하나 이상의 구성요소가 트랜스로 공급되고 직접적으로 또는 단백질 또는 핵산과 같은 또 다른 분자를 통해 연관된다). 구현예에서, 복합체의 하나 이상의 구성요소는 수소 결합들에 의해 함께 유지된다. 본 개시내용 전반에 걸쳐, 염기 편집기의 구현예가 융합 단백질을 함유하는 것으로 고려되는 경우, 염기 편집기의 하나 이상의 도메인 또는 이의 단편을 포함하는 복합체도 고려된다.
"사이토신" 또는 "4-아미노피리미딘-2(1H)-온"은 구조를 갖고, CAS 번호 71-30-7에 상응하는 분자식 C4H5N3O를 갖는 퓨린 핵염기를 의미한다.
"사이티딘"은 구조를 갖고, CAS 번호 65-46-3에 상응하는 글리코시드 결합을 통해 리보스 당에 부착된 사이토신 분자를 의미한다. 이의 분자식은 C9H13N3O5이다.
"사이티딘 염기 편집기(CBE)"는 사이티딘 데아미나아제를 포함하는 염기 편집기를 의미한다.
"사이티딘 염기 편집기(CBE) 폴리뉴클레오티드"는 CBE를 포함하는 폴리뉴클레오티드를 의미한다.
"사이티딘 데아미나아제" 또는 "사이토신 데아미나아제"는 사이티딘 또는 사이토신을 탈아미노화시킬 수 있는 폴리펩티드 또는 이의 단편을 의미한다. 일 구현예에서, 사이티딘 데아미나아제는 사이토신을 우라실로 또는 5-메틸사이토신을 티민으로 전환시킨다. 용어 "사이티딘 데아미나아제" 및 "사이토신 데아미나아제"는 본 출원 전반에 걸쳐 상호교환적으로 사용된다. 페트로미존 마리누스 사이토신 데아미나아제 1(PmCDA1)(서열번호: 12-13), 활성화-유도 사이티딘 데아미나아제(AICDA)(서열번호: 14-46, 및 18-21), 및 APOBEC(서열번호: 22-62)는 예시적인 사이티딘 데아미나아제이다. 추가의 예시적인 사이티딘 데아미나아제(CDA) 서열은 서열목록 63-67 및 서열번호: 68-190으로서 제공된다.
"사이토신 데아미나아제 활성"은 사이토신 또는 사이티딘의 탈아미노화를 촉매하는 것을 의미한다. 일 구현예에서, 사이토신 데아미나아제 활성을 갖는 폴리펩티드는 아미노기를 카르보닐기로 전환시킨다. 일 구현예에서, 사이토신 데아미나아제 변이체는 사이토신을 우라실로(즉, C에서 U로) 또는 5-메틸사이토신을 티민으로(즉, 5mC에서 T로) 전환시킨다. 일 구현예에서, 본원에 제공된 바와 같은 사이토신 데아미나아제는 참조 사이토신 데아미나아제에 대해 증가된 사이토신 데아미나아제 활성(예를 들어, 적어도 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배 이상)을 갖는다. 본원에서 사용된 바와 같은 용어 "데아미나아제" 또는 "데아미나아제 도메인"은 탈아미노화 반응을 촉매하는 단백질 또는 이의 단편을 지칭한다.
"검출"은 검출될 분석물의 존재, 부재 또는 양을 식별하는 것을 지칭한다. 일 구현예에서, 폴리뉴클레오티드 또는 폴리펩티드의 서열 변경이 검출된다. 다른 구현예에서, 인델(indels)의 존재가 검출된다.
"검출가능한 표지"는 관심 분자에 연결될 때, 분광학, 광화학, 생화학, 면역화학, 또는 화학 수단을 통해 후자를 검출가능하게 만드는 조성물을 의미한다. 예를 들어, 유용한 표지는 방사성 동위원소, 자기 비드, 금속성 비드, 콜로이드성 입자, 형광 염료, 전자-밀도 시약, 효소(예를 들어, 효소 결합 면역흡착 검정(ELISA)에서 통상적으로 사용되는 것), 비오틴, 디곡시게닌, 또는 합텐을 포함한다.
"질환"은 세포, 조직 또는 기관의 정상적인 기능을 손상시키거나 방해하는 임의의 병태 또는 장애를 의미한다.
"유효량"은 치료되지 않은 환자 또는 질병이 없는 개체, 즉 건강한 개체에 비해 질병의 증상을 개선하는 데 필요한 제제 또는 활성 화합물, 예를 들어 본원에 기술된 염기 편집기의 양을 의미한다. 또는 원하는 생물학적 반응을 이끌어내기에 충분한 제제 또는 활성 화합물의 양이다. 질병의 치료적 치료를 위해 본 발명을 실시하는데 사용되는 활성 화합물(들)의 유효량은 투여 방식, 대상체의 연령, 체중 및 전반적인 건강 상태에 따라 달라진다. 궁극적으로 주치의나 수의사가 적절한 양과 복용량을 결정하게 된다. 이러한 양을 "유효" 량으로 지칭한다. 일 구현예에서, 유효량은 세포(예를 들어, 시험관내 또는 생체내 세포)에서 관심 유전자의 변경을 도입하기에 충분한 본 발명의 염기 편집기의 양이다. 일 구현예에서, 유효량은 치료 효과를 달성하는데 필요한 염기 편집기의 양이다. 이러한 치료 효과는 대상체, 조직 또는 기관의 모든 세포에서 병원성 유전자를 변경하기에 충분할 필요는 없지만, 병원성 유전자를 약 1%, 5%, 10%, 25%, 50%, 75% 또는 75% 정도만 변경시키기만 하면 된다. 일 구현예에서, 유효량은 질병의 하나 이상의 증상을 개선하는데 충분하다.
용어 "엑소뉴클레아제"는 유리 말단으로부터 핵산(예를 들어, RNA 또는 DNA)을 분해할 수 있는 단백질 또는 폴리펩티드를 의미한다.
용어 "엔도뉴클레아제"는 핵산(예를 들어, DNA 또는 RNA)의 내부 영역을 촉매 작용(예를 들어, 절단)할 수 있는 단백질 또는 폴리펩티드를 의미한다.
"단편"은 폴리펩티드 또는 핵산 분자의 부분을 의미한다. 이 부분은 참조 핵산 분자 또는 폴리펩티드의 전체 길이의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%를 함유한다. 단편은 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000개의 뉴클레오티드 또는 아미노산을 함유할 수 있다.
"가이드 폴리뉴클레오티드"는 표적 서열에 대해 특이적이며 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 단백질(예를 들어, Cas9 또는 Cpf1)로 복합체를 형성할 수 있는 폴리뉴클레오티드 또는 폴리뉴클레오티드 복합체를 의미한다. 일 구현예에서, 가이드 폴리뉴클레오티드는 가이드 RNA(gRNA)이다. gRNA는 둘 이상의 RNA의 복합체, 또는 단일 RNA 분자로서 존재할 수 있다.
일부 구현예에서, 가이드 폴리뉴클레오티드는 다음에서 선택되는 뉴클레오티드 서열을 가지며, 여기서 소문자 “”는 표적 서열에 대한 5' 미스매치를 나타낸다:
a)
gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 191);
b)
gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 192);
c)
gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 193);
d)
GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 194);
e)
gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 195);
f)
gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 196);
g)
gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 197);
h)
GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 198);
i)
GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 190);
j)
gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 200);
k)
gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 201);
l)
GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 202);
m)
gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 203);
n)
gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 204);
o)
gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 205);
p)
GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 206);
q)
gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 207);
r)
gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 208);
s)
gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 209);
t)
gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 210);
u)
gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 211);
v)
gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 212);
w)
gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 213);
x)
gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 214);
y)
GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 215);
z)
gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 216);
aa)
gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 217);
bb)
gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 218);
cc)
GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 219);
dd)
gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 220);
ee)
gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 221);
ff)
gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 222);
gg)
gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 223);
hh)
gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 224); 또는
ii)
gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 225).
"이종성 성" 또는 "외인성"은 1) 폴리뉴클레오티드 또는 폴리펩티드가 자연에서 정상적으로 발견되지 않는 폴리뉴클레오티드 또는 폴리펩티드 서열에 실험적으로 혼입되었거나; 2) 폴리뉴클레오티드 또는 폴리펩티드를 정상적으로 포함하지 않는 세포에 실험적으로 배치된 폴리뉴클레오티드 또는 폴리펩티드를 의미한다. 일부 구현예에서, "이종성 성"은 폴리뉴클레오티드 또는 폴리펩티드가 비-천연 맥락에서 실험적으로 배치되었음을 의미한다. 일부 구현예에서, 이종성 폴리뉴클레오티드 또는 폴리펩티드는 제1 종 또는 호스트 유기체로부터 유래되고, 제2 종 또는 호스트 유기체로부터 유래된 폴리뉴클레오티드 또는 폴리펩티드에 혼입된 것이다. 일부 구현예에서, 제1 종 또는 호스트 유기체는 제2 종 또는 호스트 유기체와 상이하다. 일부 구현예에서, 이종성 폴리뉴클레오티드는 DNA이다. 일부 구현예에서, 이종성 폴리뉴클레오티드는 RNA이다.일부 구현예에서, 이종성 폴리뉴클레오티드는 이종성 인트론이다. 일부 구현예에서, 이종성 인트론은 합성 인트론이다. 일부 구현예에서, 이종성 인트론은 포유동물 유전자(예를 들어, NF1, PAX2, EEF1A1, HBB, IGHG1, SLC50A1, ABCB11, BRSK2, PLXNB3, TMPRSS6, IL32, ANTXRL, PKHD1L1, PADI1, KRT6C 또는 HMCN2)로부터 유래된다. 일부 구현예에서, 이종성 인트론은 비포유동물 유전자(예를 들어, HMCN2-Salmon, ENPEP-Gecko)로부터 유래된다. 일부 구현예에서, 본원에 제공된 바와 같은 염기 편집기를 코딩하는 폴리뉴클레오티드는 이종성 인트론을 포함한다. 일부 구현예에서, 염기 편집기는 아데노신 염기 편집기(ABE)이다. 일부 구현예에서, 염기 편집기는 사이티딘 염기 편집기(CBE)이다.
일부 구현예에서, 이종성 인트론은 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 단백질 또는 이의 단편을 코딩하는 폴리뉴클레오티드에 혼입된 것이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 단백질은 Cas9, Cas12a/Cpf1, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 또는 Cas12j/CasΦ도메인이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 스타필로코쿠스 아우레우스(Staphylococcus aureus) Cas9(SaCas9), 스트렙토코쿠스 써모필루스 1 (Streptococcus thermophiles 1) Cas9(St1Cas9), 스트렙로코쿠스 파이오게네스(Streptococcus pyogenes) Cas9(SpCas9), 또는 이들의 변이체이다.
일부 구현예에서, 이종성 인트론은 데아미나아제 또는 그의 단편을 코딩하는 폴리뉴클레오티드에 혼입된 것이다. 일부 구현예에서, 이종성 인트론은 아데노신 데아미나아제를 코딩하는 폴리뉴클레오티드에 혼입된 것이다. 일부 구현예에서, 아데노신 데아미나아제는 TadA이다. 일부 구현예에서, 이종성 인트론은 사이티딘 데아미나아제를 코딩하는 폴리뉴클레오티드에 혼입된 것이다.
"혼성화"는 수소 결합을 의미하며, 이는 상보적 핵염기 사이의 왓슨-크릭(Watson-Crick), 후그스틴(Hoogsteen) 또는 역 후그스틴 수소 결합일 수 있다. 예를 들어, 아데닌 및 티민은 수소 결합의 형성을 통해 쌍을 이루는 상보적 핵염기이다.
"증가"는 적어도 10%, 25%, 50%, 75%, 또는 100%의 양의 변경을 의미한다.
용어 "염기 복구 억제제", "염기 복구 저해제", "IBR" 또는 이들의 문법적 동등어는 핵산 복구 효소, 예를 들어 염기 절제 복구 효소의 활성을 억제할 수 있는 단백질을 의미한다.
"인테인"은 단백질 스플라이싱으로 공지된 과정에서 자체 절제하고 나머지 단편(엑스테인)을 펩티드 결합으로 연결할 수 있는 단백질의 단편이다.
"인트론"은 전사체의 번역 전에 스플라이싱에 의해 제거되는 비암호화 뉴클레오티드 서열을 의미한다. 일부 구현예에서, 인트론은 RNA 스플라이싱에 의해 mRNA 성숙 전구체 메신저 RNA 단계 동안 제거된다. 일부 구현예에서, 인트론은 유기체의 유전자로부터 유래된다. 일부 구현예에서 인트론은 합성된 것이다. 일부 구현예에서, 인트론은 스플라이스 수용체 및 스플라이스 공여체 부위를 포함한다. 일부 구현예에서, 인트론의 길이는 약 10, 25, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450 또는 500개 뉴클레오티드이다. 일부 구현예에서, 인트론의 길이는 약 50, 100, 125, 150, 175 또는 200개 뉴클레오티드이다. 일부 구현예에서, 인트론의 길이는 약 150개 뉴클레오티드이다.
일부 구현예에서, 인트론은 포유동물 유전자(예를 들어, NF1, PAX2, EEF1A1, HBB, IGHG1, SLC50A1, ABCB11, BRSK2, PLXNB3, TMPRSS6, IL32, ANTXRL, PKHD1L1, PADI1, KRT6C 또는 HMCN2)로부터 유래된다. 일부 구현예에서, 인트론은 비포유동물 유전자(예를 들어, HMCN2-Salmon, ENPEP-Gecko)로부터 유래된다. 일부 구현예에서, 인트론은 다음으로부터 선택된 폴리뉴클레오티드 서열을 갖는다:
a)
GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG (서열번호: 226);
b)
GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG (서열번호: 227);
c)
GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG (서열번호: 228);
d)
GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG (서열번호: 229);
e)
GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG (서열번호: 230);
f)
GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG (서열번호: 231);
g)
GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG (서열번호: 232);
h)
GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG (서열번호: 233);
i)
GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG (서열번호: 234);
j)
GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG (서열번호: 235);
k)
GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG (서열번호: 236);
l)
GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG (서열번호: 237);
m)
GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG (서열번호: 238);
n)
GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG (서열번호: 239);
o)
GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG (서열번호: 240);
p)
GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG (서열번호: 241); 또는
q)
GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG (서열번호: 242).
일부 구현예에서, 본원에 제공된 바와 같은 염기 편집기를 코딩하는 폴리뉴클레오티드는 이종성 인트론을 포함한다. 일부 구현예에서, 염기 편집기는 아데노신 염기 편집기(ABE)이다. 일부 구현예에서, 염기 편집기는 사이티딘 염기 편집기(CBE)이다. 일부 구현예에서, 인트론은 폴리뉴클레오티드 서열에 이종적으로 혼입된 것이다. 일부 구현예에서, 폴리뉴클레오티드 서열은 DNA이다. 일부 구현예에서, 폴리뉴클레오티드 서열은 RNA이다. 일부 구현예에서, 인트론은 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 단백질을 코딩하는 폴리뉴클레오티드에 이종성으로 혼입된다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 단백질은 Cas9, Cas12a/Cpf1, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 또는 Cas12j/CasΦ도메인이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인은 스타필로코쿠스 아우레우스 Cas9(SaCas9), 스트렙토코쿠스 써모필루스 1 Cas9(St1Cas9), 스트렙로코쿠스 파이오게네스 Cas9(SpCas9), 또는 이들의 변이체이다.일부 구현예에서, 인트론은 데아미나아제를 코딩하는 폴리뉴클레오티드에 이종적으로 혼입된 것이다. 일부 구현예에서, 인트론은 아데노신 데아미나아제를 코딩하는 폴리뉴클레오티드에 이종적으로 혼입된 것이다. 일부 구현예에서, 아데노신 데아미나아제는 TadA이다. 일부 구현예에서, 인트론은 사이티딘 데아미나아제를 코딩하는 폴리뉴클레오티드에 이종적으로 혼입된 것이다. 일부 구현예에서, 인트론은 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 단백질(예를 들어, Cas9)에 이종적으로 혼입된 것이다. 일부 구현예에서, 인트론은 링커 영역에 이종성으로 혼입된 것이다.
용어 "단리된", "정제된" 또는 "생물학적으로 순수한"은 천연 상태에서 발견되는 바와 같이 일반적으로 동반되는 구성요소로부터 다양한 정도로 자유로운 물질을 지칭한다. "단리"는 원래의 공급원 또는 주변과의 분리 정도를 나타낸다. "정제"는 단리보다 더 높은 분리 정도를 나타낸다. "정제된" 또는 "생물학적으로 순수한" 단백질은 임의의 불순물이 단백질의 생물학적 특성에 실질적으로 영향을 미치지 않거나 다른 역결과를 유발하지 않도록 다른 물질이 실질적으로 없다. 즉, 본 발명의 핵산 또는 펩티드는 재조합 DNA 기술에 의해 생성될 때 세포 물질, 바이러스 물질, 또는 배양 배지, 또는 화학적으로 합성될 때 화학적 전구체 또는 다른 화학물질이 실질적으로 없는 경우 정제된다. 순도 및 균질성은 전형적으로 분석적 화학 기술, 예를 들어 폴리아크릴아미드 겔 전기영동 또는 고성능 액체 크로마토그래피를 사용하여 결정된다. 용어 "정제된"은 핵산 또는 단백질이 전기영동 겔에서 본질적으로 하나의 밴드를 생성하는 것을 나타낼 수 있다. 변형, 예를 들어, 인산화 또는 글리코실화가 적용될 수 있는 단백질의 경우, 상이한 변형은 개별적으로 정제될 수 있는 상이한 단리된 단백질을 생성할 수 있다.
"단리된 폴리뉴클레오티드"는 본 발명의 핵산 분자가 유래되는 유기체의 자연 발생 게놈에서 유전자를 플랭킹하는 유전자가 없는 핵산 분자를 의미한다. 일 구현예에서, 핵산 분자는 DNA를 함유하거나, DNA 분자이다. 따라서, 용어는 예를 들어 벡터 내로; 자가 복제 플라스미드 또는 바이러스 내로; 또는 원핵생물 또는 진핵생물의 게놈 DNA 내로 혼입되거나; 또는 다른 서열과 독립적으로 별개의 분자(예를 들어, cDNA 또는 PCR 또는 제한 엔도뉴클레아제 절단에 의해 생성된 게놈 또는 cDNA 단편)로서 존재하는 재조합 DNA를 포함한다. 또한, 용어는 DNA 분자로부터 전사되는 RNA 분자, 뿐만 아니라 추가의 폴리펩티드 서열을 암호와하는 하이브리드 유전자의 일부인 재조합 DNA를 포함한다.
"단리된 폴리펩티드"는 자연적으로 동반되는 구성요소로부터 분리된 본 발명의 폴리펩티드를 의미한다. 전형적으로, 폴리펩티드는 단백질 및 자연적으로 회합되는 자연 발생 유기 분자로부터 중량 기준으로 적어도 60%가 없을 때 단리된다. 바람직하게는, 제조물은 본 발명의 폴리펩티드를 중량 기준으로 적어도 75%, 보다 바람직하게는 적어도 90%, 및 가장 바람직하게는 적어도 99% 이다. 본 발명의 단리된 폴리펩티드는 예를 들어, 천연 공급원으로부터 추출함으로써, 이러한 폴리펩티드를 암호화하는 재조합 핵산의 발현에 의해; 또는 단백질을 화학적으로 합성함으로써 수득될 수 있다. 순도는 임의의 적절한 방법, 예를 들어, 컬럼 크로마토그래피, 폴리아크릴아미드 겔 전기영동에 의해, 또는 HPLC 분석에 의해 측정될 수 있다.
본원에 사용된 바와 같은 용어 "링커"는 2개의 모이어티를 연결하는 분자를 지칭한다. 일 구현예에서, 용어 "링커"는 공유 링커(예를 들어, 공유 결합) 또는 비-공유 링커를 지칭한다.
본원에 사용된 바와 같은 용어 "돌연변이"는 서열, 예를 들어, 핵산 또는 아미노산 서열 내에서 잔기의 또 다른 잔기로의 치환, 또는 서열 내에서 하나 이상의 잔기의 결실 또는 삽입을 지칭한다. 돌연변이는 전형적으로 원래의 잔기에 이어서 서열 내 잔기의 위치를 식별하고 새로 치환된 잔기의 아이덴티티(identity)를 식별함으로써 본원에 기재된다. 본원에 제공된 아미노산 치환(돌연변이)를 제조하는 다양한 방법은 당업계에 널리 공지되어 있고, 예를 들어, Green 및 Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))에 의해 제공된다.
본원에 사용된 바와 같은 용어 "핵산" 및 "핵산 분자"는 핵염기 및 산성 모이어티, 예를 들어, 뉴클레오시드, 뉴클레오티드, 또는 뉴클레오티드의 중합체를 포함하는 화합물을 지칭한다. 전형적으로, 중합체성 핵산, 예를 들어, 3 개 이상의 뉴클레오티드를 포함하는 핵산 분자는 선형 분자이며, 여기서 인접한 뉴클레오티드는 포스포디에스테르 연결을 통해 서로 연결된다. 일부 구현예에서, "핵산"은 개별 핵산 잔기(예를 들어 뉴클레오티드 및/또는 뉴클레오시드)를 지칭한다. 일부 구현예에서, "핵산"은 3 개 이상의 개별 뉴클레오티드 잔기를 포함하는 올리고뉴클레오티드 쇄를 지칭한다. 본원에 사용된 바와 같은 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 뉴클레오티드의 중합체(예를 들어, 적어도 3 개의 뉴클레오티드의 스트링)를 지칭하기 위해 상호교환가능하게 사용될 수 있다. 일부 구현예에서, "핵산"은 RNA뿐만 아니라 단일 및/또는 이중-가닥 DNA를 포함한다. 핵산은 예를 들어, 게놈, 전사체, mRNA, tRNA, rRNA, siRNA, snRNA, 플라스미드, 코스미드, 염색체, 염색분체, 또는 다른 자연 발생 핵산 분자의 맥락에서 자연 발생할 수 있다. 다른 한편으로, 핵산 분자는 비-자연 발생 분자, 예를 들어, 재조합 DNA 또는 RNA, 인공 염색체, 조작된 게놈, 또는 이의 단편, 또는 합성 DNA, RNA, DNA/RNA 하이브리드일 수 있거나, 또는 비-자연 발생 뉴클레오티드 또는 뉴클레오시드를 포함할 수 있다. 또한, 용어 "핵산", "DNA", "RNA", 및/또는 유사한 용어는 핵산 유사체, 예를 들어, 포스포디에스테르 백본 이외의 것을 갖는 유사체를 포함한다. 핵산은 천연 공급원으로부터 정제되고, 재조합 발현 시스템을 사용하여 생성되고 선택적으로 정제되고, 화학적으로 합성 등이 될 수 있다. 적절한 경우, 예를 들어, 화학적으로 합성된 분자의 경우, 핵산은 화학적으로 변형된 염기 또는 당, 및 백본 변형을 갖는 유사체와 같은 뉴클레오시드 유사체를 포함할 수 있다. 핵산 서열은 달리 나타내지 않는 한 5'에서 3' 방향으로 제시된다. 일부 구현예에서, 핵산은 천연 뉴클레오시드(예를 들어 아데노신, 티미딘, 구아노신, 사이티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 및 데옥시사이티딘); 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸사이티딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-사이티딘, C5-메틸사이티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌, 및 2-티오사이티딘); 화학적으로 변형된 염기; 생물학적으로 변형된 염기(예를 들어, 메틸화 염기); 삽입된 염기; 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스); 및/또는 변형된 포스페이트 기(예를 들어, 포스포로티오에이트 및 5'-N-포스포라미다이트 연결)이거나 또는 포함한다.
"핵 국소화 서열(nuclear localization sequence)", "핵 국소화 신호(nuclear localization signal)" 또는 "NLS"라는 용어는 단백질이 세포 핵으로 유입되는 것을 촉진하는 아미노산 서열을 의미한다. 핵 국소화 서열은 당업계에 공지되어 있고, 예를 들어 Plank et al., 국제 PCT 출원, PCT/EP2000/011690(2000년 11월 23일 출원, 2001년 5월 31일 WO/2001/038547로 공개됨)에 기재되어 있으며, 그 내용은 예시적인 핵 국소화 서열의 개시를 위한 참조문헌으로서 본 명세서에 포함된다. 다른 구현예에서, NLS는 최적화된 NLS이고, 예를 들어 Koblan 등., Nature Biotech. 2018 doi:10.1038/nbt.4172에 기재되어 있다. 일부 구현예에서, NLS는 아미노산 서열 KRTADGSEFESPKKKRKV(서열번호: 243), KRPAATKKAGQAKKKK(서열번호: 244), KKTELQTTNAENKTKKL(서열번호: 245), KRGINDRNFWRGENGRKTR(서열번호: 246), RKSGKIAAIVVKRRPRK(서열번호: 247), PKKKRKV(서열번호: 248), 또는 MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(서열번호: 249)을 포함한다.
본원에서 상호교환적으로 사용되는 용어 "핵염기", "질소성 염기" 또는 "염기"는 뉴클레오시드를 형성하는 질소-함유 생물학적 화합물을 지칭하며, 이는 결국 뉴클레오티드의 성분이다. 염기쌍을 형성하고 서로 쌓이는 핵염기의 능력은 리보핵산(RNA) 및 데옥시리보핵산(DNA)과 같은 장쇄 힐리컬 구조로 직접 이어진다. 5개의 핵염기(아데닌(A), 사이토신(C), 구아닌(G), 티민(T), 우라실(U))을 일차(primary) 또는 표준(caconical)이라고 한다. 아데닌과 구아닌은 퓨린에서 파생되고 사이토신, 우라실, 티민은 피리미딘에서 파생된다. DNA와 RNA는 또한 변형된 다른(비-일차) 염기를 포함할 수도 있다. 비제한적인 예시적인 변형된 핵염기는 하이포잔틴, 크산틴, 7-메틸구아닌, 5,6-디하이드로우라실, 5-메틸사이토신(m5C) 및 5-하이드로메틸사이토신을 포함할 수 있다. 하이포잔틴과 크산틴은 돌연변이 유발물질의 존재를 통해 생성될 수 있으며 둘 다 탈아미노화(아민 그룹을 카르보닐 그룹으로 대체)를 통해 생성된다. 하이포잔틴은 아데닌에서 변형될 수 있다. 크산틴은 구아닌에서 변형될 수 있다. 우라실은 사이토신의 탈아미노화로 인해 발생할 수 있다. "뉴클레오시드"는 핵염기와 5탄당(리보스 또는 디옥시리보스)으로 구성된다. 뉴클레오시드의 예에는 아데노신, 구아노신, 우리딘, 사이티딘, 5-메틸우리딘(m5U), 데옥시아데노신, 데옥시구아노신, 티미딘, 데옥시유리딘 및 데옥시사이티딘이 포함된다. 변형된 핵염기를 갖는 뉴클레오시드의 예에는 이노신(I), 크산토신(X), 7-메틸구아노신(m7G), 디히드로우리딘(D), 5-메틸사이티딘(m5C) 및 슈도우리딘(Ψ)이 포함된다. "뉴클레오티드"는 핵염기, 5탄당(리보스 또는 디옥시리보스) 및 적어도 하나의 인산염 그룹으로 구성된다. 변형된 핵염기 및/또는 변형된 핵염기가 포함할 수 있는 화학적 변형의 비제한적 예는 다음과 같다: 슈도-우리딘, 5-메틸-사이토신, 2'-O-메틸-3'-포스포노아세테이트, 2'-O-메틸 티오PACE(MSP), 2'-O-메틸-PACE(MP), 2'-플루오로 RNA(2'-F-RNA), 구속된(constrained) 에틸(S-cEt), 2'-O-메틸('M'), 2'-O-메틸-3'-포스포로티오에이트('MS'), 2'-O-메틸-3'-티오포스포노아세테이트('MSP'), 5-메톡시유리딘, 포스포로티오에이트 및 N1-메틸슈도우리딘.
용어 "핵산 프로그래밍 가능한 DNA 결합 단백질" 또는 "napDNAbp"는 napDNAbp를 특이적 핵산 서열로 가이드하는, 가이드 핵산과 같은 핵산(예를 들어, DNA 또는 RNA) 또는 가이드 폴리뉴클레오티드(예를 들어, gRNA)와 연관되는 단백질을 지칭하기 위해 "폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인"과 상호교환가능하게 사용될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 RNA 결합 도메인이다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 Cas9 단백질이다. Cas9 단백질은 Cas9 단백질을 가이드 RNA에 상보적인 특이적 DNA 서열로 가이드하는 가이드 RNA와 연관될 수 있다. 일부 구현예에서, napDNAbp는 Cas9 도메인, 예를 들어 뉴클레아제 활성 Cas9, Cas9 니카아제(nCas9), 또는 뉴클레아제 비활성 Cas9(dCas9)이다. 핵산 프로그래밍 가능한 DNA 결합 단백질의 비제한적인 예는 Cas9(예를 들어, dCas9 및 nCas9), Cas12a/Cpfl, Cas12b/C2cl, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 및 Cas12j/CasΦ를 포함한다. Cas 효소의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas8a, Cas8b, Cas8c, Cas9(Csn1 또는 Csx12로도 공지됨), Cas10, Cas10d, Cas12a/Cpfl, Cas12b/C2cl, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, Cas12j/CasΦCpf1, Csy1, Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx1S, Csx11, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, II형 Cas 효과기 단백질, V형 Cas 효과기 단백질, VI형 Cas 효과기 단백질, CARF, DinG, 이의 상동체, 또는 이의 변형된 또는 조작된 버전을 포함한다. 다른 핵산 프로그래밍 가능한 DNA 결합 단백질은 또한 본 개시내용의 범주 내에 있지만, 이들은 본 개시내용에 구체적으로 나열되지 않을 수 있다. 예를 들어, Makarova 등 "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?" CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan 등, "Functionally diverse type V CRISPR-Cas systems" Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271을 참조하며, 각각의 전문이 본원에 참조로 포함된다. 예시적인 핵산 프로그래밍 가능한 DNA 결합 단백질 및 핵산 프로그래밍 가능한 DNA 결합 단백질을 암호화하는 핵산 서열은 서열목록에서 서열번호: 250-283 및 490으로 제공된다.
본원에 사용된 바와 같은 용어 "핵염기 편집 도메인" 또는 "핵염기 편집 단백질"은 RNA 또는 DNA에서 핵염기 변형, 예컨대 사이토신(또는 사이티딘)에서 우라실(또는 우리딘) 또는 티민(또는 티미딘)으로, 및 아데닌(또는 아데노신)에서 하이포크산틴(또는 이노신)으로의 탈아미노화, 뿐만 아니라 비-주형 뉴클레오티드 부가 및 삽입을 촉매화할 수 있는 단백질 또는 효소를 지칭한다. 일부 구현예에서, 핵염기 편집 도메인은 데아미나아제 도메인(예를 들어, 아데닌 데아미나아제 또는 아데노신 데아미나아제; 또는 사이티딘 데아미나아제 또는 사이토신 데아미나아제)이다.
본원에 사용된 바와 같이, "제제를 수득하는"에서와 같은 "수득하는"은 제제를 합성, 구매, 또는 달리 획득하는 것을 포함한다.
본원에 사용된 바와 같은 "환자" 또는 "대상체"는 질환 또는 장애로 진단되거나, 질환 또는 장애가 있거나 또는 발병할 위험이 있거나, 또는 질환 또는 장애가 있거나 또는 발병할 것으로 의심되는 포유동물 대상체 또는 개체를 지칭한다. 일부 구현예에서, 용어 "환자"는 질환 또는 장애가 발병할 가능성이 평균보다 더 높은 포유류 대상체를 지칭한다. 예시적인 환자는 인간, 비-인간 영장류, 고양이, 개, 돼지, 소, 고양이, 말, 낙타, 라마, 염소, 양, 설치류(예를 들어, 마우스, 토끼, 랫트, 또는 기니 피그) 및 본원에 개시된 요법에서 이익을 얻을 수 있는 다른 포유류일 수 있다. 예시적인 인간 환자는 남성 및/또는 여성일 수 있다.
"이를 필요로 하는 환자" 또는 "이를 필요로 하는 대상체"는 본원에서, 질환 또는 장애로 진단되거나, 질환 또는 장애를 갖거나 또는 가질 위험이 있거나, 질환 또는 장애를 갖는 것으로 미리 결정되거나, 질환 또는 장애를 갖는 것으로 의심되는 환자를 지칭한다.
용어 "병원성 돌연변이", "병원성 변이체", "질환 유발 돌연변이", “질환 유발 변이체” "유해한 돌연변이" 또는 "소인성 돌연변이"는 특정 질환 또는 장애에 대한 개인의 이병성 또는 소인성을 증가시키는 질환 또는 장애와 연관된 유전적 변경 또는 돌연변이를 지칭한다. 일부 구현예에서, 병원성 돌연변이는 유전자에 의해 암호화된 단백질에서 적어도 하나의 병원성 아미노산에 의해 치환된 적어도 하나의 야생형 아미노산을 포함한다. 일부 구현예에서, 병원성 돌연변이는 종결 영역(예를 들어, 종결 코돈)에 존재한다. 일부 구현예에서, 병원성 돌연변이는 비-코딩 영역(예를 들어, 인트론, 프로모터 등)에 존재한다.
용어 "단백질", "펩티드", "폴리펩티드", 및 이의 문법적 등가물은 본원에서 상호교환가능하게 사용되며, 펩티드(아미드) 결합에 의해 함께 연결된 아미노산 잔기의 중합체를 지칭한다. 단백질, 펩티드, 또는 폴리펩티드는 자연 발생, 재조합, 또는 합성, 또는 이들의 임의의 조합일 수 있다.
용어 "융합 단백질"은 적어도 2개의 상이한 단백질로부터의 단백질 도메인을 포함하는 하이브리드 폴리펩티드를 지칭한다.
단백질 또는 핵산의 맥락에서 본원에 사용된 바와 같은 용어 "재조합"은 자연에서 발생하지 않지만, 인간 조작의 생성물인 단백질 또는 핵산을 지칭한다. 예를 들어, 일부 구현예에서, 재조합 단백질 또는 핵산 분자는 임의의 자연 발생 서열과 비교하여 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 또는 적어도 7 개의 돌연변이를 포함하는 아미노산 또는 뉴클레오티드 서열을 포함한다.
"감소"는 적어도 10%, 25%, 50%, 75%, 또는 100%의 음의 변경을 의미한다.
"참조"는 표준 또는 제어 조건을 의미한다. 일 구현예에서, 참조는 인트론을 포함하지 않는 폴리뉴클레오티드에 의해 코딩된 염기 편집기에 의해 제공되는 편집 수준이다.
다른 구현예에서, 참조는 스플라이스 수용체 또는 스플라이스 공여체 부위의 변경을 포함하지 않는 인트론을 포함하는 폴리뉴클레오티드에 의해 코딩되는 염기 편집기에 의해 제공되는 편집 수준이다. 한 구현예에서, 참조는 야생형 또는 건강한 세포에 존재하는 분석물의 수준, 구조 또는 활성이다. 다른 구현예에서 그리고 제한 없이, 참조는 테스트 조건에 적용되지 않거나 위약 또는 생리식염수, 배지, 완충제 및/또는 관심 폴리뉴클레오티드를 포함하지 않는 대조군 벡터에 적용되는 미처리 세포에 존재하는 분석물의 수준, 구조 또는 활성이다.
"참조 서열"은 서열 비교를 위한 기준으로 사용되는 정의된 서열이다. 참조 서열은 명시된 서열의 서브세트 또는 전체; 예를 들어, 전장 cDNA 또는 유전자 서열의 분절, 또는 완전한 cDNA 또는 유전자 서열일 수 있다. 폴리펩티드의 경우, 참조 폴리펩티드 서열의 길이는 일반적으로 적어도 약 16 개의 아미노산, 적어도 약 20 개의 아미노산, 적어도 약 25 개의 아미노산, 약 35 개의 아미노산, 약 50 개의 아미노산, 또는 약 100 개의 아미노산일 것이다. 핵산의 경우, 참조 핵산 서열의 길이는 일반적으로 적어도 약 50 개의 뉴클레오티드, 적어도 약 60 개의 뉴클레오티드, 적어도 약 75 개의 뉴클레오티드, 약 100 개의 뉴클레오티드, 또는 약 300 개의 뉴클레오티드 또는 그 부근 또는 그 사이의 임의의 정수일 것이다. 일부 구현예에서, 참조 서열은 관심 단백질의 야생형 서열이다. 다른 구현예에서, 참조 서열은 야생형 단백질을 암호화하는 폴리뉴클레오티드 서열이다.
용어 "RNA-프로그래밍 가능한 뉴클레아제", 및 "RNA-가이드된 뉴클레아제"는 절단을 위한 표적이 아닌 하나 이상의 RNA(들)와 함께 사용된다(예를 들어, 이와 결합하거나 연관된다). 일부 구현예에서, RNA-프로그래밍 가능한 뉴클레아제는 RNA와 복합체를 형성할 때, 뉴클레아제:RNA 복합체로 지칭될 수 있다. 전형적으로, 결합된 RNA(들)는 가이드 RNA(gRNA)로 지칭된다. 일부 구현예에서, RNA-프로그래밍 가능한 뉴클레아제는 (CRISPR-연관 시스템) Cas9 엔도뉴클레아제, 예를 들어, 스트렙토코쿠스 파이오오게네스(Streptococcus pyogenes)로부터의 Cas9(Csnl) (예를 들어 서열번호: 250), 네이세리아 메닌지티디스(Neisseria meningitidis)로부터의 Cas9 (NmeCas9; 서열번호: 261), Nme2Cas9 (서열번호: 262), 또는 이의 유도체 (예를 들어, Nme2Cas9 또는 spCas9과 같은 Cas9과 최소 약 85% 서열 상동성을 갖는 서열)이다,
용어 "단일 뉴클레오티드 다형성(SNP)"은 게놈 내의 특이적 위치에서 발생하는 단일 뉴클레오티드에서의 변이이며, 여기서 각각의 변이는 집단 내에서 일부 인지가능한 정도로 존재한다(예를 들어, > 1%).
"특이적으로 결합하는"은 핵산 분자, 폴리펩티드, 폴리펩티드/폴리뉴클레오티드 복합체, 화합물, 또는 본 발명의 폴리펩티드 및/또는 핵산 분자를 인식하고 결합하지만, 샘플, 예를 들어, 생물학적 샘플에서 다른 분자를 실질적으로 인식하고 결합하지 않는 분자를 의미한다.
"실질적으로 동일한"은 참조 아미노산 서열에 대해 적어도 50%의 상동성을 나타내는 폴리펩티드 또는 핵산 분자를 의미한다. 일 구현예에서, 참조 서열은 야생형 아미노산 또는 핵산 서열이다. 또 다른 구현예에서, 참조 서열은 본원에 기재된 아미노산 또는 핵산 서열 중 어느 하나이다. 일 구현예에서, 이러한 서열은 아미노산 수준 또는 핵산 수준에서 비교를 위해 사용된 서열과 적어도 60%, 80%, 85%, 90%, 95% 또는 심지어 99% 동일하다.
서열 상동성은 전형적으로 서열 분석 소프트웨어(예를 들어, Genetics Computer Group의 Sequence Analysis Software Package, 53705 위스콘신주 매디슨 유니버시티 애비뉴 1710 위스콘신 대학 생물공학 센터 소재, BLAST, BESTFIT, GAP 또는 PILEUP/PRETTYBOX 프로그램의 서열 분석 소프트웨어 패키지)를 사용하여 측정한다. 이러한 소프트웨어는 다양한 치환, 결실, 및/또는 다른 변형에 상동성의 정도를 할당함으로써 동일하거나 유사한 서열을 매칭시킨다. 보존적 치환은 전형적으로 글리신, 알라닌; 발린, 이소류신, 류신; 아스파르트산, 글루탐산, 아스파라긴, 글루타민; 세린, 트레오닌; 리신, 아르기닌; 및 페닐알라닌, 티로신 내의 치환을 포함한다. 동일성의 정도를 결정하기 위한 예시적인 접근법에서, 밀접하게 관련된 서열을 나타내는 e-3 및 e-100 사이의 확률 점수와 함께 BLAST 프로그램이 사용될 수 있다.
예를 들어 COBALT는 다음과 같은 매개변수와 함께 사용된다:
a)
정렬 매개변수: 갭 페널티-11,-1 및 엔드-갭 페널티-5,-1,
b)
CDD 매개변수: RPS BLAST 사용; Blast E-값 0.003; 보존된 열 찾기 및 재계산, 및
c)
쿼리 클러스터링 매개변수: 쿼리 클러스터 사용; 글자 크기 4; 최대 클러스터 거리 0.8; 알파벳 레귤러(alphabet regular).
예를 들어 EMBOSS Needle은 다음 매개변수와 함께 사용된다:
a)
행렬: BLOSUM62;
b)
갭 개방: 10;
c)
갭 확장: 0.5;
d)
출력 형식: 쌍;
e)
엔드 갭 페널티: 위(false);
f)
엔드 갭 개방: 10; 및
g)
엔드 간격 확장: 0.5.
본 발명의 방법에 유용한 핵산 분자는 본 발명의 폴리펩티드 또는 이의 단편을 암호화하는 임의의 핵산 분자를 포함한다. 이러한 핵산 분자는 내인성 핵산 서열과 100% 동일할 필요는 없지만, 전형적으로 실질적인 동일성을 나타낼 것이다. 내인성 서열에 대해 "실질적인 동일성"을 갖는 폴리뉴클레오티드는 전형적으로 이중-가닥 핵산 분자의 적어도 하나의 가닥과 혼성화될 수 있다. 본 발명의 방법에 유용한 핵산 분자는 본 발명의 폴리펩티드 또는 이의 단편을 암호화하는 임의의 핵산 분자를 포함한다. 이러한 핵산 분자는 내인성 핵산 서열과 100% 동일할 필요는 없지만, 전형적으로 실질적인 동일성을 나타낼 것이다. 내인성 서열에 대해 "실질적인 동일성"을 갖는 폴리뉴클레오티드는 전형적으로 이중-가닥 핵산 분자의 적어도 하나의 가닥과 혼성화될 수 있다. "혼성화하는"은 다양한 엄격성 조건 하에서 상보적 폴리뉴클레오티드 서열(예를 들어, 본원에 기재된 유전자) 또는 이의 부분 사이에 이중-가닥 분자를 형성하는 쌍을 의미한다. (예를 들어, Wahl, G. M. 및 S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507 참조).
예를 들어, 엄격한 염 농도는 일반적으로 약 750 mM NaCl 및 75 mM 시트르산삼나트륨 미만, 바람직하게는 약 500 mM NaCl 및 50 mM 시트르산삼나트륨 미만, 및 보다 바람직하게는 약 250 mM NaCl 및 25 mM 시트르산삼나트륨 미만일 것이다. 낮은 엄격성 혼성화는 유기 용매, 예를 들어, 포름아미드의 부재 하에 수득될 수 있는 반면, 높은 엄격성 혼성화는 적어도 약 35% 포름아미드, 및 보다 바람직하게는 적어도 약 50% 포름아미드의 존재 하에 수득될 수 있다. 엄격한 온도 조건은 일반적으로 적어도 약 30℃보다 바람직하게는 적어도 약 37℃및 가장 바람직하게는 적어도 약 42℃의 온도를 포함할 것이다. 혼성화 시간, 세제, 예를 들어, 나트륨 도데실 술페이트(SDS)의 농도, 및 담체 DNA의 포함 또는 배제와 같은 다양한 추가적인 매개변수는 당업자에게 널리 공지되어 있다. 필요에 따라 이러한 다양한 조건을 조합함으로써 다양한 수준의 엄격성이 달성된다. 바람직한 구현예에서, 혼성화는 750 mM NaCl, 75 mM 시트르산삼나트륨, 및 1% SDS 중 30℃에서 발생할 것이다. 보다 바람직한 구현예에서, 혼성화는 500 mM NaCl, 50 mM 시트르산삼나트륨, 1% SDS, 35% 포름아미드, 및 100 μg/ml 변성된 연어 정자 DNA(ssDNA) 중 37℃에서 발생할 것이다. 가장 바람직한 구현예에서, 혼성화는 250 mM NaCl, 25 mM 시트르산삼나트륨, 1% SDS, 50% 포름아미드, 및 200 μg/ml ssDNA 중 42℃에서 발생할 것이다. 이러한 조건에 대한 유용한 변이는 당업자에게 용이하게 명백할 것이다.
대부분의 적용의 경우, 혼성화 후 세척 단계에서 또한 엄격성이 다를 것이다. 세척 엄격성 조건은 염 농도 및 온도에 의해 정의될 수 있다. 상기와 같이, 세척 엄격성은 염 농도를 감소시키거나 또는 온도를 증가시킴으로써 증가될 수 있다. 예를 들어, 세척 단계에 대한 엄격한 염 농도는 바람직하게는 약 30 mM NaCl 및 3 mM 시트르산삼나트륨 미만 및 가장 바람직하게는 약 15 mM NaCl 및 1.5 mM 시트르산삼나트륨 미만일 것이다. 세척 단계에 대한 엄격한 온도 조건은 일반적으로 적어도 약 25℃보다 바람직하게는 적어도 약 42℃및 심지어 보다 바람직하게는 적어도 약 68℃의 온도를 포함할 것이다. 일 구현예에서, 세척 단계는 30 mM NaCl, 3 mM 시트르산삼나트륨, 및 0.1% SDS 중 25℃에서 발생할 것이다. 또 다른 구현예에서, 세척 단계는 15 mM NaCl, 1.5 mM 시트르산삼나트륨, 및 0.1% SDS 중 42℃에서 발생할 것이다. 보다 바람직한 구현예에서, 세척 단계는 15 mM NaCl, 1.5 mM 시트르산삼나트륨, 및 0.1% SDS 중 68℃에서 발생할 것이다. 이러한 조건에 대한 추가적인 변경은 당업자에게 용이하게 명백할 것이다. 혼성화 기술은 당업자에게 널리 공지되어 있고 예를 들어, Benton 및 Davis (Science 196:180, 1977); Grunstein 및 Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel 등 (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger 및 Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York); 및 Sambrook 등, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York에 기재되어 있다.
"스플릿"은 2개 이상의 단편으로 나눠지는 것을 의미한다.
"스플릿 Cas9 단백질" 또는 "스플릿 Cas9"는 2 개의 별개의 뉴클레오티드 서열에 의해 암호화된 N-말단 단편 및 C-말단 단편으로 제공되는 Cas9를 지칭한다. Cas9 단백질의 N-말단 부분 및 C-말단 부분에 상응하는 폴리펩티드는 스플릿되어 "재구성된" Cas9 단백질을 형성할 수 있다.
용어 “표적 부위"는 변형되는 핵산 분자 내의 서열을 의미한다. 일 구현예에서, 핵산 분자는 데아미나아제, 융합 단백질 또는 데아미나아제를 포함하는 복합체, 또는 본원에 개시된 염기 편집기에 의해 탈아미노화된다. 일 구현예에서, 데아미나아제는 사이티딘 또는 아데닌 데아미나아제다. 일부 예에서, 데아미나아제는 dCas9-아데노신 데아미나아제 융합 단백질이다. 일부 케이스에서, 염기 편집기는 아데닌 또는 아데노신 염기 편집기(ABE) 또는 사이티딘 또는 사이토신 염기 편집기(CBE)이다.
본원에 사용된 바와 같이, 용어 "치료하다", 치료하는", "치료" 등은 장애 및/또는 이와 연관된 증상(들)을 감소시키거나 또는 개선하거나 또는 원하는 약리학적 및/또는 생리학적 효과를 수득하는 것을 지칭한다. 배제되지는 않지만, 장애 또는 병태를 치료하는 것은 장애, 병태 또는 이와 연관된 증상이 완전히 제거되는 것을 요구하지 않는 것으로 이해될 것이다. 일부 구현예에서, 효과는 치료적이며, 즉, 제한 없이, 효과는 질환 및/또는 질환에 기인하는 부작용의 강도를 부분적으로 또는 완전히 축소, 경감, 폐지, 약화, 개선, 감소 또는 치유한다. 일부 구현예에서, 효과는 예방적이며, 즉, 효과는 질환 또는 병태의 발생 또는 재발을 보호 또는 방지한다. 이를 위해, 현재 개시된 방법은 본원에 기재된 바와 같은 치료적 유효량의 조성물을 투여하는 단계를 포함한다.
"우라실 글리코실라제 억제제" 또는 "UGI"는 우라실-절제 복구 시스템을 억제하는 제제를 의미한다. 사이티딘 데아미나아제를 포함하는 염기 편집기는 사이토신을 우라실로 전환한 다음 DNA 복제 또는 복구를 통해 티민으로 전환한다. 염기 편집기에 우라실 DNA 글리코실라제(UGI)의 억제제를 포함하면 U를 다시 C로 변경하는 염기 절단 복구를 방지한다. 예시적인 UGI는 다음과 같은 아미노산 서열을 포함한다:
>splP14739IUNGI_BPPB2 우라실-DNA 글리코실라제 억제제
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML (서열번호: 284).
본원에 제공된 범위는 해당 범위 내의 모든 값을 줄여서 표현한 것으로 이해된다. 예를 들어, 1 내지 50의 범위는 임의의 숫자, 숫자의 조합, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50로 구성된 그룹의 하위 범위를 포함하는 것으로 이해된다.
본원에서 변수의 임의의 정의에서 화학 그룹의 목록의 인용은 해당 변수를 임의의 단일 그룹 또는 나열된 그룹의 조합으로 정의하는 것을 포함한다. 본원의 변수 또는 양태에 대한 구현예의 언급은 해당 구현예를 임의의 단일 구현예로 또는 임의의 다른 구현예 또는 이의 부분과 조합하여 포함한다.
모든 용어는 당업자가 이해하는 대로 이해되도록 의도되었다. 다르게 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 개시 내용이 속하는 기술 분야의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
본원에서, 단수형의 사용은 달리 명시하지 않는 한 복수형을 포함한다. 본 명세서에서 사용된 단수형 "a", "an" 및 "the"는 문맥상 명백하게 다르게 지시하지 않는 한 복수형을 포함한다는 점에 유의해야 한다. 본원에서 "또는"의 사용은 달리 명시되지 않는 한 "및/또는"을 의미한다. 또한, "포함하는(including)"이라는 용어는 물론 "포함하다(include)", "포함하다(includes)", "포함되는(included)"과 같은 다른 형태의 사용은 제한되지 않는다.
본 명세서 및 청구항(들)에 사용된 바와 같이, 단어 "포함하는"(및 "포함한다" 및 "포함한다"와 같은 임의의 형태), "갖는"(및 "갖는다" 및 "갖는다"와 같은 임의의 형태), "포함하는"(및 "포함하다" 및 "포함하다”와 같은 임의의 형태) 또는 "함유하는"(및 "함유하다" 및 "함유하다"와 같은 임의의 형태)은 포괄적이거나 개방적이며, 추가적인, 미기재된 요소 또는 방법 단계를 제외하는 것이 아니다. 특정 구성요소(들) 또는 요소(들)을 "포함하는" 것으로 명시된 임의의 구현예는 또한 일부 구현예에서 특정 구성요소(들) 또는 요소(들)로 "구성되는" 또는 "본질적으로 구성되는" 것으로도 고려된다. 본 명세서에서 논의된 임의의 구현예는 본원에 개시의 임의의 방법 또는 구성에 대해 구현될 수 있고, 그 반대도 가능하다는 것이 고려된다. 또한, 본 개시의 조성물은 본원에 개시된 방법을 달성하는데 사용될 수 있다.
용어 "약" 또는 "대략"은 당업자에 의해 결정된 특정 값에 대해 허용 가능한 오차 범위 내를 의미하며, 이는 부분적으로 값이 측정되거나 결정되는 방식, 즉 측정 시스템의 한계로 인하여 달라질 수 있다.
명세서에서 "일부 구현예", "일 구현예", "일 구현예" 또는 "다른 구현예"에 대한 명세서 내 참조는, 구현예와 관련하여 설명된 특정한 특징, 구조 또는 특성이 본원에 개시된 적어도 일부 구현예에 포함되지만, 반드시 모든 구현예에 포함되는 것은 아니라는 것을 의미한다.
본 발명은 자기-불활성화 염기 편집기를 포함하는 조성물 및 이러한 편집기를 사용하는 방법을 특징으로 한다. 본 발명은 또한 자가-불활성화를 위한 이종성 인트론을 갖는 염기 편집기를 코딩하는 폴리뉴클레오티드, 이러한 폴리뉴클레오티드를 포함하는 조성물, 및 이러한 폴리뉴클레오티드에 의해 코딩되는 염기 편집기를 불활성화하는 방법을 특징으로 한다.
DNA 염기 편집 기술은 일반적으로 사이토신 데아미나아제 또는 아데닌 데아미나아제와의 단백질 융합에서 RNA 유도 Cas9 니카아제(nCas9)와 같은 조작된 DNA 결합 도메인을 활용한다. 사이토신 염기 편집기(CBE)는 우라실 중간체를 통해 사이토신이 티민으로 전환(C > T)되는 것을 촉매하는 반면, 아데닌 염기 편집기(ABE)는 하이포크산틴 중간체를 통해 아데닌이 구아닌으로 전환(A > G)되는 것을 촉매한다 (Rees, H. A., & Liu, D. R. (2018). Base editing: precision chemistry on the genome and transcriptome of living cells. Nat Rev Genet, 19(12), 770-788). DNA 염기 편집은 RNA 유도 nCas9 도메인을 사용하여 게놈의 관심 영역에 결합하며, 이는 nCas9에서 R-루프로 압출되는 게놈 DNA의 비표적 가닥을 대체하여 이러한 짝이 없는 염기를 탈아미노화에 노출시킨다. gRNA에 결합된 DNA의 표적 가닥은 또한 nCas9에 의해 닉(nick, 흠집)이 생기는데, 이는 편집되지 않은 표적 가닥의 야생형 염기쌍으로 분해되기보다는 R-루프에 설치된 돌연변이의 혼입 쪽으로 세포 DNA 불일치 복구를 편향시킨다.
모든 게놈 변형 도구와 마찬가지로 DNA에서 영구적이고 잠재적으로 해로울 수 있는 원치 않는 오프-타겟 편집을 방지하기 위해 예방 조치를 취해야 한다(Kim, D., 등 (2017). Genome-wide target specificities of CRISPR RNA-guided programmable deaminases. Nat Biotechnol, 35(5), 475-480; Liang, P., et al. (2019). Genome-wide profiling of adenine base editor specificity by EndoV-seq. Nature Communications, 10(1), 67; Zuo, E., 등 (2019). Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science, 364(6437), 289-292). AAV에 의해 전달되는 경우와 같이 DNA 편집기가 무기한으로 발현되는 상황 (Colella, P., 등 (2018). Emerging Issues in AAV-Mediated In Vivo Gene Therapy. Molecular Therapy - Methods & Clinical Development, 8, 87-104; Nathwani, A. C., 등 (2011). Long-term Safety and Efficacy Following Systemic Administration of a Self-complementary AAV Vector Encoding Human FIX Pseudotyped With Serotype 5 and 8 Capsid Proteins. Molecular Therapy, 19(5), 876-885; Nguyen, G. N., 등 (2021). A long-term study of AAV gene therapy in dogs with hemophilia A identifies clonal expansions of transduced liver cells. Nature Biotechnology, 39(1), 47-55; Niemeyer, G. P., 등 (2009). Long-term correction of inhibitor-prone hemophilia B dogs treated with liver-directed AAV2-mediated factor IX gene therapy. Blood, 113(4), 797-806)은 노출 시간에 따라 이러한 부위에서의 편집 위험이 증가하므로 오프-타겟 활성이 매우 낮더라도 잠재적으로 문제가 될 수 있다.
또한, 염기 편집기에 의한 비표적 RNA 탈아미노화의 지속성은 비영구적이지만 영향을 받은 세포의 전사체 프로파일을 변경할 수 있다 (Grunewald, J., 등 (2019). Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors. Nature, 569(7756), 433-437; Rees, H. A., 등 (2019). Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv, 5(5), eaax5717; Zhou, C., 등 (2019). Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature, 571(7764), 275-278). AAV에 의해 전달된 Cas9 뉴클레아제의 프로그래밍된 자기-불활성화를 위한 메커니즘은 이전에 설명되었으며, 여기서 Cas9을 발현하는 이식유전자는 호스트 게놈 내의 표적 부위 외에 이중 가닥 DNA 절단을 위해 표적화된다 (Epstein, B. E., & Schaffer, D. V. (2016). Engineering a Self-Inactivating CRISPR System for AAV Vectors. Molecular Therapy, 24, S50; Li, A., 등 (2019). A Self-Deleting AAV-CRISPR System for In Vivo Genome Editing. Mol Ther Methods Clin Dev, 12, 111-122). 따라서 Cas9 발현에 대한 지시는 Cas9이 처음 전달된 세포에서 제거된다.
염기 편집 기술의 가장 광범위한 치료적 유용성을 실현하기 위해, 본 발명은 장기간 발현을 초래할 수 있는 전달 방법 후에 염기 편집기의 활성 및 발현을 약화시키는 방법을 제공한다. CRISPR-Cas 뉴클레아제와 달리 염기 편집기는 변경되지 않은 Cas9 뉴클레아제로 인해 발생할 수 있는 인델 형성을 방지하기 위해 nCas9 또는 촉매적으로 불활성인 “죽은(dead)”변이체(dCas9)을 활용한다 (Gaudelli, N. M., 등 (2017). Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature, 551(7681), 464-471; Komor, A. C., 등 (2016). Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature, 533(7603), 420-424). DNA 코딩에서 이중 가닥 절단을 생성하여 염기 편집기를 자기-불활성화하는 것이 가능하지만 몇 가지 고려사항이 있다. 염기 편집기의 니카아제 Cas9을 활용하여 염기 편집기 DNA를 코딩하는 두 가닥 모두에 닉을 형성할 수 있다. 각 닉에 대한 부위는 블런트-말단 이중-가닥 DNA 브레이크(blunt-ended double-stranded DNA break)를 생성하기 위한 각 가닥의 닉을 포함하여 염기쌍 뉴클레오티드의 해리를 선호할 정도로 근접하여 충분히 가까운 거리에서 발생할 수 있다. 또한, 이러한 접근 방식에는 재결찰을 피하기 위해 이러한 닉을 순차적이 아닌 동시에 만들어야 하며, 닉을 표적으로 하기 위해 최소한 2개의 추가 gRNA가 필요하다. dCas9이 혼입된(incorporate) 염기 편집기는 이 전략을 사용할 수 없다. 따라서 일 구현예에서, 본 발명은 가이드 의존적 및 가이드 독립적 (예: 허위 탈아미드화(spurious deamination)) 가능성을 최소화하는 목표로 추가 편집 활성 또는 발현을 줄이거나 제거하기 위해 편집기 DNA 내에서 단일 염기 편집을 수행하는 데 의존하는 방법을 제공한다 (Yu, Y., 등 (2020). Cytosine base editors with minimized unguided DNA and RNA off-target events and high on-target activity. Nature Communications, 11(1), 2052). 본 발명은 또한 CBD의 4가지 센스 코돈 CAA, CAG, CGA 또는 TGG - Gln, Arg 및 Trp 잔기를 코딩함 - 중 임의의 것이 단일 C에서 T로의 염기 편집을 통해 종결 코돈으로 직접 전환될 수 있음을 제공한다 (Billon, P., 등 (2017). CRISPR-Mediated Base Editing Enables Efficient Disruption of Eukaryotic Genes through Induction of STOP Codons. Molecular Cell, 67(6), 1068-1079.e1064). 그러나 ABE를 사용하여 자기-불활성화를 달성하기 위해서는 대체 접근 방식이 필요한데, 이는 A에서 G로의 염기 편집을 통해서는 센스 코돈이 넌센스 코돈으로 변환될 수 없기 때문이다.
본 명세서에 기술된, 본 발명은 암호화 유전 물질의 세포 전달 후 염기 편집기의 자기-불활성화를 촉진하는 조성물 및 방법을 특징으로 한다. ABE의 자기-불활성화를 위한 본 발명의 방법은 센스 코돈의 종결 코돈으로의 직접적인 전환에 의존하지 않으며, C에서 T로의 단일 염기 편집을 사용하여 CBE를 불활성화하도록 적용될 수 있다. 이들 조성물 및 방법은 염기 편집을 활용하여 편집기를 코딩하는 DNA에 단일 염기 돌연변이를 프로그래밍 방식으로 설치하여 DNA 편집 활성이 제거되거나 발현이 변경된다.
일 구현예에서, 본 발명은 가이드 RNA가 염기 편집기에 염기 편집기의 데아미나아제 서브유닛의 활성 부위 잔기를 돌연변이시켜 촉매적으로 사멸된 효소를 생성하고 염기 편집의 손실을 일으키도록 지시할 수 있다는 발견에 적어도 부분적으로 기초하고 있다. 또 다른 구현예에서, 본 발명은 또한 단일 염기 돌연변이에 대한 염기 편집기의 시작 코돈을 표적화하면 번역을 방지한다는 발견에 적어도 부분적으로 기초한다.
또 다른 구현예에서, 본 발명은 인트론이 염기 편집기 코딩 서열(예를 들어, 오픈 리딩 프레임)에 삽입될 수 있다는 발견에 적어도 부분적으로 기초한다. 인트론은 염기 편집기 전사체(예: mRNA)의 생산적인 스플라이싱을 방해하거나 변경하여 염기 편집기(예: ABE, CBE)의 발현 손실을 초래하는 염기 편집의 표적이 될 수 있는 서열을 제공한다. 일부 구현예에서, 염기 편집은 인트론 서열의 5' 또는 3' 말단(예를 들어, 스플라이스 공여체 또는 스플라이스 수용체 부위)에서 이루어진다.
타겟 폴리뉴클레오티드의 편집
본 발명의 조성물은 예를 들어 정의된 기간 동안 유전자 편집을 생성하는 데 사용된다. 원하는 수준의 편집에 도달하면 염기 편집기를 암호화하는 폴리뉴클레오티드 서열에 존재하는 인트론의 스플라이스 수용체 또는 공여체 부위를 파괴하여 염기 편집기의 발현이 감소되거나 제거된다.
일반적으로 염기 편집은 대상 세포의 게놈에 치료적 변화를 유도하기 위해 수행된다. 본 발명의 일부 구현예에서, 세포(생체 내 또는 시험관 내)는 2개 이상의 가이드 RNA 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예: Cas9), 데아미나아제(예: 사이티딘 데아미나아제 또는 아데노신 데아미나아제)를 포함하는 핵염기 편집기 폴리펩티드와 접촉된다.
일부 구현예에서, 편집될 세포는 적어도 하나의 핵산 분자와 접촉되는데, 여기서 적어도 하나의 핵산 분자는 2개 이상의 가이드 RNA 및 핵염기 편집기 폴리펩티드를 코딩하고, 이 폴리펩티드는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어, Cas9) 도메인, 데아미나아제(예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인을 포함하며, 핵염기 편집기 폴리펩티드를 코딩하는 핵산 분자의 일부는 스플라이스 수용체 또는 스플라이스 공여체를 포함하는 인트론을 포함한다. 일부 구현예에서, 편집될 세포는 적어도 하나의 핵산 분자와 접촉되는데, 여기서 적어도 하나의 핵산 분자는 2개 이상의 가이드 RNA 및 핵염기 편집기 폴리펩티드를 코딩하며, 이 폴리펩티드는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어 Cas9) 도메인, 사이티딘 데아미나아제 도메인을 포함하며, 핵염기 편집기 폴리펩티드를 코딩하는 핵산 분자의 일부는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다. 일부 구현예에서, 편집될 세포는 적어도 하나의 핵산 분자와 접촉되는데, 여기서 적어도 하나의 핵산 분자는 2개 이상의 가이드 RNA 및 핵염기 편집기 폴리펩티드를 코딩하며, 이 폴리펩티드는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) (예를 들어, Cas9) 도메인, 아데노신 데아미나아제 도메인을 포함하며, 핵염기 편집기 폴리펩티드를 코딩하는 핵산 분자의 일부는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다. 일부 구현예에서, 2개 이상의 가이드 RNA 및 핵염기 편집기 폴리펩티드를 코딩하는 적어도 하나의 핵산 분자는 하나 이상의 벡터(예를 들어, AAV 벡터)에 의해 세포로 전달된다.
일부 구현예에서, 편집될 세포는 2개 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자 및 스플릿 핵염기 편집 폴리펩티드를 코딩하는 적어도 2개의 핵산 분자와 접촉되며, 여기서 하나의 핵산 분자는 스플릿 인테인-N과 융합된 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어, Cas9) 도메인의 N-말단 단편 및 데아미나아제 (예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인을 코딩하며, 여기서 제2 핵산 분자는 스플릿 인테인-C와 융합된 핵산 프로그래밍 가능한 DNA 결합 단백질 (napDNAbp) (예를 들어, Cas9)의 C-말단 단편을 코딩하고, 제1 또는 제2 핵산 분자는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다.
일부 구현예에서, 편집될 세포는 2개 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자 및 스플릿 핵염기 편집기 폴리펩티드를 코딩하는 최소 2개의 핵산 분자와 접촉되며, 여기서 하나의 핵산 분자는 스플릿 인테인-N에 융합된 데아미나아제(예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인의 C-말단 단편을 코딩하고, 여기서 제2 핵산 분자는 스플릿 인테인-C와 융합된 데아미아나제(예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인의 C-말단 단편 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어, Cas9) 도메인을 코딩하고, 제1 또는 제2 핵산 분자는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다.
일부 구현예에서, 2개 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자 및 스플릿 핵염기 편집기 폴리펩티드를 코딩하는 제1 및 제2 핵산 분자는 하나 이상의 벡터(예를 들어, AAV 벡터)에 의해 세포로 전달된다. 일부 구현예에서, 2개 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자 및 스플릿 핵염기 편집기 폴리펩티드를 코딩하는 제1 및 제2 핵산 분자는 각각 별개의 벡터(예를 들어, AAV 벡터)에 의해 세포로 전달된다. 일부 구현예에서, 2개 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자와 스플릿 핵염기 편집기 폴리펩티드를 코딩하는 첫 번째 및 두 번째 핵산 분자는 동일한 벡터(예를 들어, AAV 벡터)에 의해 세포에 전달된다.
일부 구현예에서, 핵염기 편집기 폴리펩티드를 코딩하는 핵산 분자는 링커를 포함한다. 일부 구현예에서, 인트론은 핵염기 편집 폴리펩티드를 코딩하는 핵산 분자의 오픈 리딩 프레임 내에 삽입된다. 일부 구현예에서, 인트론은 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어, Cas9) 도메인, 데아미나아제(예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인, 또는 링커 내에 삽입된다. 일부 구현예에서, 인트론은 프로토스페이서 서열에 근접하게 삽입된다. 일부 구현예에서, 인트론은 프로토스페이서 서열의 약 10 내지 30개 염기쌍 내에 삽입된다. 일부 구현예에서, 프로토스페이서 서열은 NGG 또는 NNGRRT이다. 일부 구현예에서, 인트론의 길이는 약 10개 염기쌍 내지 약 500개 염기쌍 사이이다. 일부 구현예에서, 인트론은 약 70개 염기쌍 내지 150개 염기쌍 사이이다. 일부 구현예에서, 인트론은 약 100개 염기쌍 내지 200개 염기쌍 사이이다.
일부 구현예에서, 2개 이상의 가이드 RNA에는 하나 이상의 가이드 RNA가 포함되며, 이 가이드 RNA는 세포 게놈 내의 특정 위치를 편집하도록 핵염기 편집기 폴리펩티드를 지시하는 하나 이상의 가이드 RNA와 함께, 핵염기 편집기 폴리펩티드를 특정 인트론 내에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는(예를 들어, A에서 G로의 편집 또는 C에서 T로의 편집) 하나 이상의 가이드 RNA가 포함된다. 일부 구현예에서, gRNA는 뉴클레오티드 유사체를 포함한다. 이러한 뉴클레오티드 유사체는 세포 과정에서 gRNA가 분해되는 것을 억제할 수 있다.
다양한 경우에, 스페이서 서열이 5' 및/또는 3' "G" 뉴클레오티드를 포함하는 것이 유리하다. 일부 경우에, 예를 들어 본원에 제공된 임의의 스페이서 서열 또는 가이드 폴리뉴클레오티드는 5' "G"를 포함하거나 추가로 포함하며, 일부 구현예에서 5' "G"는 표적 서열에 상보적이거나 상보적이지 않다. 일부 구현예에서, 5' "G"는 5' "G"를 아직 포함하지 않은 스페이서 서열에 추가된다. 예를 들어, 가이드 RNA가 U6 프로모터 등의 제어 하에 발현될 때 가이드 RNA가 5' 말단 "G"를 포함하는 것이 유리할 수 있는데, 그 이유는 U6 프로모터가 전사 시작 부위에서 "G"를 선호하기 때문이다 (Cong, L. 등 “Multiplex genome engineering using CRISPR/Cas systems. Science 339:819-823 (2013) doi: 10.1126/science.1231143 참고). 일부 경우에, 5' 말단 "G"는 프로모터의 제어 하에 발현될 가이드 폴리뉴클레오티드에 첨가되지만, 가이드 폴리뉴클레오티드가 프로모터의 제어 하에 발현되지 않는 경우 또는 가이드 폴리뉴클레오티드가 발현되지 않을 때에는 임의로 가이드 폴리뉴클레오티드에 첨가되지 않는다.
일부 구현예에서, 본 발명의 염기 편집은 in vivo에서 대상체에 수행된다. 일부 구현예에서, 2개 이상의 가이드 RNA 및 핵염기 편집기 폴리펩티드를 코딩하는 최소 하나의 핵산 분자를 포함하는 하나 이상의 벡터(예를 들어 AAV 벡터)가, in vivo에서 대상체의 세포(예를 들어, A-에서-G 또는 C-에서-T 베이스 편집)로 전달되며, 여기서 핵염기 편집기 폴리펩티드는 핵산 프로그래밍 가능한 DNA 결합 단백질 (napDNAbp)(예를 들어, Cas9) 도메인, 데아미아나제(예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인을 포함하고, 여기서 핵염기 편집기 폴리펩티드를 코딩하는 핵산 분자의 일부는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다.
일부 구현예에서, 핵염기 편집기 폴리펩티드가 세포 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 코딩하는 최소 하나의 핵산 분자, 및 핵산 프로그래밍 가능한 DNA 결합 단백질 (napDNAbp)(예를 들어, Cas9) 도메인, 데아미나아제 (예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인, 및 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함하는 핵염기 편집기 폴리펩티드를 코딩하는 최소 하나의 핵산 분자를 포함하는 하나 이상의 벡터(예를 들어, AAV 벡터)는 세포의 게놈 부위를 편집하기 위해 in vivo에서 대상체 세포에 전달된다. 일부 구현예에서, 대상체에서 원하는 수준의 염기 편집이 달성되면, 하나 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자를 포함하는 하나 이상의 벡터(예를 들어, AAV 벡터)는 in vivo에서 대상체 내 세포로 전달되어 핵염기 편집기 폴리뉴클레오티드의 인트론을 코딩하는 핵산 분자 내에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하는 것을 표적으로 하며, 이렇게 함으로써 핵염기 편집 활동을 줄이거나 제거하여 핵염기 편집기 폴리뉴클레오티드를 자기-불활성화한다.
일부 구현예에서, 두 개 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자 및 스플릿 핵염기 편집기 폴리펩티드를 코딩하는 적어도 두 개의 핵산 분자를 코딩하는 하나 이상의 벡터(예를 들어, AAV 벡터)는 in vivo에서 대상체 내 세포로 전달되며, 여기서 하나의 핵산 분자는 스플릿 인테인-N 및 데아미나아제(예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인과 융합된 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어, Cas9) 도메인의 N-말단 단편을 코딩하며, 제2 핵산 분자는 스플릿 인테인-C와 융합된 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어 Cas9) 도메인의 C-말단 단편을 코딩하며, 제1 또는 제2 핵산 분자 중 하나는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다.
일부 구현예에서, 2개 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자 및 스플릿 핵염기 편집기 폴리펩티드를 코딩하는 적어도 2개의 핵산 분자를 포함하는 하나 이상의 벡터(예를 들어, AAV 벡터)는 in vivo에서 대상체의 세포에 전달되며, 여기서 하나의 핵산 분자는 스플릿 인테인-N에 융합된 데아미나아제(예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인의 N-말단 단편을 코딩하고, 여기서 제2 핵산 분자는 스플릿 인테인-C 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어 Cas9) 도메인에 융합된 데아미나아제 (예를 들어 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인의 C-말단 단편을 코딩하며, 제1 또는 제2 핵산 분자는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다.
일부 구현예에서, 핵염기 편집기 폴리펩티드가 세포의 게놈 내 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자를 포함하는 하나 이상의 벡터(예를 들어, AAV 벡터), 및 스플릿 핵염기 편집기 폴리펩티드를 코딩하는 적어도 2개의 핵산 분자는 in vivo에서 대상체의 세포에 전달되어 세포 게놈 부위를 편집하며, 여기서 하나의 핵산 분자는 스플릿 인테인-N 및 데아미나아제(예를 들어 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인에 융합된 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어 Cas9) 도메인의 N-말단 단편을 코딩하고, 여기서 제2 핵산 분자는 스플릿 인테인-C에 융합된 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어 Cas9) 도메인의 C-말단 단편을 코딩하고, 제1 또는 제2 핵산 분자 중 하나는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다.
일부 구현예에서, 핵염기 편집기 폴리펩티드가 세포 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자를 포함하는 하나 이상의 벡터 (예를 들어, AAV 벡터), 및 스플릿 핵염기 편집기 폴리펩티드를 코딩하는 적어도 2개의 핵산 분자는 in vivo에서 대상체의 세포에 전달되어 세포 게놈 부위를 편집하며, 여기서 하나의 핵산 분자는 스플릿 인테인-C에 융합된 데아미나아제(예를 들어 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인의 N-말단 단편을 코딩하고, 여기서 제2 핵산 분자는 스플릿 인테인-C 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)(예를 들어 Cas9) 도메인에 융합된 데아미나아제(예를 들어 사이티딘 데아미나아제 또는 아데노신 데아미나아제) 도메인의 C-말단 단편을 코딩하며, 제1 또는 제2 핵산 분자 중 하나는 스플라이스 수용체 또는 스플라이스 공여체 부위를 포함하는 인트론을 포함한다.
하나 이상의 벡터(예를 들어, AAV 벡터)가 세포에 전달될 때, 세포는 스플릿 핵염기 편집기 폴리펩티드의 N-말단 및 C-말단 단편을 발현할 것이며, 이는 함께 결합하여 핵염기 편집기 폴리펩티드를 형성할 것이다. 일부 구현예에서, 대상체에서 원하는 수준의 염기 편집이 달성되면, 하나 이상의 가이드 RNA를 코딩하는 적어도 하나의 핵산 분자를 포함하는 하나 이상의 벡터(예를 들어, AAV 벡터)는 in vivo에서 대상체 내 세포로 전달되어 핵염기 편집기 폴리뉴클레오티드의 인트론을 코딩하는 핵산 분자에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집(예를 들어 A에서 G로의 또는 G에서 T로의 염기 편집)하는 것을 표적으로 하며, 이렇게 함으로써 핵염기 편집 활동을 줄이거나 제거하여 핵염기 편집기 폴리뉴클레오티드를 자기-불활성화한다.
본 발명은 예를 들어, 본원에 제공된 바와 같은 스플릿 인테인 염기 편집기 시스템을 함유하는 2개의 AAV 벡터를 투여함으로써 관심 SNP가 있는 질병을 앓고 있는 환자를 치료하는 방법을 제공한다. 일부 구현예에서, AAV 벡터는 각각 염기 편집기의 일부를 코딩한다: 인테인-N에 융합된 N-말단 부분 및 인테인-C에 융합된 C-말단 부분. 염기 편집기의 두 부분 중 하나 이상의 코딩 서열에 코딩된 것은 인트론 서열이다. 일부 구현예에서, SNP를 표적으로 하는 가이드 RNA도 AAV 벡터 중 하나에 포함된다. 일부 구현예에서, AAV 벡터는 질병에 걸린 세포, 조직 또는 기관과 관련된 향성을 갖는다(예를 들어, AAV 벡터는 단일 혈청형(single serotype)이다).
세포가 염기 편집 시스템의 두 AAV 벡터에 감염되면 염기 편집기의 두 부분을 코딩하는 전사물이 발현되고 인트론이 절단된다. 두 반쪽의 폴리펩티드가 발현되면 염기 편집기는 스플릿 인테인 태그를 통해 세포 내에서 단백질 접합에 의해 재구성된다. 일부 구현예에서, 염기 편집이 발생하도록 일정 기간 동안 염기 편집을 수행한 후, 세포의 염기 편집기와 함께 인트론에서 공여체 또는 수용체 스플라이스 부위를 표적으로 하는 가이드 RNA를 코딩하는 제3 AAV가 제공된다. 이 AAV가 염기 편집기를 발현하는 세포를 감염시키면 스플라이싱이 발생하지 않도록 스플라이스 부위를 변경한다. 염기 편집기의 일부가 적절하게 발현되지 못하기 때문에 온-타겟 및 오프-타겟 부위를 포함하여 세포 내에서 염기 편집이 불활성화되거나 약화된다. 본 발명은 또한 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론을 표적으로 하는 가이드 RNA를 제공한다. 표 1A는 인트론 수용체 또는 공여체 부위를 표적으로 하는 gRNA에 사용되는 표적 인트론 서열을 제공한다.
표 1A: 예시적 표적 인트론 서열
표 1B는 인트론 수용체 또는 공여체 부위를 표적화하기 위한 gRNA 서열을 제공한다. 일부 구현예에서, gRNA 서열은 U6 프로모터로부터 발현된다. 아래 표 1B에서 소문자 “g”는 표적 서열에 대한 5' 미스매치를 나타낸다.
표 1B. 예시적 gRNA 서열. 소문자 “”는 표적 서열에 대한 5' 미스매치를 나타낸다.
일부 구현예에서, 데아미나아제 도메인은 TadA 도메인이다. 일부 구현예에서, 인트론은 TadA의 코돈 내부 또는 바로 뒤에 삽입된다. 일부 구현예에서, 인트론은 TadA의 코돈 18, 23, 59, 62, 87 또는 129 내부 또는 바로 뒤에 삽입된다. 일부 구현예에서, 인트론은 TadA의 코돈 87 바로 뒤에 삽입된다.
아래 표 1C는 TadA 오픈 리딩 프레임에 인트론을 삽입하기 위한 표적 서열좌를 제공한다(예를 들어, c.100+1은 인트론 서열의 첫 번째 염기쌍이 TadA의 100번째 코딩 뉴클레오티드 바로 뒤에 있다는 것을 나타낸다). 따라서, 일부 구현예에서, 인트론 서열은 명명된 아미노산 위치 바로 뒤에 위치한다. 다른 구현예에서, 인트론 서열은 명명된 아미노산 위치 바로 앞에 위치한다.
표 1C. 예시적 표적 인트론 서열좌
핵염기 편집기
폴리뉴클레오티드의 표적 뉴클레오티드 서열을 편집, 변형 또는 변경하는 핵염기 편집기(예를 들어 자기-불활성화 핵염기 편집기)가 본원에 기재된 방법 및 조성물에 유용하다. 본원에 기재된 핵염기 편집기는 전형적으로 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 및 핵염기 편집 도메인(예를 들어, 아데노신 데아미나아제 또는 사이티딘 데아미나아제)을 포함한다. 결합된 가이드 폴리뉴클레오티드(예를 들어, gRNA)와 함께 결합될 때, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 표적 폴리뉴클레오티드 서열에 특이적으로 결합할 수 있고, 이에 의해 염기 편집기를 편집하고자 하는 표적 핵산 서열에 국재화할 수 있다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 인트론에 존재한다 (예를 들어 스플라이스 수용체 또는 스플라이스 공여체 부위).
특정 구현예에서, 본원에 제공된 핵염기 편집기는 염기 편집 활성을 개선시키는 하나 이상의 특성을 포함한다. 예를 들어, 본원에 제공된 임의의 핵염기 편집기는 감소된 뉴클레아제 활성을 갖는 Cas9 도메인을 포함할 수 있다. 일부 구현예에서, 본원에 제공된 임의의 핵염기 편집기는 뉴클레아제 활성을 갖지 않는 Cas9 도메인(dCas9), 또는 Cas9 니카아제(nCas9)로 지칭되는 듀플렉스된 DNA 분자의 한 가닥을 절단하는 Cas9 도메인을 가질 수 있다. 임의의 특정 이론에 얽매이지 않고, 촉매 잔기(예를 들어, H840)의 존재는 표적화된 핵염기 반대편의 비-편집된(예를 들어, 비-탈아미노화된) 가닥을 절단하기 위해 Cas9의 활성을 유지한다. 촉매 잔기 (예를 들어, D10에서 A10으로의)의 돌연변이는 표적화된 잔기(예를 들어, A 또는 C)를 함유하는 편집된(예를 들어, 탈아민화된) 가닥의 절단을 방지한다. 이러한 Cas9 변이체는 gRNA-정의된 표적 서열에 기반한 특이적 위치에서 단일-가닥 DNA 절단(닉)을 생성하여, 비-편집된 가닥의 복구를 야기하고, 궁극적으로 비-편집된 가닥 상의 핵염기 변화를 초래할 수 있다.
폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인
폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드(예를 들어, RNA, DNA)에 결합한다. 일부 구현예에서, 인트론은 염기 편집기의 뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 코딩하는 오픈 리딩 프레임에 존재한다. 염기 편집기의 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 그 자체로 하나 이상의 도메인(예를 들어, 하나 이상의 뉴클레아제 도메인)을 포함할 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 뉴클레아제 도메인은 엔도뉴클레아제 또는 엑소뉴클레아제를 포함할 수 있다. 엔도뉴클레아제는 이중-가닥 핵산의 단일 가닥 또는 이중-가닥 핵산 분자의 양쪽 가닥을 절단할 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 뉴클레아제 도메인은 표적 폴리뉴클레오티드의 0, 1, 또는 2개의 가닥을 절단할 수 있다.
염기 편집기 내로 혼입될 수 있는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 비제한적인 예는 CRISPR 단백질-유래 도메인, 제한 뉴클레아제, 메가뉴클레아제, TAL 뉴클레아제(TALEN), 및 아연 핑거 뉴클레아제(ZFN)를 포함한다. 일부 구현예에서, 염기 편집기는 결합된 가이드 핵산을 통해 핵산의 CRISPR(즉, 클러스터링된 규칙적 간격의 짧은 회문 반복부)-매개 변형 동안 핵산 서열에 결합할 수 있는 천연 또는 변형된 단백질 또는 이의 부분을 포함하는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함한다. 이러한 단백질은 본원에서 "CRISPR 단백질"로 지칭된다. 따라서, 본원에는 CRISPR 단백질의 전부 또는 부분을 포함하는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함하는 염기 편집기(즉, 염기 편집기의 "CRISPR 단백질-유래 도메인"으로도 지칭되는 CRISPR 단백질의 전부 또는 부분을 도메인으로 포함하는 염기 편집기)가 개시되어 있다. 염기 편집기 내로 혼입된 CRISPR 단백질-유래 도메인은 CRISPR 단백질의 야생형 또는 천연 버전과 비교하여 변형될 수 있다. 예를 들어, 하기 기재된 바와 같이 CRISPR 단백질-유래 도메인은 CRISPR 단백질의 야생형 또는 천연 버전에 비해 하나 이상의 돌연변이, 삽입, 결실, 재배열 및/또는 재조합을 포함할 수 있다.
본원에 사용될 수 있는 Cas 단백질은 클래스 1 및 클래스 2를 포함한다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas9(Csn1 또는 Csx12로도 공지됨), Cas10, Csy1, Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx1S, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, Cas12a/Cpf1, Cas12b/C2c1(예를 들어, 서열번호: 320), Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 및 Cas12j/CasΦCARF, DinG, 이의 상동체, 또는 이의 변형된 버전을 포함한다. CRISPR 효소는 표적 서열 내에서 및/또는 표적 서열의 상보체 내에서와 같은 표적 서열에서 하나 또는 두 가닥의 절단을 지시할 수 있다. 예를 들어, CRISPR 효소는 표적 서열의 첫번째 또는 마지막 뉴클레오티드로부터 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 개 이상의 염기 쌍 내에서 하나 또는 두 가닥의 절단을 지시할 수 있다.
돌연변이된 CRISPR 효소가 표적 서열을 함유하는 표적 뉴클레오티드의 하나 또는 두 가닥을 절단하는 능력이 결여되도록 상응하는 야생형 효소에 대해 돌연변이된 CRISPR 효소를 암호화하는 벡터가 사용될 수 있다. Cas 단백질(예를 들어, Cas9, Cas12) 또는 Cas 도메인(예를 들어, Cas9, Cas12)은 예시적인 야생형 Cas 폴리펩티드 또는 Cas 도메인에 대해 적어도 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 상동성 및/또는 서열 호몰로지(homology)를 갖는 폴리펩티드 또는 도메인을 지칭할 수 있다. Cas(예를 들어, Cas9, Cas12)는 아미노산 변화, 예컨대 결실, 삽입, 치환, 변이체, 돌연변이, 융합, 키메라, 또는 이들의 임의의 조합을 포함할 수 있는 Cas 단백질의 야생형 또는 변형된 형태를 지칭할 수 있다.
일부 구현예에서, 염기 편집기의 CRISPR 단백질-유래 도메인은 코리네박테리움 울세란스(Corynebacterium ulcerans)(NCBI Refs: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아(Corynebacterium diphtheria)(NCBI Refs: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라(Spiroplasma syrphidicola)(NCBI Ref: NC_021284.1); 프레보텔라 인테르메디아(Prevotella intermedia)(NCBI Ref: NC_017861.1); 스피로플라스마 타이와넨세(Spiroplasma taiwanense)(NCBI Ref: NC_021846.1); 스트렙토코쿠스 이니에(Streptococcus iniae)(NCBI Ref: NC_021314.1); 벨리엘라 발티카(Belliella baltica)(NCBI Ref: NC_018010.1); 사이크로플렉수스 토르퀴스(Psychroflexus torquis)(NCBI Ref: NC_018721.1); 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) (NCBI Ref: YP_820832.1); 리스테리아 이노쿠아(Listeria innocua)(NCBI Ref: NP_472073.1); 캄필로박터 제주니(Campylobacter jejuni)(NCBI Ref: YP_002344900.1); 네이세리아 메닌자이티디스(Neisseria meningitidis)(NCBI Ref: YP_002342100.1), 스트렙토코쿠스 파이오게네스, 또는 스타필로코쿠스 아우레우스로부터의 Cas9의 전부 또는 부분을 포함할 수 있다.
Cas9 뉴클레아제 서열 및 구조는 당업자에게 잘 알려져 있다(예를 들어, "Complete genome sequence of an Ml strain of Streptococcus pyogenes." Ferretti 등, Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., 등, Nature 471:602-607 (2011); 및 "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., 등, Science 337:816-821(2012)을 참조하며, 각각의 전체 내용이 본원에 참조로 포함된다). Cas9 오솔로그는 에스. 파이오게네스 및 에스. 써모필루스를 포함하지만 이에 제한되지 않는 다양한 종에 기재되었다. 추가적인 적합한 Cas9 뉴클레아제 및 서열은 본 개시내용에 기초하여 당업자에게 명백할 것이며, 이러한 Cas9 뉴클레아제 및 서열은 Chylinski, Rhun, 및 Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5, 726-737에 개시된 유기체 및 유전자좌로부터의 Cas9 서열을 포함하며; 상기 문헌의 전체 내용이 본원에 참조로 포함된다.
고충실도 Cas9 도메인(High Fidelity Cas9 Domains)
본 개시내용의 일부 측면은 고충실도 Cas9 도메인을 제공한다. 고충실도 Cas9 도메인은 해당 분야에 알려져 있으며, 예를 들어 Kleinstiver, B.P., 등 “CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.”Nature 529, 490-495 (2016); and Slaymaker, I.M., 등 “Rationally engineered Cas9 nucleases with improved specificity.”Science 351, 84-88 (2015)에 기재되어 있고; 각각의 전체 내용은 본 문서에 참조로 포함된다. 예시적인 고충실도 Cas9 도메인은 서열 목록에 서열번호 321로 제공된다. 일부 구현예에서, 고충실도 Cas9 도메인은, 상응하는 야생형 Cas9 도메인에 비하여, Cas9 도메인과 당-인산염 백본 사이의 정전기적 상호작용을 감소시키는 하나 이상의 돌연변이를 포함하는 조작된 Cas9 도메인이다.
DNA의 당-인산 백본과의 정전기적 상호작용이 감소된 고충실도 Cas9 도메인은 오프-타겟 효과가 적다. 일부 구현예에서, Cas9 도메인(예를 들어, 야생형 Cas9 도메인(서열 번호: 250 및 253))은 Cas9 도메인과 DNA의 당-인산염 백본 사이의 연관성을 감소시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, Cas9 도메인은 Cas9 도메인과 DNA의 당-인산 골격 사이의 결합을 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 최소 5%, 최소 10%, 최소 15%, 최소 20%, 최소 25%, 최소 30%, 최소 35%, 최소 40%, 최소 45%, 최소 50%, 최소 55%, 최소 60%, 최소 65% 또는 최소 70% 감소시키는 하나 이상의 돌연변이를 포함한다.
일부 구현예에서, 본 명세서에 제공된 Cas9 융합 단백질 중 어느 것은 D10A, N497X, R661X, Q695X 및/또는 Q926X 돌연변이 중 하나 이상, 또는 본 명세서에 제공된 아미노산 서열 중 어느 것에 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, 고충실도 Cas9 효소는 SpCas9(K855A), eSpCas9(1.1), SpCas9-HF1, 또는 초정밀(hyper accurate) Cas9 변이체(HypaCas9)이다. 일부 구현예에서, 변형된 Cas9 eSpCas9(1.1)은 HNH/RuvC 그루브(groove)와 비표적 DNA 가닥 사이의 상호작용을 약화시켜 가닥 분리를 방지하고 오프-타겟 부위에서 절단하는 알라닌 치환을 함유한다. 마찬가지로 SpCas9-HF1은 Cas9와 DNA 인산염 백본의 상호 작용을 방해하는 알라닌 치환을 통해 오프-타겟 편집을 낮춘다. HypaCas9는 Cas9 교정 및 표적 차별을 증가시키는 REC3 도메인의 돌연변이(SpCas9 N692A/M694A/Q695A/H698A)를 포함한다. 세 가지 고충실도 효소는 모두 야생형 Cas9보다 오프-타겟 편집을 덜 생성한다.
독점성이 감소된 Cas9 도메인(Cas9 domains with Reduced Exclusivity)
일반적으로 에스. 파이오게네스(S. pyogenes)의 Cas9(spCas9)와 같은 Cas9 단백질은 "프로토스페이서 인접 모티프(PAM)" 또는 PAM 유사 모티프가 필요하며, 이는 CRISPR 박테리아 적응성 면역(adaptive immune) 시스템에서 Cas9 뉴클레아제가 목표로 하는 DNA 서열 바로 뒤에 나타나는 2-6 염기쌍 DNA 서열로 되어 있다. 특정 핵산 영역을 결합하려면 NGG PAM 서열의 존재가 필요하며, 여기서 "NGG"의 "N"은 아데노신(A), 티미딘(T) 또는 사이토신(C)이고 G는 구아노신이다. 이는 게놈 내에서 원하는 염기를 편집하는 능력을 제한할 수 있다. 일부 구현예에서, 본 문서에 제공된 염기 편집 융합 단백질은 정확한 위치, 예를 들어 PAM의 상류에 있는 표적 염기를 포함하는 영역에 배치되는 것이 필요할 수 있다. 예를 들어 Komor, A.C., 등 “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533, 420-424 (2016)를 참조할 수 있고, 이는 전체 내용이 여기에 참조로 포함된다.
PAM 서열에 결합할 수 있는 spCas9 단백질에 대한 예시적인 폴리펩티드 서열은 서열 목록에 서열 번호: 250, 254, 및 322-325로 제공된다. 따라서, 일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 표준(canonical)(예를 들어, NGG) PAM 서열을 포함하지 않는 뉴클레오티드 서열에 결합할 수 있는 Cas9 도메인을 포함할 수 있다. 비표준(non-canonical) PAM 서열에 결합하는 Cas9 도메인은 당업계에 기술되어 있으며 당업자에게는 명백할 것이다. 예를 들어, 비표준 PAM 서열에 결합하는 Cas9 도메인은 Kleinstiver, B. P., 등 “Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523, 481-485 (2015); and Kleinstiver, B. P., 등 “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology 33, 1293-1298 (2015)에 기재되어 있으며; 각각의 전체 내용은 여기에 참조로 포함된다.
니카아제(Nickases)
일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 니카아제 도메인을 포함할 수 있다. 본 명세서에서 용어 "니카아제"는 듀플렉스된 핵산 분자 (예를 들어 DNA)에서 두 가닥 중 한 가닥만 절단할 수 있는 뉴클레아제 도메인을 포함하는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 의미한다. 일부 구현예에서, 니카아제는 활성 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인에 하나 이상의 돌연변이를 도입함으로써 완전히 촉매적으로 활성인(예를 들어, 천연) 형태의 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인으로부터 유래될 수 있다. 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인이 Cas9로부터 유래된 니카아제 도메인을 포함하는 경우, Cas9 유래 니카아제 도메인은 위치 840에 D10A 돌연변이 및 히스티딘을 포함할 수 있다. 이러한 구현예에서, 잔기 H840은 촉매 활성을 유지하여 듀플렉스된 핵산 단일 가닥이 절단될 수 있다. 또 다른 예에서, Cas9 유래 니카아제 도메인은 H840A 돌연변이를 포함할 수 있는 반면, 위치 10의 아미노산 잔기는 D로 유지된다. 일부 구현예에서, 니카아제 도메인은 니카아제 활성에 필요하지 않은 뉴클레아제 도메인의 전부 또는 일부를 제거함으로써 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 형태인 완전히 촉매적으로 활성인(예를 들어, 천연) 형태의 니카아제로부터 유래될 수 있다. 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인이 Cas9로부터 유래된 니카아제 도메인을 포함하는 경우, Cas9 유래 니카아제 도메인은 RuvC 도메인 또는 HNH 도메인의 전부 또는 일부의 결실을 포함할 수 있다.
일부 구현예에서, 야생형 Cas9은 다음 아미노산 서열에 상응하거나 이를 포함한다:
(서열번호: 250) (밑줄: HNH 도메인, 이중 밑줄: RuvC 도메인)
일부 구현예에서, 니카아제 도메인(예를 들어, Cas9-유래 니카아제 도메인, Cas12-유래 니카아제 도메인)을 포함하는 염기 편집기에 의해 절단되는 듀플렉스된 핵산 표적 폴리뉴클레오티드 서열의 가닥은 염기 편집기 (즉, 염기 편집기에 의해 절단되는 가닥이 편집될 염기를 포함하는 가닥의 반대편에 있음)에 의해 편집되지 않는 가닥이다. 다른 구현예에서, 니카아제 도메인(예를 들어, Cas9-유래 니카아제 도메인, Cas12-유래 니카아제 도메인)을 포함하는 염기 편집기는 편집을 위해 표적화되는 DNA 분자의 가닥을 절단할 수 있다. 이러한 구현예에서, 비표적화 가닥은 절단되지 않는다.
일부 구현예에서, Cas9 뉴클레아제는 비활성(예를 들어, 비활성화) DNA 절단 도메인을 갖고, 즉 Cas9는 "nCas9" 단백질("니카아제" Cas9의 경우)로 지칭되는 니카아제이다. Cas9 니카아제는 듀플렉스된 핵산 분자(예를 들어, 듀플렉스된 DNA 분자)의 단지 하나의 가닥을 절단할 수 있는 Cas9 단백질일 수 있다. 일부 구현예에서, Cas9 니카아제는 듀플렉스된 핵산 분자의 표적 가닥을 절단하며, 이는 Cas9 니카아제가 Cas9에 결합된 gRNA(예를 들어, sgRNA)에 염기 쌍을 이루는 (상보적으로) 연결된 가닥을 절단함을 의미한다. 일부 구현예에서, Cas9 니카아제는 D10A 돌연변이를 포함하고 위치 840에서 히스티딘을 갖는다
일부 구현예에서, Cas9 니카아제는 듀플렉스된 핵산 분자의 비표적, 비-염기 편집 가닥을 절단하는데, 이는 Cas9 니카아제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)와 염기 쌍을 이루지 않은 가닥을 절단한다는 것을 의미한다. 일부 구현예에서, Cas9 니카아제는 H840A 돌연변이를 포함하고 위치 10에 아스파르트산 잔기 또는 상응하는 돌연변이를 갖는다. 일부 구현예에서 Cas9 니카아제는 본원에 제공된 Cas9 니카아제 중 어느 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 이상, 적어도 96% 이상, 적어도 97% 이상, 적어도 98% 이상, 적어도 99% 이상 또는 적어도 99.5% 이상 상동성이 있는 아미노산 서열을 포함한다. 추가의 적합한 Cas9 니카아제는 본 개시내용 및 해당 분야의 지식에 기초하여 당업자에게 명백할 것이며, 본 개시내용의 범위 내에 있다.
예시적인 촉매적 Cas9 니카아제(nCas9)의 아미노산 서열은 다음과 같다:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD (서열번호: 254).
Cas9 뉴클레아제에는 RuvC와 HNH라는 두 가지 기능성 엔도뉴클레아제 도메인이 있다. Cas9는 표적 DNA의 반대 가닥을 절단하기 위해 뉴클레아제 도메인을 위치시키는 표적 결합 시 형태 변화를 겪는다. Cas9 매개 DNA 절단의 최종 결과는 표적 DNA(PAM 서열 상류의 ~3-4 뉴클레오티드) 내의 이중-가닥 파손(double-strand break, DSB)이다. 생성된 DSB는 다음 두 가지 일반적인 복구 경로 중 하나에 의해 복구된다. (1) 효율적이지만 오류가 발생하기 쉬운 NHEJ(비-동종 말단 결합, non-homologous end joining) 경로; 또는 (2) 덜 효율적이지만 고충실도의 HDR(상동성 지시 복구, homology directed repair) 경로.
NHEJ 및/또는 HDR의 “효율성”은 편리한 방법으로 계산할 수 있다. 예를 들어, 일부 구현예에서, 효율성은 성공적 HDR의 백분율로 표시될 수 있다. 예를 들어, 서베이어 뉴클레아제 분석(surveyor nuclease assay)을 이용하여 절단 생성물을 생성할 수 있고, 생성물 대 기질의 비율을 사용하여 백분율을 계산할 수 있다. 예를 들어, 성공적인 HDR의 결과로 새로 혼입된 제한 서열(integrated restriction sequence)를 포함하는 DNA를 직접 절단하는 서베이어 뉴클레아제 효소를 사용할 수 있다. 더 많이 절단된 기질은 더 높은 HDR 비율(HDR 효율성이 더 높음)을 나타낸다. 예시적 예로서, HDR의 분율(백분율)은 다음 식 [(절단 생성물(cleavage products))/(기질+절단 생성물(substrate plus cleavage products))] (예를 들어, (b+c)/(a+b+c), 여기서 “”는 DNA 기질의 밴드 강도이고, “”및 “”는 절단 생성물이다)으로 계산될 수 있다.
일부 구현예에서, 효율성은 성공적인 NHEJ의 백분율로 표현될 수 있다. 예를 들어, T7 엔도뉴클레아제 I 분석을 사용하여 절단 생성물을 생성할 수 있으며 생성물 대 기질의 비율을 사용하여 NHEJ 비율을 계산할 수 있다. T7 엔도뉴클레아제 I은 야생형 및 돌연변이 DNA 가닥의 혼성화로 인해 발생하는 미스매치된 이종성 이중 DNA를 절단한다(NHEJ는 오리지널 절단 부위에서 작은 무작위 삽입(random insertions) 또는 삭제(deletions, 인델)를 생성한다). 절단이 많을수록 NHEJ 비율이 높아진다(NHEJ 효율성이 높아짐). 예시적인 예로서, NHEJ의 비율(백분율)은 다음 식을 사용하여 계산할 수 있다: (1-(1-(b+c)/(a+b+c))1/2)×100, 여기서 "a "는 DNA 기질의 밴드 강도이고 "b"와 "c"는 절단 생성물이다 (Ran 등Cell. 2013 Sep. 12; 154(6):1380-9; and Ran et al., Nat Protoc. 2013 Nov.; 8(11): 2281-2308).
NHEJ 복구 경로는 가장 활동적인 복구 메커니즘이며 DSB 부위에서 작은 뉴클레오티드 삽입 또는 삭제(인델)를 자주 유발한다. NHEJ-매개 DSB 복구의 무작위성(randomness)은 Cas9 및 gRNA 또는 가이드 폴리뉴클레오티드를 발현하는 세포 집단이 다양한 돌연변이 배열을 초래할 수 있기 때문에 중요한 실제적 의미를 갖는다. 대부분의 구현예에서, NHEJ는 표적 유전자의 오픈 리딩 프레임(ORF) 내의 조기 종결 코돈을 초래하는 아미노산 결실, 삽입 또는 프레임이동 돌연변이를 초래하는 표적 DNA의 작은 삽입결실을 발생시킨다. 이상적인 최종 결과는 표적 유전자 내의 기능 상실 돌연변이(loss-of-function mutation)이다.
NHEJ 매개 DSB 복구는 종종 유전자의 개방형 판독 프레임을 방해하는 반면, HDR은 단일 뉴클레오티드 변화부터 형광단 또는 태그 추가와 같은 대규모 삽입에 이르기까지 특정 뉴클레오티드 변화를 생성하는 데 사용될 수 있다.
유전자 편집을 위해 HDR을 활용하기 위해, 원하는 서열을 포함하는 DNA 복구 템플릿을 gRNA 및 Cas9 또는 Cas9 니카아제와 함께 관심 세포 유형으로 전달할 수 있다. 복구 템플릿에는 원하는 편집 내용과 표적의 바로 상류 및 하류에 있는 추가 상동성 서열(왼쪽 및 오른쪽 상동성 암(left & right homology arms)이라고 함)이 포함될 수 있다. 각 상동성 암의 길이는 도입되는 변화의 크기에 따라 달라질 수 있으며, 더 큰 삽입에는 더 긴 상동성 암이 필요하다. 복구 템플릿은 단일-가닥 올리고뉴클레오티드, 이중-가닥 올리고뉴클레오티드 또는 이중-가닥 DNA 플라스미드일 수 있다. HDR의 효율성은 Cas9, gRNA 및 외인성 복구 템플릿을 발현하는 세포에서도 일반적으로 낮다(변형된 대립유전자의 <10%). HDR은 세포 주기의 S 및 G2 단계에서 발생하므로 세포를 동기화함으로써 HDR의 효율성을 향상시킬 수 있다. NHEJ와 관련된 유전자를 화학적으로 또는 유전적으로 억제하는 것도 HDR 빈도를 증가시킬 수 있다.
일부 구현예에서, Cas9는 변형된 Cas9이다. 주어진 gRNA 표적화 서열은 부분적 상동성이 존재하는 게놈 전반에 걸쳐 추가적인 부위를 가질 수 있다. 이들 부위는 오프-타겟이라 불리며 gRNA를 설계할 때 고려되어야 한다. gRNA 설계를 최적화하는 것 외에도, CRISPR 특이성은 또한 Cas9에 대한 변형을 통해 증가될 수 있다. Cas9는 2 개의 뉴클레아제 도메인인 RuvC 및 HNH의 조합된 활성을 통해 이중-가닥 절단(DSB)을 생성한다. SpCas9의 D10A 돌연변이체인 Cas9 니카아제는 하나의 뉴클레아제 도메인을 보유하고 DSB보다 DNA 닉을 생성한다. 니카아제 시스템은 또한 특이적 유전자 편집을 위해 HDR-매개 편집과 조합될 수 있다.
촉매적 사멸 뉴클레아제
또한 본원에는 촉매적으로 사멸(즉, 표적 폴리뉴클레오티드 서열을 절단할 수 없는) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함하는 염기 편집기가 제공된다. 본원에서 용어 "촉매적으로 사멸된" 및 "뉴클레아제 사멸된"은 핵산의 가닥을 절단할 수 없는 능력을 초래하는 하나 이상의 돌연변이 및/또는 결실을 갖는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 지칭하기 위해 상호교환가능하게 사용된다. 일부 구현예에서, 촉매적으로 사멸된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 염기 편집기는 하나 이상의 뉴클레아제 도메인에서 특이적 점 돌연변이의 결과로서 뉴클레아제 활성이 결여될 수 있다. 예를 들어, Cas9 도메인을 포함하는 염기 편집기의 경우, Cas9는 D10A 돌연변이 및 H840A 돌연변이 둘 모두를 포함할 수 있다. 이러한 돌연변이는 뉴클레아제 도메인 둘 모두를 비활성화하여, 뉴클레아제 활성의 손실을 초래한다. 다른 구현예에서, 촉매적으로 사멸된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 촉매 도메인(예를 들어, RuvC1 및/또는 HNH 도메인)의 전부 또는 부분의 하나 이상의 결실을 포함할 수 있다. 추가 구현예에서, 촉매적으로 사멸된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 점 돌연변이(예를 들어, D10A 또는 H840A) 뿐만 아니라 뉴클레아제 도메인의 전부 또는 부분의 결실을 포함한다. dCas9 도메인은 당업계에 공지되어 있고, 예를 들어 Qi 등, "Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression." Cell. 2013; 152(5):1173-83에 기재되어 있으며, 이의 전체 내용은 여기에 참조로 포함된다.
추가의 적합한 뉴클레아제-비활성 dCas9 도메인은 본 개시내용 및 당해 분야의 지식에 기초하여 당업자에게 명백할 것이며, 본 개시내용의 범주 내에 있다. 이러한 추가의 예시적인 적합한 뉴클레아제-비활성 Cas9 도메인은 D10A/H840A, D10A/D839A/H840A, 및 D10A/D839A/H840A/N863A 돌연변이체 도메인을 포함하지만 이에 제한되지 않는다(예를 들어, Prashant 등, CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838을 참조하며, 이의 전체 내용은 여기에 참조로 포함된다).
일부 구현예에서, dCas9는 Cas9 뉴클레아제 활성을 불활성화하는 하나 이상의 돌연변이를 갖는 Cas9 아미노산 서열에 상응하거나, 부분적으로 또는 전체적으로 포함한다. 일부 구현예에서, 뉴클레아제-비활성 dCas9 도메인은 본원에 제시된 아미노산 서열의 D10X 돌연변이 및 H840X 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산 변화이다. 일부 구현예에서, 뉴클레아제-불활성 dCas9 도메인은 본원에 제시된 아미노산 서열의 D10A 돌연변이 및 H840A 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함한다. 일 구현예에서, 뉴클레아제-불활성 Cas9 도메인은 클로닝 벡터 pPlatTET-gRNA2(수탁 번호 BAV54124)에 제시된 아미노산 서열을 포함한다.
일부 구현예에서, 변이체 Cas9 단백질은 가이드 표적 서열의 상보적 가닥을 절단할 수 있지만 이중 가닥 가이드 표적 서열의 비-상보적 가닥을 절단하는 능력은 감소된다. 예를 들어, 변이체 Cas9 단백질은 RuvC 도메인의 기능을 감소시키는 돌연변이(아미노산 치환)을 가질 수 있다. 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 D10A(아미노산 위치 10에서 아스파르테이트를 알라닌으로)를 가지며 따라서 이중 가닥 가이드 표적 서열의 상보적 가닥을 절단할 수 있지만 이중 가닥 가이드 표적 서열의 비-상보적 가닥을 절단하는 능력은 감소된다(따라서 변이체 Cas9 단백질이 이중 가닥 표적 핵산을 절단할 때 이중 가닥 절단(DSB) 대신에 단일 가닥 절단(SSB)을 초래한다)(예를 들어, Jinek 등, Science. 2012 Aug. 17; 337(6096):816-21 참조).
일부 구현예에서, 변이체 Cas9 단백질은 이중 가닥 가이드 표적 서열의 비-상보적 가닥을 절단할 수 있지만 가이드 표적 서열의 상보적 가닥을 절단하는 능력은 감소된다. 예를 들어, 변이체 Cas9 단백질은 HNH 도메인(RuvC/HNH/RuvC 도메인 모티프)의 기능을 감소시키는 돌연변이(아미노산 치환)를 가질 수 있다. 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 H840A(아미노산 위치 840에서 히스티딘을 알라닌으로) 돌연변이를 가지며 따라서 가이드 표적 서열의 비-상보적 가닥을 절단할 수 있지만 가이드 표적 서열의 상보적 가닥을 절단하는 능력은 감소된다(따라서 변이체 Cas9 단백질이 이중 가닥 가이드 표적 서열을 절단할 때 DSB 대신에 SSB를 초래한다). 이러한 Cas9 단백질은 가이드 표적 서열(예를 들어, 단일 가닥 가이드 표적 서열)을 절단하는 능력이 감소되지만 가이드 표적 서열(예를 들어, 단일 가닥 가이드 표적 서열)을 결합하는 능력은 보유한다.
또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 W476A 및 W1126A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 보유한다.
또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 P475A, W476A, N477A, D1125A, W1126A, 및 D1127A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 보유한다.
또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 H840A, W476A, 및 W1126A, 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 보유한다. 또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 H840A, D10A, W476A, 및 W1126A, 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 보유한다. 일부 구현예에서, 변이체 Cas9는 Cas9 HNH 도메인의 위치 840에서 촉매 His 잔기를 복원하였다(A840H).
또 다른 비제한적인 예로, 일부 구현예에서, 변이체 Cas9 단백질은 H840A, P475A, W476A, N477A, D1125A, W1126A 및 D1127A 돌연변이를 가지고 있고, 따라서 DNA를 절단하는 능력이 감소된다. 이러한 Cas9 단백질은 표적 DNA (예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력은 감소하지만 표적 DNA (예를 들어, 단일 가닥 표적 DNA)에 결합하는 능력은 유지한다. 또 다른 비제한적인 예로서, 일부 구현예에서, 변이체 Cas9 단백질은 D10A, H840A, P475A, W476A, N477A, D1125A, W1126A, 및 D1127A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소되지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 결합하는 능력은 보유한다. 일부 구현예에서, 변이체 Cas9 단백질이 W476A 및 W1126A 돌연변이를 보유하거나 또는 변이체 Cas9 단백질이 P475A, W476A, N477A, D1125A, W1126A, 및 D1127A 돌연변이를 보유할 때, 변이체 Cas9 단백질은 PAM 서열에 효율적으로 결합하지 않는다. 따라서, 따라서, 일부 이러한 경우에, 이러한 변이체 Cas9 단백질이 결합 방법에 사용될 때, 상기 방법은 PAM 서열이 필요하지 않다. 다시 말해서, 일부 구현예에서, 이러한 변이체 Cas9 단백질이 결합 방법에 사용될 때, 상기 방법은 가이드 RNA를 포함할 수 있지만, 상기 방법은 PAM 서열의 부재 하에 수행될 수 있다(그리고 따라서 결합의 특이성은 가이드 RNA의 표적화 분절에 의해 제공된다). 다른 잔기가 돌연변이되어 상기 효과를 달성할 수 있다(즉, 하나 또는 다른 뉴클레아제 부분을 비활성화시킨다). 비제한적인 예로서, 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, 및/또는 A987은 변경(즉, 치환)될 수 있다. 또한, 알라닌 치환 이외의 돌연변이가 적합하다. 일부 구현예에서, 변이체 Cas9 단백질 (예를 들어, Cas9 단백질이 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, 및/또는 A987 돌연변이를 갖는, 예를 들어 D10A, G12A, G17A, E762A, H840A, N854A, N863A, H982A, H983A, A984A, 및/또는 D986A일 때)은 감소된 촉매 활성을 가지며, 변이체 Cas9 단백질은 부위-특이적으로 표적 DNA에 여전히 결합할 수 있다 (왜냐하면 가이드 RNA와 상호작용하는 능력을 유지하는 한 여전히 가이드 RNA에 의해 표적 DNA 서열로 가이드되기 때문이다).
일부 구현예에서, 변이체 Cas 단백질은 spCas9, spCas9-VRQR, spCas9-VRER, xCas9(sp), saCas9, saCas9-KKH, spCas9-MQKSER, spCas9-LRKIQK, 또는 spCas9-LRVSQL일 수 있다.
일부 구현예에서, Cas9 도메인은 스타필로코쿠스 아우레우스로부터의 Cas9(SaCas9) 도메인이다. 일부 구현예에서, SaCas9 도메인은 뉴클레아제 활성 SaCas9, 뉴클레아제 불활성 SaCas9(SaCas9d), 또는 SaCas9 니카아제(SaCas9n)이다. 일부 구현예에서, SaCas9는 N579A 돌연변이, 또는 함께 제출된 서열목록에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함한다.
일부 구현예에서, SaCas9 도메인, SaCas9d 도메인 또는 SaCas9n 도메인은 비표준 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 구현예에서, SaCas9 도메인, SaCas9d 도메인, 또는 SaCas9n 도메인은 NNGRRT 또는 NNGRRV PAM 서열을 갖는 핵산 서열에 결합할 수 있다. 일부 구현예에서, SaCas9 도메인은 E781X, N967X 및 R1014X 돌연변이 중 하나 이상, 또는 본 명세서에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, SaCas9 도메인은 E781K, N967K 및 R1014H 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 하나 이상의 상응하는 돌연변이를 포함한다. 일부 구현예에서, SaCas9 도메인은 E781K, N967K 또는 R1014H 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함한다.
일부 구현예에서, 융합 단백질에 존재하는 Cas9 도메인 중 하나는 PAM 서열에 대한 요구 사항이 없는 가이드 뉴클레오티드 서열 프로그래밍 가능한 DNA 결합 단백질 도메인으로 대체될 수 있다. 일부 구현예에서 Cas9는 SaCas9이다. SaCas9의 잔기 A579는 N579에서 돌연변이되어 SaCas9 니카아제를 생성할 수 있다. 잔기 K781, K967 및 H1014는 E781, N967 및 R1014에서 돌연변이되어 SaKKH Cas9를 생성할 수 있다.
일부 구현예에서, 아미노산 치환 D1135M, S1136Q, G1218K, E1219F, A1322R, D1332A, R1335E, 및 T1337R(SpCas9-MQKFRAER)을 포함하고 변경된 PAM 5'-NGC-3'에 대해 특이성을 갖는 변형된 SpCas9를 사용하였다.
에스. 파이오게네스(S. pyogenes) Cas9에 대한 대안에는 포유류 세포에서 절단 활성을 나타내는 Cpf1 계열의 RNA 유도 엔도뉴클레아제가 포함될 수 있다. Prevotella 및 Francisella 1의 CRISPR(CRISPR/Cpf1)은 CRISPR/Cas9 시스템과 유사한 DNA 편집 기술이다. Cpf1은 클래스 II CRISPR/Cas 시스템의 RNA 유도 엔도뉴클레아제이다. 이러한 후천적 면역 메커니즘은 Prevotella 및 Francisella 박테리아에서 발견된다. Cpf1 유전자는 CRISPR 유전자좌와 연관되어 있으며 가이드 RNA를 사용하여 바이러스 DNA를 찾아 절단하는 엔도뉴클레아제를 코딩한다. Cpf1은 Cas9보다 작고 단순한 엔도뉴클레아제로 CRISPR/Cas9 시스템 제한 사항 중 일부를 극복한다. Cas9 뉴클레아제와 달리 Cpf1 매개 DNA 절단의 결과는 짧은 3' 오버행을 갖는 이중-가닥 파손이다. Cpf1의 엇갈린(staggered) 절단 패턴은 전통적인 제한 효소 복제와 유사한 방향성 유전자 전달 가능성을 열어 유전자 편집 효율성을 높일 수 있다. 위에서 설명한 Cas9 변종 및 오솔로그(orthologues)와 마찬가지로 Cpf1은 CRISPR의 표적이 될 수 있는 부위의 수를 SpCas9가 선호하는 NGG PAM 부위가 없는 AT가 풍부한 부위 또는 AT가 풍부한 게놈으로 확장할 수도 있다. Cpf1 유전자좌에는 혼합 알파/베타 도메인, RuvC-I, 이어서 힐리컬(helical) 영역, RuvC-II 및 징크 핑거형 도메인이 포함되어 있다. Cpf1 단백질에는 Cas9의 RuvC 도메인과 유사한 RuvC 유사 엔도뉴클레아제 도메인이 있다.
또한 Cpf1은 Cas9와 달리 HNH 엔도뉴클레아제 도메인이 없으며 Cpf1의 N 말단에는 Cas9의 알파-힐리컬 인식 로브(alpha-helical recognition lobe)가 없다. Cpf1 CRISPR-Cas 도메인 아키텍처는 Cpf1이 기능적으로 고유하며 클래스 2, 유형 V CRISPR 시스템으로 분류됨을 보여준다. Cpf1 유전자좌는 유형 II 시스템보다 유형 I 및 III과 더 유사한 Cas1, Cas2 및 Cas4 단백질을 코딩한다. 기능성 Cpf1에는 트랜스 활성화 CRISPR RNA(tracrRNA)가 필요하지 않으므로 CRISPR(crRNA)만 필요하다. Cpf1은 Cas9보다 작을 뿐만 아니라 sgRNA 분자도 더 작기 때문에(Cas9의 뉴클레오티드 수의 약 절반) 게놈 편집에 이점이 있다. Cpf1-crRNA 복합체는 Cas9가 표적으로 하는 G가 풍부한 PAM과 달리 프로토스페이서 인접 모티프 5'-YTN-3' 또는 5'-TTN-3'을 식별하여 표적 DNA 또는 RNA를 절단한다. PAM을 확인한 후 Cpf1은 4개 또는 5개 뉴클레오티드의 오버행을 갖는 스틱키-말단-유사(sticky-end-like) DNA 이중 가닥 파손(break)을 도입한다.
일부 구현예에서, Cas9는 변경된 PAM 서열에 대해 특이성을 갖는 Cas9 변이체이다. 일부 구현예에서, 추가의 Cas9 변이체 및 PAM 서열은 Miller, S.M., 등 Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol. (2020)에 기재되어 있으며, 이의 전문은 여기에 참조로 포함된다. 일부 구현예에서, Cas9 변이체는 특이적 PAM 요건을 갖지 않는다. 일부 구현예에서, Cas9 변이체, 예를 들어, SpCas9 변이체는 NRNH PAM에 대해 특이성을 가지며, 여기서 R은 A 또는 G이고, H는 A, C, 또는 T이다. 일부 구현예에서, SpCas9 변이체는 PAM 서열 AAA, TAA, CAA, GAA, TAT, GAT 또는 CAC에 대해 특이성을 갖는다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1134, 1135, 1137, 1139, 1151, 1180, 1188, 1211, 1218, 1219, 1221, 1249, 1256, 1264, 1290, 1318, 1317, 1320, 1321, 1323, 1332, 1333, 1335, 1337, 또는 1339, 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1135, 1218, 1219, 1221, 1249, 1320, 1321, 1323, 1332, 1333, 1335, 또는 1337 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1134, 1135, 1137, 1139, 1151, 1180, 1188, 1211, 1219, 1221, 1256, 1264, 1290, 1318, 1317, 1320, 1323, 1333 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1131, 1135, 1150, 1156, 1180, 1191, 1218, 1219, 1221, 1227, 1249, 1253, 1286, 1293, 1320, 1321, 1332, 1335, 1339 또는 이의 상응하는 위치에 아미노산 치환을 포함한다. 일부 구현예에서, SpCas9 변이체는 위치 1114, 1127, 1135, 1180, 1207, 1219, 1234, 1286, 1301, 1332, 1335, 1337, 1338, 1349 또는 이의 상응하는 위치에서 아미노산 치환을 포함한다. SpCas9 변이체의 예시적인 아미노산 치환 및 PAM 특이성은 표 2A-2D에 나타낸다.
표 2A. SpCas9 변이체 및 PAM 특이성
표 2B. SpCas9 변이체 및 PAM 특이성
표 2C. SpCas9 변이체 및 PAM 특이성
표 2D. SpCas9 변이체 및 PAM 특이성
변형된 PAM 인식을 갖는 추가의 예시적인 Cas9 (예를 들어, SaCas9) 폴리펩티드는 Kleinstiver, 등 “the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition,”에 기재되어 있고, 이 내용은 모두 여기에 참조로 포함된다. 일부 구현예에서, 변경 E782K, N929R, N968K 및/또는 R1015H 중 하나 이상을 포함하는 Cas9 변이체 (예를 들어, SaCas9 변이체)는 참조 폴리펩티드(예를 들어, SaCas9) NNNRRT 또는 NNHRRT PAM 서열에 대해 특이성을 갖거나 증가된 편집 활성과 연관되며, 여기서 N은 임의의 뉴클레오티드를 나타내고, H는 G 이외의 임의의 뉴클레오티드(즉, "G가 아님")를 나타내며, R은 퓨린을 나타낸다. 구현예에서, Cas9 변이체(예를 들어, SaCas9 변이체)는 변경 E782K, N968K 및 R1015H 또는 변경 E782K, K929R 및 R1015H를 포함한다.
일부 구현예에서, 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)은 미생물 CRISPR-Cas 시스템의 단일 효과기이다.
미생물 CRISPR-Cas 시스템의 단일 효과기는 Cas9, Cpf1, Cas12b/C2c1, 및 Cas12c/C2c3을 포함하지만 이에 제한되지 않는다. 전형적으로, 미생물 CRISPR-Cas 시스템은 클래스 1 및 클래스 2 시스템으로 나눠진다. 클래스 1 시스템은 다중 서브유닛 효과기 복합체를 갖는 반면, 클래스 2 시스템은 단일 단백질 효과기를 갖는다. 예를 들어, Cas9 및 Cpf1은 클래스 2 효과기이다. Cas9 및 Cpf1 외에도, 3 개의 별도의 클래스 2 CRISPR-Cas 시스템(Cas12b/C2c1, 및 Cas12c/C2c3)이 Shmakov 등, "Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems", Mol. Cell, 2015 Nov. 5; 60(3): 385-397에 기재되었으며, 이의 전체 내용이 여기에 참조로 포함된다. 2 개의 시스템인 Cas12b/C2c1, 및 Cas12c/C2c3의 효과기는 Cpf1과 관련된 RuvC-유사 엔도뉴클레아제 도메인을 함유한다. 제3 시스템은 2 개의 예측된 HEPN RNase 도메인을 갖는 효과기를 함유한다. 성숙 CRISPR RNA의 생산은 Cas12b/C2c1에 의한 CRISPR RNA의 생산과 달리 tracrRNA-독립적이다. Cas12b/C2c1은 DNA 절단을 위해 CRISPR RNA 및 tracrRNA 둘 모두에 따라 달라진다.
일부 구현예에서, napDNAbp는 원형 순열(예를 들어, 서열번호: 326)이다.
알리사이클로바실루스 아시도테라스트리스(Alicyclobaccillus acidoterrastris) Cas12b/C2c1(AacC2c1)의 결정 구조는 키메라 단일-분자 가이드 RNA(sgRNA)와의 복합체로 보고되었다. 예를 들어, Liu 등, "C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism", Mol. Cell, 2017 Jan. 19; 65(2):310-322를 참조하며, 이의 전체 내용이 여기에 참조로 포함된다. 결정 구조는 또한 삼원 복합체로서 표적 DNA에 결합된 알리사이클로바실루스 아시도테레스트리스(Alicyclobacillus acidoterrestris) C2c1에서 보고되었다. 예를 들어, Yang 등, "PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease", Cell, 2016 Dec. 15; 167(7):1814-1828을 참조하며, 이의 전체 내용이 여기에 참조로 포함된다. 표적 및 비-표적 DNA 가닥 둘 모두를 갖는 AacC2c1의 촉매적으로 적격한 형태는 독립적으로 단일 RuvC 촉매 포켓 내에 위치하도록 포획되었으며, Cas12b/C2c1-매개 절단은 표적 DNA의 시차를 둔 7-뉴클레오티드 절단을 초래한다. Cas12b/C2c1 삼원 복합체 및 이전에 식별된 Cas9 및 Cpf1 대응물 사이의 구조적 비교는 CRISPR-Cas9 시스템에 의해 사용되는 메커니즘의 다양성을 입증한다.
일부 구현예에서, 본원에 제공된 임의의 융합 단백질의 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)은 Cas12b/C2c1, 또는 Cas12c/C2c3 단백질일 수 있다. 일부 구현예에서, napDNAbp는 Cas12b/C2c1 단백질이다. 일부 구현예에서, napDNAbp는 Cas12c/C2c3 단백질이다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12b/C2c1 또는 Cas12c/C2c3 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 쉽게(at ease) 99.5% 동일한 아미노산을 포함한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12b/C2c1 또는 Cas12c/C2c3 단백질이다. 일부 구현예에서, napDNAbp는 본원에 제공된 napDNAbp 서열 중 임의의 하나와 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 바람직하게는 99.5% 동일한 아미노산 서열을 포함한다. 다른 박테리아 종으로부터의 Cas12b/C2c1 또는 Cas12c/C2c3은 또한 본 개시내용에 따라 사용될 수 있음이 이해되어야 한다.
일부 구현예에서, napDNAbp는 Cas12c를 지칭한다. 일부 구현예에서, Cas12c 단백질은 Cas12c1(서열번호: 327) 또는 Cas12c1의 변이체이다. 일부 구현예에서, Cas12 단백질은 Cas12c2(서열번호: 328) 또는 Cas12c2의 변이체이다. 일부 구현예에서, Cas12 단백질은 올레이필루스 종 HI0009(즉, OspCas12c; 서열번호: 329)로부터의 Cas12c 단백질 또는 OspCas12c의 변이체이다. 이들 Cas12c 분자는 Yan 등, "Functionally Diverse Type V CRISPR-Cas Systems," Science, 2019 Jan. 4; 363: 88-91에 기재되어 있으며; 이의 전체 내용은 여기에 참조로 포함된다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12c1, Cas12c2, 또는 OspCas12c 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12c1, Cas12c2, 또는 OspCas12c 단백질이다. 일부 구현예에서, napDNAbp는 본원에 기재된 임의의 Cas12c1, Cas12c2, 또는 OspCas12c 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 바람직하게는 99.5% 동일한 아미노산 서열을 포함한다. 다른 박테리아 종으로부터의 Cas12c1, Cas12c2, 또는 OspCas12c가 또한 본 개시내용에 따라 사용될 수 있음이 이해되어야 한다.
일부 구현예에서, napDNAbp는 예를 들어 Yan 등, "Functionally Diverse Type V CRISPR-Cas Systems," Science, 2019 Jan. 4; 363: 88-91에 기재된 Cas12g, Cas12h, 또는 Cas12i를 지칭하고; 각각의 전체 내용은 여기에 참조로 포함된다. 예시적인 Cas12g, Cas12h, 및 Cas12i 폴리펩티드 서열은 서열목록에서 서열번호: 330-333으로서 제공된다. 10 테라바이트 초과의 서열 데이터를 종합함으로써, Cas12g, Cas12h, 및 Cas12i를 포함하는, 이전에 특징화된 클래스 V 단백질과 약한 유사성을 나타내는 V형 Cas 단백질의 새로운 분류가 식별되었다. 일부 구현예에서, Cas12 단백질은 Cas12g 또는 Cas12g의 변이체이다. 일부 구현예에서, Cas12 단백질은 Cas12h 또는 Cas12h의 변이체이다. 일부 구현예에서, Cas12 단백질은 Cas12i 또는 Cas12i의 변이체이다. 다른 RNA-가이드된 DNA 결합 단백질이 napDNAbp로서 사용될 수 있고, 본 개시내용의 범주 내에 있다는 것이 이해되어야 한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12g, Cas12h 또는 Cas12i 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12g, Cas12h, 또는 Cas12i 단백질이다. 일부 구현예에서, napDNAbp는 본원에 기재된 임의의 Cas12g, Cas12h, 또는 Cas12i 단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 바람직하게는 99.5% 동일한 아미노산 서열을 포함한다. 다른 박테리아 종으로부터의 Cas12g, Cas12h, 또는 Cas12i가 또한 본 개시내용에 따라 사용될 수 있다는 것이 이해되어야 한다. 일부 구현예에서, Cas12i는 Cas12i1 또는 Cas12i2이다.
일부 구현예에서, 본원에 제공된 임의의 융합 단백질의 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp)은 Cas12j/CasΦ단백질일 수 있다. Cas12j/CasΦ는 Pausch 등, "CRISPR-CasΦfrom huge phages is a hypercompact genome editor," Science, 17 July 2020, Vol. 369, Issue 6501, pp. 333-337에 기재되어 있으며, 이는 이의 전문이 여기에 참조로 포함된다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12j/CasΦ단백질과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 바람직하게는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, napDNAbp는 자연 발생 Cas12j/CasΦ단백질이다. 일부 구현예에서, napDNAbp는 뉴클레아제 불활성("사멸") Cas12j/CasΦ단백질이다. 다른 종들로부터의 Cas12j/CasΦ가 또한 본 개시내용에 따라 사용될 수 있다는 것이 이해되어야 한다.
내부 삽입을 갖는 융합 단백질
본원에는 핵산 프로그래밍 가능한 핵산 결합 단백질, 예를 들어, napDNAbp에 융합된 이종성 폴리펩티드를 포함하는 융합 단백질이 제공된다. 아래에 상세히 설명된 바와 같이, 본 개시내용은 이종성 폴리펩티드를 특징으로 하는 융합 단백질을 코딩하는 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 융합 단백질의 이종성 도메인의 전부 또는 일부를 코딩하는 오픈 리딩 프레임에 인트론을 포함한다. 이종성 폴리펩티드는 천연 또는 야생형 napDNAbp 폴리펩티드 서열에서 발견되지 않는 폴리펩티드일 수 있다. 이종성 폴리펩티드는 napDNAbp의 C-말단 단부, napDNAbp의 N-말단 단부에서 napDNAbp에 융합되거나, 또는 napDNAbp의 내부 위치에 삽입될 수 있다. 일부 구현예에서, 이종성 폴리펩티드는 napDNAbp의 내부 위치에 삽입된다. 일부 구현예에서, 이종성 폴리펩티드는 데아미나아제(예를 들어, 아데노신 데아미나아제의 사이티딘) 또는 이의 기능적 단편이다. 예를 들어, 융합 단백질은 Cas9 또는 Cas12 (예를 들어 Cas12b/C2c1) 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 데아미나아제를 포함할 수 있다. 일부 구현예에서, 사이티딘 데아미나아제는 APOBEC 데아미나아제 (예를 들어 APOBEC1)이다. 일부 구현예에서, 아데노신 데아미나아제는 TadA (예를 들어, TadA*7.10 또는 TadA*8)이다. 일부 구현예에서, TadA는 TadA*8 또는 TadA*9이다. 본원에 개시된 TadA 서열 (예를 들어 TadA7.10 또는 TadA*8)은 상기-기재된 융합 단백질의 적합한 데마이나아제이다.
일부 구현예에서, 융합 단백질은 구조
NH2-[napDNAbp의 N-말단 단편]-[데아미나아제]-[napDNAbp의 C-말단 단편]-COOH;
NH2-[Cas9의 N-말단 단편]-[아데노신 데아미나아제]-[Cas9의 C-말단 단편]-COOH;
NH2-[Cas12의 N-말단 단편]-[아데노신 데아미나아제]-[Cas12의 C-말단 단편]-COOH;
NH2-[Cas9의 N-말단 단편]-[사이티딘 데아미나아제]-[Cas9의 C-말단 단편]-COOH;
NH2-[Cas12의 N-말단 단편]-[사이티딘 데아미나아제]-[Cas12의 C-말단 단편]-COOH;를 포함하며;
여기서 "]-["의 각 인스턴스는 선택적 링커이다.
데아미나아제는 원형 순열 데아미나아제일 수 있다. 예를 들어, 데아미나아제는 원형 순열 아데노신 데아미나아제일 수 있다. 일부 구현예에서, 데아미나아제는 TadA 참조 서열에서 넘버링된 바와 같이 아미노산 잔기 116, 136 또는 65에서 원형으로 순열된 원형 순열 TadA이다.
융합 단백질은 하나 초과의 데아미나아제를 포함할 수 있다. 융합 단백질은 예를 들어, 1, 2, 3, 4, 5개 이상의 데아미나아제를 포함할 수 있다. 일부 구현예에서, 융합 단백질은 하나 또는 두 개의 데아미나아제를 포함한다. 융합 단백질에서 2개 이상의 데아미나아제는 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 이들의 조합일 수 있다. 2개 이상의 데아미나아제는 동종이량체 또는 이종이량체일 수 있다. 2개 이상의 데아미나아제는 napDNAbp에서 나란히 삽입될 수 있다. 일부 구현예에서, 2개 이상의 데아미나아제는 napDNAbp에서 나란히 있지 않을 수 있다.
일부 구현예에서, 융합 단백질에서 napDNAbp는 Cas9 폴리펩티드 또는 이의 단편이다. Cas9 폴리펩티드는 변이체 Cas9 폴리펩티드일 수 있다. 일부 구현예에서, Cas9 폴리펩티드는 Cas9 니카아제(nCas9) 폴리펩티드 또는 이의 단편이다. 일부 구현예에서, Cas9 폴리펩티드는 뉴클레아제 사멸 Cas9(dCas9) 폴리펩티드 또는 이의 단편이다. 융합 단백질에서 Cas9 폴리펩티드는 전장 Cas9 폴리펩티드일 수 있다. 일부 경우에, 융합 단백질에서 Cas9 폴리펩티드는 전장 Cas9 폴리펩티드가 아닐 수 있다. Cas9 폴리펩티드는 자연 발생 Cas9 단백질에 대해 예를 들어, N-말단 또는 C-말단 단부에서 절단될 수 있다. Cas9 폴리펩티드는 원형으로 순열된 Cas9 단백질일 수 있다. Cas9 폴리펩티드는 여전히 표적 폴리뉴클레오티드 및 가이드 핵산 서열에 결합할 수 있는 Cas9 폴리펩티드의 단편, 부분, 또는 도메인일 수 있다.
일부 구현예에서, Cas9 폴리펩티드는 스트렙토코쿠스 파이오게네스 Cas9(SpCas9), 스타필로코쿠스 아우레우스 Cas9(SaCas9), 스트렙토코쿠스 써모필루스 1 Cas9(St1Cas9), 또는 본원에 개시된 임의의 Cas9 폴리펩티드의 단편 또는 변이체이다.
일부 구현예에서, 융합 단백질은 Cas9 내에 삽입된 아데노신 데아미나아제 도메인 및 사이티딘 데아미나아제 도메인을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 Cas9 내에서 융합되고 사이티딘 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, 아데노신 데아미나아제는 Cas9 내에서 융합되고 사이티딘 데아미나아제는 N-말단에 융합된다. 일부 구현예에서, 사이티딘 데아미나아제는 Cas9 내에서 융합되고 아데노신 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, 사이티딘 데아미나아제는 Cas9 내에서 융합되고 아데노신 데아미나아제는 N-말단에 융합된다.
아데노신 데아미나아제 및 사이티딘 데아미나아제 및 Cas9를 갖는 융합 단백질의 예시적인 구조는 다음과 같이 제공된다:
NH2-[Cas9(아데노신 데아미나아제)]-[사이티딘 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[Cas9(아데노신 데아미나아제)]-COOH;
NH2-[Cas9(사이티딘 데아미나아제)]-[아데노신 데아미나아제]-COOH; 또는
NH2-[아데노신 데아미나아제]-[Cas9(사이티딘 데아미나아제)]-COOH.
일부 구현예에서, 상기 일반적인 구조에서 사용되는 "-"는 선택적인 링커의 존재를 나타낸다.
다양한 구현예에서, 촉매 도메인은 DNA 변형 활성(예를 들어, 데아미나아제 활성), 예컨대 아데노신 데아미나아제 활성을 갖는다. 일부 구현예에서, 아데노신 데아미나아제는 TadA(예를 들어, TadA*7.10)이다. 일부 구현예에서, TadA는 TadA*8이다. 일부 구현예에서, TadA*8은 Cas9 내에 융합되고, 사이티딘 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, TadA*8 은 Cas9 내에 융합되고, 사이티딘 데아미나아제는 N-말단에 융합된다. 일부 구현예에서, 사이티딘 데아미나아제는 Cas9 내에 융합되고, TadA*8은 C-말단에 융합된다. 일부 구현예에서, 사이티딘 데아미나아제는 Cas9 및 N-말단에 융합된 TadA*8 내에 융합된다. TadA*8 및 사이티딘 데아미나아제 및 Cas9를 갖는 융합 단백질의 예시적인 구조는 다음과 같이 제공된다:
NH2-[Cas9(TadA*8)]-[사이티딘 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[Cas9(TadA*8)]-COOH;
NH2-[Cas9(사이티딘 데아미나아제)]-[TadA*8]-COOH; 또는
NH2-[TadA*8]-[Cas9(사이티딘 데아미나아제)]-COOH.
일부 구현예에서, 상기 일반적인 구조에서 사용되는 "-"는 선택적인 링커의 존재를 나타낸다.
이종성 폴리펩티드(예를 들어, 데아미나아제)는 예를 들어 적합한 위치에서 napDNAbp(예를 들어, Cas9 또는 Cas12 (예를 들어 Cas12b/C2c1))에 삽입될 수 있어, napDNAbp가 표적 폴리뉴클레오티드 및 가이드 핵산에 결합하는 능력을 보유하도록 한다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 데아미나아제의 기능(예를 들어, 염기 편집 활성) 또는 napDNAbp(예를 들어, 표적 핵산 및 가이드 핵산에 결합하는 능력)를 손상시키지 않고 napDNAbp 내로 삽입될 수 있다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 예를 들어, 무질서한 영역 또는 결정학 연구에 의해 나타낸 바와 같이 고온 인자(high temperature factor) 또는 B-인자(B-factor)를 포함하는 영역에서 napDNAbp에 삽입될 수 있다. 질서가 적거나, 무질서하거나, 또는 비구조화된 단백질의 영역, 예를 들어 용매 노출된 영역 및 루프는 구조 또는 기능을 손상시키지 않고 삽입에 사용될 수 있다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 유연한 루프 영역 또는 용매-노출된 영역에서 napDNAbp에 삽입될 수 있다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 Cas9 또는 Cas12b/C2c1 (예를 들어 Cas12b/C2c1) 폴리펩티드의 유연한 루프에 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)의 삽입 위치는 Cas9 폴리펩티드의 결정 구조의 B-인자 분석에 의해 결정된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 평균보다 더 높은 B-인자(예를 들어, 총 단백질 또는 무질서한 영역을 포함하는 단백질 도메인과 비교하여 더 높은 B-인자)를 포함하는 Cas9 폴리펩티드의 영역에 삽입된다. B-인자 또는 온도 인자는 평균 위치에서 원자의 변동을 나타낼 수 있다(예를 들어, 온도-의존적 원자 진동 또는 결정 격자에서 정적 무질서의 결과). 백본 원자에 대한 높은 B-인자(예를 들어, 평균보다 더 높은 B-인자)는 비교적 높은 국소 이동성을 갖는 영역을 나타낼 수 있다. 이러한 영역은 구조 또는 기능을 손상시키지 않으면서 데아미나아제를 삽입하는 데 사용될 수 있다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 총 단백질에 대한 평균 B-인자보다 50%, 60%, 70%, 80%, 90%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 또는 200% 초과인 B-인자를 갖는 Cα 원자를 갖는 잔기가 있는 위치에 삽입될 수 있다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 잔기를 포함하는 Cas9 단백질 도메인에 대한 평균 B-원자보다 50%, 60%, 70%, 80%, 90%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200% 또는 200% 초과인 B-원자를 갖는 Cα 원자를 갖는 잔기가 있는 위치에 삽입될 수 있다. 평균보다 더 큰 B-원자를 포함하는 Cas9 폴리펩티드 위치는 예를 들어, 상기 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 768, 792, 1052, 1015, 1022, 1026, 1029, 1067, 1040, 1054, 1068, 1246, 1247, 및 1248을 포함할 수 있다. 평균보다 더 큰 B-인자를 포함하는 Cas9 폴리펩티드 영역은 상기 Cas9 참조 서열에서 넘버링된 바와 같이 예를 들어, 잔기 792-872, 792-906, 및 2-791을 포함할 수 있다.
이종성 폴리펩티드(예를 들어, 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 768, 791, 792, 1015, 1016, 1022, 1023, 1026, 1029, 1040, 1052, 1054, 1067, 1068, 1069, 1246, 1247, 및 1248로 이루어진 군으로부터 선택된 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 napDNAbp에 삽입될 수 있다. 일부 구현예에서, 이종성 폴리펩티드는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 위치 768-769, 791-792, 792-793, 1015-1016, 1022-1023, 1026-1027, 1029-1030, 1040-1041, 1052-1053, 1054-1055, 1067-1068, 1068-1069, 1247-1248, 또는 1248-1249 또는 이의 상응하는 아미노산 위치 사이에 삽입된다. 일부 구현예에서, 이종성 폴리펩티드는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 위치 769-770, 792-793, 793-794, 1016-1017, 1023-1024, 1027-1028, 1030-1031, 1041-1042, 1053-1054, 1055-1056, 1068-1069, 1069-1070, 1248-1249, 또는 1249-1250 또는 이의 상응하는 아미노산 위치 사이에 삽입된다. 일부 구현예에서, 이종성 폴리펩티드는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 768, 791, 792, 1015, 1016, 1022, 1023, 1026, 1029, 1040, 1052, 1054, 1067, 1068, 1069, 1246, 1247, 및 1248로 이루어진 군으로부터 선택된 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체한다. 삽입 위치와 관련하여 상기 Cas9 참조 서열에 대한 언급은 예시적인 목적을 위한 것임이 이해되어야 한다. 본원에 논의된 바와 같은 삽입은 상기 Cas9 참조 서열의 Cas9 폴리펩티드 서열로 제한되지 않지만, 변이체 Cas9 폴리펩티드, 예를 들어 Cas9 니카아제(nCas9), 뉴클레아제 사멸 Cas9(dCas9), 뉴클레아제 도메인이 결여되어 있는 Cas9 변이체, 절단된 Cas9, 또는 부분적 또는 완전한 HNH 도메인이 결여되어 있는 Cas9 도메인에서 상응하는 위치에의 삽입을 포함한다.
이종성 폴리펩티드(예를 들어, 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 768, 792, 1022, 1026, 1040, 1068, 및 1247로 이루어진 군으로부터 선택된 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 napDNAbp에 삽입될 수 있다. 일부 구현예에서, 이종성 폴리펩티드는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 위치 768-769, 792-793, 1022-1023, 1026-1027, 1029-1030, 1040-1041, 1068-1069, 또는 1247-1248 또는 이의 상응하는 아미노산 위치 사이에 삽입된다. 일부 구현예에서, 이종성 폴리펩티드는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 위치 769-770, 793-794, 1023-1024, 1027-1028, 1030-1031, 1041-1042, 1069-1070, 또는 1248-1249 또는 이의 상응하는 아미노산 위치 사이에 삽입된다. 일부 구현예에서, 이종성 폴리펩티드는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 768, 792, 1022, 1026, 1040, 1068, 및 1247로 이루어진 군으로부터 선택된 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체한다.
이종성 폴리펩티드(예를 들어, 데아미나아제)는 본원에 기재된 바와 같은 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 napDNAbp에 삽입될 수 있다. 일 구현예에서, 이종성 폴리펩티드(예를 들어, 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 1002, 1003, 1025, 1052-1056, 1242-1247, 1061-1077, 943-947, 686-691, 569-578, 530-539, 및 1060-1077로 이루어진 군으로부터 선택된 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 napDNAbp에 삽입될 수 있다. 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 잔기의 N-말단 또는 C-말단에 삽입되거나 또는 잔기를 대체할 수 있다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 잔기의 C-말단에 삽입된다.
일부 구현예에서, 아데노신 데아미나아제(예를 들어, TadA)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군으로부터 선택된 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 아데노신 데아미나아제(예를 들어, TadA)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 792-872, 792-906, 또는 2-791, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기 대신에 삽입된다. 일부 구현예에서, 아데노신 데아미나아제는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군으로부터 선택된 아미노산의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 아데노신 데아미나아제는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군으로부터 선택된 아미노산의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 아데노신 데아미나아제는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군으로부터 선택된 아미노산, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체한다.
일부 구현예에서, 사이티딘 데아미나아제(예를 들어, APOBEC1)는 상기 Cas9 참조 서열에서 번호가 매겨진 1016, 1023, 1029, 1040, 1069 및 1247로 구성된 그룹으로부터 선택된 아미노산 잔기, 또는 상응하는 다른 Cas9 폴리펩티드의 아미노산 잔기에 삽입된다. 일부 구현예에서 사이티딘 데아미나아제는 상기 Cas9 참조 서열에 번호가 매겨진 1016, 1023, 1029, 1040, 1069 및 1247로 구성된 그룹으로부터 선택된 아미노산, 또는 다른 Cas9 폴리펩티드의 상응하는 아미노산 잔기의 N-말단에 삽입된다.
일부 구현예에서 사이티딘 데아미나아제는 상기 Cas9 참조 서열에서 번호가 매겨진 1016, 1023, 1029, 1040, 1069 및 1247로 구성된 그룹으로부터 선택된 아미노산, 또는 다른 Cas9 폴리펩티드의 상응하는 아미노산 잔기의 C-말단에 삽입된다. 일부 구현예에서 사이티딘 데아미나아제는 상기 Cas9 참조 서열에서 번호가 매겨진 1016, 1023, 1029, 1040, 1069 및 1247로 구성된 그룹으로부터 선택된 아미노산, 또는 다른 Cas9 폴리펩티드의 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 768, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 768의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 768의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 768, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하기 위해 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된바와 같은 아미노산 잔기 791에 삽입되거나, 아미노산 잔기 792에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 791의 N-말단에 삽입되거나, 아미노산 792의 N-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 791의 C-말단에 삽입되거나, 아미노산 792의 N-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 791을 대체하도록 삽입되거나, 아미노산 792를 대체하도록 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하도록 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1016, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1016의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1016의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에서 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1016, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하도록 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1022에 삽입되거나, 아미노산 잔기 1023에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1022의 N-말단에 삽입되거나, 아미노산 잔기 1023의 N-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1022의 C-말단에 삽입되거나, 아미노산 잔기 1023의 C-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1022를 대체하도록 삽입되거나, 아미노산 잔기 1023을 대체하도록 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하도록 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1026에 삽입되거나, 아미노산 잔기 1029에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1026의 N-말단에 삽입되거나, 아미노산 잔기 1029의 N-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1026의 C-말단에 삽입되거나, 아미노산 잔기 1029의 C-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1026을 대체하도록 삽입되거나, 아미노산 잔기 1029를 대체하도록 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하도록 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1040, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1040의 N-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1040의 C-말단, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1040, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하도록 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1052에 삽입되거나, 아미노산 잔기 1054에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1052의 N-말단에 삽입되거나, 아미노산 잔기 1054의 N-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제 (예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1052의 C-말단에 삽입되거나, 아미노산 잔기 1054의 C-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1052를 대체하도록 삽입되거나, 아미노산 잔기 1054를 대체하도록 삽입되거나, 또는 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하도록 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같이 아미노산 잔기 1067에 삽입되거나, 아미노산 잔기 1068에 삽입되거나, 아미노산 잔기 1069에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1067의 N-말단에 삽입되거나, 아미노산 잔기 1068의 N-말단에 삽입되거나, 아미노산 잔기 1069의 N-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1067의 C-말단에 삽입되거나, 아미노산 잔기 1068의 C-말단에 삽입되거나, 아미노산 잔기 1069의 C-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1067을 대체하도록 삽입되거나, 아미노산 잔기 1068을 대체하도록 삽입되거나, 아미노산 잔기 1069를 대체하도록 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하도록 삽입된다.
일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같이 아미노산 잔기 1246에 삽입되거나, 아미노산 잔기 1247에 삽입되거나, 아미노산 잔기 1248에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같이, 아미노산 잔기 1246의 N-말단에 삽입되거나, 아미노산 잔기 1247의 N-말단에 삽입되거나, 아미노산 잔기 1248의 N-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 넘버링된 바와 같이 아미노산 잔기 1246의 C-말단에 삽입되거나, 아미노산 잔기 1247의 C-말단에 삽입되거나, 아미노산 잔기 1248의 C-말단에 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 삽입된다. 일부 구현예에서, 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1246을 대체하도록 삽입되거나, 아미노산 잔기 1247을 대체하도록 삽입되거나, 아미노산 잔기 1248을 대체하도록 삽입되거나, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기를 대체하도록 삽입된다.
일부 구현예에서, 이종성 폴리펩티드(예를 들어, 데아미나아제)는 Cas9 폴리펩티드의 유연한 루프에 삽입된다. 유연한 루프 부분은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 530-537, 569-570, 686-691, 943-947, 1002-1025, 1052-1077, 1232-1247, 또는 1298-1300, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기로 이루어진 군으로부터 선택될 수 있다. 유연한 루프 부분은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 1-529, 538-568, 580-685, 692-942, 948-1001, 1026-1051, 1078-1231, 또는 1248-1297, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기로 이루어진 군으로부터 선택될 수 있다.
이종성 폴리펩티드(예를 들어, 아데닌 데아미나아제)는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1017-1069, 1242-1247, 1052-1056, 1060-1077, 1002 - 1003, 943-947, 530-537, 568-579, 686-691, 1242-1247, 1298-1300, 1066-1077, 1052-1056, 또는 1060-1077, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응하는 Cas9 폴리펩티드 영역 내로 삽입될 수 있다.
이종성 폴리펩티드(예를 들어, 아데닌 데아미나아제)는 Cas9 폴리펩티드의 결실된 영역 대신에 삽입될 수 있다. 결실된 영역은 Cas9 폴리펩티드의 N-말단 또는 C-말단 부분에 상응할 수 있다. 일부 구현예에서, 결실된 영역은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 792-872, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응한다. 일부 구현예에서, 결실된 영역은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 792-906, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응한다. 일부 구현예에서, 결실된 영역은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 2-791, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응한다. 일부 구현예에서, 결실된 영역은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 잔기 1017-1069, 또는 이의 상응하는 아미노산 잔기에 상응한다.
예시적인 내부 융합 염기 편집기는 하기 표 3에 제공된다:
표 3. Cas9 단백질의 삽입 유전자좌
이종성 폴리펩티드(예를 들어, 데아미나아제)는 Cas9 폴리펩티드의 구조적 또는 기능적 도메인 내에 삽입될 수 있다. 이종성 폴리펩티드(예를 들어, 데아미나아제)는 Cas9 폴리펩티드의 2 개의 구조적 또는 기능적 도메인 사이에 삽입될 수 있다. 이종성 폴리펩티드(예를 들어, 데아미나아제)는 예를 들어, Cas9 폴리펩티드로부터 도메인을 결실시킨 후, Cas9 폴리펩티드의 구조적 또는 기능적 도메인 대신에 삽입될 수 있다. Cas9 폴리펩티드의 구조적 또는 기능적 도메인은 예를 들어, RuvC I, RuvC II, RuvC III, Rec1, Rec2, PI, 또는 HNH를 포함할 수 있다.
일부 구현예에서, Cas9 폴리펩티드는 RuvC I, RuvC II, RuvC III, Rec1, Rec2, PI, 또는 HNH 도메인으로 이루어진 군으로부터 선택된 하나 이상의 도메인이 결여되어 있다. 일부 구현예에서, Cas9 폴리펩티드는 뉴클레아제 도메인이 결여되어 있다. 일부 구현예에서, Cas9 폴리펩티드는 HNH 도메인이 결여되어 있다. 일부 구현예에서, Cas9 폴리펩티드는 Cas9 폴리펩티드가 HNH 활성을 감소시키거나 또는 폐지(abolished)하도록 HNH 도메인의 부분이 결여되어 있다. 일부 구현예에서, Cas9 폴리펩티드는 뉴클레아제 도메인의 결실을 포함하고, 데아미나아제는 뉴클레아제 도메인을 대체하기 위해 삽입된다. 일부 구현예에서, HNH 도메인은 결실되고 데아미나아제가 그 자리에 삽입된다. 일부 구현예에서, RuvC 도메인 중 하나 이상은 결실되고 데아미나아제가 그 자리에 삽입된다.
이종성 폴리펩티드를 포함하는 융합 단백질은 napDNAbp의 N-말단 및 C-말단 단편에 의해 플랭킹될 수 있다. 일부 구현예에서, 융합 단백질은 Cas9 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 데아미나아제를 포함한다. N 말단 단편 또는 C 말단 단편은 표적 폴리뉴클레오티드 서열에 결합할 수 있다. N 말단 단편의 C-말단 또는 C 말단 단편의 N-말단은 Cas9 폴리펩티드의 유연한 루프의 일부를 포함할 수 있다. N 말단 단편의 C-말단 또는 C 말단 단편의 N-말단은 Cas9 폴리펩티드의 알파-힐리컬 구조의 일부를 포함할 수 있다. N-말단 단편 또는 C-말단 단편은 DNA 결합 도메인을 포함할 수 있다. N-말단 단편 또는 C-말단 단편은 RuvC 도메인을 포함할 수 있다. N-말단 단편 또는 C-말단 단편은 HNH 도메인을 포함할 수 있다. 일부 구현예에서, N-말단 단편 및 C-말단 단편 중 어느 것도 HNH 도메인을 포함하지 않는다.
일부 구현예에서, N 말단 Cas9 단편의 C-말단은 융합 단백질이 표적 핵염기를 탈아미노화할 때 표적 핵염기에 근접한 아미노산을 포함한다. 일부 구현예에서, C 말단 Cas9 단편의 N-말단은 융합 단백질이 표적 핵염기를 탈아미노화할 때 표적 핵염기에 근접한 아미노산을 포함한다. 상이한 데아미나아제의 삽입 위치는 표적 핵염기 및 N 말단 Cas9 단편의 C-말단 또는 C 말단 Cas9 단편의 N-말단에서의 아미노산 사이에 근접성을 갖기 위해 상이할 수 있다. 예를 들어, 데아미나아제의 삽입 위치는 상기 Cas9 참조 서열에서 넘버링된 바와 같은 1015, 1022, 1029, 1040, 1068, 1247, 1054, 1026, 768, 1067, 1248, 1052, 및 1246으로 이루어진 군으로부터 선택된 아미노산 잔기, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 있을 수 있다.
융합 단백질의 N-말단 Cas9 단편(즉, 융합 단백질에서 데아미나아제를 플랭킹하는 N-말단 Cas9 단편)은 Cas9 폴리펩티드의 N-말단을 포함할 수 있다. 융합 단백질의 N-말단 Cas9 단편은 적어도 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 또는 1300 개 아미노산의 길이를 포함할 수 있다. 융합 단백질의 N-말단 Cas9 단편은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1-56, 1-95, 1-200, 1-300, 1-400, 1-500, 1-600, 1-700, 1-718, 1-765, 1-780, 1-906, 1-918, 또는 1-1100, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응하는 서열을 포함할 수 있다. N-말단 Cas9 단편은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1-56, 1-95, 1-200, 1-300, 1-400, 1-500, 1-600, 1-700, 1-718, 1-765, 1-780, 1-906, 1-918, 또는 1-1100, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 대해 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 서열 상동성을 포함하는 서열을 포함할 수 있다.
융합 단백질의 C-말단 Cas9 단편(즉, 융합 단백질에서 데아미나아제를 플랭킹하는 C-말단 Cas9 단편)은 Cas9 폴리펩티드의 C-말단을 포함할 수 있다. 융합 단백질의 C-말단 Cas9 단편은 적어도 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 또는 1300 개 아미노산의 길이를 포함할 수 있다. 융합 단백질의 C-말단 Cas9 단편은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1099-1368, 918-1368, 906-1368, 780-1368, 765-1368, 718-1368, 94-1368, 또는 56-1368, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 상응하는 서열을 포함할 수 있다. N-말단 Cas9 단편은 상기 Cas9 참조 서열에서 넘버링된 바와 같은 아미노산 잔기 1099-1368, 918-1368, 906-1368, 780-1368, 765-1368, 718-1368, 94-1368, 또는 56-1368, 또는 또 다른 Cas9 폴리펩티드에서 상응하는 아미노산 잔기에 대해 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 서열 상동성을 포함하는 서열을 포함할 수 있다.
함께 취해진 융합 단백질의 N-말단 Cas9 단편 및 C-말단 Cas9 단편은 예를 들어, 상기 Cas9 참조 서열에 제시된 바와 같은 전장 자연 발생 Cas9 폴리펩티드 서열에 상응하지 않을 수 있다.
본원에 기재된 융합 단백질은 감소된 게놈 와이드 허위 탈아미노화와 같은, 비-표적 부위(예를 들어, 오프-타겟 부위)에서 감소된 탈아미노화로 표적화된 탈아미노화에 영향을 미칠 수 있다. 본원에 기재된 융합 단백질은 비-표적 부위에서 감소된 방관자 탈아미노화로 표적화된 탈아미노화에 영향을 미칠 수 있다. 바람직하지 않은 탈아미노화 또는 오프-타겟 탈아미노화는 예를 들어, Cas9 폴리펩티드의 N 말단 또는 C 말단에 융합된 데아미나아제를 포함하는 단부 말단 융합 단백질과 비교하여 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 적어도 99%까지 감소될 수 있다. 바람직하지 않은 탈아미노화 또는 오프-타겟 탈아미노화는 예를 들어, Cas9 폴리펩티드의 N 말단 또는 C 말단에 융합된 데아미나아제를 포함하는 단부 말단 융합 단백질과 비교하여, 적어도 1-배, 적어도 2-배, 적어도 3-배, 적어도 4-배, 적어도 5-배, 적어도 10배, 적어도 15 배, 적어도 20 배, 적어도 30 배, 적어도 40 배, 적어도 50 배, 적어도 60 배, 적어도 70 배, 적어도 80 배, 적어도 90 배, 또는 적어도 100 배까지 감소될 수 있다.
일부 구현예에서, 융합 단백질의 데아미나아제(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)는 R-루프의 범위 내에서 2 개 이하의 핵염기를 탈아미노화한다. 일부 구현예에서, 융합 단백질의 데아미나아제는 R-루프의 범위 내에서 3 개 이하의 핵염기를 탈아미노화한다. 일부 구현예에서, 융합 단백질의 데아미나아제는 R-루프의 범위 내에서 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 이하의 핵염기를 탈아미노화한다. R-루프는 DNA:RNA 하이브리드, DNA:DNA 또는 RNA: RNA 상보적 구조를 포함하는 3-가닥 핵산 구조이며 단일-가닥 DNA와 연관된다. 본원에 사용된 바와 같이, R-루프는 표적 폴리뉴클레오티드가 CRISPR 복합체 또는 염기 편집 복합체와 접촉될 때 형성될 수 있으며, 여기서 가이드 폴리뉴클레오티드의 부분, 예를 들어 가이드 RNA는 표적 폴리뉴클레오티드, 예를 들어, 표적 DNA의 부분과 혼성화하고 대체한다. 일부 구현예에서, R-루프는 스페이서 서열 및 표적 DNA 상보적 서열의 혼성화된 영역을 포함한다. R-루프 영역은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 개의 핵염기 쌍 길이일 수 있다. 일부 구현예에서, R-루프 영역은 약 20 개의 핵염기 쌍 길이이다. 본원에 사용된 바와 같이, R-루프 영역은 가이드 폴리뉴클레오티드와 혼성화하는 표적 DNA 가닥으로 제한되지 않음이 이해되어야 한다. 예를 들어, R-루프 영역 내에서 표적 핵염기의 편집은 가이드 RNA에 대한 상보적 가닥을 포함하는 DNA 가닥에 대한 것일 수 있거나, 또는 가이드 RNA에 상보적인 가닥의 반대 가닥인 DNA 가닥에 대한 것일 수 있다. 일부 구현예에서, R-루프의 영역에서 편집은 표적 DNA 서열에서 비-상보적 가닥(프로토스페이서 가닥) 상의 핵염기를 가이드 RNA로 편집하는 것을 포함한다.
본원에 기재된 융합 단백질은 표준 염기 편집과 상이한 편집 윈도우에서 표적 탈아미노화에 영향을 미칠 수 있다. 일부 구현예에서, 표적 핵염기는 표적 폴리뉴클레오티드 서열에서 PAM 서열의 상류에 있는 약 1 내지 약 20 개의 염기이다. 일부 구현예에서, 표적 핵염기는 표적 폴리뉴클레오티드 서열에서 PAM 서열의 상류에 있는 약 2 내지 약 12 개의 염기이다. 일부 구현예에서, 표적 핵염기는 PAM 서열의 상류에 있거나 떨어져 있는 약 1 내지 9 개의 염기 쌍, 약 2 내지 10 개의 염기 쌍, 약 3 내지 11 개의 염기 쌍, 약 4 내지 12 개의 염기 쌍, 약 5 내지 13 개의 염기 쌍, 약 6 내지 14 개의 염기 쌍, 약 7 내지 15 개의 염기 쌍, 약 8 내지 16 개의 염기 쌍, 약 9 내지 17 개의 염기 쌍, 약 10 내지 18 개의 염기 쌍, 약 11 내지 19 개의 염기 쌍, 약 12 내지 20 개의 염기 쌍, 약 1 내지 7 개의 염기 쌍, 약 2 내지 8 개의 염기 쌍, 약 3 내지 9 개의 염기 쌍, 약 4 내지 10 개의 염기 쌍, 약 5 내지 11 개의 염기 쌍, 약 6 내지 12 개의 염기 쌍, 약 7 내지 13 개의 염기 쌍, 약 8 내지 14 개의 염기 쌍, 약 9 내지 15 개의 염기 쌍, 약 10 내지 16 개의 염기 쌍, 약 11 내지 17 개의 염기 쌍, 약 12 내지 18 개의 염기 쌍, 약 13 내지 19 개의 염기 쌍, 약 14 내지 20 개의 염기 쌍, 약 1 내지 5 개의 염기 쌍, 약 2 내지 6 개의 염기 쌍, 약 3 내지 7 개의 염기 쌍, 약 4 내지 8 개의 염기 쌍, 약 5 내지 9 개의 염기 쌍, 약 6 내지 10 개의 염기 쌍, 약 7 내지 11 개의 염기 쌍, 약 8 내지 12 개의 염기 쌍, 약 9 내지 13 개의 염기 쌍, 약 10 내지 14 개의 염기 쌍, 약 11 내지 15 개의 염기 쌍, 약 12 내지 16 개의 염기 쌍, 약 13 내지 17 개의 염기 쌍, 약 14 내지 18 개의 염기 쌍, 약 15 내지 19 개의 염기 쌍, 약 16 내지 20 개의 염기 쌍, 약 1 내지 3 개의 염기 쌍, 약 2 내지 4 개의 염기 쌍, 약 3 내지 5 개의 염기 쌍, 약 4 내지 6 개의 염기 쌍, 약 5 내지 7 개의 염기 쌍, 약 6 내지 8 개의 염기 쌍, 약 7 내지 9 개의 염기 쌍, 약 8 내지 10 개의 염기 쌍, 약 9 내지 11 개의 염기 쌍, 약 10 내지 12 개의 염기 쌍, 약 11 내지 13 개의 염기 쌍, 약 12 내지 14 개의 염기 쌍, 약 13 내지 15 개의 염기 쌍, 약 14 내지 16 개의 염기 쌍, 약 15 내지 17 개의 염기 쌍, 약 16 내지 18 개의 염기 쌍, 약 17 내지 19 개의 염기 쌍, 약 18 내지 20 개의 염기 쌍이다. 일부 구현예에서, 표적 핵염기는 PAM 서열의 상류에 있거나 또는 떨어져 있는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 개 이상의 염기 쌍이다. 일부 구현예에서, 표적 핵염기는 PAM 서열의 상류에 있는 약 1, 2, 3, 4, 5, 6, 7, 8, 또는 9 개의 염기 쌍이다. 일부 구현예에서, 표적 핵염기는 PAM 서열의 상류에 있는 약 2, 3, 4, 또는 6 개의 염기 쌍이다.
융합 단백질은 하나 초과의 이종성 폴리펩티드를 포함할 수 있다. 예를 들어, 융합 단백질은 하나 이상의 UGI 도메인 및/또는 하나 이상의 핵 국재화 신호를 추가적으로 포함할 수 있다. 2 개 이상의 이종성 도메인은 나란히 삽입될 수 있다. 2 개 이상의 이종성 도메인은 NapDNAbp에서 나란히 있지 않도록 하는 위치에 삽입될 수 있다.
융합 단백질은 데아미나아제 및 napDNAbp 폴리펩티드 사이에 링커를 포함할 수 있다. 링커는 펩티드 또는 비-펩티드 링커일 수 있다. 예를 들어, 링커는 XTEN, (GGGS)n(서열번호: 334), (GGGGS)n(서열번호: 335), (G)n, (EAAAK)n(서열번호: 336), (GGS)n, SGSETPGTSESATPES(서열번호: 337)일 수 있다.
일부 구현예에서, 융합 단백질은 N-말단 Cas9 단편과 데아미나아제 사이에 링커를 포함한다. 일부 구현예에서, 융합 단백질은 C-말단 Cas9 단편과 데아미나아제 사이에 링커를 포함한다. 일부 구현예에서, napDNAbp의 N-말단 및 C-말단 단편은 링커로 데아미나아제에 연결된다. 일부 구현예에서, N-말단 및 C-말단 단편은 링커 없이 데아미나아제 도메인에 결합된다. 일부 구현예에서, 융합 단백질은 N-말단 Cas9 단편과 데아미나아제 사이에 링커를 포함하지만, C-말단 Cas9 단편과 데아미나아제 사이에 링커를 포함하지 않는다. 일부 구현예에서, 융합 단백질은 C-말단 Cas9 단편과 데아미나아제 사이에 링커를 포함하지만, N-말단 Cas9 단편과 데아미나아제 사이에 링커를 포함하지 않는다.
일부 구현예에서, 융합 단백질의 napDNAbp는 Cas12 폴리펩티드, 예를 들어 Cas12b/C2c1 또는 이의 단편이다. Cas12 폴리펩티드는 변이체 Cas12 폴리펩티드일 수 있다. 다른 구현예에서, Cas12 폴리펩티드의 N- 또는 C-말단 단편은 핵산 프로그래밍 가능한 DNA 결합 도메인 또는 RuvC 도메인을 포함한다. 다른 구현예에서, 융합 단백질은 Cas12 폴리펩티드와 촉매 도메인 사이에 링커를 함유한다. 다른 구현예에서, 링커의 아미노산 서열은 GGSGGS(서열번호: 338) 또는 GSSGSETPGTSESATPESSG(서열번호: 339)이다. 다른 구현예에서, 링커는 강성(rigid) 링커이다. 상기 측면의 다른 구현예에서, 링커는 GGAGGCTCTGGAGGAAGC(서열번호: 340) 또는 GGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGC(서열번호: 341)에 의해 코딩된다.
Cas12 폴리펩티드의 N- 및 C-말단 단편에 의해 플랭킹된 이종성 촉매 도메인을 포함하는 융합 단백질은 또한 본원에 기재된 바와 같은 방법에서 염기 편집에 유용하다. Cas12 및 하나 이상의 데아미나아제 도메인, 예를 들어, 아데노신 데아미나아제를 포함하거나, 또는 Cas12 서열에 의해 플랭킹된 아데노신 데아미나아제 도메인을 포함하는 융합 단백질은 또한 표적 서열의 고도로 특이적이고 효율적인 염기 편집에 유용하다. 일 구현예에서, 키메라 Cas12 융합 단백질은 Cas12 폴리펩티드 내에 삽입된 이종성 촉매 도메인(예를 들어, 아데노신 데아미나아제, 사이티딘 데아미나아제, 또는 아데노신 데아미나아제 및 사이티딘 데아미나아제)을 함유한다. 일부 구현예에서, 융합 단백질은 Cas12 내에 삽입된 아데노신 데아미나아제 도메인 및 사이티딘 데아미나아제 도메인을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 Cas12 내에서 융합되고 사이티딘 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, 아데노신 데아미나아제는 Cas12 내에서 융합되고 사이티딘 데아미나아제는 N-말단에 융합된다. 일부 구현예에서, 사이티딘 데아미나아제는 Cas12 내에서 융합되고 아데노신 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, 사이티딘 데아미나아제는 Cas12 내에서 융합되고 아데노신 데아미나아제는 N-말단에 융합된다. 아데노신 데아미나아제 및 사이티딘 데아미나아제 및 Cas12를 갖는 융합 단백질의 예시적인 구조는 다음과 같이 제공된다:
NH2-[Cas12(아데노신 데아미나아제)]-[사이티딘 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[Cas12(아데노신 데아미나아제)]-COOH;
NH2-[Cas12(사이티딘 데아미나아제)]-[아데노신 데아미나아제]-COOH; 또는
NH2-[아데노신 데아미나아제]-[Cas12(사이티딘 데아미나아제)]-COOH;
일부 구현예에서, 상기 일반적인 구조에서 사용되는 "-"는 선택적인 링커의 존재를 나타낸다.
다양한 구현예에서, 촉매 도메인은 아데노신 데아미나아제 활성과 같은 DNA 변형 활성(예를 들어, 데아미나아제 활성)을 갖는다. 일부 구현예에서, 아데노신 데아미나아제는 TadA(예를 들어, TadA*7.10)이다. 일부 구현예에서, TadA는 TadA*8이다. 일부 구현예에서, TadA*8은 Cas12 내에서 융합되고 사이티딘 데아미나아제는 C-말단에 융합된다. 일부 구현예에서, TadA*8은 Cas12 내에서 융합되고 사이티딘 데아미나아제는 N-말단에 융합된다. 일부 구현예에서, 사이티딘 데아미나아제는 Cas12 내에서 융합되고 TadA*8은 C-말단에 융합된다. 일부 구현예에서, 사이티딘 데아미나아제는 Cas12 내에서 융합되고 TadA*8은 N-말단에 융합된다. TadA*8 및 사이티딘 데아미나아제 및 Cas12가 있는 융합 단백질의 예시적인 구조는 다음과 같이 제공된다:
N-[Cas12(TadA*8)]-[사이티딘 데아미나아제]-C;
N-[사이티딘 데아미나아제]-[Cas12(TadA*8)]-C;
N-[Cas12(사이티딘 데아미나아제)]-[TadA*8]-C; 또는
N-[TadA*8]-[Cas12(사이티딘 데아미나아제)]-C.
일부 구현예에서, 상기 일반적인 구조에서 사용되는 "-"는 선택적인 링커의 존재를 나타낸다.
다른 구현예에서, 융합 단백질은 하나 이상의 촉매 도메인을 함유한다. 다른 구현예에서, 하나 이상의 촉매 도메인 중 적어도 하나는 Cas12 폴리펩티드 내에 삽입되거나 또는 Cas12 N-말단 또는 C-말단에서 융합된다. 다른 구현예에서, 하나 이상의 촉매 도메인 중 적어도 하나는 Cas12 폴리펩티드의 루프, 알파 힐리컬 영역, 비구조화 부분, 또는 용매 허용가능한 부분 내에 삽입된다. 다른 구현예에서, Cas12 폴리펩티드는 Cas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i 또는 Cas12j/CasΦ이다. 다른 구현예에서, Cas12 폴리펩티드는 바실루스 히사시이 Cas12b, 바실루스 써모아밀로보란스 Cas12b, 바실루스 종 V3-13 Cas12b, 또는 알리사이클로바실루스 아시디필루스 Cas12b(서열번호: 342)에 대해 적어도 약 85% 아미노산 서열 동일성을 갖는다. 다른 구현예에서, Cas12 폴리펩티드는 바실루스 히사시이 Cas12b(서열번호: 343), 바실루스 써모아밀로보란스 Cas12b, 바실루스 종 V3-13 Cas12b, 또는 알리사이클로바실루스 아시디필루스 Cas12b에 대해 적어도 약 90% 아미노산 서열 상동성을 갖는다. 다른 구현예에서, Cas12 폴리펩티드는 바실루스 히사시이 Cas12b, 바실루스 써모아밀로보란스 Cas12b(서열번호: 344), 바실루스 종 V3-13 Cas12b(서열번호: 345), 또는 알리사이클로바실루스 아시디필루스 Cas12b에 대해 적어도 약 95% 아미노산 서열 상동성을 갖는다. 다른 구현예에서, Cas12 폴리펩티드는 바실루스 히사시이 Cas12b, 바실루스 써모아밀로보란스 Cas12b, 바실루스 종 V3-13 Cas12b, 또는 알리사이클로바실루스 아시디필루스 Cas12b의 단편을 함유하거나 또는 이로 본질적으로 이루어진다. 구현예에서, Cas12 폴리펩티드는 BvCas12b(V4)를 함유하며, 이는 일부 구현예에서 5'mRNA 캡---5' UTR---bhCas12b---종결 서열 --- 3' UTR --- 120polyA 테일(서열번호: 346-348)로서 발현된다.
다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 위치 153-154, 255-256, 306-307, 980-981, 1019-1020, 534-535, 604-605, 또는 344-345 또는 Cas12a, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i 또는 Cas12j/CasΦ의 상응하는 아미노산 잔기 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 P153 및 S154 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 K255 및 E256 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 D980 및 G981 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 K1019 및 L1020 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 F534 및 P535 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 K604 및 G605 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BhCas12b의 아미노산 H344 및 F345 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 위치 147 및 148, 248 및 249, 299 및 300, 991 및 992, 또는 1031 및 1032 또는 Cas12a, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i 또는 Cas12j/CasΦ의 상응하는 잔기 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 P147 및 D148 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 G248 및 G249 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 P299 및 E300 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 G991 및 E992 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 BvCas12b의 아미노산 K1031 및 M1032 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 위치 157 및 158, 258 및 259, 310 및 311, 1008 및 1009, 또는 1044 및 1045 또는 Cas12a, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i 또는 Cas12j/CasΦ의 상응하는 아미노산 잔기 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 P157 및 G158 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 V258 및 G259 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 D310 및 P311 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 G1008 및 E1009 사이에 삽입된다. 다른 구현예에서, 촉매 도메인은 AaCas12b의 아미노산 G1044 및 K1045 사이에 삽입된다.
다른 구현예에서, 융합 단백질은 핵 국재화 신호(예를 들어, 이분 핵 국재화 신호)를 포함한다. 다른 구현예에서, 핵 국재화 신호의 아미노산 서열은 MAPKKKRKVGIHGVPAA(서열번호: 349)이다. 상기 양태의 다른 구현예들에서, 핵 국재화 신호는 다음과 같은 서열에 의해 암호화된다:
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC(서열번호: 350). 다른 구현예에서, Cas12b 폴리펩티드는 RuvC 도메인의 촉매 활성을 침묵시키는 돌연변이를 함유한다. 다른 구현예에서, Cas12b 폴리펩티드는 D574A, D829A 및/또는 D952A 돌연변이를 함유한다. 다른 구현예에서, 융합 단백질은 태그(예를 들어, 인플루엔자 헤마글루티닌 태그)를 추가로 함유한다.
일부 구현예에서, 융합 단백질은 내부적으로 융합된 핵염기 편집 도메인(예를 들어, 데아미나아제 도메인, 예를 들어, 아데노신 데아미나아제 도메인의 전부 또는 부분)을 갖는 napDNAbp 도메인(예를 들어, Cas12-유래 도메인)을 포함한다. 일부 구현예에서, napDNAbp는 Cas12b이다. 일부 구현예에서, 염기 편집기는 하기 표 4에 제공된 유전자좌에 삽입된 내부적으로 융합된 TadA*8 도메인을 갖는 BhCas12b 도메인을 포함한다.
표 4: Cas12b 단백질의 삽입 유전자좌
예시적이지만 비제한적인 아데노신 데아미나아제(예를 들어, TadA*8.13)는 BhCas12b 내로 삽입되어 핵산 서열을 효과적으로 편집하는 융합 단백질(예를 들어, TadA*8.13-BhCas12b)을 생성할 수 있다.
일부 구현예에서, 본원에 설명된 염기 편집 시스템은 Cas9에 TadA가 삽입된 ABE이다. Cas9에 삽입된 TadA를 갖는 관련 ABE 폴리펩티드의 서열은 첨부된 서열목록에 서열번호: 351-396으로 제공된다.
일부 구현예에서, TadA 또는 이의 변이체는 Cas9 폴리펩티드의 확인된 위치에 삽입하기 위해 아데노신 염기 편집기가 생성되었다.
예시적이지만 비제한적인 융합 단백질은 국제 PCT 출원 번호 PCT/US2020/016285 및 U.S. 가출원번호 62/852,224 및 62/852,228 에 기재되어 있으며, 이의 내용은 그 전문이 본원에 참조로 포함된다.
A에서 G로의 편집
일부 구현예에서, 본원에 기재된 염기 편집기는 아데노신 데아미나아제 도메인을 포함한다. 염기 편집기의 이러한 아데노신 데아미나아제 도메인은 A를 탈아미노화하여 G의 염기 쌍 형성 특성을 나타내는 이노신(I)을 형성함으로써 아데닌(A) 핵염기의 구아닌(G) 핵염기로의 편집을 용이하게 할 수 있다. 아데노신 데아미나아제는 데옥시리보핵산(DNA)에서 데옥시아데노신 잔기의 아데닌을 탈아미노화(즉, 아민 기를 제거)할 수 있다.
일부 구현예에서, A에서 G로의 염기 편집기는 이노신 염기 절제 복구의 억제제, 예를 들어, 우라실 글리코실라제 억제제(UGI) 도메인 또는 촉매적으로 비활성인 이노신 특이적 뉴클레아제를 추가로 포함한다. 임의의 특정 이론에 얽매이지 않고, UGI 도메인 또는 촉매적으로 비활성인 이노신 특이적 뉴클레아제는 탈아미노화된 아데노신 잔기(예를 들어, 이노신)의 염기 절제 복구를 억제하거나 또는 방지할 수 있으며, 이는 염기 편집기의 활성 또는 효율을 개선시킬 수 있다.
아데노신 데아미나아제를 포함하는 염기 편집기는 DNA, RNA 및 DNA-RNA 하이브리드를 포함한 임의의 폴리뉴클레오티드에서 작용할 수 있다. 특정 구현예에서, 아데노신 데아미나아제를 포함하는 염기 편집기는 RNA를 포함하는 폴리뉴클레오티드의 표적 A를 탈아미노화할 수 있다. 예를 들어, 염기 편집기는 RNA 폴리뉴클레오티드 및/또는 DNA-RNA 하이브리드 폴리뉴클레오티드의 표적 A를 탈아미노화할 수 있는 아데노신 데아미나아제 도메인을 포함할 수 있다. 일 구현예에서, 염기 편집기 내로 혼입된 아데노신 데아미나아제는 RNA(ADAR, 예를 들어, ADAR1 또는 ADAR2) 또는 tRNA (ADAT)에서 작용하는 아데노신 데아미나아제의 전부 또는 부분을 포함한다. 아데노신 데아미나아제 도메인을 포함하는 염기 편집기는 또한 DNA 폴리뉴클레오티드의 A 핵염기를 탈아미노화할 수 있다. 일 구현예에서 염기 편집기의 아데노신 데아미나아제 도메인은 ADAT가 DNA에서 표적 A를 탈아미노화하도록 허용하는 하나 이상의 돌연변이를 포함하는 ADAT의 전부 또는 부분을 포함한다. 예를 들어, 염기 편집기는 다음 돌연변이 D108N, A106V, D147Y, E155V, L84F, H123Y, I156F 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하는 에세리키아 콜라이로부터의 ADAT(EcTadA)의 전부 또는 부분을 포함할 수 있다. 예시적인 ADAT 호몰로그 폴리펩티드 서열은 서열목록에 서열번호 1, 397-403으로 제공된다.
아데노신 데아미나아제는 임의의 적합한 유기체(예를 들어, 이. 콜라이)로부터 유래될 수 있다. 일부 구현예에서, 아데노신 데아미나아제는 원핵생물로부터 유래한다. 일부 구현예에서, 아데노신 데아미나아제는 박테리아로부터 유래된다. 일부 구현예에서, 아데노신 데아미나아제는 에세리키아 콜라이, 스타필로코커스 아우레우스, 살모넬라 티피, 슈와넬라 푸트레파시엔스, 헤모필루스 인플루엔자, 카울로박터 크레센투스 또는 바실루스 서브틸리스로부터 유래된다. 일부 구현예에서, 아데노신 데아미나아제는 이. 콜라이로부터 유래된다. 일부 구현예에서, 아데닌 데아미나아제는 본원에 제공된 임의의 돌연변이(예를 들어, ecTadA에서의 돌연변이)에 상응하는 하나 이상의 돌연변이를 포함하는 자연 발생 아데노신 데아미나아제다. 임의의 상동성 단백질에서 상응하는 잔기는 예를 들어, 서열 정렬 및 상동성 잔기의 결정에 의해 식별될 수 있다. 따라서 본원에 기재된 임의의 돌연변이(예를 들어, ecTadA에서 식별된 임의의 돌연변이)에 상응하는 임의의 자연 발생 아데노신 데아미나아제(예를 들어, ecTadA에 대한 상동성을 가짐)에서 돌연변이가 생성될 수 있다.
일부 구현예에서, 아데노신 데아미나아제는 본원에 제공된 임의의 아데노신 데아미나아제에 제시된 아미노산 서열 중 임의의 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 본원에 제공된 아데노신 데아미나아제는 하나 이상의 돌연변이(예를 들어, 본원에 제공된 임의의 돌연변이)를 포함할 수 있음이 이해되어야 한다. 본 개시내용은 특정 퍼센트 동일성을 갖는 임의의 데아미나아제 도메인 및 본원에 기재된 임의의 돌연변이 또는 이들의 조합을 제공한다. 일부 구현예에서, 아데노신 데아미나아제는 참조 서열, 또는 본원에 제공된 임의의 아데노신 데아미나아제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 개 이상의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 당업계에 알려져 있거나 또는 본원에 기재된 아미노산 서열 중 임의의 하나와 비교하여 적어도 5 개, 적어도 10 개, 적어도 15 개, 적어도 20 개, 적어도 25 개, 적어도 30 개, 적어도 35 개, 적어도 40 개, 적어도 45 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 또는 적어도 170 개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
본원에 제공된 임의의 돌연변이(예를 들어, TadA 참조 서열에 기초함)는 이. 콜라이 TadA(ecTadA), 에스. 아우레우스 TadA(saTadA), 또는 다른 아데노신 데아미나아제(예를 들어, 박테리아 아데노신 데아미나아제)와 같은 다른 아데노신 데아미나아제 내로 도입될 수 있음이 이해되어야 한다. 추가적인 데아미나아제는 본원에 제공된 바와 같이 돌연변이될 수 있는 상동성 아미노산 잔기를 식별하도록 정렬될 수 있음이 당업자에게 이해될 것이다. 따라서, TadA 참조 서열에서 식별된 임의의 돌연변이는 상동성 아미노산 잔기를 갖는 다른 아데노신 데아미나아제(예를 들어, ecTada)에서 만들어질 수 있다. 또한 본원에 제공된 임의의 돌연변이는 개별적으로 또는 TadA 참조 서열 또는 또 다른 아데노신 데아미나아제와의 임의의 조합으로 만들어질 수 있음이 이해되어야 한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D108X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D108G, D108N, D108V, D108A, 또는 D108Y 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 그러나, 추가의 데아미나아제는 본원에 제공된 바와 같은 돌연변이될 수 있는 상동성 아미노산 잔기를 식별하기 위해 유사하게 정렬될 수 있다는 것이 이해되어야 한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106V 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E155X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E155D, E155G, 또는 E155V 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D147X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D147Y, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106X, E155X, 또는 D147X, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 E155D, E155G, 또는 E155V 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 D147Y를 포함한다. 또한, 본원에 제공된 임의의 돌연변이는 ecTadA 또는 또 다른 아데노신 데아미나아제에서 개별적으로 또는 임의의 조합으로 만들어질 수 있다는 것이 이해되어야 한다. 예를 들어, 아데노신 데아미나아제는 TadA 참조 서열에서 D108N, A106V, E155V, 및/또는 D147Y 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 함유할 수 있다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 다음 돌연변이의 군(돌연변이의 군은 ";"에 의해 구분됨), 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다: D108N 및 A106V; D108N 및 E155V; D108N 및 D147Y; A106V 및 E155V; A106V 및 D147Y; E155V 및 D147Y; D108N, A106V, 및 E155V; D108N, A106V, 및 D147Y; D108N, E155V, 및 D147Y; A106V, E155V, 및 D147Y; 및 D108N, A106V, E155V, 및 D147Y. 그러나, 본원에 제공된 상응하는 돌연변이의 임의의 조합은 아데노신 데아미나아제(예를 들어, ecTadA)에서 만들어질 수 있음이 이해되어야 한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열 (예를 들어 TadA*7.10)에서 돌연변이의 조합, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다: V82G + Y147T + Q154S; I76Y + V82G + Y147T + Q154S; L36H + V82G + Y147T + Q154S + N157K; V82G + Y147D + F149Y + Q154S + D167N; L36H + V82G + Y147D + F149Y + Q154S + N157K + D167N; L36H + I76Y + V82G + Y147T + Q154S + N157K; I76Y + V82G + Y147D + F149Y + Q154S + D167N; 또는 L36H + I76Y + V82G + Y147D + F149Y + Q154S + N157K + D167N
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, T17X, L18X, W23X, L34X, W45X, R51X, A56X, E59X, E85X, M94X, I95X, V102X, F104X, A106X, R107X, D108X, K110X, M118X, N127X, A138X, F149X, M151X, R153X, Q154X, I156X, 및/또는 K157X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, T17S, L18E, W23L, L34S, W45L, R51H, A56E, 또는 A56S, E59G, E85K, 또는 E85G, M94L, I95L, V102A, F104L, A106V, R107C, 또는 R107H, 또는 R107P, D108G, 또는 D108N, 또는 D108V, 또는 D108A, 또는 D108Y, K110I, M118K, N127S, A138V, F149Y, M151V, R153C, Q154L, I156D, 및/또는 K157R 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, D108X, 및/또는 N127X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, 및/또는 N127S 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, R26X, M61X, L68X, M70X, A106X, D108X, A109X, N127X, D147X, R152X, Q154X, E155X, K161X, Q163X, 및/또는 T166X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, R26W, M61I, L68Q, M70V, A106T, D108N, A109T, N127S, D147Y, R152C, Q154H 또는 Q154R, E155G 또는 E155V 또는 E155D, K161Q, Q163H, 및/또는 T166P 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, D108X, N127X, D147X, R152X, 및 Q154X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 또는 6 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, M61X, M70X, D108X, N127X, Q154X, E155X, 및 Q163X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 또는 8 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, D108X, N127X, E155X, 및 T166X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 또는 5 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.
일부 구현예에서, 아데노신 데아미나아제는 H8X, A106X, 및 D108X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 또는 6개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 H8X, R26X, L68X, D108X, N127X, D147X 및 E155X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 또는 8개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, R126X, L68X, D108X, N127X, D147X 및 E155X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, D108X, A109X, N127X, 및 E155X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 또는 5 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, N127S, D147Y, R152C, 및 Q154H로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 또는 6 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, M61I, M70V, D108N, N127S, Q154R, E155G 및 Q163H로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 또는 8 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, N127S, E155V, 및 T166P로 이루어진 군으로부터 선택된 1, 2, 3, 4, 또는 5 개의, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, A106T, D108N, N127S, E155D, 및 K161Q로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 또는 6 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, R26W, L68Q, D108N, N127S, D147Y, 및 E155V로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 또는 8 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, A109T, N127S, 및 E155G로 이루어진 군으로부터 선택된 1, 2, 3, 4, 또는 5 개의, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이 또는 돌연변이들을 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 다른 아데노신 데아미나아제에서 하나 이상의 또는 하나 이상의 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D108N, D108G, 또는 D108V 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106V 및 D108N 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R107C 및 D108N 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, N127S, D147Y, 및 Q154H 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, N127S, D147Y, 및 E155V 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 D108N, D147Y, 및 E155V 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, D108N, 및 N127S 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A106V, D108N, D147Y 및 E155V 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S2X, H8X, I49X, L84X, H123X, N127X, I156X 및/또는 K160X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S2A, H8Y, I49F, L84F, H123Y, N127S, I156F 및/또는 K160S 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 L84X 돌연변이 아데노신 데아미나아제를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 L84F 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H123X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H123Y 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 I156X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 I156F 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 L84X, A106X, D108X, H123X, D147X, E155X, 및 I156X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6, 또는 7 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S2X, I49X, A106X, D108X, D147X, 및 E155X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 또는 6 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8X, A106X, D108X, N127X, 및 K160X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 또는 5 개의, 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 L84F, A106V, D108N, H123Y, D147Y, E155V, 및 I156F로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6, 또는 7 개의 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S2A, I49F, A106V, D108N, D147Y, 및 E155V로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 또는 6 개의 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H8Y, A106T, D108N, N127S, 및 K160S로 이루어진 군으로부터 선택된 1, 2, 3, 4, 또는 5 개의, 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이 또는 돌연변이들을 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E25X, R26X, R107X, A142X, 및/또는 A143X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E25M, E25D, E25A, E25R, E25V, E25S, E25Y, R26G, R26N, R26Q, R26C, R26L, R26K, R107P, R107K, R107A, R107N, R107W, R107H, R107S, A142N, A142D, A142G, A143D, A143G, A143E, A143L, A143W, A143M, A143S, A143Q 및/또는 A143R 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에 상응하는 본원에 기재된 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E25X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 E25M, E25D, E25A, E25R, E25V, E25S, 또는 E25Y 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R26X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R26G, R26N, R26Q, R26C, R26L, 또는 R26K 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R107X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R107P, R107K, R107A, R107N, R107W, R107H, 또는 R107S 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A142X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A142N, A142D, A142G, 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A143X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A143D, A143G, A143E, A143L, A143W, A143M, A143S, A143Q 및/또는 A143R 돌연변이, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H36X, N37X, P48X, I49X, R51X, M70X, N72X, D77X, E134X, S146X, Q154X, K157X, 및/또는 K161X 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제에서 하나 이상의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H36L, N37T, N37S, P48T, P48L, I49V, R51H, R51L, M70L, N72S, D77G, E134G, S146R, S146C, Q154H, K157N, 및/또는 K161T 돌연변이 중 하나 이상, 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 하나 이상의 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H36X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 H36L 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 N37X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 N37T, 또는 N37S 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 P48X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 P48T 또는 P48L 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R51X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R51H 또는 R51L 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S146X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 S146R 또는 S146C 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 K157X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 K157N 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 P48X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 P48S, P48T, 또는 P48A 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A142X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 A142N 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 W23X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 W23R 또는 W23L 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R152X 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나아제에서 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에서 R152P 또는 R52H 돌연변이, 또는 또 다른 아데노신 데아미나아제에서 상응하는 돌연변이를 포함한다.
일 구현예에서, 아데노신 데아미나아제는 돌연변이 H36L, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F, 및 K157N를 포함할 수 있다. 일부 구현예에서, 아데노신 데아미나아제는 TadA 참조 서열에 비해 다음 돌연변이 조합을 포함하며, 여기서 조합의 각각의 돌연변이는 "_"에 의해 구분되고 각각의 돌연변이 조합은 괄호 사이에 있다:
(A106V_D108N),
(R107C_D108N),
(H8Y_D108N_N127S_D147Y_Q154H),
(H8Y _D108N_N127S_D147Y_E155V),
(D108N_D147Y_E155V),
(H8Y_D108N_N127S),
(H8Y_D108N_N127S_D147Y_Q154H),
(A106V_D108N_D147Y_E155V),
(D108Q_D147Y_E155V),
(D108M_D147Y_E155V),
(D108L_D147Y_E155V),
(D108K_D147Y_E155V),
(D108I_D147Y_E155V),
(D108F_D147Y_E155V),
(A106V_D108N_D147Y),
(A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V),
(E59A 캣 데드(cat dead)_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D103A_D104N),
(G22P_D103A_D104N),
(D103A_D104N_S138A),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I156F), (R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F), (R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F), (L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F), (R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V), (R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
(H36L_L84F_A106V_D108N_H123Y_ D147Y_E155V_I156F_K157N) (H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N), (N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E), (R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N), (H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F (H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_ I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F _K157N), (H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N), (W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N), (W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P _E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N), (H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155 V_I156F _K157N).
일부 구현예에서, TadA 데아미나아제는 TadA 변이체이다. 일부 구현예에서, TadA 변이체는 TadA*7.10이다. 특정 구현예에서, 융합 단백질은 단일 TadA*7.10 도메인(예를 들어, 단량체로서 제공됨)을 포함한다. 다른 구현예에서, 융합 단백질은 이종이량체를 형성할 수 있는 TadA*7.10 및 TadA(wt)를 포함한다. 일 구현예에서, 본 발명의 융합 단백질은 Cas9 니카아제에 연결된, TadA*7.10에 연결된 야생형 TadA를 포함한다.
일부 구현예에서, TadA*7.10은 적어도 하나의 변경을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 다음의 서열의 변경을 포함한다:
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열번호: 1)
일부 구현예에서, TadA*7.10은 아미노산 82 및/또는 166에서의 변경을 포함한다. 특정 구현예에서, TadA*7.10은 다음 변경 중 하나 이상을 포함한다: Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R. 다른 구현예에서, TadA*7.10의 변이체는 Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군으로부터 선택된 변경의 조합을 포함한다.
일부 구현예에서, TadA*7.10의 변이체는 L36H, I76Y, V82G, Y147T, Y147D, F149Y, Q154S, N157K, 및/또는 D167N의 군으로부터 선택된 변경 중 하나 이상을 포함한다. 일부 구현예에서, TadA*7.10의 변이체는 V82G, Y147T/D, Q154S 및 L36H, I76Y, F149Y, N157K, 및 D167N 중 하나 이상을 포함한다. 다른 구현예에서 TadA*7.10의 변이체는 V82G + Y147T + Q154S; I76Y + V82G + Y147T + Q154S; L36H + V82G + Y147T + Q154S + N157K; V82G + Y147D + F149Y + Q154S + D167N; L36H + V82G + Y147D + F149Y + Q154S + N157K + D167N; L36H + I76Y + V82G + Y147T + Q154S + N157K; I76Y + V82G + Y147D + F149Y + Q154S + D167N; 및 L36H + I76Y + V82G + Y147D + F149Y + Q154S + N157K + D167N의 군으로부터 선택된 변경의 조합을 포함한다.
일부 구현예에서, 아데노신 데아미나아제 변이체(예를 들어, TadA*8)는 결실을 포함한다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 C 말단의 결실을 포함한다. 특정 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 잔기 149, 150, 151, 152, 153, 154, 155, 156, 및 157에서 시작하는 C 말단의 결실을 포함한다.
다른 구현예에서, 아데노신 데아미나아제 변이체(예를 들어, TadA*8)는 TadA*7.10, TadA 참조 서열, 또는 다른 TadA에서 상응하는 돌연변이와 비교하여 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R 중 하나 이상의 변경을 포함하는 단량체이다. 다른 구현예에서, 아데노신 데아미나아제 변이체(TadA*8)는 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군으로부터 선택된 변경의 조합을 포함하는 단량체이다.
다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 각각 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R 및/또는 Q154R 중 하나 이상을 갖는 2개의 아데노신 데아미나아제 도메인(예를 들어, TadA*8)을 포함하는 동종이량체이다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 각각 Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군으로부터 선택된 변경의 조합을 갖는 2개의 아데노신 데아미나아제 도메인(예를 들어, TadA*8)을 포함하는 동종이량체이다.
다른 구현예에서, 본 개시내용의 염기 편집기는 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA의 상응하는 돌연변이에 대해 다음 변경 중 하나 이상의 변경: R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및/또는 D167N, 또는 또 다른 TadA의 상응하는 돌연변이를 포함하는 아데노신 데아미나아제 변이체(예를 들어, TadA*8) 단량체를 포함한다. 다른 구현예에서, 아데노신 데아미나아제 변이체 (TadA*8) 단량체는 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA의 상응하는 돌연변이에 대해 다음에서 선택되는 변경의 조합: R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N을 포함한다.
일부 구현예에서, 아데노신 데아미나아제 변이체 (예를 들어, MSP828)은 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA의 상응하는 돌연변이에 대해, 다음 변경 중 하나 이상: L36H, I76Y, V82G, Y147T, Y147D, F149Y, Q154S, N157K, 및/또는 D167N, 또는 또 다른 TadA의 상응하는 돌연변이를 포함하는 단량체이다. 일부 구현예에서, 아데노신 데아미나아제 변이체 (예를 들어, MSP828)은 TadA*7.10, TadA 참조 서열에 대해, 다음 변경 중 하나 이상: V82G, Y147T/D, Q154S 및 하나 이상의 L36H, I76Y, F149Y, N157K, 및 D167N을 포함하는 단량체이다. 다른 구현예에서, 아데노신 데아미나아제 변이체 (TadA 변이체)는 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA의 상응하는 돌연변이에 대해 다음 그룹에서 선택되는 변경의 조합: V82G + Y147T + Q154S; I76Y + V82G + Y147T + Q154S; L36H + V82G + Y147T + Q154S + N157K; V82G + Y147D + F149Y + Q154S + D167N; L36H + V82G + Y147D + F149Y + Q154S + N157K + D167N; L36H + I76Y + V82G + Y147T + Q154S + N157K; I76Y + V82G + Y147D + F149Y + Q154S + D167N; L36H + I76Y + V82G + Y147D + F149Y + Q154S + N157K + D167N을 포함하는 단량체이다.
다른 구현예에서, 아데노신 데아미나아제 변이체는 야생형 아데노신 데아미나아제 도메인 및 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA의 상응하는 돌연변이에 대해 하나 이상의 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R, 또는 또 다른 TadA의 상응하는 돌연변이를 포함하는 아데노신 데아미나아제 변이체 도메인 (예를 들어, TadA*8)의 이종이량체다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 야생형 아데노신 데아미나아제 도메인 및 TadA*7.10, TadA 참조 서열에 대해 Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 그룹에서 선택되는 변경의 조합을 포함하는 아데노신 데아미나아제 변이체 도메인 (예를 들어, TadA*8)의 이종이량체이다.
다른 구현예에서, 본 개시내용의 염기 편집기는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서의 상응하는 돌연변이와 비교하여 각각 변경 R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및/또는 D167N 중 하나 이상을 갖는 2개의 아데노신 데아미나아제 도메인(예를 들어, TadA*8)을 포함하는 아데노신 데아미나아제 변이체(예를 들어, TadA*8) 동종이량체를 포함한다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서의 상응하는 돌연변이와 비교하여 각각 R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N의 군으로부터 선택된 변경의 조합을 갖는 2개의 아데노신 데아미나아제 도메인(예를 들어, TadA*8)을 포함하는 동종이량체이다.
일부 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서의 상응하는 돌연변이와 비교하여 각각 변경 L36H, I76Y, V82G, Y147T, Y147D, F149Y, Q154S, N157K, 및/또는 D167N 중 하나 이상을 갖는 2개의 아데노신 데아미나아제 도메인(예를 들어, TadA*7.10)을 포함하는 동종이량체이다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서의 상응하는 돌연변이와 비교하여 각각 변경 V82G, Y147T/D, Q154S, 및 L36H, I76Y, F149Y, N157K, 및 D167N 중 하나 이상을 갖는 2 개의 아데노신 데아미나아제 변이체 도메인(예를 들어, MSP828)을 포함하는 동종이량체이다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서의 상응하는 돌연변이와 비교하여 각각 V82G + Y147T + Q154S; I76Y + V82G + Y147T + Q154S; L36H + V82G + Y147T + Q154S + N157K; V82G + Y147D + F149Y + Q154S + D167N; L36H + V82G + Y147D + F149Y + Q154S + N157K + D167N; L36H + I76Y + V82G + Y147T + Q154S + N157K; I76Y + V82G + Y147D + F149Y + Q154S + D167N; L36H + I76Y + V82G + Y147D + F149Y + Q154S + N157K + D167N의 군으로부터 선택된 변경의 조합을 갖는 2개의 아데노신 데아미나아제 도메인(예를 들어, TadA*7.10)을 포함하는 동종이량체이다.
다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체이고, 이는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R 중 하나 이상을 포함한다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체이며, 이는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군으로부터 선택된 변경의 조합을 포함한다.
다른 구현예에서, 염기 편집기는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체를 포함하며, 이는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 변경 R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및/또는 D167N 중 하나 이상을 포함한다. 다른 구현예에서, 염기 편집기는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 도메인의 이종이량체(예를 들어, TadA*8)를 포함하며, 이는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N의 군으로부터 선택된 변경의 조합을 포함한다.
다른 구현예에서, 아데노신 데아미나아제 변이체는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*7.10)의 이종이량체이고, 이는 TadA*7.10, TadA 참조 서열, 또는 다른 TadA에서의 상응하는 돌연변이와 비교하여 변경 L36H, I76Y, V82G, Y147T, Y147D, F149Y, Q154S, N157K, 및/또는 D167N 중 하나 이상을 포함한다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, MSP828)을 포함하는 이종이량체이며, 이는 TadA*7.10, TadA 참조 서열, 또는 다른 TadA에서 상응하는 돌연변이와 비교하여 변경 V82G, Y147T/D, Q154S, 및 L36H, I76Y, F149Y, N157K, 및 D167N 중 하나 이상을 갖는다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 야생형 아데노신 데아미나아제 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*7.10)의 이종이량체이며, 이는 TadA*7.10, TadA 참조 서열, 또는 다른 TadA에서 상응하는 돌연변이와 비교하여 V82G + Y147T + Q154S; I76Y + V82G + Y147T + Q154S; L36H + V82G + Y147T + Q154S + N157K; V82G + Y147D + F149Y + Q154S + D167N; L36H + V82G + Y147D + F149Y + Q154S + N157K + D167N; L36H + I76Y + V82G + Y147T + Q154S + N157K; I76Y + V82G + Y147D + F149Y + Q154S + D167N; L36H + I76Y + V82G + Y147D + F149Y + Q154S + N157K + D167N의 군으로부터 선택된 변경의 조합을 포함한다.
다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체이며, 이는 TadA*7.10, TadA 참조 서열, 또는 다른 TadA에서 상응하는 돌연변이와 비교하여 변경 Y147T, Y147R, Q154S, Y123H, V82S, T166R, 및/또는 Q154R 중 하나 이상을 포함한다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체이며, 이는 TadA*7.10 도메인 및 TadA*7.10, TadA 참조 서열, 또는 다른 TadA에서 상응하는 돌연변이와 비교하여 Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군으로부터 선택된 변경의 조합을 포함한다.
특정 구현예에서, 아데노신 데아미나아제 이종이량체는 에스. 아우레우스 (S. aureus) TadA, 비. 서브틸리스 (B. subtilis) TadA, 에스. 티피뮤리움 (S. typhimurium) TadA, 에스. 푸트레파시엔스 (S. putrefaciens) TadA, 에이취. 인플루엔자에 F3031 (H. influenza F3031) TadA, 씨. 크레센투스 (C. crescentus) TadA, 쥐. 술푸레두센스 (G. sulfurreducens) TadA, 또는 TadA*7.10에서 선택되는 아데노신 데아미나아제 도메인을 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 TadA*8이다. 일 구현예에서, 아데노신 데아미나아제는 다음 서열 또는 아데노신 데아미나아제 활성을 갖는 이의 단편을 포함하거나, 또는 필수적으로 구성된 TadA*8이다: MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD (서열번호: 404)
일부 구현예에서, TadA*8은 절단된다. 일부 구현예에서, 절단된 TadA*8은 전장 TadA*8에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20개의 N-말단 아미노산 잔기가 미싱(missing)된 것이다. 일부 구현예에서, 절단된 TadA*8은 전장 TadA*8에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20개의 C-말단 아미노산 잔기가 미싱된 것이다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 전장 TadA*8이다.
일부 구현예에서, TadA*8은 TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, 또는 TadA*8.24이다.
다른 구현예에서, 염기 편집기는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA의 상응하는 돌연변이에 대해 하나 이상의 다음 변경: R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및/또는 D167N을 포함하는 아데노신 데아미나아제 변이체 (예를 들어 TadA*8) 단량체를 포함한다. 다른 구현예에서, 아데노신 데아미나아제 변이체 (TadA*8) 단량체는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA의 상응하는 돌연변이에 대해 다음 그룹: R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N에서 선택되는 변경의 조합을 포함한다.
다른 구현예에서, 염기 편집기는 야생형 아데노신 데아미나아제 도메인 및 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA의 상응하는 돌연변이에 대해 하나 이상의 다음 변경: R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및/또는 D167N을 포함하는 아데노신 데아미나아제 변이체 도메인 (예를 들어, TadA*8)의 이종이량체를 포함한다. 다른 구현예에서, 염기 편집기는 야생형 아데노신 데아미나아제 도메인 및 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA의 상응하는 돌연변이에 대해 다음 그룹: R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N에서 선택되는 변경의 조합을 포함하는 아데노신 데아미나아제 변이체 도메인 (예를 들어, TadA*8)을 포함한다.
다른 구현예에서, 염기 편집기는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체를 포함하며, 이는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 변경 R26C, V88A, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및/또는 D167N 중 하나 이상을 포함한다. 다른 구현예에서, 염기 편집기는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*8)의 이종이량체를 포함하며, 이는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 R26C + A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N; V88A + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; R26C + A109S + T111R + D119N + H122N + F149Y + T166I + D167N; V88A + T111R + D119N + F149Y; 및 A109S + T111R + D119N + H122N + Y147D + F149Y + T166I + D167N의 군으로부터 선택된 변경의 조합을 포함한다.
다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*7.10)의 이종이량체이며, 이는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 변경 L36H, I76Y, V82G, Y147T, Y147D, F149Y, Q154S, N157K, 및/또는 D167N 중 하나 이상을 포함한다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 TadA *7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, MSP828)을 포함하는 이종이량체이며, 이는 TadA*7.10, TadA 참조 서열 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 변경 V82G, Y147T/D, Q154S, 및 L36H, I76Y, F149Y, N157K, 및 D167N 중 하나 이상을 갖는다. 다른 구현예에서, 아데노신 데아미나아제 변이체는 TadA*7.10 도메인 및 아데노신 데아미나아제 변이체 도메인(예를 들어, TadA*7.10)의 이종이량체이며, 이는 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 V82G + Y147T + Q154S; I76Y + V82G + Y147T + Q154S; L36H + V82G + Y147T + Q154S + N157K; V82G + Y147D + F149Y + Q154S + D167N; L36H + V82G + Y147D + F149Y + Q154S + N157K + D167N; L36H + I76Y + V82G + Y147T + Q154S + N157K; I76Y + V82G + Y147D + F149Y + Q154S + D167N; L36H + I76Y + V82G + Y147D + F149Y + Q154S + N157K + D167N의 군으로부터 선택된 변경의 조합을 포함한다.
일부 구현예에서, TadA*8은 표 5에 나타낸 바와 같은 변이체이다. 표 5는 TadA 아미노산 서열 내의 특정 아미노산 위치 번호 및 TadA-7.10 아데노신 데아미나아제 내의 이들 위치에 존재하는 아미노산을 나타낸다. 표 5는 또한 M. Richter 등, 2020, Nature Biotechnology, doi.org/10.1038/s41587-020-0453-z에 기재된 바와 같이 파지-보조된 비-연속 진화(PANCE) 및 파지-보조된 연속 진화(PACE) 후 TadA-7.10에 대한 TadA 변이체에서의 아미노산 변화를 나타내고, 이의 전체 내용은 여기에 참조로 포함된다. 일부 구현예에서, TadA*8은 TadA*8a, TadA*8b, TadA*8c, TadA*8d 또는 TadA*8e이다. 일부 구현예에서, TadA*8은 TadA*8e이다.
표 5. 선택된 TadA*8 변이체
일부 구현예에서, TadA 변이체는 표 5.1에 제시된 바와 같은 변이체이다. 표 5.1는 TadA 아미노산 서열 내의 특정 아미노산 위치 번호 및 TadA*7.10 아데노신 데아미나아제 내의 이들 위치에 존재하는 아미노산을 보여준다. 일부 구현예에서, TadA 변이체는 MSP605, MSP680, MSP823, MSP824, MSP825, MSP827, MSP828 또는 MSP829이다. 일부 구현예에서, TadA 변이체는 MSP828이다. 일부 구현예에서, TadA 변이체는 MSP829이다.
표 5.1. TadA 변이체
일 구현예에서, 본 발명의 융합 단백질은 본원에 기재된 아데노신 데아미나아제 변이체(예를 들어 TadA*8)에 연결된 야생형 TadA를 포함하고, 이는 Cas9 니카아제에 연결된다. 특정 구현예에서, 융합 단백질은 단일 TadA*8 도메인 (예를 들어, 단량체로서 제공됨)을 포함한다. 다른 구현예에서, 융합 단백질은 이종이량체를 형성할 수 있는 TadA*8 및 TadA(wt)를 포함한다.
일부 구현예에서, 아데노신 데아미나아제는 여기에 제공된 임의의 아데노신 데아미나아제에 제시된 아미노산 서열 중 임의의 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 상동성을 갖는 아미노산 서열을 포함한다. 본원에 제공된 아데노신 데아미나아제는 하나 이상의 돌연변이(예를 들어, 본원에 제공된 임의의 돌연변이)를 포함할 수 있음을 이해해야 한다. 본 개시내용은 특정 백분율 상동성을 갖는 임의의 데아미나아제 도메인과 본원에 기술된 임의의 돌연변이 또는 이들의 조합을 제공한다. 일부 구현예에서, 아데노신 데아미나아제는, 참조 서열 또는 여기에 제공된 임의의 아데노신 데아미나아제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 또는 그 이상의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 아데노신 데아미나아제는 당업계에 공지되어 있거나, 본원에 기술된 임의의 아미노산 서열 중 하나와 비교하였을 때 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 적어도 130개, 적어도 140개, 적어도 150개, 적어도 160개 또는 적어도 170개 상동성이 있는 연속 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
특정 구현예에서, TadA*8은 굵은체로 표시된 임의의 다음 위치에서 하나 이상의 돌연변이를 포함한다. 다른 구현예에서, TadA*8은 밑줄 친 것으로 제시된 임의의 다음 위치에서 하나 이상의 돌연변이를 포함한다:
예를 들어, TadA*8은 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 아미노산 위치 82 및/또는 166(예를 들어, V82S, T166R)에서 단독으로 또는 다음 Y147T, Y147R, Q154S, Y123H, 및/또는 Q154R 중 임의의 하나 이상과 조합한 변경을 포함한다. 특정 구현예에서, 변경의 조합은 TadA*7.10, TadA 참조 서열, 또는 또 다른 TadA에서 상응하는 돌연변이와 비교하여 Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; 및 I76Y + V82S + Y123H + Y147R + Q154R의 군으로부터 선택된다.
일부 구현예에서, TadA*8은 절단된다. 일부 구현예에서, 절단된 TadA*8은 전장 TadA*8에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20개의 N-말단 아미노산 잔기가 미싱(missing)된 것이다. 일부 구현예에서, 절단된 TadA*8은 전장 TadA*8에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19, 또는 20개의 C-말단 아미노산 잔기가 미싱된 것이다. 일부 구현예에서, 아데노신 데아미나아제 변이체는 전장 TadA*8이다.
일 구현예에서, 본 발명의 융합 단백질은 Cas9 니카아제에 연결된, 본원에 기술된 아데노신 데아미나아제 변이체(예를 들어, TadA*8)에 연결된 야생형 TadA를 포함한다. 특정 구현예에서, 융합 단백질은 단일 TadA*8 도메인(예를 들어, 단량체로서 제공됨)을 포함한다. 다른 구현예에서, 염기 편집기는 이종이량체를 형성할 수 있는 TadA*8 및 TadA(wt)를 포함한다.
특정 구현예에서, 융합 단백질은 단일(예를 들어, 단량체로서 제공됨) TadA*8을 포함한다. 일부 구현예에서, TadA*8은 Cas9 니카아제에 연결된다. 일부 구현예에서, 본 발명의 융합 단백질은 TadA*8에 연결된 야생형 TadA(TadA(wt))의 이종이량체로서 포함된다. 다른 구현예에서, 본 발명의 융합 단백질은 TadA*8에 연결된 TadA*7.10의 이종이량체로서 포함된다. 일부 구현예에서, 염기 편집기는 TadA*8 변이체 단량체를 포함하는 ABE8이다. 일부 구현예에서, 염기 편집기는 TadA*8 및 TadA(wt)의 이종이량체를 포함하는 ABE8이다. 일부 구현예에서, 염기 편집기는 TadA*8 및 TadA*7.10의 이종이량체를 포함하는 ABE8이다. 일부 구현예에서, 염기 편집기는 TadA*8의 이종이량체를 포함하는 ABE8이다. 일부 구현예에서, TadA*8은 표 5, 11 또는 12로부터 선택된다. 일부 구현예에서, ABE8은 표 11, 12 또는 14로부터 선택된다.
일부 구현예에서, 아데노신 데아미나아제는 TadA*9 변이체이다. 일부 구현예에서, 아데노신 디아미나제는 하기 서열(TadA*7.10으로 지칭됨)을 참조하여 하기 기재된 변이체로부터 선택된 TadA*9 변이체이다:
일부 구현예에서, 아데노신 데아미나아제는 다음 변경 중 하나 이상을 포함한다: R21N, R23H, E25F, N38G, L51W, P54C, M70V, Q71M, N72K, Y73S, V82T, M94V, P124W, T133K, D139L, D139M, C146R, 및 A158K. 하나 이상의 변경은 밑줄 및 굵은체로 상기 서열에 표기되었다.
일부 구현예에서, 아데노신 데아미나아제는 다음 변경의 조합 중 하나 이상을 포함한다: V82S + Q154R + Y147R; V82S + Q154R + Y123H; V82S + Q154R + Y147R+ Y123H; Q154R + Y147R + Y123H + I76Y+ V82S; V82S + I76Y; V82S + Y147R; V82S + Y147R + Y123H; V82S + Q154R + Y123H; Q154R + Y147R + Y123H + I76Y; V82S + Y147R; V82S + Y147R + Y123H; V82S + Q154R + Y123H; V82S + Q154R + Y147R; V82S + Q154R + Y147R; Q154R + Y147R + Y123H + I76Y; Q154R + Y147R + Y123H + I76Y + V82S; I76Y_V82S_Y123H_Y147R_Q154R; Y147R + Q154R + H123H; 및 V82S + Q154R.
일부 구현예에서, 아데노신 데아미나아제는 다음 변경의 조합 중 하나 이상을 포함한다: E25F + V82S + Y123H, T133K + Y147R + Q154R; E25F + V82S + Y123H + Y147R + Q154R; L51W + V82S + Y123H + C146R + Y147R + Q154R; Y73S + V82S + Y123H + Y147R + Q154R; P54C + V82S + Y123H + Y147R + Q154R; N38G + V82T + Y123H + Y147R + Q154R; N72K + V82S + Y123H + D139L + Y147R + Q154R; E25F + V82S + Y123H + D139M + Y147R + Q154R; Q71M + V82S + Y123H + Y147R + Q154R; E25F + V82S + Y123H + T133K + Y147R + Q154R; E25F + V82S + Y123H + Y147R + Q154R; V82S + Y123H + P124W + Y147R + Q154R; L51W + V82S + Y123H + C146R + Y147R + Q154R; P54C + V82S + Y123H + Y147R + Q154R; Y73S + V82S + Y123H + Y147R + Q154R; N38G + V82T + Y123H + Y147R + Q154R; R23H + V82S + Y123H + Y147R + Q154R; R21N + V82S + Y123H + Y147R + Q154R; V82S + Y123H + Y147R + Q154R + A158K; N72K + V82S + Y123H + D139L + Y147R + Q154R; E25F + V82S + Y123H + D139M + Y147R + Q154R; 및 M70V + V82S + M94V + Y123H + Y147R + Q154R.
일부 구현예에서, 아데노신 데아미나아제는 다음 변경의 조합 중 하나 이상을 포함한다: Q71M + V82S + Y123H + Y147R + Q154R; E25F + I76Y+ V82S + Y123H + Y147R + Q154R; I76Y + V82T + Y123H + Y147R + Q154R; N38G + I76Y + V82S + Y123H + Y147R + Q154R; R23H + I76Y + V82S + Y123H + Y147R + Q154R; P54C + I76Y + V82S + Y123H + Y147R + Q154R; R21N + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82S + Y123H + D139M + Y147R + Q154R; Y73S + I76Y + V82S + Y123H + Y147R + Q154R; E25F + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82T + Y123H + Y147R + Q154R; N38G + I76Y + V82S + Y123H + Y147R + Q154R; R23H + I76Y + V82S + Y123H + Y147R + Q154R; P54C + I76Y + V82S + Y123H + Y147R + Q154R; R21N + I76Y + V82S + Y123H + Y147R + Q154R; I76Y + V82S + Y123H + D139M + Y147R + Q154R; Y73S + I76Y + V82S + Y123H + Y147R + Q154R; and V82S + Q154R; N72K_V82S + Y123H + Y147R + Q154R; Q71M_V82S + Y123H + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R + A158K; M70V +Q71M +N72K +V82S + Y123H + Y147R + Q154R; N72K_V82S + Y123H + Y147R + Q154R; Q71M_V82S + Y123H + Y147R + Q154R; M70V +V82S + M94V + Y123H + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R; V82S + Y123H + T133K + Y147R + Q154R + A158K; 및 M70V +Q71M +N72K +V82S + Y123H + Y147R + Q154R. 일부 구현예에서, 아데노신 데아미나아제는 단량체로서 발현된다. 다른 구현예에서, 아데노신 데아미나아제는 이종이량체로서 발현된다. 일부 구현예에서, 데아미나아제 또는 다른 폴리펩티드 서열은, 예를 들어 융합 단백질의 구성요소로서 포함될 때, 메티오닌이 결여된다. 이는 위치의 넘버링을 변경할 수 있다. 그러나, 당업자는 이러한 상응하는 돌연변이가 동일한 돌연변이, 예를 들어 Y73S 및 Y72S 및 D139M 및 D138M을 지칭함을 이해할 것이다.
일부 구현예에서, TadA*9 변이체는 본원에 기재된 표 15에 기재된 변경을 포함한다.
일부 구현예에서, TadA*9 변이체는 단량체이다. 일부 구현예에서, TadA*9 변이체는 야생형 TadA 아데노신 데아미나아제를 갖는 이종이량체다. 일부 구현예에서, TadA*9 변이체는 또 다른 TadA 변이체(예를 들어, TadA*8, TadA*9)를 갖는 이종이량체다. TadA*9 아데노신 데아미나아제에 대한 추가 세부 사항은 국제 PCT 출원 번호 PCT/2020/049975에 기재되어 있으며, 이는 그 전문이 여기에 참조로 포함된다.
본원에 제공된 임의의 돌연변이 및 임의의 추가의 돌연변이(예를 들어, ecTadA 아미노산 서열을 기초로 함)는 임의의 다른 아데노신 데아미나아제에 도입될 수 있다. 본원에 제공된 돌연변이 중 임의의 것은 개별적으로 또는 TadA 참조 서열 또는 또 다른 아데노신 데아미나아제(예를 들어, ecTadA)에서 임의의 조합으로 이루어질 수 있다.
A에서 G로의 핵염기 편집 단백질의 상세한 내용은 국제 PCT 출원번호 PCT/2017/045381 (WO2018/027078) 및 Gaudelli, N.M., 등, "Programmable base editing of AㆍT to GㆍC in genomic DNA without DNA cleavage" Nature, 551, 464-471 (2017)에 기재되어 있으며, 그의 전체 내용은 본원에 참조로 포함된다.
C에서 T로의 편집
일부 구현예에서, 본 명세서에 개시된 염기 편집기는 폴리뉴클레오티드의 표적 사이티딘(C) 염기를 탈아민화하여 티민의 염기쌍 결합 특성을 갖는 우리딘(U)을 생성할 수 있는 사이티딘 데아미나아제를 포함하는 융합 단백질을 포함한다. 예를 들어 폴리뉴클레오티드가 이중 가닥(예: DNA)인 일부 구현예에서, 우리딘 염기는 티미딘 염기로 치환되어(예: 세포 복구 기구에 의해) C:G에서 T:A로 전환될 수 있다. 다른 구현예에서, 염기 편집기에 의한 핵산 내 C에서 U로의 탈아미노화는 U에서 T로의 치환을 수반할 수 없다.
U를 발생시키기 위한 폴리뉴클레오티드 내 표적 C의 탈아미노화는 본원에 기술된 염기 편집기에 의해 실행될 수 있는 염기 편집 유형의 비제한적인 예이다. 또 다른 예에서, 사이티딘 데아미나아제 도메인을 포함하는 염기 편집기는 사이토신(C) 염기의 구아닌(G) 염기로의 전환을 중재할 수 있다. 예를 들어, 염기 편집기의 사이티딘 데아미나아제 도메인에 의한 사이티딘의 탈아미노화에 의해 생성된 폴리뉴클레오티드의 U는 염기 절단 복구 메커니즘(예: 우라실 DNA 글리코실라제(UDG) 도메인)에 의해 폴리뉴클레오티드로부터 절단되어 무염기 부위(abasic site)를 생성할 수 있다. 이어서, 염기 부위 반대편의 핵염기는 예를 들어 전이 중합효소에 의해 C와 같은 또 다른 염기로 대체될 수 있다(예를 들어, 염기 복구 기구에 의해). 무염기 부위 반대편의 핵염기가 C로 대체되는 것이 일반적이지만, 다른 치환(예를 들어, A, G 또는 T)도 발생할 수 있다.
따라서, 일부 구현예에서, 본 명세서에 기술된 염기 편집기는 폴리뉴클레오티드에서 표적 C를 U로 탈아미노화할 수 있는 탈아미노화 도메인(예를 들어, 사이티딘 데아미나아제 도메인)을 포함한다. 또한, 아래에 설명된 바와 같이, 염기 편집기는 탈아미노화로 인한 U의 일부 실시예에서는 T 또는 G로의 전환을 촉진하는 추가 도메인을 포함할 수 있다. 예를 들어, 사이티딘 데아미나아제 도메인을 포함하는 염기 편집기는 우라실을 추가로 포함할 수 있다. 글리코실라제 억제제(UGI) 도메인은 U의 T로의 치환을 중재하여 C에서 T로의 염기 편집 이벤트를 완료한다. 또 다른 예에서, 염기 편집기는 C에서 G로의 염기 편집의 효율성을 향상시키기 위해 전이 중합효소가 혼입될 수 있다. 왜냐하면 전이 중합효소는 무염기 부위 반대편에 C의 혼입을 촉진할 수 있기 때문이다(즉, 무염기 부위에 G를 혼입시키고, C에서 G로의 염기 편집 이벤트를 완료함).
사이티딘 데아미나아제를 도메인으로 포함하는 염기 편집기는 DNA, RNA 및 DNA-RNA 하이브리드를 포함한 임의의 폴리뉴클레오티드에서 표적 C를 탈아미노화할 수 있다. 일반적으로 사이티딘 데아미나아제는 폴리뉴클레오티드의 단일 가닥 부분에 위치하는 C 핵염기를 촉매한다. 일부 구현예에서, 표적 C를 포함하는 전체 폴리뉴클레오티드는 단일 가닥일 수 있다. 예를 들어, 염기 편집기에 혼입된 사이티딘 데아미나아제는 단일 가닥 RNA 폴리뉴클레오티드의 표적 C를 탈아미노화할 수 있다. 다른 구현예에서, 사이티딘 데아미나아제도메인을 포함하는 염기 편집기는 이중 가닥 폴리뉴클레오티드에 작용할 수 있지만, 표적 C는 탈아미노화 반응 시 단일 가닥 상태에 있는 폴리뉴클레오티드의 일부에 위치할 수 있다. 예를 들어, NAGPB 도메인이 Cas9 도메인을 포함하는 구현예에서, 여러 뉴클레오티드는 Cas9-gRNA-표적 DNA 복합체 형성 동안 쌍을 이루지 않은 상태로 남아 Cas9 "R-루프 복합체"가 형성될 수 있다. 이러한 짝을 이루지 않은 뉴클레오티드는 단일 가닥 특정 뉴클레오티드 데아미나아제 효소(예: 사이티딘 데아미나아제)에 대한 기질 역할을 할 수 있는 단일 가닥 DNA 버블을 형성할 수 있다.
일부 구현예에서, 염기 편집기의 사이티딘 데아미나아제는 아포지단백질 B mRNA 편집 복합체(APOBEC) 계열 데아미나아제의 전부 또는 일부를 포함할 수 있다. APOBEC은 진화적으로 보존된 사이티딘 탈아미노효소 계열이다. 이 계열의 구성원은 C에서 U로의(C-to-U) 편집 효소이다. APOBEC 유사 단백질의 N-말단 도메인은 촉매 도메인인 반면, C-말단 도메인은 유사촉매 도메인이다. 보다 구체적으로, 촉매 도메인은 아연 의존성 사이티딘 탈아미노효소 도메인이며 사이티딘 탈아미노화에 중요하다. APOBEC 계열 구성원에는 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D(현재 "APOBEC3E"는 이를 지칭함), APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4 및 활성화 유도(사이티딘) 데아미나아제가 포함된다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC1 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC2 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3A 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3B 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3C 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3D 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3E 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3F 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3G 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC3H 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC4 데아미나아제의 전부 또는 일부를 포함한다. 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 활성화 유도 데아미나아제(AID)의 전부 또는 일부를 포함한다. 일부 구현예에서 염기 편집기에 포함된 데아미나아제는 사이티딘 데아미나아제 1(CDA1)의 전부 또는 일부를 포함한다. 염기 편집기는 임의의 적합한 유기체(예를 들어, 인간 또는 쥐)로부터의 데아미나아제를 포함할 수 있음을 이해해야 한다. 일부 구현예에서, 염기 편집기의 데아미나아제 도메인은 인간, 침팬지, 고릴라, 원숭이, 소, 개, 쥐 또는 마우스로부터 유래된다. 일부 구현예에서, 염기 편집기의 데아미나아제 도메인은 래트(예를 들어, 래트 APOBEC1)로부터 유래된다. 일부 구현예에서, 염기 편집기의 데아미나아제 도메인은 인간 APOBEC1이다. 일부 구현예에서, 염기 편집기의 데아미나아제 도메인은 pmCDA1이다.
본 개시의 측면에 따라 Cas9에 융합될 수 있는 다른 예시적인 데아미나아제가 아래에 제공된다. 구현예에서, 데아미나아제는 활성화 유도된 데아미나아제(AID)이다. 일부 구현예에서, 각각의 서열의 활성 도메인, 예를 들어 국소화 신호가 없는 도메인(핵 국소화 서열, 핵 방출 신호가 없는 핵 국소화 서열, 세포질 국소화 신호)이 사용될 수 있다는 것이 이해되어야 한다.
본 개시내용의 일부 측면은 예를 들어 데아미나아제 도메인에서 점 돌연변이를 생성함으로써 본원에 기술된 임의의 융합 단백질의 데아미나아제 도메인 촉매 활성을 조절하는 것이 융합 단백질의 진행성에 영향을 미친다는 인식에 기초한다(예를 들어, 염기 편집기). 예를 들어, 염기 편집 융합 단백질 내에서 데아미나아제 도메인의 촉매 활성을 감소시키지만 제거하지는 않는 돌연변이는 데아미나아제 도메인이 표적 잔기에 인접한 잔기의 탈아미노화를 촉매할 가능성을 줄임으로써 탈아미노화 윈도우를 좁힐 수 있다. 탈아미노화 윈도우을 좁힐 수 있는 능력은 특정 표적 잔기에 인접한 잔기의 원치 않는 탈아미노화를 방지할 수 있으며, 이는 오프-타겟 효과를 감소시키거나 방지할 수 있다.
예를 들어, 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 H121X, H122X, R126X, R126X, R118X, W90X, W90X 및 R132X로 구성된 그룹으로부터 선택된 하나 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함할 수 있고, 여기서 X는 임의의 아미노산이다.
일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 H121R, H122R, R126A, R126E, R118A, W90A, W90Y 및 R132E로 구성된 그룹으로부터 선택된 하나 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함할 수 있다.
일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 D316X, D317X, R320X, R320X, R313X, W285X, W285X, R326X로 구성된 그룹 중에서 선택되는 하나 이상의 돌연변이, 또는 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함할 수 있으며, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 hAPOBEC3G의 D316R, D317R, R320A, R320E, R313A, W285A, W285Y, R326E로 이루어진 군으로부터 선택된 하나 이상의 돌연변이, 또는 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함한다.
일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 H121R 및 H122R 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R126A 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R126E 돌연변이, 또는 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R118A 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90A 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90Y 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90Y 및 R126E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 R126E 및 R132E 돌연변이, 또는 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90Y 및 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 rAPOBEC1의 W90Y, R126E 및 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다.
일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 D316R 및 D317R 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 hAPOBEC3G의 R320A 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함한다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 R320E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 R313A 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285A 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285Y 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285Y 및 R320E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 R320E 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285Y 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다. 일부 구현예에서, 염기 편집기에 혼입된 APOBEC 데아미나아제는 hAPOBEC3G의 W285Y, R320E 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나아제의 하나 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나아제를 포함할 수 있다.
SaBE3, SaKKH-BE3, VQR-BE3, EQR-BE3, VRER-BE3, YE1-BE3, EE-BE3, YE2-BE3 및 YEE-BE3를 포함하되 이에 국한되지 않는 다수의 변형된 사이티딘 데아미나아제가 상업적으로 이용 가능하며, 이들은 애드진(Addgene)에서 구입 가능하다(플라스미드 85169, 85170, 85171, 85172, 85173, 85174, 85175, 85176, 85177). 일부 구현예에서, 염기 편집기에 포함된 데아미나아제는 APOBEC1 데아미나아제의 전부 또는 일부를 포함한다.
일부 구현예에서, 본 발명의 융합 단백질은 하나 이상의 사이티딘 데아미나아제 도메인을 포함한다. 일부 구현예에서, 본원에 제공된 사이티딘 데아미나아제는 사이토신 또는 5-메틸사이토신을 우라실 또는 티민으로 탈아민화할 수 있다. 일부 구현예에서, 본원에 제공된 사이티딘 데아미나아제는 DNA에서 사이토신을 탈아미노화할 수 있다. 사이티딘 데아미나아제는 임의의 적합한 유기체로부터 유래될 수 있다. 일부 구현예에서, 사이티딘 데아미나아제는 본원에 제공된 임의의 돌연변이에 상응하는 하나 이상의 돌연변이를 포함하는 자연 발생 사이티딘 데아미나아제이다. 당업자는 예를 들어 서열 정렬 및 상동 잔기의 결정에 의해 임의의 상동 단백질에서 상응하는 잔기를 확인할 수 있을 것이다. 따라서, 당업자는 본원에 기술된 임의의 돌연변이에 상응하는 임의의 자연 발생 사이티딘 데아미나아제에서 돌연변이를 생성할 수 있을 것이다. 일부 구현예에서 사이티딘 데아미나아제는 원핵생물로부터 유래된다. 일부 구현예에서 사이티딘 데아미나아제는 박테리아로부터 유래된다. 일부 구현예에서, 사이티딘 데아미나아제는 포유동물(예를 들어, 인간)로부터 유래된다.
일부 구현예에서, 사이티딘 데아미나아제는 본원에 제시된 사이티딘 데아미나아제 아미노산 서열 중 어느 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 상동성을 갖는 아미노산 서열을 포함한다. 본원에 제공된 사이티딘 데아미나아제는 하나 이상의 돌연변이(예를 들어, 본원에 제공된 임의의 돌연변이)를 포함할 수 있음을 이해해야 한다. 일부 구현예는 임의의 이전 측면 또는 본원에 기술된 사이티딘 데아미나아제 핵염기 편집기 폴리펩티드를 코딩하는 폴리뉴클레오티드 분자를 제공한다. 일부 구현예에서, 폴리뉴클레오티드는 코돈 최적화된다.
본 개시내용은 특정 백분율 동일성을 갖는 임의의 데아미나아제 도메인과 본원에 기술된 임의의 돌연변이 또는 이들의 조합을 제공한다. 일부 구현예에서, 사이티딘 데아미나아제는 참조 서열 또는 본원에 제공된 임의의 사이티딘 데아미나아제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 이상의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 구현예에서 사이티딘 데아미나아제는 당업계에 공지되어 있거나 본원에 기술된 아미노산 서열 중 어느 하나와 비교하여 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 최소 50개, 최소 60개, 최소 70개, 최소 80개, 최소 90개, 최소 100개, 최소 110개, 최소 120개, 최소 130개, 최소 140개, 최소 150개, 최소 160개 또는 적어도 170개의 동일한 연속 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
본 발명의 제2 단백질의 융합 단백질은 2개 이상의 핵산 편집 도메인을 포함한다.
C에서 T로의 핵염기 편집의 세부사항은 국제 PCT 출원번호 PCT/US2016/058344 (WO2017/070632) 및 Komor, A.C., 등 “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533, 420-424 (2016)에 기술되어 있으며, 그 전체 내용은 여기에 참조로 포함된다.
가이드 폴리뉴클레오티드
폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은, 결합된 가이드 폴리뉴클레오티드(예를 들어, gRNA)와 결합할 때 표적 폴리뉴클레오티드 서열에 특이적으로 결합할 수 있으며 (즉, 결합된 가이드 핵산의 염기와 표적 폴리뉴클레오티드 서열의 염기 사이의 상보적인 염기쌍 형성을 통해), 이에 의해 편집하고자 하는 표적 핵산 서열에 염기 편집기를 위치시킨다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 단일 가닥 DNA 또는 이중 가닥 DNA를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 RNA를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오티드 서열은 DNA-RNA 하이브리드를 포함한다.
CRISPR는 이동성 유전 요소(바이러스, 전이 요소 및 접합 플라스미드)로부터 보호하는 적응성 면역 시스템이다. CRISPR 클러스터에는 스페이서, 선행 모바일 요소에 상보적인 서열 및 표적 침입 핵산이 포함되어 있다. CRISPR 클러스터는 CRISPR RNA(crRNA)로 전사되고 처리된다. 유형 II CRISPR 시스템에서 pre-crRNA의 올바른 처리에는 트랜스 코딩된 소형 RNA(tracrRNA), 내인성 리보뉴클레아제 3(rnc) 및 Cas9 단백질이 필요하다. tracrRNA는 pre-crRNA의 리보뉴클레아제 3 보조 처리를 위한 가이드 역할을 한다. 이어서, Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 핵내분해적으로 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 내핵용해적으로(endonucleolytically) 절단된 다음, 외핵용해적으로(exonucleolytically) 3'-5' 트리밍된다. 자연적으로 DNA 결합과 절단에는 일반적으로 단백질과 두 RNA가 모두 필요하다. 그러나 단일 가이드 RNA("sgRNA" 또는 간단히 "gRNA")는 crRNA 및 tracrRNA 둘 다의 측면을 단일 RNA 종에 혼입하도록 조작될 수 있다. 예를 들어 Jinek M., 등 Science 337:816-821(2012)를 참고하며, 이의 전체 내용은 여기에 참조로 포함된다. Cas9은 CRISPR 반복 서열(PAM 또는 프로토스페이서 인접 모티프)에서 짧은 모티프를 인식하여 자기와 비자기를 구별하는 데 도움을 준다. 예를 들어 “genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J.J. 등 Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. 등 Nature 471:602-607(2011); 및 Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity, Jinek M. 등, Science 337:816-821(2012)를 참조하며, 이의 전체 내용은 여기에 참조로 포함된다.
PAM 서열은 당업계에 공지된 임의의 PAM 서열일 수 있다. 적합한 PAM 서열에는NGG, NGA, NGC, NGN, NGT, NGCG, NGAG, NGAN, NGNG, NGCN, NGCG, NGTN, NNGRRT, NNNRRT, NNGRR(N), TTTV, TYCV, TYCV, TATV, NNNNGATT, NNAGAAW 또는 NAAAAC가 포함되나 이로 제한되지 않는다. Y는 피리미딘이고; N은 임의의 뉴클레오티드 염기이고; W는 A 또는 T이다.
일 구현예에서, 본 명세서에 기술된 가이드 폴리뉴클레오티드는 RNA 또는 DNA일 수 있다. 한 구현예에서, 가이드 폴리뉴클레오티드는 gRNA이다. RNA/Cas 복합체는 Cas 단백질을 표적 DNA로 "유도"하는 데 도움을 줄 수 있다. Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 핵내분해적으로 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 내핵용해적으로 절단된 다음, 외핵용해적으로 3'-5'로 잘린다. 자연적으로 DNA 결합과 절단에는 일반적으로 단백질과 두 RNA가 모두 필요하다. 그러나 단일 가이드 RNA("sgRNA" 또는 간단히 "gRNA")는 crRNA 및 tracrRNA 둘 다의 측면을 단일 RNA 종에 혼입하도록 조작될 수 있다. 예를 들어 Jinek M., 등. Science 337:816-821(2012)를 참고하며, 이의 전체 내용은 여기에 참조로 포함된다.
일부 구현예에서, 가이드 폴리뉴클레오티드는 적어도 하나의 단일 가이드 RNA("sgRNA" 또는 "gRNA")이다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 예를 들어 상보적인 염기쌍(예를 들어, 이중 가이드 폴리뉴클레오티드, 이중 gRNA)을 통해 서로 상호작용할 수 있는 2개 이상의 개별 폴리뉴클레오티드를 포함한다. 예를 들어, 가이드 폴리뉴클레오티드는 CRISPR RNA(crRNA) 및 트랜스 활성화 CRISPR RNA(tracrRNA)를 포함할 수 있거나 하나 이상의 트랜스 활성화 CRISPR RNA(tracrRNA)를 포함할 수 있다.
일부 구현예에서, 가이드 폴리뉴클레오티드는 적어도 하나의 tracrRNA이다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인(예를 들어, Cas9 또는 Cpf1)을 표적 뉴클레오티드 서열로 안내하기 위해 PAM 서열을 필요로 하지 않는다.
가이드 폴리뉴클레오티드는 천연 또는 비천연(또는 비천연) 뉴클레오티드(예를 들어, 펩티드 핵산 또는 뉴클레오티드 유사체)를 포함할 수 있다. 일부 경우에, 가이드 핵산 서열의 표적화 영역은 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 뉴클레오티드 길이일 수 있다. 가이드 핵산의 표적화 영역은 길이가 10-30개 뉴클레오티드, 또는 15-25개 뉴클레오티드, 또는 15-20개 뉴클레오티드 길이일 수 있다.
일부 구현예에서, 본원에 제공된 염기 편집기는 하나 이상의 가이드 폴리뉴클레오티드(예: 다중 gRNA)를 활용한다. 일부 구현예에서, 단일 가이드 폴리뉴클레오티드는 본 명세서에 설명된 다양한 염기 편집기에 사용된다. 예를 들어, 단일 가이드 폴리뉴클레오티드는 사이티딘 염기 편집기 및 아데노신 염기 편집기에 활용될 수 있다.
일부 구현예에서, 본 명세서에 기술된 방법은 조작된 Cas 단백질을 활용할 수 있다. 가이드 RNA(gRNA)는 Cas 결합에 필요한 스캐폴드 서열과 변형할 게놈 표적을 정의하는 사용자 정의 ~20 뉴클레오티드 스페이서로 구성된 짧은 합성 RNA이다. 예시적인 gRNA 스캐폴드 서열은 서열 목록에 서열 번호: 405-415로 제공된다. 따라서, 숙련된 기술자는 Cas 단백질 특이성의 게놈 표적을 변경할 수 있으며, 이는 gRNA 표적화 서열이 게놈의 나머지 부분과 비교하여 게놈 표적에 대해 얼마나 특이적인가에 따라 부분적으로 결정된다.
다른 구현예에서, 가이드 폴리뉴클레오티드는 단일 분자(즉, 단일 분자 가이드 핵산)에 핵산의 폴리뉴클레오티드 표적화 부분과 핵산의 스캐폴드 부분을 모두 포함할 수 있다. 예를 들어, 단일 분자 가이드 폴리뉴클레오티드는 단일 가이드 RNA(sgRNA 또는 gRNA)일 수 있다. 본 명세서에서 가이드 폴리뉴클레오티드 서열이라는 용어는 염기 편집기와 표적 폴리뉴클레오티드 서열과 상호작용하고 이를 지시할 수 있는 임의의 단일, 이중 또는 다중 분자 핵산을 고려한다.
전형적으로, 가이드 폴리뉴클레오티드(예를 들어, crRNA/trRNA 복합체 또는 gRNA)는 표적 폴리뉴클레오티드 서열을 인식하고 이에 결합할 수 있는 서열을 포함하는 "폴리뉴클레오티드-표적화 분절" 및 이를 안정화시키는 "단백질-결합 분절"를 포함한다. 염기 편집기의 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 구성요소 내에서 폴리뉴클레오티드를 안내한다. 일부 구현예에서, 가이드 폴리뉴클레오티드의 폴리뉴클레오티드 표적화 분절은 DNA 폴리뉴클레오티드를 인식하고 이에 결합함으로써 DNA 내 염기의 편집을 촉진한다. 다른 경우에, 가이드 폴리뉴클레오티드의 폴리뉴클레오티드 표적화 분절은 RNA 폴리뉴클레오티드를 인식하고 이에 결합하여 RNA의 염기 편집을 촉진한다. 본 명세서에서 "분절"은 분자의 섹션 또는 영역, 예를 들어 가이드 폴리뉴클레오티드 내 연속적인 뉴클레오티드 스트레치를 의미한다. 분절은 또한 분절이 다음보다 많은 영역을 포함할 수 있도록 복합체의 영역/섹션을 의미할 수 있다. 예를 들어, 가이드 폴리뉴클레오티드가 다중 핵산 분자를 포함하는 경우, 단백질 결합 분절은 예를 들어 상보성 영역을 따라 혼성화되는 다중 개별 분자의 전부 또는 일부를 포함할 수 있다. 두 개의 개별 분자를 포함하는 DNA 표적화 RNA의 결합 분절은 (i) 길이가 100개의 염기쌍인 첫 번째 RNA 분자의 염기쌍 40-75 및 (ii) 두 번째 RNA 분자의 염기쌍 10-25를 포함할 수 있으며, 즉, 길이는 50개 염기쌍이다. 특정 문맥에서 달리 구체적으로 정의되지 않는 한, "분절"의 정의는 총 염기쌍의 특정 수에 제한되지 않고, 주어진 RNA 분자로부터의 특정 염기쌍 수에 제한되지 않으며, 특정 염기쌍 수에 제한되지 않고, 복합체 내의 개별 분자의 수는 임의의 전체 길이의 RNA 분자 영역을 포함할 수 있으며 다른 분자에 대한 상보성을 갖는 영역을 포함할 수 있다.
가이드 폴리뉴클레오티드는 화학적으로 합성되거나, 효소적으로 합성되거나, 이들의 조합으로 합성될 수 있다. 예를 들어, gRNA는 표준 포스포르아미다이트 기반 고체상 합성 방법을 사용하여 합성할 수 있다. 대안적으로, gRNA는 gRNA를 코딩하는 DNA를 파지 RNA 폴리머라아제에 의해 인식되는 프로모터 제어 서열에 작동가능하게 연결함으로써 시험관내에서 합성될 수 있다. 적합한 파지 프로모터 서열의 예에는 T7, T3, SP6 프로모터 서열 또는 그의 변이가 포함된다. gRNA가 2개의 별도의 분자(예를 들어, crRNA 및 tracrRNA)를 포함하는 구현예에서, crRNA는 화학적으로 합성될 수 있고 tracrRNA는 효소적으로 합성될 수 있다.
가이드 폴리뉴클레오티드는 예를 들어 gRNA를 코딩하는 DNA, 예를 들어 gRNA를 코딩하는 서열을 포함하는 DNA 벡터에 의해 발현될 수 있다. gRNA는 단독으로 또는 코딩된 염기 편집기와 함께 코딩될 수 있다. 이러한 DNA 서열은 발현 시스템, 예를 들어 세포 내로 함께 또는 별도로 도입될 수 있다. 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 및 gRNA를 코딩하는 DNA 서열은 세포 내로 도입될 수 있으며, 각 DNA 서열은 별도의 분자(예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 코딩 서열을 포함하는 하나의 벡터 및 두 번째 벡터)의 일부일 수 있다. gRNA 코딩 서열을 포함하는 또는 둘 다 동일한 분자의 일부일 수 있다(예를 들어, 폴리뉴클레오티드 프로그래밍 가능힌 뉴클레오티드 결합 도메인과 gRNA 둘 다에 대한 코딩(및 조절) 서열을 포함하는 하나의 벡터). RNA는 합성 DNA 분자(예: gBlocks®유전자 단편)로부터 전사될 수 있다. gRNA 분자는 in vitro에서 전사될 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 3개의 영역, 즉 염색체 서열의 표적 부위에 상보적일 수 있는 5' 말단의 첫 번째 영역, 스템 루프 구조를 형성할 수 있는 두 번째 내부 영역, 및 단일 가닥이 될 수 있는 세 번째 3' 영역을 포함할 수 있다. 각 gRNA의 첫 번째 영역은 또한 각 gRNA가 융합 단백질을 특정 표적 부위로 안내하도록 다를 수 있다. 또한, 각 gRNA의 두 번째 및 세 번째 영역은 모든 gRNA에서 동일할 수 있다.
gRNA의 제1 영역 또는 가이드 폴리뉴클레오티드는 gRNA의 제1 영역이 표적 부위와 염기쌍을 이룰 수 있도록 염색체 서열의 표적 부위의 서열에 상보적일 수 있다. 일부 경우에, gRNA의 제1 영역은 약 10개의 뉴클레오티드 내지 25개의 뉴클레오티드(즉, 10개의 뉴클레오티드 내지 뉴클레오티드; 또는 약 10개의 뉴클레오티드 내지 약 25개의 뉴클레오티드; 또는 10개의 뉴클레오티드 내지 약 25개의 뉴클레오티드; 또는 약 10개 뉴클레오티드 내지 25개 뉴클레오티드) 또는 그 이상을 포함할 수 있다. 예를 들어, gRNA의 제1 영역과 염색체 서열의 표적 부위 사이의 염기쌍 형성 영역은 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25개 이상의 뉴클레오티드 길이일 수 있거나, 또는 그 길이일 수 있다. 때때로, gRNA의 제1 영역은 길이가 약 19개, 20개 또는 21개 뉴클레오티드일 수 있거나 길이일 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 또한 2차 구조를 형성하는 제2 영역을 포함할 수 있다. 예를 들어, gRNA에 의해 형성된 2차 구조는 스템(또는 헤어핀) 및 루프를 포함할 수 있다. 루프와 스템의 길이는 다양할 수 있다. 예를 들어, 루프의 길이는 약 3 내지 10개의 뉴클레오티드 길이일 수 있고, 스템의 길이는 약 6 내지 20개의 염기쌍 길이일 수 있다. 스템은 1개 내지 10개 또는 약 10개의 뉴클레오티드로 구성된 하나 이상의 오버행을 포함할 수 있다. 제2 영역의 전체 길이는 약 16 내지 60개의 뉴클레오티드 길이일 수 있다. 예를 들어, 루프는 길이가 약 4개의 뉴클레오티드일 수 있거나 그럴 수 있고 스템은 약 12개의 염기쌍일 수 있거나 그럴 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 또한 본질적으로 단일 가닥일 수 있는 3' 말단에 제3 영역을 포함할 수 있다. 예를 들어, 세 번째 영역은 관심 세포의 염색체 서열과 상보적이지 않은 경우도 있고 gRNA의 나머지 부분과 상보적이지 않은 경우도 있다. 또한, 제3 영역의 길이는 다양할 수 있다. 제3 영역의 길이는 약 4개 뉴클레오티드 이상일 수 있다. 예를 들어, 제3 영역의 길이는 약 5 내지 60개의 뉴클레오티드 길이일 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 유전자 표적의 임의의 엑손 또는 인트론을 표적화할 수 있다. 어떤 경우에는 가이드가 유전자의 엑손 1 또는 2를 표적으로 삼을 수 있고, 다른 경우에는; 가이드는 유전자의 엑손 3 또는 4를 표적으로 삼을 수 있다. 일부 구현예에서, 조성물은 모두 동일한 엑손을 표적화하는 다중 gRNA 또는 상이한 엑손을 표적화하는 다중 gRNA를 포함한다. 유전자의 엑손 및/또는 인트론이 표적화될 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 약 20개 뉴클레오티드 또는 약 20개 미만의 뉴클레오티드(예를 들어, 적어도 약 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 뉴클레오티드) 또는 약 1-100개 뉴클레오티드(예: 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 40, 50, 60, 70, 80, 90, 100)의 핵산 서열을 표적할 수 있다. 표적 핵산 서열은 PAM의 첫 번째 뉴클레오티드의 5' 바로 옆의 약 20개의 염기이거나 그럴 수 있다. gRNA는 핵산 서열을 표적으로 삼을 수 있다. 표적 핵산은 적어도 또는 적어도 약 1-10, 1-20, 1-30, 1-40, 1-50, 1-60, 1-70, 1-80, 1-90 또는 1-100개의 뉴클레오티드 일 수 있다.
가이드 폴리뉴클레오티드, 예를 들어 gRNA 및 표적화 서열을 선택, 설계 및 검증하는 방법은 본원에 기재되어 있으며 당업자에게 공지되어 있다. 예를 들어, 핵염기 편집기 시스템(예: AID 도메인)에서 데아미나아제 도메인의 잠재적 기질 부적합성(substrate promiscuity)의 영향을 최소화하기 위해 의도하지 않게 탈아미노화의 표적이 될 수 있는 잔기(예: 잠재적으로 표적을 벗어난 C 잔기)의 수를 최소화한다. 표적 핵산 유전자좌 내의 단일 가닥 DNA에 존재하는 것)이 최소화될 수 있다. 또한, 소프트웨어 도구를 사용하여 표적 핵산 서열에 해당하는 gRNA를 최적화할 수 있다(예: 게놈 전반에 걸쳐 전체 표적을 벗어난 활성을 최소화하기 위해). 예를 들어 에스. 파이오게네스(S. pyogenes) Cas9를 사용하여 가능한 각각의 표적화 도메인 선택에 대해 모든 오프-타겟 서열(선행된 선택된 PAM, 예를 들어 NAG 또는 NGG)은 미스매치된 염기쌍 특정 수(예: 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10)까지를 포함하는 전체 게놈 내에서 확인될 수 있다. 표적 부위에 상보적인 gRNA의 첫 번째 영역을 식별할 수 있으며, 모든 첫 번째 영역(예: crRNA)은 전체 예측된 오프-타겟 점수에 따라 순위를 매길 수 있다. 최상위 타겟팅 도메인은 목표에 대한 활동이 가장 크고 목표를 벗어난 활동이 가장 적을 가능성이 있는 도메인을 나타낸다. gRNA를 표적으로 하는 후보는 당업계에 공지된 방법 및/또는 본원에 제시된 방법을 사용하여 기능적으로 평가될 수 있다.
비제한적 예로서, Cas9와 함께 사용하기 위한 gRNA의 crRNA의 표적 DNA 혼성화 서열은 DNA 서열 검색 알고리즘을 사용하여 식별될 수 있다. gRNA 디자인은 Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475 (2014)에 설명된 공개 도구 cas-OFFinder를 기반으로 하는 맞춤형 gRNA 디자인 소프트웨어를 사용하여 수행된다. 이 소프트웨어는 게놈 전체의 오프-타겟 성향을 계산한 후 점수를 매긴다. 일반적으로 길이가 17~24인 가이드에 대해 완벽한 일치부터 7개의 불일치까지 일치 항목이 고려된다. 오프-타겟 부위가 컴퓨터로 결정되면 각 가이드에 대해 집계 점수가 계산되고 웹-인터페이스를 사용하여, 표형식의 아웃풋이 요약된다. PAM 서열에 인접한 잠재적인 표적 부위를 식별하는 것 외에도, 소프트웨어는 선택된 표적 부위와 1, 2, 3 또는 3개 이상의 뉴클레오티드가 다른 모든 PAM 인접 서열도 식별한다. 표적 핵산 서열, 예를 들어 표적 유전자에 대한 게놈 DNA 서열을 얻을 수 있고 반복 요소는 공개적으로 이용 가능한 도구, 예를 들어 리피트마스커(RepeatMasker) 프로그램을 사용하여 스크리닝할 수 있다. 리피트마스커(RepeatMasker)는 입력 DNA 서열에서 반복되는 요소와 복잡성이 낮은 영역을 검색한다. 출력은 주어진 쿼리 시퀀스에 존재하는 반복에 대한 자세한 주석이다.
식별 후, gRNA(예: crRNA)의 첫 번째 영역은 표적 부위까지의 거리, 직교성(orthogonality) 및 관련 PAM 서열과 밀접하게 일치하는 5' 뉴클레오티드의 존재 여부를 기준으로 계층으로 순위가 지정된다 (예를 들어, 관련 PAM, 예를 들어 에스. 파이오게네스(S. pyogenes)의 경우, NGG PAM, 에스. 파이오게네스(S. pyogenes)의 경우, NNGRRT 또는 NNGRRV PAM을 함유하는 인간 게놈에서 근접한 매치의 식별에 기초한 5'G). 본 명세서에 사용된 바와 같이, 직교성(orthogonality)은 표적 서열에 대한 최소 수의 미스매치를 포함하는 인간 게놈의 서열 수를 의미한다. "높은 수준의 직교성" 또는 "우수한 직교성"은 예를 들어, 의도된 표적 외에 인간 게놈에 동일한 서열이 없거나 표적에 하나 또는 두 개의 미스매치를 포함하는 서열이 없는 20량체 표적 도메인을 의미할 수 있다. 표적을 벗어난 DNA 절단을 최소화하기 위해 직교성이 좋은 표적화 도메인을 선택할 수 있다.
그런 다음 gRNA는 RNA 분자 또는 비RNA 핵산 분자, 예를 들어 DNA 분자로서 세포 또는 배아에 도입될 수 있다. 한 구현예에서, gRNA를 코딩하는 DNA는 관심 세포 또는 배아에서 gRNA의 발현을 위한 프로모터 제어 서열에 작동가능하게 연결된다. RNA 코딩 서열은 RNA 폴리머라아제 III(Pol III)에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. gRNA를 발현하는데 사용될 수 있는 플라스미드 벡터에는 px330 벡터 및 px333 벡터가 포함되지만 이에 제한되지는 않는다. 일부 경우에, 플라스미드 벡터(예를 들어, px333 벡터)는 적어도 2개의 gRNA 코딩 DNA 서열을 포함할 수 있다. 또한, 벡터는 추가적인 발현 제어 서열(예를 들어, 인핸서 서열, Kozak 서열, 폴리아데닐화 서열, 전사 종결 서열 등), 선택 가능한 마커 서열(예를 들어, GFP 또는 퓨로마이신과 같은 항생제 내성 유전자), 복제 오리진 등을 포함할 수 있다. gRNA를 코딩하는 DNA 분자는 선형일 수도 있다. gRNA 또는 가이드 폴리뉴클레오티드를 코딩하는 DNA 분자는 또한 원형일 수 있다.
일부 구현예에서, 염기 편집 활성을 검출하고 후보 가이드 폴리뉴클레오티드를 테스트하기 위해 리포터 시스템이 사용된다. 일부 구현예에서, 리포터 시스템은 염기 편집 활성이 리포터 유전자의 발현을 유도하는 리포터 유전자 기반 검정을 포함한다. 예를 들어, 리포터 시스템은 비활성화된 시작 코돈, 예를 들어 주형 가닥의 3'-TAC-5'에서 3'-CAC-5'로의 돌연변이를 포함하는 리포터 유전자를 포함할 수 있다. 표적 C가 성공적으로 탈아미노화되면 해당 mRNA가 5'-GUG-3' 대신 5'-AUG-3'으로 전사되어 리포터 유전자의 번역이 가능해진다. 적합한 리포터 유전자는 당업자에게 명백할 것이다. 리포터 유전자의 비제한적인 예에는 녹색 형광 단백질(GFP), 적색 형광 단백질(RFP), 루시퍼라제, 분비된 알칼리성 포스파타제(SEAP)를 코딩하는 유전자, 또는 발현이 검출 가능하고 당업자에게 명백한 기타 유전자가 포함된다. 리포터 시스템은 예를 들어 각각의 데아미나아제가 표적화할 표적 DNA 서열과 관련하여 어느 잔기(들)를 결정하기 위해 다양한 gRNA를 테스트하는 데 사용될 수 있다. 비주형 가닥을 표적으로 하는 sgRNA는 특정 염기 편집 단백질(예: Cas9 데아미나아제 융합 단백질)의 오프-타겟 효과를 평가하기 위해 테스트될 수도 있다. 일부 구현예에서, 이러한 gRNA는 돌연변이된 시작 코돈이 gRNA와 염기쌍을 이루지 않도록 설계될 수 있다. 가이드 폴리뉴클레오티드는 표준 리보뉴클레오티드, 변형된 리보뉴클레오티드(예를 들어, 슈도우리딘), 리보뉴클레오티드 이성질체, 및/또는 리보뉴클레오티드 유사체를 포함할 수 있다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 적어도 하나의 검출 가능한 표지를 포함할 수 있다. 검출 가능한 라벨은 형광단(예: FAM, TMR, Cy3, Cy5, 텍사스 레드(Texas Red), 오레곤 그린(Oregon Green), 알렉사 플루어스(Alexa Fluors), 할로(Halo) 태그 또는 적합한 형광 염료), 검출 태그(예: 비오틴, 디곡시게닌 등), 양자점 또는 금 입자 일 수 있다.
일부 구현예에서, 염기 편집기 시스템은 다중 가이드 폴리뉴클레오티드, 예를 들어 gRNA를 포함할 수 있다. 예를 들어, gRNA는 염기 편집기 시스템으로 구성되는 하나 이상의 표적 유전자좌(예를 들어, 적어도 1 gRNA, 적어도 2 gRNA, 적어도 5 gRNA, 적어도 10 gRNA, 적어도 20 gRNA, 적어도 30 g RNA, 적어도 50 gRNA)를 표적화할 수 있다. 다수의 gRNA 서열은 일렬로 배열될 수 있고 바람직하게는 직접 반복부에 의해 분리된다.
변경된 폴리뉴클레오티드(Modified Polynucleotides)
발현, 안정성 및/또는 게놈/염기 편집 효율성을 향상시키고/하거나 가능한 독성을 줄이기 위해, 염기 편집기 코딩 서열(예: mRNA) 및/또는 가이드 폴리뉴클레오티드(예: gRNA)는 다음 중 하나를 포함하도록 변형될 수 있다. 또는 하나 이상의 변형된 뉴클레오티드 및/또는 화학적 변형, 예를 들어 슈도-우리딘, 5-메틸-사이토신, 2'-O-메틸-3'-포스포노아세테이트, 2'-O-메틸 티오PACE(MSP), 2'-O-메틸-PACE(MP), 2'-플루오로 RNA(2'-F-RNA), =컨스트레인된 에틸(S-cEt), 2'-O-메틸('M'), 2'-O-메틸-3'-포스포로티오에이트('MS'), 2'-O-메틸-3'-티오포스포노아세테이트('MSP'), 5-메톡시우리딘, 포스포로티오에이트 및 N1-메틸슈도우리딘을 사용하여 변경될 수 있다. 화학적으로 보호된 gRNA는 생체 내 및 생체 외 안정성과 편집 효율성을 향상시킬 수 있다. 화학적으로 변경된 mRNA 및 가이드 RNA를 사용하는 방법은 당업계에 공지되어 있으며, 예를 들어 Jiang 등, Chemical modifications of adenine base editor mRNA and guide RNA expand its application scope. Nat Commun 11, 1979 (2020). doi.org/10.1038/s41467-020-15892-8, Callum 등, N1-Methylpseudouridine substitution enhances the performance of synthetic mRNA switches in cells, Nucleic Acids Research, Volume 48, Issue 6, 06 April 2020, Page e35, 및 Andries 등, Journal of Controlled Release, Volume 217, 10 November 2015, Pages 337-344에 기재되어 있고, 이들 각각은 그 전체가 여기에 참조로 포함된다.
특정 구현예에서, 화학적 변형은 2'-O-메틸(2'-OMe) 변형이다. 변형된 가이드 RNA는 saCas9 효능과 특이성을 향상시킬 수 있다. 개별 변형의 효과는 사용된 화학적 변형의 위치와 조합뿐만 아니라 다른 변형된 뉴클레오티드와의 분자간 및 분자내 상호작용에 따라 달라진다. 예를 들어, S-cEt는 올리고뉴클레오티드 분자내 접힘을 개선하는 데 사용되었다.
일부 구현예에서, 가이드 폴리뉴클레오티드는 가이드의 5' 말단 및/또는 3' 말단에 하나 이상의 변형된 뉴클레오티드를 포함한다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 가이드의 5' 말단 및/또는 3' 말단에 2개, 3개, 4개 이상의 변형된 뉴클레오시드를 포함한다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 가이드의 5' 말단 및/또는 3' 말단에 2개, 3개, 4개 이상의 변형된 뉴클레오시드를 포함한다. 일부 구현예에서, 가이드 폴리뉴클레오티드는 가이드의 5' 말단에 4개의 변형된 뉴클레오시드 및 3' 말단에 4개의 변형된 뉴클레오시드를 포함한다. 일부 구현예에서, 변형된 뉴클레오시드는 2'-O-메틸 또는 포스포로티오에이트를 포함한다.
일부 구현예에서, 가이드는 적어도 약 50%-75% 변형된 뉴클레오티드를 포함한다. 일부 구현예에서, 가이드는 적어도 약 85% 이상의 변형된 뉴클레오티드를 포함한다. 일부 구현예에서, gRNA의 5' 말단에 있는 적어도 약 1-5개의 뉴클레오티드가 변형되고, gRNA의 3' 말단에 있는 적어도 약 1-5개의 뉴클레오티드가 변형된다. 일부 구현예에서, gRNA의 5' 및 3' 말단 각각에서 적어도 약 3-5개의 연속 뉴클레오티드가 변형된다. 일부 구현예에서, 직접 반복부 또는 역-직접 반복부에 존재하는 뉴클레오티드의 약 20% 이상이 변형된다. 일부 구현예에서, 직접 반복부 또는 역-직접 반복부에 존재하는 뉴클레오티드의 약 50% 이상이 변형된다. 일부 구현예에서, 직접 반복부 또는 역-직접 반복부에 존재하는 뉴클레오티드의 적어도 약 50-75%가 변형된다. 일부 구현예에서, 직접 반복부 또는 역-직접 반복부에 존재하는 뉴클레오티드 중 적어도 약 100개가 변형된다. 일부 구현예에서, gRNA 스캐폴드에 존재하는 헤어핀에 존재하는 뉴클레오티드의 적어도 약 20% 이상이 변형된다. 일부 구현예에서, gRNA 스캐폴드에 존재하는 헤어핀에 존재하는 뉴클레오티드의 적어도 약 50% 이상이 변형된다. 일부 실시예에서, 가이드는 가변 길이 스페이서를 포함한다. 일부 구현예에서, 가이드는 20-40개의 뉴클레오티드 스페이서를 포함한다. 일부 구현예에서, 가이드는 적어도 약 20-25개의 뉴클레오티드 또는 적어도 약 30-35개의 뉴클레오티드를 포함하는 스페이서를 포함한다. 일부 구현예에서, 스페이서는 변형된 뉴클레오티드를 포함한다. 일부 실시예에서, 가이드는 다음 중 2개 이상을 포함한다:
gRNA의 5' 말단에 있는 적어도 약 1-5개의 뉴클레오티드가 변형되고, gRNA의 3' 말단에 있는 적어도 약 1-5개의 뉴클레오티드가 변형되고;
직접 반복 또는 역-직접 반복에 존재하는 뉴클레오티드의 약 20% 이상이 변형되고;
직접 반복 또는 역직접 반복에 존재하는 뉴클레오티드의 약 50-75% 이상이 변형되고;
gRNA 스캐폴드에 존재하는 헤어핀에 존재하는 뉴클레오티드의 적어도 약 20% 이상이 변형되고;
가변 길이 스페이서; 및
변형된 뉴클레오티드를 포함하는 스페이서.
구현예에서, gRNA는 수많은 변형된 뉴클레오티드 및/또는 화학적 변형("중형 모드(heavy mods)")을 포함한다. 이러한 중형 모드는 생체 내 또는 시험관 내에서 염기 편집을 ~2배 증가시킬 수 있다. 이러한 변형의 경우 mN = 2'-OMe; Ns = 포스포로티오에이트(PS)이고, 여기서 "N"은 당업자가 이해하는 바와 같이 임의의 뉴클레오티드를 나타낸다. 일부 경우에, 뉴클레오티드(N)는 두 가지 변형, 예를 들어 2'-OMe 및 PS 변형을 모두 포함할 수 있다. 예를 들어, 포스포로티오에이트와 2'OMe가 있는 뉴클레오티드는 "mNs"로 표시된다. 두 개의 수정 사항이 나란히 있는 경우 표기법은 "mNsmNs"이다.
변형된 gRNA의 일부 구현예에서, gRNA는 2′-O-메틸 (2'-OMe), 포스포로티오에이트(PS), 2'-O-메틸 티오PACE(MSP), 2'-O-메틸-PACE(MP), 2'-O-메틸 티오PACE(MSP), 2'-플루오로 RNA(2'-F-RNA) 및 컨스트레인된(constrained) 에틸(S-cEt)로 이루어진 군으로부터 선택되는 하나 이상의 화학적 변형을 포함한다. 구현예에서, gRNA는 2'-O-메틸 또는 포스포로티오에이트 변형을 포함한다. 구현예에서, gRNA는 2'-O-메틸 및 포스포로티오에이트 변형을 포함한다. 구현예에서, 변형은 염기 편집을 적어도 약 2배 증가시킨다.
가이드 폴리뉴클레오티드는 새롭거나 향상된 특징을 가진 핵산을 제공하기 위해 하나 이상의 변형을 포함할 수 있다. 가이드 폴리뉴클레오티드는 핵산 친화성 태그를 포함할 수 있다. 가이드 폴리뉴클레오티드는 합성 뉴클레오티드, 합성 뉴클레오티드 유사체, 뉴클레오티드 유도체 및/또는 변형된 뉴클레오티드를 포함할 수 있다.
일부 경우에, gRNA 또는 가이드 폴리뉴클레오티드는 변형을 포함할 수 있다. 변형은 gRNA 또는 가이드 폴리뉴클레오티드의 임의 위치에서 이루어질 수 있다. 단일 gRNA 또는 가이드 폴리뉴클레오티드에 대해 하나 이상의 변형이 이루어질 수 있다. gRNA 또는 가이드 폴리뉴클레오티드는 변형 후 품질 관리를 받을 수 있다. 어떤 경우에는 품질 관리에 PAGE, HPLC, MS 또는 이들의 조합이 포함될 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드의 변형은 치환, 삽입, 결실, 화학적 변형, 물리적 변형, 안정화, 정제 또는 이들의 임의의 조합일 수 있다.
gRNA 또는 가이드 폴리뉴클레오티드는 또한 5' 아데닐레이트, 5' 구아노신-트리포스페이트 캡, 5' N7-메틸구아노신-트리포스페이트 캡, 5' 트리포스페이트 캡, 3' 포스페이트, 3' 티오포스페이트, 5' 포스페이트, 5' 티오포스페이트, Cis-Syn 티미딘 이량체, 삼량체, C12 스페이서, C3 스페이서, C6 스페이서, d스페이서, PC 스페이서, r스페이서, 스페이서 18, 스페이서 9, 3'-3' 변형, 2'-O-메틸 티오PACE(MSP), 2'-O-메틸-PACE(MP) 및 컨드트레인된(constrained) 에틸(S-cEt), 5'-5' 변형, 아크리딘, 아조벤젠, 비오틴, 비오틴 BB, 비오틴 TEG, 콜레스테릴 TEG, 데스티오비오틴 TEG, DNP TEG , DNP-X, DOTA, dT-비오틴, 이중 비오틴, PC 비오틴, 소랄렌(psoralen) C2, 소랄렌(psoralen) C6, TINA, 3' DABCYL, 블랙홀 소광제 1, 블랙홀 소광제 2, DABCYL SE, dT-DABCYL, IRDye QC-1 , QSY-21, QSY-35, QSY-7, QSY-9, 카르복실 링커, 티올 링커, 2'-데옥시리보뉴클레오사이드 유사체 퓨린, 2'-데옥시리보뉴클레오사이드 유사체 피리미딘, 리보뉴클레오사이드 유사체, 2'-O-메틸 리보뉴클레오사이드 유사체, 슈가 변형된 유사체, 워블/범용 베이스(wobble/universal bases), 형광 염료 라벨, 2'-플루오로 RNA, 2'-O-메틸 RNA, 메틸포스포네이트, 포스포디에스테르 DNA, 포스포디에스테르 RNA, 포스포티오에이트 DNA, 포스포로티오에이트 RNA, UNA, 슈도우리딘-5'-트리포스페이트, 5'-메틸사이티딘-5'-트리포스페이트, 또는 이들의 조합에 의해 변형될 수 있다..
일부 경우, 변형은 영구적이다. 다른 경우, 변형은 일시적이다. 어떤 경우 gRNA 또는 가이드 폴리뉴클레오티드에 다중 변형이 이루어진다. gRNA 또는 가이드 폴리뉴클레오티드 변형은 형태, 극성, 소수성, 화학적 반응성, 염기쌍 상호작용 또는 이들의 조합과 같은 뉴클레오티드의 물리화학적 특성을 변경할 수 있다.
가이드 폴리뉴클레오티드는 단리된 gRNA 또는 가이드 RNA를 코딩하는 서열 및 프로모터를 포함하는 플라스미드 DNA로 세포를 형질감염시킴으로써 세포 내로 전달될 수 있다. gRNA 또는 가이드 폴리뉴클레오티드는 바이러스 매개 유전자 전달을 사용하는 것과 같은 다른 방식으로 세포 내로 전달될 수도 있다. gRNA 또는 가이드 폴리뉴클레오티드가 분리될 수 있다. 예를 들어, gRNA는 분리된 RNA 형태로 세포나 유기체에 형질감염될 수 있다. gRNA는 당업계에 공지된 임의의 시험관내 전사 시스템을 사용하여 시험관내 전사에 의해 제조될 수 있다. gRNA는 gRNA에 대한 암호화 서열을 포함하는 플라스미드 형태가 아닌 분리된 RNA 형태로 세포에 전달될 수 있다.
변형은 포스포로티오에이트 대체물일 수도 있다. 어떤 경우에는 천연 포스포디에스테르 결합이 세포 뉴클레아제에 의해 빠르게 분해되기 쉬울 수 있다. 포스포로티오에이트(PS) 결합 대체물을 사용한 뉴클레오티드 간 연결의 변형은 세포 분해에 의한 가수분해에 대해 더 안정적일 수 있다. 변형은 gRNA 또는 가이드 폴리뉴클레오티드의 안정성을 증가시킬 수 있다. 변형은 생물학적 활동을 향상시킬 수도 있다. 어떤 경우에는 포스포로티오에이트 강화 RNA gRNA가 RNase A, RNase T1, 소 혈청 뉴클레아제 또는 이들의 조합을 억제할 수 있다. 이러한 특성으로 인해 생체 내 또는 시험관 내에서 뉴클레아제에 노출될 가능성이 높은 응용 분야에서 PS-RNA gRNA를 사용할 수 있다. 예를 들어, 포스포로티오에이트(PS) 결합은 엑소뉴클레아제 분해를 억제할 수 있는 gRNA의 5'- 또는 3'-말단의 마지막 3-5개 뉴클레오티드 사이에 도입될 수 있다. 어떤 경우에는 엔도뉴클레아제에 의한 공격을 줄이기 위해 전체 gRNA에 포스포로티오에이트 결합을 추가할 수 있다.
일부 구현예에서, 가이드 RNA는 스플라이스 부위(즉, 스플라이스 수용체(SA) 또는 스플라이스 공여체(SD)를 파괴하도록 설계된다. 일부 구현예에서, 가이드 RNA는 염기 편집이 조기 종결 코돈을 초래하도록 설계된다.
프로토스페이서 인접 모티프(Protospacer Adjacent Motif)
용어 “프로토스페이서 인접 모티프(PAM)”또는 PAM 유사 모티프는 CRISPR 박테리아 적응성 면역 시스템에서 Cas9 뉴클레아제가 표적으로 삼는 DNA 서열 바로 뒤에 있는 2-6 염기쌍 DNA 서열을 의미한다. 일부 구현예에서, PAM은 5' PAM일 수 있다(즉, 프로토스페이서의 5' 말단의 상류에 위치함). 다른 구현예에서, PAM은 3' PAM(즉, 프로토스페이서의 5' 말단의 하류에 위치함)일 수 있다. PAM 서열은 표적 결합에 필수적이지만 정확한 서열은 Cas 단백질의 유형에 따라 다르다. PAM 서열은 당업계에 공지된 임의의 PAM 서열일 수 있다. 적합한 PAM 서열에는 NGG, NGA, NGC, NGN, NGT, NGTT, NGCG, NGAG, NGAN, NGNG, NGCN, NGCG, NGTN, NNGRRT, NNNRRT, NNGRR(N), TTTV, TYCV, TYCV, TATV, NNNNGATT, NNAGAAW 또는 NAAAAC이 있으며 이로 제한되지 않는다. Y는 피리미딘이고; N은 임의의 뉴클레오티드 염기이고; W는 A 또는 T이다.
본원에 제공된 염기 편집기는 표준 또는 비-표준 프로토스페이서 인접 모티프(PAM) 서열을 포함하는 뉴클레오티드 서열에 결합할 수 있는 CRISPR 단백질 유래 도메인을 포함할 수 있다. PAM 부위는 표적 폴리뉴클레오티드 서열에 근접한 뉴클레오티드 서열이다. 본 개시내용의 일부 측면은 상이한 PAM 특이성을 갖는 CRISPR 단백질의 전부 또는 일부를 포함하는 염기 편집기를 제공한다.
예를 들어, 일반적으로 에스. 파이오게네스(S. pyogenes)의 Cas9(spCas9)와 같은 Cas9 단백질은 특정 핵산 영역에 결합하기 위해 표준 NGG PAM 서열이 필요하다. 여기서 "NGG"의 "N"은 아데닌(A), 티민(T), 구아닌(G) 또는 사이토신(C)이고, G는 구아닌이다. PAM은 CRISPR 단백질 특이적일 수 있으며 다양한 CRISPR 단백질 유래 도메인을 포함하는 다양한 염기 편집기 간에 다를 수 있다. PAM은 표적 서열의 5' 또는 3'일 수 있다. PAM은 표적 서열의 업스트림 또는 다운스트림일 수 있다. PAM은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 뉴클레오티드 길이일 수 있다. 종종 PAM의 길이는 2-6개 뉴클레오티드 사이이다.
일부 구현예에서, PAM은 "NRN"의 "N"이 아데닌(A), 티민(T), 구아닌(G) 또는 사이토신(C)이고, R이 아데닌(A) 또는 구아닌(G)인 "NRN" PAM이거나; 또는 PAM은 "NYN" PAM이고, 여기서 NYN의 "N"은 아데닌(A), 티민(T), 구아닌(G) 또는 사이토신(C)이고, Y는 사이티딘(C) 또는 티민(T)이며, 예를 들어 R.T. Walton 등 2020, Science, 10.1126/science.aba8853 (2020)에 설명되어 있고, 전체 내용은 여기에 참조로 포함된다.
여러 PAM 변형이 아래 표 6에 설명되어 있다.
표 6. Cas9 단백질 및 상응하는 PAM 서열
일부 구현예에서, PAM은 NGC이다. 일부 구현예에서, NGC PAM은 Cas9 변이체에 의해 인식된다. 일부 구현예에서, NGC PAM 변이체는 D1135M, S1136Q, G1218K, E1219F, A1322R, D1332A, R1335E 및 T1337R(총칭하여 "MQKFRAER"로 지칭됨)로부터 선택된 하나 이상의 아미노산 치환을 포함한다.
일부 구현예에서, PAM은 NGT이다. 일부 구현예에서 NGT PAM은 Cas9 변이체에 의해 인식된다. 일부 구현예에서, NGT PAM 변이체는 하나 이상의 잔기 1335, 1337, 1135, 1136, 1218 및/또는 1219에서 표적화된 돌연변이를 통해 생성된다. 일부 구현예에서, NGT PAM 변이체는 하나 이상의 잔기 1219, 1335, 1337, 1218에서 표적화된 돌연변이를 통해 생성된다. 일부 구현예에서, NGT PAM 변이체는 하나 이상의 잔기 1135, 1136, 1218, 1219 및 1335에서 표적화된 돌연변이를 통해 생성된다. 일부 구현예에서, NGT PAM 변이체는 아래 표 7A 및 7B에 제공된 표적화된 돌연변이 세트에서 선택된다.
표 7A. 잔기 1219, 1335, 1337, 1218에서의 NGT PAM 변이체 돌연변이
표7B: 잔기 1135, 1136, 1218, 1219, 및 1335에서의 NGT PAM 변이체 돌연변이
일부 구현예에서, NGT PAM 변이체는 표 7A 및 표 7B의 변이체 5, 7, 28, 31, 또는 36에서 선택된다. 일부 구현예에서, 변이체는 향상된 NGT PAM 인식을 갖는다.
일부 구현예에서, NCT PAM 변이체는 잔기 1219, 1335, 1337 및/또는 1218에 돌연변이를 갖는다. 일부 구현예에서, NGT PAM 변이체는 다음 표 8에 제공된 변이체로부터 향상된 인식을 갖는 돌연변이에서 선택된다.
표 8: 잔기 1219, 1335, 1337, 및 1218에서의 NGT PAM 변이체 돌연변이
일부 구현예에서, NGT PAM은 아래 표 9에 제공되는 변이체로부터 선택된다.
표 9. NGT PAM 변이체
일부 구현예에서, NGTN 변이체는 변이체 1이다. 일부 구현예에서, NGTN 변이체는 변이체 2이다. 일부 구현예에서, NGTN 변이체는 변이체 3이다. 일부 구현예에서, NGTN 변이체는 변이체 4이다. 일부 구현예에서, NGTN 변이체는 변이체 5이다. 일부 구현예에서, NGTN 변이체는 변이체 6이다.
일부 구현예에서, Cas9 도메인은 스트렙토코쿠스 파이오게네스(Streptococcus pyogenes) (SpCas9)으로부터의 Cas9 도메인이다. 일부 구현예에서, SpCas9 도메인은 뉴클레아제 활성 SpCas9, 뉴클레아제 불활성 SpCas9(SpCas9d), 또는 SpCas9 니카아제(SpCas9n)이다. 일부 구현예에서, SpCas9는 D9X 돌연변이, 또는 본 명세서에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함하고, 여기서 X는 D를 제외한 임의의 아미노산이다. 일부 구현예에서, SpCas9는 본원에 제공된 임의의 아미노산 서열에서 D9A 돌연변이 또는 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인, SpCas9d 도메인, 또는 SpCas9n 도메인은 비표준 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 구현예에서, SpCas9 도메인, SpCas9d 도메인 또는 SpCas9n 도메인은 NGG, NGA 또는 NGCG PAM 서열을 갖는 핵산 서열에 결합할 수 있다.
일부 구현예에서, SpCas9 도메인은 D1135X, R1335X 및 T1337X 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, SpCas9 도메인은 D1135E, R1335Q 및 T1337R 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135E, R1335Q 및 T1337R 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135X, R1335X 및 T1337X 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에서 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, SpCas9 도메인은 D1135V, R1335Q 및 T1337R 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135V, R1335Q 및 T1337R 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135X, G1218X, R1335X 및 T1337X 돌연변이 중 하나 이상, 또는 본 명세서에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 구현예에서, SpCas9 도메인은 D1135V, G1218R, R1335Q 및 T1337R 돌연변이 중 하나 이상, 또는 본원에 제공된 임의의 아미노산 서열의 상응하는 돌연변이를 포함한다. 일부 구현예에서, SpCas9 도메인은 D1135V, G1218R, R1335Q 및 T1337R 돌연변이, 또는 본원에 제공된 임의의 아미노산 서열에 상응하는 돌연변이를 포함한다.
일부 예에서, 본 명세서에 개시된 염기 편집기의 CRISPR 단백질 유래 도메인에 의해 인식되는 PAM은 염기 편집기를 코딩하는 삽입물(예를 들어, AAV 삽입물)에 대한 별도의 올리고뉴클레오티드 상의 세포에 제공될 수 있다. 이러한 구현예에서, 별도의 올리고뉴클레오티드에 PAM을 제공하면 표적 서열과 동일한 폴리뉴클레오티드에 인접한 PAM이 존재하지 않기 때문에 그렇지 않으면 절단될 수 없는 표적 서열의 절단을 허용할 수 있다.
구현예에서, 에스. 파이오게네스(S. pyogenes) Cas9(SpCas9)는 게놈 조작을 위한 CRISPR 엔도뉴클레아제로 사용될 수 있다. 그러나 다른 것들도 사용될 수 있다. 일부 실시예에서, 특정 게놈 표적을 표적으로 하기 위해 다른 엔도뉴클레아제가 사용될 수 있다. 일부 구현예에서, 비-NGG PAM 서열을 갖는 합성 SpCas9-유래 변이체가 사용될 수 있다. 추가로, 다양한 종으로부터의 다른 Cas9 이종성 상동체가 확인되었으며 이들 "비-SpCas9"는 본 개시내용에 또한 유용할 수 있는 다양한 PAM 서열에 결합할 수 있다. 예를 들어, SpCas9의 상대적으로 큰 크기(대략 4kb 코딩 서열)는 세포에서 효율적으로 발현될 수 없는 SpCas9 cDNA를 운반하는 플라스미드로 이어질 수 있다. 반대로, 스타필로코쿠스 아우레우스(Staphylococcus aureu) Cas9(SaCas9)의 코딩 서열은 SpCas9보다 약 1킬로베이스 짧기 때문에 세포에서 효율적으로 발현될 수 있다. SpCas9와 유사하게 SaCas9 엔도뉴클레아제는 시험관 내 포유류 세포와 생체 내 생쥐의 표적 유전자를 변형할 수 있다. 일부 구현예에서 Cas 단백질은 다른 PAM 서열을 표적으로 할 수 있다. 일부 구현예에서, 표적 유전자는 예를 들어 Cas9 PAM, 5'-NGG에 인접할 수 있다. 다른 구현예에서, 다른 Cas9 오솔로그는 다른 PAM 요구 사항을 가질 수 있다. 예를 들어 에스. 써모필루스(S. thermophiles)(CRISPR1의 경우 5'-NNAGAA, CRISPR3의 경우 5'-NGGNG) 및 네이세리아 메닌자이티디스(Neisseria meningitides) (5'-NNNNGATT)와 같은 다른 PAM도 표적 유전자 근처에서 발견될 수 있다.
일부 구현예에서, 에스. 파이오게네스 시스템의 경우, 표적 유전자 서열은 5'-NGG PAM보다 앞에 있을 수 있고(즉, 5'에 대해), 20-nt 가이드 RNA 서열은 반대 가닥과 염기쌍을 맺어 PAM에 인접한 Cas9 절단을 매개할 수 있다. 일부 구현예에서, 인접한 절단부는 PAM 상류의 약 3개 염기쌍일 수 있거나 그럴 수 있다. 일부 구현예에서, 인접한 절단부는 PAM 상류의 염기쌍 약 10개일 수 있거나 그럴 수 있다. 일부 구현예에서, 인접한 절단부는 PAM 상류의 약 0-20개의 염기쌍일 수 있거나 그럴 수 있다. 예를 들어 인접한 컷은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30 염기쌍 상류의 PAM 옆에 있을 수 있다. 인접한 컷은 PAM의 하류에 1~30개 염기쌍만큼 있을 수도 있다. PAM 서열에 결합할 수 있는 예시적인 SpCas9 단백질의 서열은 다음과 같다:
일부 구현예에서, 조작된 SpCas9 변이체는 3' H(비-G PAM)가 측면에 있는 프로토스페이서 인접 모티프(PAM) 서열을 인식할 수 있다(표 2A-2D 참조). 일부 구현예에서 SpCas9 변이체는 NRNH PAM(여기서 R은 A 또는 G이고 H는 A, C 또는 T임)을 인식한다. 일부 구현예에서, 비-G PAM은 NRRH, NRTH 또는 NRCH이다(예를 들어, Miller, S.M., 등Continuous Evolution of SpCas9 Variants Compatible with non-G PAMs, Nat. Biotechnol. (2020)를 참조하며, 이는 전체 내용이 여기에 참조로 포함된다.)
일부 구현예에서 Cas9 도메인은 재조합 Cas9 도메인이다. 일부 구현예에서, 재조합 Cas9 도메인은 SpyMacCas9 도메인이다. 일부 구현예에서, SpyMacCas9 도메인은 뉴클레아제 활성 SpyMacCas9, 뉴클레아제 불활성 SpyMacCas9(SpyMacCas9d), 또는 SpyMacCas9 니카아제(SpyMacCas9n)이다. 일부 구현예에서, SaCas9 도메인, SaCas9d 도메인 또는 SaCas9n 도메인은 비표준 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 구현예에서, SpyMacCas9 도메인, SpCas9d 도메인, 또는 SpCas9n 도메인은 NAA PAM 서열을 갖는 핵산 서열에 결합할 수 있다.
천연 5'-NAAN-3' PAM 특이성을 갖는 스트렙토코커스 마카카에에서 Spy Cas9의 예시적인 Cas9 A 상동체의 서열은 당업계에 공지되어 있으며, 예를 들어 Chatterjee, 등, “A Cas9 with PAM recognition for adenine dinucleotides”, Nature Communications, vol. 11, article no. 2474 (2020)에 기술되어 있고, 서열목록에 서열번호: 325로 존재한다.
일부 구현예에서, 변이체 Cas9 단백질은 H840A, P475A, W476A, N477A, D1125A, W1126A 및 D1218A 돌연변이를 보유하여 폴리펩티드가 표적 DNA 또는 RNA를 절단하는 능력이 감소된다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소하지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)에 결합하는 능력을 유지한다. 또 다른 비제한적인 예로서, 일부 구현예에서 변이체 Cas9 단백질은 D10A, H840A, P475A, W476A, N477A, D1125A, W1126A 및 D1218A 돌연변이를 보유하여 폴리펩티드가 표적 DNA를 절단하는 능력이 감소되도록 한다. 이러한 Cas9 단백질은 표적 DNA(예를 들어, 단일 가닥 표적 DNA)를 절단하는 능력이 감소하지만 표적 DNA(예를 들어, 단일 가닥 표적 DNA)에 결합하는 능력을 유지한다. 일부 구현예에서, 변이 Cas9 단백질이 W476A 및 W1126A 돌연변이를 보유하는 경우 또는 변이 Cas9 단백질이 P475A, W476A, N477A, D1125A, W1126A 및 D1218A 돌연변이를 보유하는 경우, 변이 Cas9 단백질은 PAM 서열에 효율적으로 결합하지 않는다. 따라서 일부 경우에 이러한 변이체 Cas9 단백질이 결합 방법에 사용되는 경우 해당 방법에는 PAM 서열이 필요하지 않다. 즉, 일부 구현예에서 이러한 변이체 Cas9 단백질이 결합 방법에 사용되는 경우, 방법은 가이드 RNA를 포함할 수 있지만, 이 방법은 PAM 서열 없이 수행될 수 있다(그리고 결합의 특이성은 따라서 가이드 RNA의 표적화 분절에 의해 제공된다). 위의 효과를 달성하기 위해 다른 잔기가 돌연변이될 수 있다(즉, 하나 또는 다른 뉴클레아제 부분을 불활성화함). 비제한적인 예로서, 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986 및/또는 A987은 변경(즉, 치환)될 수 있다. 또한 알라닌 치환 이외의 돌연변이도 적합하다.
일부 구현예에서, 염기 편집기의 CRISPR 단백질 유래 도메인은 표준 PAM 서열(NGG)을 갖는 Cas9 단백질의 전부 또는 일부를 포함할 수 있다. 다른 구현예에서, 염기 편집기의 Cas9 유래 도메인은 비표준 PAM 서열을 사용할 수 있다. 이러한 서열은 당업계에 기술되어 있으며 당업자에게는 명백할 것이다. 예를 들어, 비-표준 PAM 서열에 결합하는 Cas9 도메인은 Kleinstiver, B. P., 등, “Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523, 481-485 (2015); and Kleinstiver, B. P., 등, “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology 33, 1293-1298 (2015); R.T. Walton 등. “Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants”Science 10.1126/science.aba8853 (2020); Hu 등, “Evolved Cas9 variants with broad PAM compatibility and high DNA specificity,”Nature, 2018 Apr. 5, 556(7699), 57-63; Miller 등, "Continuous evolution of SpCas9 variants compatible with non-G PAMs”Nat. Biotechnol., 2020 Apr;38(4):471-481에 기술되어 있고; 각각의 전체 내용은 여기에 참조로 포함된다.
NapDNAbp 및 사이티딘 데아미나아제 및/또는 아데노신 데아미나아제를 포함하는 융합 단백질
본 개시내용의 일부 양태는 Cas9 도메인 또는 다른 핵산 프로그래밍 가능한 DNA 결합 단백질(예를 들어, Cas12) 및 하나 이상의 사이티딘 데아미나아제 또는 아데노신 데아미나아제 도메인을 포함하는 융합 단백질을 제공한다. Cas9 도메인은 본원에 제공된 임의의 Cas9 도메인 또는 Cas9 단백질(예를 들어, dCas9 또는 nCas9)임을 이해해야 한다. 일부 구현예에서, 본원에 제공된 임의의 Cas9 도메인 또는 Cas9 단백질(예를 들어, dCas9 또는 nCas9)은 본원에 제공된 임의의 사이티딘 데아미나아제 및/또는 아데노신 데아미나아제와 융합될 수 있다. 본원에 개시된 염기 편집기의 도메인들은 임의의 순서로 배열될 수 있다.
일부 구현예에서, 융합 단백질은 다음 도메인 A-C, A-D 또는 A-E를 포함하며,
NH2-[A-B-C]-COOH;
NH2-[A-B-C-D]-COOH; 또는
NH2-[A-B-C-D-E]-COOH;
여기서 A 및 C 또는 A, C 및 E는 각각
아데노신 데아미나아제 도메인 또는 이의 활성 단편,
사이티딘 데아미나아제 도메인 또는 이의 활성 단편 중 하나 이상을 포함하고,
여기서 B 또는 B 및 D는 각각 핵산 서열 특이적 결합 활성을 갖는 하나 이상의 도메인을 포함한다.
일부 구현예에서, 융합 단백질은 다음 구조를 포함하며,
NH2-[An-Bo-Cn]-COOH;
NH2-[An-Bo-Cn-Do]-COOH; 또는
NH2-[An-Bo-Cp-Do-Eq]-COOH;
여기서 A 및 C 또는 A, C 및 E는 각각
아데노신 데아미나아제 도메인 또는 이의 활성 단편,
사이티딘 데아미나아제 도메인 또는 이의 활성 단편 중 하나 이상을 포함하고,
여기서 n은 1, 2, 3, 4 또는 5의 정수이고, 여기서 p는 0, 1, 2, 3, 4 또는 5의 정수이며; 여기서 q는 0, 1, 2, 3, 4 또는 5의 정수이고; 여기서 B 또는 B 및 D는 각각 핵산 서열 특이적 결합 활성을 갖는 도메인을 포함하며; 여기서 o는 1, 2, 3, 4 또는 5의 정수이다.
예를 들어, 비제한적으로, 일부 구현예에서, 융합 단백질은 하기 구조를 포함한다:
NH2-[아데노신 데아미나아제]-[Cas9 도메인]-COOH;
NH2-[Cas9 도메인]-[아데노신 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[Cas9 도메인]-COOH;
NH2-[Cas9 도메인]-[사이티딘 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[Cas9 도메인]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[Cas9 도메인]-[사이티딘 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[사이티딘 데아미나아제]-[Cas9 도메인]-COOH;
NH2-[사이티딘 데아미나아제]-[아데노신 데아미나아제]-[Cas9 도메인]-COOH;
NH2-[Cas9 도메인]-[아데노신 데아미나아제]-[사이티딘 데아미나아제]-COOH; 또는
NH2-[Cas9 도메인]-[사이티딘 데아미나아제]-[아데노신 데아미나아제]-COOH.
일부 구현예에서, 본원에 제공된 임의의 Cas12 도메인 또는 Cas12 단백질은 본원에 제공된 임의의 사이티딘 또는 아데노신 데아미나아제와 융합될 수 있다. 예를 들어, 비제한적으로, 일부 구현예에서, 융합 단백질은 하기 구조를 포함한다:
NH2-[아데노신 데아미나아제]-[Cas12 도메인]-COOH;
NH2-[Cas12 도메인]-[아데노신 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[Cas12 도메인]-COOH;
NH2-[Cas12 도메인]-[사이티딘 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[Cas12 도메인]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[Cas12 도메인]-[사이티딘 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[사이티딘 데아미나아제]-[Cas12 도메인]-COOH;
NH2-[사이티딘 데아미나아제]-[아데노신 데아미나아제]-[Cas12 도메인]-COOH;
NH2-[Cas12 도메인]-[아데노신 데아미나아제]-[사이티딘 데아미나아제]-COOH; 또는
NH2-[Cas12 도메인]-[사이티딘 데아미나아제]-[아데노신 데아미나아제]-COOH.
일부 구현예에서, 아데노신 데아미나아제는 TadA*8이다. 예시적인 융합 단백질 구조는 다음을 포함한다:
NH2-[TadA*8]-[Cas9 도메인]-COOH;
NH2-[Cas9 도메인]-[TadA*8]-COOH;
NH2-[TadA*8]-[Cas12 도메인]-COOH; 또는
NH2-[Cas12 도메인]-[TadA*8]-COOH.
일부 구현예에서, 융합 단백질의 아데노신 데아미나아제는 TadA*8 및 사이티딘 데아미나아제 및/또는 아데노신 데아미나아제를 포함한다. 일부 구현예에서, TadA*8은 TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, 또는 TadA*8.24이다.
예시적인 융합 단백질 구조는 다음을 포함한다:
NH2-[TadA*8]-[Cas9/Cas12]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[Cas9/Cas12]-[TadA*8]-COOH;
NH2-[TadA*8]-[Cas9/Cas12]-[사이티딘 데아미나아제]-COOH; 또는
NH2-[사이티딘 데아미나아제]-[Cas9/Cas12]-[TadA*8]-COOH.
일부 구현예에서, 융합 단백질의 아데노신 데아미나아제는 TadA*9 및 사이티딘 데아미나아제 및/또는 아데노신 데아미나아제를 포함한다. 예시적인 융합 단백질 구조는 다음을 포함한다:
NH2-[TadA*9]-[Cas9/Cas12]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[Cas9/Cas12]-[TadA*9]-COOH;
NH2-[TadA*9]-[Cas9/Cas12]-[사이티딘 데아미나아제]-COOH; 또는
NH2-[사이티딘 데아미나아제]-[Cas9/Cas12]-[TadA*9]-COOH.
일부 구현예에서, 융합 단백질은 Cas9 또는 Cas12 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 데아미나아제를 포함할 수 있다. 일부 구현예에서, 융합 단백질은 Cas9 또는 Cas12 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 사이티딘 데아미나아제를 포함한다. 일부 구현예에서, 융합 단백질은 Cas9 또는 Cas 12 폴리펩티드의 N-말단 단편 및 C-말단 단편에 의해 플랭킹된 아데노신 데아미나아제를 포함한다.
일부 구현예에서, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 napDNAbp(예를 들어, Cas9 또는 Cas12 도메인)를 포함하는 융합 단백질은 링커 서열을 포함하지 않는다. 일부 구현예에서, 사이티딘 또는 아데노신 데아미나아제와 napDNAbp 사이에 링커가 존재한다. 일부 구현예에서, 상기 일반적 구조에서 사용된 "-"는 선택적인 링커의 존재를 나타낸다. 일부 구현예에서, 사이티딘 또는 아데노신 데아미나아제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다. 예를 들어, 일부 구현예에서, 사이티딘 또는 아데노신 데아미나아제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다.
본 개시내용의 융합 단백질은 하나 이상의 추가적인 특징을 포함할 수 있음을 이해해야 한다. 예를 들어, 일부 구현예에서, 융합 단백질은 억제제, 세포질 국재화 서열, 이출 서열(export sequence), 예컨대 핵 이출 서열, 또는 다른 국재화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제, 또는 검출에 유용한 서열 태그를 포함할 수 있다. 본원에 제공된 적합한 단백질 태그는 비오틴 카르복실라제 담체 단백질(BCCP) 태그, myc-태그, 칼모듈린-태그, FLAG-태그, 헤마글루티닌(HA)-태그, 히스티딘 태그 또는 His-태그로도 지칭되는 폴리히스티딘 태그, 말토스 결합 단백질(MBP)-태그, nus-태그, 글루타티온-S-트랜스퍼라제(GST)-태그, 녹색 형광 단백질(GFP)-태그, 티오레독신-태그, S-태그, 소프트태그(Softag) (예를 들어, Softag 1, Softag 3), 스트렙(strep)-태그, 비오틴 리가제 태그, 플래쉬(FlAsH) 태그, V5 태그 및 SBP-태그를 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 융합 단백질은 하나 이상의 His 태그를 포함한다.
예시적이지만 비제한적인 융합 단백질은 국제 PCT 출원번호 PCT/2017/044935, PCT/US2019/044935 및 PCT/US2020/016288에 기재되어 있고, 각각은 그 전문이 여기에 참조로 포함된다.
핵 국재화 서열(NLS)을 포함하는 융합 단백질
일부 구현예에서, 본원에 제공된 융합 단백질은 하나 이상(예를 들어, 2, 3, 4, 5 개)의 핵 표적화 서열, 예를 들어 핵 국재화 서열(NLS)을 추가로 포함한다. 일 구현예에서, 이분 NLS가 사용된다. 일부 구현예에서, NLS는 NLS를 포함하는 단백질의 세포 핵 내로의 유입(예를 들어, 핵 수송체에 의함)을 용이하게 하는 아미노산 서열을 포함한다. 일부 구현예에서, NLS은 융합 단백질의 N-말단 또는 C-말단과 융합된다. 일부 구현예에서, NLS는 nCas9 도메인 또는 dCas9 도메인의 N-말단 또는 C-말단과 융합된다. 일부 구현예에서, NLS는 Cas12 도메인의 N-말단 또는 C-말단과 융합된다. 일부 구현예에서, NLS는 사이티딘 또는 아데노신 데아미나아제의 N-말단 또는 C-말단과 융합된다. 일부 구현예에서, NLS는 하나 이상의 링커를 통해 융합 단백질에 융합된다. 일부 구현예에서, NLS는 링커 없이 융합 단백질에 융합된다. 일부 구현예에서, NLS는 본원에 제공되거나 참조된 NLS 서열 중 어느 하나의 아미노산 서열을 포함한다. 추가적인 핵 국재화 서열은 당업계에 알려져 있고 당업자에게 명백할 것이다. 예를 들어, NLS 서열은 Plank 등, PCT/EP2000/011690에 기재되어 있으며, 이의 내용은 예시적인 핵 국재화 서열의 개시내용에 대해 여기에 참조로 포함된다. 일부 구현예에서, NLS는 아미노산 서열 PKKKRKVEGADKRTADGSEFESPKKKRKV(서열번호: 416), KRTADGSEFESPKKKRKV(서열번호: 243), KRPAATKKAGQAKKKK(서열번호: 244), KKTELQTTNAENKTKKL(서열번호: 245), KRGINDRNFWRGENGRKTR(서열번호: 246), RKSGKIAAIVVKRPRKPKKKRKV(서열번호: 417) 또는 MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(서열번호: 249)를 포함한다.
일부 구현예에서, 사이티딘 또는 아데노신 데아미나아제, Cas9 도메인, 및 NLS를 포함하는 융합 단백질은 링커 서열을 포함하지 않는다. 일부 구현예에서, 하나 이상의 도메인 또는 단백질(예를 들어, 사이티딘 또는 아데노신 데아미나아제, Cas9 도메인 또는 NLS) 사이에 링커 서열이 존재한다. 일부 구현예에서, 링커는 사이티딘 데아미나아제 및 아데노신 데아미나아제 도메인과 napDNAbp 사이에 존재한다. 일부 구현예에서, 하기 일반 구조에서 사용되는 "-"는 선택적인 링커의 존재를 나타낸다. 일부 구현예에서, 사이티딘 데아미나아제 및 아데노신 데아미나아제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다. 예를 들어, 일부 구현예에서 사이티딘 데아미나아제 및 아데노신 데아미나아제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다. 일부 구현예에서, 사이티딘 또는 아데노신 데아미나아제 및 napDNAbp(예를 들어, Cas9 또는 Cas12) 도메인을 갖는 예시적인 napDNAbp(예를 들어, Cas9 또는 Cas12) 융합 단백질의 일반적인 구조는 다음 구조 중 어느 하나를 포함하며, 여기서 NLS는 핵 국재화 서열(예를 들어, 본원에 제공된 임의의 NLS)이고, NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다:
NH2-NLS-[사이티딘 데아미나아제]-[napDNAbp 도메인]-COOH;
NH2-NLS [napDNAbp 도메인]-[사이티딘 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[napDNAbp 도메인]-NLS-COOH;
NH2-[napDNAbp 도메인]-[사이티딘 데아미나아제]-NLS-COOH;
NH2-NLS-[아데노신 데아미나아제]-[napDNAbp 도메인]-COOH;
NH2-NLS [napDNAbp 도메인]-[아데노신 데아미나아제]-COOH;
NH2-[아데노신 데아미나아제]-[napDNAbp 도메인]-NLS-COOH;
NH2-[napDNAbp 도메인]-[아데노신 데아미나아제]-NLS-COOH;
NH2-NLS-[사이티딘 데아미나아제]-[napDNAbp 도메인]-[아데노신 데아미나아제]-COOH;
NH2-NLS-[아데노신 데아미나아제]-[napDNAbp 도메인]-[사이티딘 데아미나아제]-COOH;
NH2-NLS-[아데노신 데아미나아제] [사이티딘 데아미나아제]-[napDNAbp 도메인]-COOH;
NH2-NLS-[사이티딘 데아미나아제]-[아데노신 데아미나아제]-[napDNAbp 도메인]-COOH;
NH2-NLS-[napDNAbp 도메인]-[아데노신 데아미나아제]-[사이티딘 데아미나아제]-COOH;
NH2-NLS-[napDNAbp 도메인]-[사이티딘 데아미나아제]-[아데노신 데아미나아제]-COOH;
NH2-[사이티딘 데아미나아제]-[napDNAbp 도메인]-[아데노신 데아미나아제]-NLS-COOH;
NH2-[아데노신 데아미나아제]-[napDNAbp 도메인]-[사이티딘 데아미나아제]-NLS-COOH;
NH2-[아데노신 데아미나아제] [사이티딘 데아미나아제]-[napDNAbp 도메인]-NLS-COOH;
NH2-[사이티딘 데아미나아제]-[아데노신 데아미나아제]-[napDNAbp 도메인]-NLS-COOH;
NH2-[napDNAbp 도메인]-[아데노신 데아미나아제]-[사이티딘 데아미나아제]-NLS-COOH; 또는
NH2-[napDNAbp 도메인]-[사이티딘 데아미나아제]-[아데노신 데아미나아제]-NLS-COOH.
일부 구현예에서, NLS는 링커 내에 존재하거나, 또는 NLS는 예를 들어 본원에 기재된 링커에 의해 플랭킹된다. 이분 NLS는 2개의 염기성 아미노산 클러스터를 포함하며, 이는 비교적 짧은 스페이서 서열에 의해 분리된다(따라서 이분(bipartite) - 2부(2 parts), 반면, 일분 NLS(monopartite NLSs)는 그렇지 않다). 뉴클레오플라스민의 NLS, KR[PAATKKAGQA]KKKK(서열번호: 244)는 약 10개 아미노산의 스페이서에 의해 분리된 2개의 염기성 아미노산 클러스터의 편재하는 이분 신호의 원형이다. 예시적인 이분 NLS의 서열은 다음과 같다: PKKKKRKVEGADKRTADGSEFESPKKKRKV(서열번호: 416).
하나 이상의 핵 국재화 서열(NLS)을 포함하는 CRISPR 효소를 암호화하는 벡터가 사용될 수 있다. 예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개의 NLS가 사용될 수 있거나 사용될 수 있다. CRISPR 효소는 아미노-말단에 또는 그 근처에 NLS, 카르복시-말단에 또는 그 근처에 약 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 초과의 NLS, 또는 이들의 임의의 조합(예를 들어, 아미노-말단에 하나 이상의 NLS 및 카르복시 말단에 하나 이상의 NLS)을 포함할 수 있다. 하나 초과의 NLS가 존재하는 경우, 각각은 다른 것들과 독립적으로 선택될 수 있어서, 단일 NLS가 하나 이상의 카피 내에 및/또는 하나 이상의 카피 내에 존재하는 하나 이상의 다른 NLS와 조합되어 존재할 수 있다.
본 방법에 사용되는 CRISPR 효소는 약 6개의 NLS를 포함할 수 있다. NLS에 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 사슬을 따라 약 50개 아미노산 내에, 예를 들어 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 또는 50개 아미노산 내에 있을 때, NLS는 N- 또는 C-말단 근처에 있는 것으로 간주된다.
추가 도메인
본 명세서에 기술된 염기 편집기는 폴리뉴클레오티드의 핵염기의 핵염기 편집, 변형 또는 변경을 촉진하는 데 도움이 되는 임의의 도메인을 포함할 수 있다. 다양한 구현예에서, 이들 추가 도메인 중 임의의 것을 코딩하는 오픈 리딩 프레임은 본원에 기재된 방법에 따라 불활성화되는 인트론을 포함하도록 변형될 수 있다. 일부 구현예에서, 염기 편집기는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예: Cas9), 핵염기 편집 도메인(예: 데아미나아제 도메인) 및 하나 이상의 추가 도메인을 포함한다. 일부 구현예에서, 추가 도메인은 염기 편집기의 효소적 또는 촉매적 기능, 염기 편집기의 결합 기능을 촉진할 수 있거나, 원하는 염기 편집 결과를 방해할 수 있는 세포 기구(예: 효소)의 억제제일 수 있다. 일부 구현예에서, 염기 편집기는 뉴클레아제, 니카아제, 재조합효소, 데아미나아제, 메틸트랜스퍼라제, 메틸라제, 아세틸라제, 아세틸트랜스퍼라제, 전사 활성화제, 또는 전사 억제인자 도메인을 포함할 수 있다.
일부 구현예에서, 염기 편집기는 우라실 글리코실라제 억제제(UGI) 도메인을 포함할 수 있다. 일부 구현예에서, U:G 이종이중체 DNA의 존재에 대한 세포 DNA 복구 반응은 세포에서 핵염기 편집 효율의 감소를 담당할 수 있다. 이러한 구현예에서, 우라실 DNA 글리코실라제(UDG)는 세포 내 DNA로부터 U의 제거를 촉매할 수 있으며, 이는 염기 절단 복구(BER)를 개시할 수 있고, 대부분 U:G 쌍이 C:G 쌍으로 전환되는 결과를 가져온다. 이러한 구현예에서, BER은 단일 가닥에 결합하고, 편집된 염기를 차단하며, UGI를 억제하고, BER을 억제하며, 편집된 염기를 보호하고/하거나 편집되지 않은 가닥의 복구를 촉진하는 하나 이상의 도메인을 포함하는 염기 편집기에서 억제될 수 있다. 따라서, 본 개시내용은 UGI 도메인을 포함하는 염기 편집기 융합 단백질을 고려한다.
일부 구현예에서, 염기 편집기는 이중 가닥 절단(DSB) 결합 단백질의 전부 또는 일부를 도메인으로 포함한다. 예를 들어, DSB 결합 단백질은 DSB의 말단에 결합하여 분해로부터 보호할 수 있는 박테리오파지 Mu의 Gam 단백질을 포함할 수 있다. Komor, A.C., 등, “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3: eaao4774 (2017)를 참고하며, 그 내용은 여기에 참조로 포함된다.
추가적으로, 일부 구현예에서, Gam 단백질은 염기 편집기의 N 말단에 융합될 수 있다. 일부 구현예에서, Gam 단백질은 염기 편집기의 C 말단에 융합될 수 있다. 박테리오파지 Mu의 Gam 단백질은 이중 가닥 절단(DSB)의 끝 부분에 결합하여 분해로부터 보호할 수 있다. 일부 구현예에서, Gam을 사용하여 DSB의 자유 말단에 결합하면 염기 편집 과정 동안 삽입결실 형성을 감소시킬 수 있다. 일부 구현예에서, 174-잔기 Gam 단백질은 염기 편집기의 N 말단에 융합된다. Komor, A.C., 등, “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)를 참조한다. 일부 구현예에서, 돌연변이 또는 돌연변이들은 야생형 도메인에 대해 염기 편집기 도메인의 길이를 변경할 수 있다. 예를 들어, 적어도 하나의 도메인에서 적어도 하나의 아미노산을 삭제하면 염기 편집기의 길이가 줄어들 수 있다. 다른 경우에는 돌연변이가 야생형 도메인에 비해 도메인의 길이를 변경하지 않는다. 예를 들어, 어떤 도메인의 대체도 염기 편집기의 길이를 변경하지 않는다.
모든 도메인의 길이가 야생형 도메인과 동일한 염기 편집기의 비제한적인 예는 다음과 같다.
NH2-[핵염기 편집 도메인]-링커1-[APOBEC1]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[APOBEC1]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[APOBEC1]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[APOBEC1]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[APOBEC1]-링커2-[핵염기 편집 도메인]-[UGI]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[APOBEC1]-[핵염기 편집 도메인]-[UGI]-COOH;
NH2-[핵염기 편집 도메인]-[APOBEC1]-링커2-[핵염기 편집 도메인]-[UGI]-COOH;
NH2-[핵염기 편집 도메인]-[APOBEC1]-[핵염기 편집 도메인]-[UGI]-COOH;
NH2-[UGI]-[핵염기 편집 도메인]-링커1-[APOBEC1]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[UGI]-[핵염기 편집 도메인]-링커1-[APOBEC1]-[핵염기 편집 도메인]-COOH;
NH2-[UGI]-[핵염기 편집 도메인]-[APOBEC1]-링커2-[핵염기 편집 도메인]-COOH; 또는
NH2-[UGI]-[핵염기 편집 도메인]-[APOBEC1]-[핵염기 편집 도메인]-COOH.
염기 편집기 시스템
자기-불활성화 염기 편집기를 특징으로 하는 염기 편집기 시스템을 사용하여 핵염기를 편집하기 위한 시스템, 조성물 및 방법이 본원에 제공된다. 일부 구현예에서, 염기 편집기 시스템은 (1) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 및 핵염기를 편집하기 위한 핵염기 편집 도메인(예를 들어, 데아미나아제 도메인)을 포함하는 염기 편집기(BE); 및 (2) 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인과 함께 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)를 포함한다. 일부 구현예에서, 염기 편집기 시스템은 사이티딘 염기 편집기(CBE), 또는 아데노신 염기 편집기(ABE)이다. 인트론은 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인, 핵염기 편집 도메인, 또는 이들 도메인 중 하나의 단편을 코딩하는 오픈 리딩 프레임에 삽입될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 프로그래밍 가능한 DNA 또는 RNA 결합 도메인이다. 일부 구현예에서, 데아미나아제 도메인은 사이티딘 데아미나아제 또는 사이토신 데아미나아제일 수 있다. 일부 구현예에서, 데아미나아제 도메인은 아데닌 데아미나아제 또는 아데노신 데아미나아제일 수 있다. 일부 구현예에서, 아데노신 염기 편집기는 DNA 내의 아데인을 탈아미노화시킬 수 있다. 일부 구현예에서, 염기 편집기는 DNA 내의 사이티딘을 탈아미노화시킬 수 있다. 일부 구현예에서, 본원에 제공된 바와 같은 염기 편집 시스템은, 촉매적으로 결함이 있는 스트렙토코커스 파이오게네스 Cas9, 데아미나아제(예를 들어, 사이티딘 또는 아데노신 데아미나아제), 및 염기 절제 복구 억제제를 함유하는 융합 단백질을 사용하여 이중 가닥 DNA 절단을 발생시키지 않고, 공여체 DNA 주형을 필요로 하지 않으며, 과량의 확률적 삽입 및 결실을 유도하지 않으면서 DNA에서 프로그래밍 가능한 단일 뉴클레오티드(C→또는 A→변화를 유도하는 게놈 편집에 대한 새로운 접근법을 제공한다.
핵염기 편집 단백질의 상세한 내용은 국제 PCT 출원번호 PCT/2017/045381(WO2018/027078) 및 PCT/US2016/058344(WO2017/070632)에 기재되어 있으며, 각각은 그 전문이 본원에 참조로 포함된다. 또한 Komor, A.C., 등, "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., 등, "Programmable base editing of A ㆍT to G ㆍC in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); 및 Komor, A.C., 등, "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017)을 참조하여, 이의 전체 내용이 본원에 참조로 포함된다.
본원에 제공된 자기-불활성화 염기 편집기 시스템의 사용은 (a) 대상체의 폴리뉴클레오티드(예를 들어, 이중- 또는 단일 가닥 DNA 또는 RNA)의 표적 뉴클레오티드 서열을 핵염기 편집기(예를 들어, 아데노신 염기 편집기 또는 사이티딘 염기 편집기) 및 가이드 폴리핵산(예를 들어, gRNA)을 포함하는 염기 편집기 시스템과 접촉시키는 단계로서, 여기서 표적 뉴클레오티드 서열은 표적화된 핵염기 쌍을 포함하는, 단계; (b) 상기 표적 영역의 가닥 분리를 유도하는 단계; (c) 표적 영역의 단일 가닥 내의 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계; (d) 상기 표적 영역의 하나 이상의 가닥을 절단하는 단계로서, 여기서 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기에 의해 대체되는, 단계; (e) 핵염기 편집기의 도메인을 코딩하는 오픈 리딩 프레임에 존재하는 표적 인트론 서열을 인트론의 스플라이스 수용체 또는 스플라이스 공여체 부위를 표적으로 하는 가이드 RNA와 접촉시키고, 단계 b-d에 기술된 바와 같이 편집을 도입함으로써 염기 편집기를 불활성화시키는 단계를 포함한다. 원하는 편집 수준에 도달하면 언제든지 불활성화가 유도될 수 있다. 일부 구현예들에서, 단계 (b) 또는 (e)는 생략된다는 것이 이해되어야 한다. 일부 구현예에 있어서, 상기 표적화된 핵염기쌍은 하나 이상의 유전자에서의 복수의 핵염기쌍이다. 일부 구현예에서, 본원에 제공된 염기 편집기 시스템은 하나 이상의 유전자에서 복수의 핵염기 쌍의 멀티플렉스 편집이 가능하다. 일부 구현예에 있어서, 복수의 핵염기 쌍은 동일한 유전자에 위치한다. 일부 구현예에 있어서, 복수의 핵염기 쌍은 하나 이상의 유전자에 위치하고, 적어도 하나의 유전자는 상이한 유전자좌에 위치한다.
일부 구현예에서, 절단된 단일 가닥(닉 가닥)은 가이드 핵산에 혼성화된다. 일부 구현예에서, 절단된 단일 가닥은 제1 핵염기를 포함하는 가닥의 반대편에 있다. 일부 구현예에서, 염기 편집기는 Cas9 도메인을 포함한다. 일부 구현예에서, 제1 염기는 아데닌이고, 제2 염기는 G, C, A, 또는 T가 아니다. 일부 구현예에서, 제2 염기는 이노신이다.
일부 구현예에서, 단일 가이드 폴리뉴클레오티드는 데아미나아제를 표적 핵산 서열에 표적화하기 위해 활용될 수 있다. 일부 구현예에서, 단일 쌍의 가이드 폴리뉴클레오티드는 표적 핵산 서열에 상이한 데아미나아제를 표적화하기 위해 활용될 수 있다. 염기 편집기 시스템의 구성요소(예를 들어, 데아미나아제 도메인, 가이드 RNA, 및/또는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인)는 서로 공유적으로 또는 비공유적으로 연관될 수 있다. 예를 들어, 일부 구현예에서, 데아미나아제 도메인은 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인에 의해 표적 뉴클레오티드 서열로 표적화될 수 있으며, 임의로 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 (예를 들어, 가이드 RNA)와 복합체를 형성할(complexed) 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 데아미나아제 도메인에 융합되거나 연결될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 데아미나아제 도메인과 비공유적으로 상호작용하거나 이와 연관됨으로써 데아미나아제 도메인을 표적 뉴클레오티드 서열에 표적화할 수 있다. 예를 들어, 일부 구현예에서, 핵염기 편집 구성요소 (예를 들어, 데아미나아제 구성요소)는 상응하는 이종성 부분, 항원 또는 도메인과 상호작용하거나, 이와 연관되거나, 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인을 포함하며, 이는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 및/또는 이와 복합체를 이루는 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)의 일부이다.
일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 및/또는 이와 복합체화된 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)는 복합체와 상호작용할 수 있거나, 연관될 수 있거나, 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인을 포함하며, 이는 핵염기 편집 도메인의 일부인 상응하는 이종성 부분, 항원 또는 도메인(예를 들어, 데아미나아제 성분)과 함께 사용된다. 일부 구현예에서, 추가의 이종성 부분은 폴리펩티드에 결합하거나, 이와 상호작용하거나, 이와 연관되거나, 또는 폴리펩티드와 복합체를 형성할 수 있다. 일부 구현예에서, 추가의 이종성 부분은 폴리뉴클레오티드에 결합하거나, 이와 상호작용하거나, 이와 연관되거나, 또는 이와 복합체를 형성할 수 있을 수 있다. 일부 구현예에서, 추가의 이종성 부분은 가이드 폴리뉴클레오티드에 결합할 수 있다. 일부 구현예에서, 추가의 이종성 부분은 폴리펩티드 링커에 결합할 수 있다.
일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드 링커에 결합할 수 있다. 추가적인 이종성 부분은 단백질 도메인일 수 있다. 일부 구현예에서, 추가의 이종성 부분은 람다 박테리오파지 항종결자 단백질 N(N22p)의 22개 아미노산 RNA 결합 도메인, 2G12 IgG 동종이량체 도메인, ABI, 항체(예를 들어 결합하는 항체)와 같은 폴리펩티드를 포함한다. 염기 편집기 시스템의 구성요소 또는 이종성 부분) 또는 이의 단편(예: IgM(MHD2) 또는 IgE(EHD2)의 중쇄 도메인 2(CH2), 면역글로불린 Fc 영역, IgM(MHD2)의 중쇄 도메인 3(CH3)) IgG 또는 IgA, IgM 또는 IgE의 중쇄 도메인 4(CH4), Fab, Fab2, 소형항체 및/또는 ZIP 항체), 바르나제-바스타 이량체 도메인, Bcl-xL 도메인, 칼시뉴린 A(CAN) 도메인, 심장 포스포람반 막관통 펜타머 도메인, 콜라겐 도메인, Com RNA 결합 단백질 도메인(예를 들어 SfMu Com 코트 단백질 도메인 및 SfMu Com 결합 단백질 도메인), 시클로필린-Fas 융합 단백질(CyP-Fas) 도메인, Fab 도메인, Fe 도메인, 피브리틴 폴돈 도메인, FK506 결합 단백질(FKBP) 도메인, mTOR의 FKBP 결합 도메인(FRB) 도메인, 폴돈 도메인, 단편 X 도메인, GAI 도메인, GID1 도메인, 글리코포린 A 막횡단 도메인, GyrB 도메인, Halo 태그, HIV Gp41 삼량체화 도메인, HPV45 종양단백질 E7 C-말단 이량체 도메인, 소수성 폴리펩티드, K 상동성(KH) 도메인, Ku 단백질 도메인(예: Ku 이종이량체), 류신 지퍼, LOV 도메인, 미토콘드리아 항바이러스 신호 전달 단백질 CARD 필라멘트 도메인, MS2 코트 단백질 도메인(MCP), 해당 RNA 모티프/압타머에 결합하는 비천연 RNA 앱타머 리간드, 부갑상선 호르몬 이량체화 도메인, PP7 코트 단백질(PCP) 도메인, PSD95-Dlgl-zo-1(PDZ) 도메인, PYL 도메인, SNAP 태그, SpyCatcher 모이어티, SpyTag 모이어티, 스트렙타비딘 도메인, 스트렙타비딘 결합 단백질 도메인, 스트렙타비딘 결합 단백질(SBP) 도메인, 텔로머라제 Sm7 단백질 도메인(예를 들어, Sm7 호모헵타머 또는 단량체성 Sm 유사 단백질) 및/또는 이의 단편을 포함한다. 구현예에서, 추가의 이종성 부분은 폴리뉴클레오티드(예를 들어, RNA 모티프), 예컨대 MS2 파지 오퍼레이터 스템-루프(예를 들어, MS2, MS2 C-5 돌연변이체, 또는 MS2 F-5 돌연변이체), 비-천연 RNA 모티프, PP7 작동자 스템-루프, SfMu 페이트 Com 스템-루프, 스테릴 알파 모티프, 텔로머라제 Ku 결합 모티프, 텔로머라제 Sm7 결합 모티프, 및/또는 이의 단편을 포함한다. 추가적인 이종성 부분의 비제한적 예에는 서열번호: 492, 494, 496, 498-500 중 하나 이상과 적어도 약 85% 서열 상동성을 갖는 폴리펩티드 또는 이의 단편이 포함된다. 추가적인 이종성 부분의 비제한적 예에는 서열번호: 491, 493, 495, 497 중 하나 이상 또는 이의 단편과 적어도 약 85% 서열 상동성을 갖는 폴리뉴클레오티드가 포함된다.
염기 편집기 시스템은 가이드 폴리뉴클레오티드 구성요소를 추가로 포함할 수 있다. 염기 편집기 시스템의 구성요소는 공유 결합, 비공유 상호작용, 또는 이의 연관 및 상호작용의 임의의 조합을 통해 서로 연관될 수 있음이 이해되어야 한다. 일부 구현예에서, 데아미나아제 도메인은 가이드 폴리뉴클레오티드에 의해 표적 뉴클레오티드 서열에 표적화될 수 있다. 예를 들어, 일부 구현예에서, 염기 편집기 시스템의 핵염기 편집 구성요소, (예를 들어, 데아미나아제 구성요소)는 가이드 폴리뉴클레오티드의 이종성 부분 또는 분절(예를 들어, 폴리뉴클레오티드 모티프) 또는 항원과 상호작용하거나, 연관되거나, 또는 이와의 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인(예를 들어, RNA 또는 DNA 결합 단백질과 같은 폴리뉴클레오티드 결합 도메인)을 포함할 수 있다. 일부 구현예에서, 추가적인 이종성 부분 또는 도메인(예를 들어, RNA 또는 DNA 결합 단백질과 같은 폴리뉴클레오티드 결합 도메인)은 데아미나아제 도메인에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩티드에 결합하거나, 이와 상호작용하거나, 연관되거나, 또는 이와의 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드에 결합하거나, 이와 상호작용하거나, 연관되거나, 또는 이와의 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 가이드 폴리뉴클레오티드에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩티드 링커에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드 링커에 결합할 수 있다. 추가적인 이종성 부분은 단백질 도메인일 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩타이드, 예컨대 람다 박테리오파지 항종결자 단백질 N(N22p)의 22개 아미노산 RNA 결합 도메인, 2G12 IgG 동종이량체 도메인, ABI, 항체(예를 들어, 염기 편집기 시스템의 구성요소 또는 이종성 부분) 또는 이의 단편(예를 들어, IgM(MHD2) 또는 IgE(EHD2)의 중쇄 도메인 2(CH2), 면역글로불린 Fc 영역, 중쇄 도메인 3(CH3) IgG 또는 IgA, IgM 또는 IgE의 중쇄 도메인 4(CH4), Fab, Fab2, 소형항체 및/또는 ZIP 항체), 바르나제-바스타 이량체 도메인, Bcl-xL 도메인, 칼시뉴린 A( CAN) 도메인, 심장 포스포람반 막횡단 펜타머 도메인, 콜라겐 도메인, Com RNA 결합 단백질 도메인(예를 들어 SfMu Com 코트 단백질 도메인 및 SfMu Com 결합 단백질 도메인), 시클로필린-Fas 융합 단백질(CyP-Fas) 도메인, Fab 도메인, Fe 도메인, 피브리틴 폴돈 도메인, FK506 결합 단백질(FKBP) 도메인, mTOR의 FKBP 결합 도메인(FRB) 도메인, 폴돈 도메인, 단편 X 도메인, GAI 도메인, GID1 도메인, 글리코포린 A 막횡단 도메인, GyrB 도메인, Halo 태그, HIV Gp41 삼량체화 도메인, HPV45 종양단백질 E7 C-말단 이량체 도메인, 소수성 폴리펩티드, K 상동성(KH) 도메인, MS2 코트 단백질, Ku 단백질 도메인(예를 들어, Ku 이종이량체), 류신 지퍼, LOV 도메인, 미토콘드리아 항바이러스 신호 단백질 CARD 필라멘트 도메인, MS2 코트 단백질 도메인(MCP), 해당 RNA 모티프/압타머에 결합하는 비천연 RNA 앱타머 리간드, 부갑상선 호르몬 이량체화 도메인, PP7 코트 단백질 도메인, SfMu Com 코트 단백질 도메인, 멸균(PCP) 도메인, PSD95-Dlgl-zo-1(PDZ) 도메인, PYL 도메인, SNAP 태그, SpyCatcher 모이어티, SpyTag 모이어티, 스트렙타비딘 도메인, 스트렙타비딘 결합 단백질 도메인, 스트렙타비딘 결합 단백질(SBP) 도메인, 텔로머라제 Sm7 단백질 도메인(예를 들어, Sm7 호모헵타머 또는 단량체성 Sm 유사 단백질) 및/또는 이의 단편을 포함한다. 구현예에서, 추가의 이종성 부분은 폴리뉴클레오티드(예를 들어, RNA 모티프), 예컨대 MS2 파지 오퍼레이터 스템-루프(예를 들어, MS2, MS2 C-5 돌연변이체, 또는 MS2 F-5 돌연변이체), 비-천연 RNA 모티프, PP7 작동자 스템 루프, SfMu 페이트 Com 스템 루프, 스테릴 알파 모티프, 텔로머라제 Ku 결합 모티프 및 Ku 단백질, 텔로머라제 Sm7 결합 모티프 및 Sm7 단백질, 또는 RNA 인식 모티프 및/또는 그 단편을 포함한다. 추가적인 이종성 부분의 비제한적 예에는 서열번호: 492, 494, 496, 498-500 중 하나 이상과 적어도 약 85% 서열 상동성을 갖는 폴리펩티드 또는 이의 단편이 포함된다. 추가적인 이종성 부분의 비제한적 예에는 서열번호: 491, 493, 495, 497 중 하나 이상 또는 이의 단편과 적어도 약 85% 서열 상동성을 갖는 폴리뉴클레오티드가 포함된다.
일부 구현예에서, 염기 편집기 시스템은 염기 절제 복구(BER) 구성요소의 억제제를 추가로 포함할 수 있다. 염기 편집기 시스템의 구성요소는 공유 결합, 비공유 상호작용, 또는 이의 연관 및 상호작용의 임의의 조합을 통해 서로 연관될 수 있음이 이해되어야 한다. BER 구성요소의 억제제는 염기 절제 복구 억제제를 포함할 수 있다. 일부 구현예에서, 염기 절제 복구의 억제제는 우라실 DNA 글리코실라제 억제제(UGI)일 수 있다. 일부 구현예에서, 염기 절제 복구의 억제제는 이노신 염기 절제 복구 억제제일 수 있다. 일부 구현예에서, 염기 절제 복구의 억제제는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인에 의해 표적 뉴클레오티드 서열에 표적화될 수 있으며, 선택적으로 여기서 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 폴리뉴클레오티드 (예를 들어, 가이드 RNA)와 복합체화된다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 염기 절제 복구의 억제제에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 데아미나아제 도메인 및 염기 절제 복구의 억제제에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인은 염기 절제 복구의 억제제와 비-공유적으로 상호작용하거나 또는 연관됨으로써 염기 절제 복구의 억제제를 표적 뉴클레오티드 서열에 표적화할 수 있다. 예를 들어, 일부 구현예에서, 염기 절제 복구의 억제제 구성요소는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인의 일부인 상응하는 추가적인 이종성 부분, 항원 또는 도메인과 상호작용하거나, 연관되거나, 또는 이와의 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인을 포함할 수 있다. 일부 구현예에서, 폴리뉴클레오티드 프로그래밍 뉴클레오티드 결합 도메인 구성요소, 및/또는 이와 복합화된 가이드 폴리뉴클레오티드(예를 들어, 가이드 RNA)는 염기 절제 복구 성분의 억제제의 일부인 상응하는 이종성 부분, 항원 또는 도메인과 상호작용할 수 있거나, 연관될 수 있거나, 이와의 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인을 포함한다. 일부 구현예에서, 염기 절제 복구의 억제제는 가이드 폴리뉴클레오티드에 의해 표적 뉴클레오티드 서열에 표적화될 수 있다. 예를 들어, 일부 구현예에서, 염기 절제 복구의 억제제는 가이드 폴리뉴클레오티드의 일부 또는 분절(예를 들어, 폴리뉴클레오티드 모티프)과 상호작용하거나, 연관되거나, 또는 이와의 복합체를 형성할 수 있는 추가적인 이종성 부분 또는 도메인(예를 들어, RNA 또는 DNA 결합 단백질과 같은 폴리뉴클레오티드 결합 도메인)을 포함할 수 있다. 일부 구현예에서, 가이드 폴리뉴클레오티드의 추가적인 이종성 부분 또는 도메인(예를 들어, RNA 또는 DNA 결합 단백질과 같은 폴리뉴클레오티드 결합 도메인)은 염기 절제 복구의 억제제에 연결되거나 또는 융합될 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드에 결합하거나, 이와 상호작용하거나, 연관되거나, 또는 이와의 복합체를 형성할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 가이드 폴리뉴클레오티드에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩티드 링커에 결합할 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리뉴클레오티드 링커에 결합할 수 있다. 추가적인 이종성 부분은 단백질 도메인일 수 있다. 추가적인 이종성 부분은 단백질 도메인일 수 있다. 일부 구현예에서, 추가적인 이종성 부분은 폴리펩타이드, 예컨대 람다 박테리오파지 항종결자 단백질 N(N22p)의 22개 아미노산 RNA 결합 도메인, 2G12 IgG 동종이량체 도메인, ABI, 항체(예를 들어, 염기 편집기 시스템의 구성요소 또는 이종성 부분) 또는 이의 단편(예를 들어, IgM(MHD2) 또는 IgE(EHD2)의 중쇄 도메인 2(CH2), 면역글로불린 Fc 영역, 중쇄 도메인 3(CH3) IgG 또는 IgA, IgM 또는 IgE의 중쇄 도메인 4(CH4), Fab, Fab2, 소형항체 및/또는 ZIP 항체), 바르나제-바스타 이량체 도메인, Bcl-xL 도메인, 칼시뉴린 A(CAN) 도메인, 심장 포스포람반 막횡단 펜타머 도메인, 콜라겐 도메인, Com RNA 결합 단백질 도메인(예를 들어, SfMu Com 코트 단백질 도메인 및 SfMu Com 결합 단백질 도메인), 시클로필린-Fas 융합 단백질(CyP-Fas) 도메인, Fab 도메인, Fe 도메인, 피브리틴 폴돈 도메인, FK506 결합 단백질(FKBP) 도메인, mTOR의 FKBP 결합 도메인(FRB) 도메인, 폴돈 도메인, 단편 X 도메인, GAI 도메인, GID1 도메인, 글리코포린 A 막횡단 도메인, GyrB 도메인, Halo 태그, HIV Gp41 삼량체화 도메인, HPV45 종양단백질 E7 C-말단 이량체 도메인, 소수성 폴리펩티드, K 상동성(KH) 도메인, MS2 코트 단백질, Ku 단백질 도메인(예를 들어, Ku 이종이량체), 류신 지퍼, LOV 도메인, 미토콘드리아 항바이러스 신호 단백질 CARD 필라멘트 도메인, MS2 코트 단백질 도메인(MCP), 해당 RNA 모티프/압타머에 결합하는 비천연 RNA 앱타머 리간드, 부갑상선 호르몬 이량체화 도메인, PP7 코트 단백질 도메인, SfMu Com 코트 단백질 도메인, 멸균(PCP) 도메인, PSD95-Dlgl-zo-1(PDZ) 도메인, PYL 도메인, SNAP 태그, SpyCatcher 모이어티, SpyTag 모이어티, 스트렙타비딘 도메인, 스트렙타비딘 결합 단백질 도메인, 스트렙타비딘 결합 단백질(SBP) 도메인, 텔로머라제 Sm7 단백질 도메인(예를 들어, Sm7 호모헵타머 또는 단량체성 Sm 유사 단백질) 및/또는 이의 단편을 포함한다. 구현예에서, 추가의 이종성 부분은 폴리뉴클레오티드(예를 들어, RNA 모티프), 예컨대 MS2 파지 오퍼레이터 스템-루프(예를 들어, MS2, MS2 C-5 돌연변이체, 또는 MS2 F-5 돌연변이체), 비-천연 RNA 모티프, PP7 작동자 스템 루프, SfMu 페이트 Com 스템 루프, 스테릴 알파 모티프, 텔로머라제 Ku 결합 모티프 및 Ku 단백질, 텔로머라제 Sm7 결합 모티프 및 Sm7 단백질, 또는 RNA 인식 모티프 및/또는 그 단편을 포함한다. 추가적인 이종성 부분의 비제한적 예에는 서열번호: 492, 494, 496, 498-500 중 하나 이상과 적어도 약 85% 서열 상동성을 갖는 폴리펩티드 또는 이의 단편이 포함된다. 추가적인 이종성 부분의 비제한적 예에는 서열번호: 491, 493, 495, 497 중 하나 이상 또는 이의 단편과 적어도 약 85% 서열 상동성을 갖는 폴리뉴클레오티드가 포함된다.
어떤 경우에는, 염기 편집 시스템의 구성요소가 류신 지퍼 도메인(예를 들어, 서열번호 499 및 500)의 상호작용을 통해 서로 연관된다. 일부 경우에, 염기 편집 시스템의 구성요소는 약, 적어도 약, 또는 약 1, 2 이하 (즉, 이량체화), 3, 4, 5, 6, 7, 8, 9, 10 폴리펩티드 도메인 유닛을 포함하는 단백질 복합체를 형성하는 것과 연관된 폴리펩티드 도메인 (예를 들어,FokI 도메인)을 통해 또 다른 것과 연관되며, 선택적으로 폴리펩티드 도메인은 이의 활성을 감소 또는 제거하는 변경을 포함할 수 있다. 어떤 경우에는, 염기 편집 시스템의 구성요소가 다량체 항체 또는 이의 단편(예를 들어, IgG, IgD, IgA, IgM, IgE, IgM(MHD2)의 중쇄 도메인 2(CH2)), IgE(EHD2), 면역글로불린 Fc 영역, IgG 또는 IgA의 중쇄 도메인 3(CH3), IgM 또는 IgE의 중쇄 도메인 4(CH4), Fab 및 Fab2)의 상호작용을 통해 서로 연관된다. 어떤 경우에, 항체는 이량체, 삼량체 또는 사량체이다. 구현예에서, 이량체 항체는 염기 편집 시스템의 폴리펩타이드 또는 폴리뉴클레오티드 구성요소에 결합한다. 일부 경우에, 염기 편집 시스템의 구성요소는 폴리뉴클레오티드 결합 단백질 도메인(들)과 폴리뉴클레오티드(들)의 상호작용을 통해 서로 연관된다. 일부 경우에, 염기 편집 시스템의 구성요소는 하나 이상의 폴리뉴클레오티드-결합 단백질 도메인과 자기 상보적 및/또는 서로 상보적인 폴리뉴클레오티드의 상호작용을 통해 서로 연관되어 폴리뉴클레오티드가 서로 상보적으로 결합되도록 하며, 각각의 결합된 폴리뉴클레오티드 결합 단백질 도메인(들)을 결합시킨다. 일부 경우에, 염기 편집 시스템의 구성요소가 폴리펩티드 도메인과 소분자(예: 화학적 이량체화 유도제(CID), "이량체화제"라고도 알려져 있음)의 상호작용을 통해 서로 연관된다. CID의 비제한적 예는 Amara, 등, "A Versatile Synthetic Dimerizer for the Regulator of Protein-Protein Interaction," PNAS, 94:10618-10623 (1997); 및 Voß등 "Chemically ducated dimerization: reversible and spatiotemporal control of Protein function in cell", Current Opinion in Chemical Biology, 28:194-201(2015)에 설명되어 있으며, 이들 각각의 개시내용은 모든 목적을 위해 그 전체 내용이 여기에 참조로 포함된다. 이량체화 할 수 있는 폴리펩티드 및 그에 상응하는 이량체화제의 비제한적 예가 아래 표 10.1에 제공된다.
표 10.1. 화학적으로 유도된 이량체 시스템
구현예에서, 추가적인 이종성 부분은 가이드 RNA 분자의 일부이다. 어떤 경우에는 추가적인 이종성 부분이 RNA 모티프를 포함하거나 RNA 모티프이다. RNA 모티프는 가이드 RNA 분자의 5' 또는 3' 말단 또는 가이드 RNA 분자의 다양한 위치에 위치할 수 있다. 구현예에서, RNA 모티프는 가이드 RNA 내에 위치하여 입체 장애를 감소시키며, 선택적으로 이러한 장애는 RNA 스캐폴드의 다른 부피가 큰 루프와 연관된다. 어떤 경우에는 RNA 모티프를 링커를 통해 가이드 RNA의 다른 부분에 연결하는 것이 유리하며, 여기서 링커는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 뉴클레오티드 길이 이하일 수 있다. 선택적으로 링커는 GC가 풍부한 뉴클레오티드 서열을 포함한다. 가이드 RNA는 1개, 2개, 3개, 4개, 5개 이상의 RNA 모티프 카피를 함유할 수 있으며, 선택적으로 이들은 연속적으로 위치하고/하거나 선택적으로 링커(들)에 의해 각각 서로 분리되어 있다. RNA 모티프는 본 명세서에 기술된 폴리뉴클레오티드 변형 중 임의의 하나 이상을 포함할 수 있다. RNA 모티프에 적합한 변형의 비제한적인 예에는 2' 데옥시-2-아미노퓨린, 2'리보스-2-아미노퓨린, 포스포로티오에이트 모드, 2'-O-메틸 모드, 2'-플루로 모드 및 LNA 모드가 포함된다. 유리하게는, 변형은 안정성을 증가시키고 RNA 모티프에 의해 형성된 헤어핀(들)의 더 강한 결합/접힘 구조를 촉진하는 데 도움이 된다.
일부 구현예에서, RNA 모티프는 연장부를 포함하도록 변형된다. 구현예에서, 연장은 약, 적어도 약, 또는 약 2, 3, 4, 5, 10, 15, 20 또는 25개 이하의 뉴클레오티드를 포함한다. 어떤 경우에는 연장으로 인해 RNA 모티프에 의해 형성된 스템 길이가 변경된다(예: 연장 또는 단축). RNA 모티프에 의해 형성된 스템이 약, 적어도 약, 또는 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100개 뉴클레오티드 길이 이하인 것이 유리할 수 있다. 다양한 구현예에서, 연장은 RNA 모티프의 유연성을 증가시키고/시키거나 상응하는 RNA 모티프와의 결합을 증가시킨다.
일부 구현예에서, 염기 편집기는 편집된 가닥의 염기 절제 복구(BER)를 억제한다. 일부 구현예에서, 염기 편집기는 편집되지 않은 가닥을 보호하거나 또는 결합한다. 일부 구현예에서, 염기 편집기는 UGI 활성을 포함한다. 일부 구현예에서, 염기 편집기는 촉매적으로 비활성 이노신-특이적 뉴클레아제를 포함한다. 일부 구현예에서, 염기 편집기는 니카아제 활성을 포함한다. 일부 구현예에서, 염기 쌍의 의도된 편집은 PAM 부위의 상류에 있다. 일부 구현예에서, 염기 쌍의 의도된 편집은 PAM 부위의 상류에 있는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개의 뉴클레오티드이다. 일부 구현예에서, 염기-쌍의 의도된 편집은 PAM 부위의 하류에 있다. 일부 구현예에서, 의도된 편집된 염기 쌍은 PAM 부위의 하류 스트림에 있는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개의 뉴클레오티드이다.
일부 구현예에서, 방법은 표준(예를 들어, NGG) PAM 부위를 필요로 하지 않는다. 일부 구현예에서, 핵염기 편집기는 링커 또는 스페이서를 포함한다. 일부 구현예에서, 링커 또는 스페이서는 1-25 개의 아미노산 길이이다. 일부 구현예에서, 링커 또는 스페이서는 5-20 개의 아미노산 길이이다. 일부 구현예에서, 링커 또는 스페이서는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개의 아미노산 길이이다.
일부 구현예에서, 본원에 제공된 염기 편집 융합 단백질은 정확한 위치에 위치될 필요가 있으며, 예를 들어, 여기서 표적 염기가 정의된 영역(예를 들어, "탈아미노화 윈도우") 내에 배치된다. 일부 구현예에서, 표적은 4 염기 영역 내에 있을 수 있다. 일부 구현예에서, 이러한 정의된 표적 영역은 PAM의 대략 15 염기 상류일 수 있다. Komor, A.C., 등, "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., 등, "Programmable base editing of AㆍT to GㆍC in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); 및 Komor, A.C., 등, "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017)를 참조하며, 이의 전체 내용은 본원에 참조로 포함된다.
일부 구현예에서, 표적 영역은 표적 윈도우를 포함하며, 여기서 표적 윈도우는 표적 핵염기 쌍을 포함한다. 일부 구현예에서, 표적 윈도우는 1-10 개의 뉴클레오티드를 포함한다. 일부 구현예에서, 표적 윈도우는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개의 뉴클레오티드 길이이다. 일부 구현예에서, 염기 쌍의 의도된 편집은 표적 윈도우 내에 있다. 일부 구현예에서, 표적 윈도우는 염기 쌍의 의도된 편집을 포함한다. 일부 구현예에서, 방법은 본원에 제공된 임의의 염기 편집기를 사용하여 수행된다. 일부 구현예에서, 표적 윈도우는 탈아미노화 윈도우이다. 탈아미노화 윈도우는 염기 편집기가 표적 뉴클레오티드에 작용하고 탈아미노화하는 정의된 영역일 수 있다. 일부 구현예에서, 탈아미노화 윈도우는 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 염기 영역 내에 있다. 일부 구현예에서, 탈아미노화 윈도우는 PAM의 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 염기 상류이다.
본 개시내용의 염기 편집기는 표적 폴리뉴클레오티드 서열의 편집을 용이하게 하는 임의의 도메인, 특성 또는 아미노산 서열을 포함할 수 있다. 예를 들어, 일부 구현예에서, 염기 편집기는 핵 국재화 서열(NLS)를 포함한다. 일부 구현예에서, 염기 편집기의 NLS는 데아미나아제 도메인과 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인 사이에 국재화된다. 일부 구현예에서, 염기 편집기의 NLS는 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인에 대해 국재화된 C-말단이다.
본원에 개시된 바와 같은 염기 편집기에 존재할 수 있는 다른 예시적인 특성은 세포질 국재화 서열, 예컨대 국재화 서열, 이출 서열, 예컨대 핵 이출 서열, 또는 다른 국재화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제, 또는 검출에 유용한 서열 태그이다. 본원에 제공된 적합한 단백질 태그는 비오틴 카르복실라제 담체 단백질(BCCP) 태그, myc-태그, 칼모듈린-태그, FLAG-태그, 헤마글루티닌(HA)-태그, 히스티딘 태그 또는 His-태그로도 지칭되는 폴리히스티딘 태그, 말토스 결합 단백질(MBP)-태그, nus-태그, 글루타티온-S-트랜스퍼라제(GST)-태그, 녹색 형광 단백질(GFP)-태그, 티오레독신-태그, S-태그, 소프트태그(Softag)(예를 들어, 소프트태그 1, 소프트태그 3), 스트렙(strep)-태그, 비오틴 리가제 태그, 플래쉬(FlAsH) 태그, V5 태그 및 SBP-태그를 포함하지만, 이에 제한되지 않는다. 일부 구현예에서, 융합 단백질은 하나 이상의 His 태그를 포함한다.
일부 구현예에서, 비제한적인 예시적인 사이티딘 염기 편집기(CBE)에는 BE1(APOBEC1-XTEN-dCas9), BE2(APOBEC1-XTEN-dCas9-UGI), BE3(APOBEC1-XTEN-dCas9(A840H)-UGI), BE3-Gam, saBE3, saBE4-Gam, BE4, BE4-Gam, saBE4 또는 saB4E-Gam이 포함된다. BE4는 APOBEC1-Cas9n(D10A) 링커를 32개 아미노산으로 확장하고 Cas9n-UGI 링커를 9개 아미노산으로 확장하고 또 다른 9개 아미노산 링커를 사용하여 UGI의 두 번째 복사본을 구조물의 C 말단에 추가하여 단일 염기 편집기로 확장한다. 염기 편집기 saBE3 및 saBE4에는 에스. 파이오게네스(S. pyogenes) Cas9n(D10A)이 더 작은 에스. 파이오게네스(S. pyogenes) Cas9n(D10A)으로 대체되었다. BE3-Gam, saBE3-Gam, BE4-Gam 및 saBE4-Gam은 16개 아미노산 XTEN 링커를 통해 BE3, saBE3, BE4 및 saBE4의 N-말단에 융합된 Gam 단백질의 174개 잔기를 갖는다.
일부 구현예에서, 아데노신 염기 편집기(ABE)는 DNA에서 아데닌을 탈아미노화할 수 있다. 일부 구현예에서, ABE는 BE3의 APOBEC1 구성요소를 천연 또는 조작된 이. 콜라이 TadA, 인간 ADAR2, 마우스 ADA, 또는 인간 ADAT2로 대체함으로써 생성된다. 일부 구현예에서, ABE는 진화된 TadA 변이체를 포함한다. 일부 구현예에서, ABE는 ABE 1.2(TadA*-XTEN-nCas9-NLS)이다. 일부 구현예에서, TadA*는 A106V 및 D108N 돌연변이를 포함한다.
일부 구현예에서, ABE는 2세대 ABE이다. 일부 구현예에서, ABE는 TadA*(TadA*2.1)에서 추가적인 돌연변이 D147Y 및 E155V를 포함하는 ABE2.1이다. 일부 구현예에서, ABE는 인간 알킬 아데닌 DNA 글리코실라제의 촉매적으로 비활성화 버전(E125Q 돌연변이가 있는 AAG)에 융합된 ABE2.1인 ABE2.2이다. 일부 구현예에서, ABE는 이. 콜라이 Endo V의 촉매적으로 비활성화 버전(D35A 돌연변이로 비활성화)에 융합된 ABE2.1인 ABE2.3이다. 일부 구현예에서, ABE는 ABE2.1에서 링커보다 2 개 긴 링커(32 개의 아미노산, (SGGS)2(서열번호: 418)-XTEN-(SGGS)2(서열번호: 418))를 갖는 ABE2.6이다. 일부 구현예에서, ABE는 추가적인 야생형 TadA 단량체로 테더링된 ABE2.1인 ABE2.7이다. 일부 구현예에서, ABE는 추가적인 TadA*2.1 단량체로 테더링된 ABE2.1인 ABE2.8이다. 일부 구현예에서, ABE는 진화된 TadA(TadA*2.1)가 ABE2.1의 N-말단에 직접 융합된 ABE2.9이다. 일부 구현예에서, ABE는 야생형 TadA가 ABE2.1의 N-말단에 직접 융합된 ABE2.10이다. 일부 구현예에서, ABE는 TadA* 단량체의 N-말단에서 비활성화 E59A 돌연변이가 있는 ABE2.9인 ABE2.11이다. 일부 구현예에서, ABE는 내부 TadA* 단량체에 비활성화 E59A 돌연변이가 있는 ABE2.9인 ABE2.12이다.
일부 구현예에서, ABE는 3세대 ABE이다. 일부 구현예에서, ABE는 ABE3.1이고, 이는 3개의 추가적인 TadA 돌연변이(L84F, H123Y 및 I156F)를 갖는 ABE2.3이다.
일부 실시예에서, ABE는 4세대 ABE이다. 일부 구현예에서, ABE는 ABE4.3이고, 이는 추가적인 TadA 돌연변이 A142N(TadA*4.3)을 갖는 ABE3.1이다.
일부 구현예에서, ABE는 5세대 ABE이다. 일부 구현예에서, ABE는 생존 클론(H36L, R51L, S146C, 및 K157N)으로부터 ABE3.1 내로 돌연변이의 컨센서스 세트를 유입함으로써 생성된 ABE5.1이다. 일부 구현예에서, ABE는 내부 진화된 TadA*에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물을 갖는 ABE5.3이다. 일부 구현예에서, ABE는 하기 표 10에 제시된 바와 같이, ABE5.2, ABE5.4, ABE5.5, ABE5.6, ABE5.7, ABE5.8, ABE5.9, ABE5.10, ABE5.11, ABE5.12, ABE5.13, 또는 ABE5.14이다. 일부 구현예에서, ABE는 6세대 ABE이다. 일부 구현예에서, ABE는 하기 표 10에 제시된 바와 같이, ABE6.1, ABE6.2, ABE6.3, ABE6.4, ABE6.5, 또는 ABE6.6이다. 일부 구현예에서, ABE는 7세대 ABE이다. 일부 구현예에서, ABE는 하기 표 10에 제시된 바와 같이, ABE7.1, ABE7.2, ABE7.3, ABE7.4, ABE7.5, ABE7.6, ABE7.7, ABE7.8, ABE 7.9, 또는 ABE7.10이다.
표 10. ABE의 유전자형
일부 구현예에서, 염기 편집기는 8세대 ABE(ABE8)이다. 일부 구현예에서, ABE8은 TadA*8 변이체를 함유한다. 일부 구현예에서, ABE8은 TadA*8 변이체를 함유하는 단량체성 작제물을 갖는다("ABE8.x-m"). 일부 구현예에서, ABE8은 Y147T 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.1)을 갖는 ABE8.1-m이다. 일부 구현예에서, ABE8은 Y147R 돌연변이가 있는 TadA*7.10을 함유하는 단랑체성 작제물(TadA*8.2)을 갖는 ABE8.2-m이다. 일부 구현예에서, ABE8은 Q154S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.3)을 갖는 ABE8.3-m이다.
일부 구현예에서, ABE8은 Y123H 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.4)을 갖는 ABE8.4-m이다. 일부 구현예에서, ABE8은 V82S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.5)을 갖는 ABE8.5-m이다. 일부 구현예에서, ABE8은 T166R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.6)을 갖는 ABE8.6-m이다. 일부 구현예에서, ABE8은 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.7)을 갖는 ABE8.7-m이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 Y123H 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.8)을 갖는 ABE8.8-m이다. 일부 구현예에서, ABE8은 Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.9)을 갖는 ABE8.9-m이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 T166R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.10)을 갖는 ABE8.10-m이다. 일부 구현예에서, ABE8은 Y147T 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.11)을 갖는 ABE8.11-m이다. 일부 구현예에서, ABE8은 Y147T 및 Q154S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.12)을 갖는 ABE8.12-m이다.
일부 구현예에서, ABE8은 Y123H(Y123H는 H123Y로부터 복귀됨), Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.13)을 갖는 ABE8.13-m이다. 일부 구현예에서, ABE8은 I76Y 및 V82S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.14)을 갖는 ABE8.14-m이다. 일부 구현예에서, ABE8은 V82S 및 Y147R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.15)을 갖는 ABE8.15-m이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Y147R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.16)을 갖는 ABE8.16-m이다. 일부 구현예에서, ABE8은 V82S 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.17)을 갖는 ABE8.17-m이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.18)을 갖는 ABE8.18-m이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨), Y147R 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.19)을 갖는 ABE8.19-m이다. 일부 구현예에서, ABE8은 I76Y, V82S, Y123H(Y123H는 H123Y로부터 복귀됨), Y147R 및 Q154R 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.20)을 갖는 ABE8.20-m이다. 일부 구현예에서, ABE8은 Y147R 및 Q154S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.21)을 갖는 ABE8.21-m이다. 일부 구현예에서, ABE8은 V82S 및 Q154S 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.22)을 갖는 ABE8.22-m이다. 일부 구현예에서, ABE8은 V82S 및 Y123H(Y123H는 H123Y로부터 복귀됨) 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.23)을 갖는 ABE8.23-m이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨), 및 Y147T 돌연변이가 있는 TadA*7.10을 함유하는 단량체성 작제물(TadA*8.24)을 갖는 ABE8.24-m이다.
일부 구현예에서, ABE8은 TadA*8 변이체에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물을 갖는다("ABE8.x-d"). 일부 구현예에서, ABE8은 Y147T 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.1)을 갖는 ABE8.1-d이다. 일부 구현예에서, ABE8은 Y147R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.2)을 갖는 ABE8.2-d이다. 일부 구현예에서, ABE8은 Q154S 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.3)을 갖는 ABE8.3-d이다. 일부 구현예에서, ABE8은 Y123H 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.4)을 갖는 ABE8.4-d이다. 일부 구현예에서, ABE8은 V82S 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.5)을 갖는 ABE8.5-d이다. 일부 구현예에서, ABE8은 T166R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.6)을 갖는 ABE8.6-d이다. 일부 구현예에서, ABE8은 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.7)을 갖는 ABE8.7-d이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 Y123H 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.8)을 갖는 ABE8.8-d이다. 일부 구현예에서, ABE8은 Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.9)을 갖는 ABE8.9-d이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 T166R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.10)을 갖는 ABE8.10-d이다. 일부 구현예에서, ABE8은 Y147T 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.11)을 갖는 ABE8.11-d이다. 일부 구현예에서, ABE8은 Y147T 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.12)을 갖는 ABE8.12-d이다. 일부 구현예에서, ABE8은 Y123H(Y123H는 H123Y로부터 복귀됨), Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.13)을 갖는 ABE8.13-d이다. 일부 구현예에서, ABE8은 I76Y 및 V82S 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.14)을 갖는 ABE8.14-d이다. 일부 구현예에서, ABE8은 V82S 및 Y147R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.15)을 갖는 ABE8.15-d이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Y147R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.16)을 갖는 ABE8.16-d이다. 일부 구현예에서, ABE8은 V82S 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.17)을 갖는 ABE8.17-d이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.18)을 갖는 ABE8.18-d이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨), Y147R 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.19)을 갖는 ABE8.19-d이다. 일부 구현예에서, ABE8은 I76Y, V82S, Y123H(Y123H는 H123Y로부터 복귀됨), Y147R 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.20)을 갖는 ABE8.20-d이다. 일부 구현예에서, ABE8은 Y147R 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.21)을 갖는 ABE8.21-d이다. 일부 구현예에서, ABE8은 V82S 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.22)을 갖는 ABE8.22-d이다. 일부 구현예에서, ABE8은 V82S 및 Y123H(Y123H는 H123Y로부터 복귀됨) 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.23)을 갖는 ABE8.23-d이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨), 및 Y147T 돌연변이가 있는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체성 작제물(TadA*8.24)을 갖는 ABE8.24-d이다.
일부 구현예에서, ABE8은 TadA*8 변이체에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물을 갖는다("ABE8.x-7"). 일부 구현예에서, ABE8은 Y147T 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.1)을 갖는 ABE8.1-7이다. 일부 구현예에서, ABE8은 Y147R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.2)을 갖는 ABE8.2-7이다. 일부 구현예에서, ABE8은 Q154S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.3)을 갖는 ABE8.3-7이다. 일부 구현예에서, ABE8은 Y123H 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.4)을 갖는 ABE8.4-7이다. 일부 구현예에서, ABE8은 V82S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.5)을 갖는 ABE8.5-7이다. 일부 구현예에서, ABE8은 T166R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.6)을 갖는 ABE8.6-7이다. 일부 구현예에서, ABE8은 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.7)을 갖는 ABE8.7-7이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 Y123H 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.8)을 갖는 ABE8.8-7이다. 일부 구현예에서, ABE8은 Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.9)을 갖는 ABE8.9-7이다. 일부 구현예에서, ABE8은 Y147R, Q154R, 및 T166R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.10)을 갖는 ABE8.10-7이다. 일부 구현예에서, ABE8은 Y147T 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.11)을 갖는 ABE8.11-7이다. 일부 구현예에서, ABE8은 Y147T 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.12)을 갖는 ABE8.12-7이다. 일부 구현예에서, ABE8은 Y123H(Y123H는 H123Y로부터 복귀됨), Y147R, Q154R 및 I76Y 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.13)을 갖는 ABE8.13-7이다. 일부 구현예에서, ABE8은 I76Y 및 V82S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.14)을 갖는 ABE8.14-7이다. 일부 구현예에서, ABE8은 V82S 및 Y147R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.15)을 갖는 ABE8.15-7이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Y147R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.16)을 갖는 ABE8.16-7이다. 일부 구현예에서, ABE8은 V82S 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.17)을 갖는 ABE8.17-7이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨) 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.18)을 갖는 ABE8.18-7이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨), Y147R 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.19)을 갖는 ABE8.19-7이다. 일부 구현예에서, ABE8은 I76Y, V82S, Y123H(Y123H는 H123Y로부터 복귀됨), Y147R 및 Q154R 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.20)을 갖는 ABE8.20-7이다. 일부 구현예에서, ABE8은 Y147R 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.21)을 갖는 ABE8.21-7이다. 일부 구현예에서, ABE8은 V82S 및 Q154S 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.22)을 갖는 ABE8.22-7이다. 일부 구현예에서, ABE8은 V82S 및 Y123H(Y123H는 H123Y로부터 복귀됨) 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.23)을 갖는 ABE8.23-7이다. 일부 구현예에서, ABE8은 V82S, Y123H(Y123H는 H123Y로부터 복귀됨), 및 Y147T 돌연변이가 있는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체성 작제물(TadA*8.24)을 갖는 ABE8.24-7이다.
일부 구현예에서, ABE는 하기 표 11에 나타낸 바와 같은 ABE8.1-m, ABE8.2-m, ABE8.3-m, ABE8.4-m, ABE8.5-m, ABE8.6-m, ABE8.7-m, ABE8.8-m, ABE8.9-m, ABE8.10-m, ABE8.11-m, ABE8.12-m, ABE8.13-m, ABE8.14-m, ABE8.15-m, ABE8.16-m, ABE8.17-m, ABE8.18-m, ABE8.19-m, ABE8.20-m, ABE8.21-m, ABE8.22-m, ABE8.23-m, ABE8.24-m, ABE8.1-d, ABE8.2-d, ABE8.3-d, ABE8.4-d, ABE8.5-d, ABE8.6-d, ABE8.7-d, ABE8.8-d, ABE8.9-d, ABE8.10-d, ABE8.11-d, ABE8.12-d, ABE8.13-d, ABE8.14-d, ABE8.15-d, ABE8.16-d, ABE8.17-d, ABE8.18-d, ABE8.19-d, ABE8.20-d, ABE8.21-d, ABE8.22-d, ABE8.23-d, 또는 ABE8.24-d이다.
표 11: 아데노신 염기 편집기 8(ABE8) 변이체
일부 구현예에서, ABE8은 ABE8a-m이고, 이는 R26C, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이(TadA*8a)를 갖는 TadA*7.10을 함유하는 단량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8b-m이고, 이는 V88A, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이(TadA*8b)를 갖는 TadA*7.10을 함유하는 단량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8c-m이고, 이는 R26C, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이(TadA*8c)를 갖는 TadA*7.10을 함유하는 단량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8d-m이고, 이는 V88A, T111R, D119N, 및 F149Y 돌연변이(TadA*8d)를 갖는 TadA*7.10을 함유하는 단량체성 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8e-m이고, 이는 A109S, T111R, D119N, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이(TadA*8e)를 갖는 TadA*7.10을 함유하는 단량체 작제물을 갖는다.
일부 구현예에서, ABE8은 ABE8a-d이며, 이는 R26C, A109S, T111R, D119, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이(TadA*8a)를 갖는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8b-d이며, 이는 V88A, A109S, T111R, D119N, H122N, F149Y, T166I 및 D167N 돌연변이(TadA*8b)를 갖는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8c-d이고, 이는 R26C, A109S, T111R, D119N, H122N, F149Y, T166I 및 D167N 돌연변이(TadA*8c)를 갖는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8d-d이고, 이는 V88A, T111R, D119N 및 F149Y 돌연변이(TadA*8d)를 갖는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8e-d이며, 이는 A109S, T111R, D119N, H122N, Y147D, F149Y, T166I 및 D167N 돌연변이(TadA*8e)를 갖는 TadA*7.10에 융합된 야생형 이. 콜라이 TadA를 함유하는 이종이량체 작제물을 갖는다.
일부 구현예에서, ABE8은 ABE8a-7이고, 이는 R26C, A109S, T111R, D119, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이(TadA*8a)를 갖는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8b-7이고, 이는 V88A, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이(TadA*8b)를 갖는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8c-7이고, 이는 R26C, A109S, T111R, D119N, H122N, F149Y, T166I, 및 D167N 돌연변이(TadA*8c)를 갖는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8d-7이고, 이는 V88A, T111R, D119N, 및 F149Y 돌연변이(TadA*8d)를 갖는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물을 갖는다. 일부 구현예에서, ABE8은 ABE8e-7이고, 이는 A109S, T111R, D119N, H122N, Y147D, F149Y, T166I, 및 D167N 돌연변이(TadA*8e)를 갖는 TadA*7.10에 융합된 TadA*7.10을 함유하는 이종이량체 작제물을 갖는다.
일부 구현예에서, ABE는 하기 표 12에 나타낸 바와 같이, ABE8a-m, ABE8b-m, ABE8c-m, ABE8d-m, ABE8e-m, ABE8a-d, ABE8b-d, ABE8c-d, ABE8d-d, 또는 ABE8e-d이다. 일부 구현예에서, ABE는 ABE8e-m 또는 ABE8e-d이다. ABE8e는 SpCas9 이외의 Cas 상동체, 예를 들어, SaCas9, SaCas9-KKH, Cas12a 상동체, 예를 들어, LbCas12a, enAs-Cas12a, SpCas9-NG 및 원형적으로 순열된 CP1028-SpCas9 및 CP1041-SpCas9와 함께 사용될 때 효율적인 아데닌 염기 편집 활성 및 낮은 인델 형성을 나타낸다. 표 12에서 ABE8e에 대해 나타낸 돌연변이 이외에, 오프-타겟 RNA 및 DNA 편집은 TadA 도메인 내로 V106W 치환을 도입함으로써 감소되었다(M. Richter 등, 2020, Nature Biotechnology, doi.org/10.1038/s41587-020-0453-z에 기재된 바와 같고, 이의 전체 내용은 본원에 참조로 포함됨).
표 12. 추가의 아데노신 염기 편집기 8 변이체. 표에서, “단량체”는 표시된 변경을 포함하는 단일 TadA*7.10을 포함하는 ABE를 나타내고, “이종이량체”는
이. 콜라이
TadA 아데노신 데아미나아제에 융합된 표시된 변경을 포함하는 TadA*7.10을 포함하는 ABE를 나타낸다.
일부 구현예에서, 염기 편집기(예를 들어, ABE8)는 아데노신 데아미나아제 변이체(예를 들어, TadA*8)를 원형 순열 Cas9(예를 들어, CP5 또는 CP6) 및 이분 핵 국재화 서열을 포함하는 스캐폴드 내로 클로닝함으로써 생성된다. 일부 구현예에서, 염기 편집기(예를 들어, ABE7.9, ABE7.10, 또는 ABE8)는 NGC PAM CP5 변이체(에스. 파이오게네스 Cas9 또는 spVRQR Cas9)이다. 일부 구현예에서, 염기 편집기(예를 들어, ABE7.9, ABE7.10, 또는 ABE8)는 AGA PAM CP5 변이체(에스. 파이오게네스 Cas9 또는 spVRQR Cas9)이다. 일부 구현예에서, 염기 편집기(예를 들어, ABE7.9, ABE7.10, 또는 ABE8)는 NGC PAM CP6 변이체(에스. 파이오게네스 Cas9 또는 spVRQR Cas9)이다. 일부 구현예에서, 염기 편집기(예를 들어 ABE7.9, ABE7.10, 또는 ABE8)는 AGA PAM CP6 변이체(에스. 파이오게네스 Cas9 또는 spVRQR Cas9)이다.
일부 구현예에서, ABE는 하기 표 13에 제시된 바와 같은 유전자형을 갖는다.
표 13. ABE의 유전자형
하기 표 14에 제시된 바와 같이, 40 개의 ABE8의 유전자형이 기재되어 있다. ABE의 진화된 이. 콜라이 TadA 부분에서의 잔기 위치가 표시된다. ABE7.10 돌연변이와 구별될 때 ABE8의 돌연변이 변화가 제시된다. 일부 구현예에서, ABE는 하기 표 14에 제시된 바와 같은 ABE 중 하나의 유전자형을 갖는다.
표 14. 진화된 TadA의 잔기 식별
_
일부 구현예에서, 염기 편집기는 아데노신 데아미나아제 활성을 갖는 하기 서열 또는 이의 단편을 포함하거나 또는 이로 본질적으로 이루어진 ABE8.1이다:
ABE8.1_Y147T_CP5_NGC PAM_단량체 (서열번호: 419)
상기 서열에서, 상기 일반 글씨체는 아데노신 데아미나아제 서열을 의미하고, 굵은체 서열은 Cas9로부터 유래된 서열을 의미하며, 이탤릭체 서열은 링커 서열을 의미하고, 밑줄친 서열은 이분 핵 국재화 서열을 의미한다. 다른 ABE8 서열은 첨부된 서열목록(서열번호: 420-442)에 제공된다.
일부 구현예들에서, 염기 편집기는 9세대 ABE(ABE9)이다. 일부 구현예에서, ABE9는 TadA*9 변이체를 함유한다. ABE9 염기 편집기는 본원에 기재된 바와 같이 ABE 7*10 참조 서열에 대한 변경을 함유하는, 아미노산 서열을 포함하는 아데노신 데아미나아제 변이체를 포함한다. 예시적인 ABE9 변이체는 표 15에 열거되어 있다. ABE9 염기 편집기의 세부 사항은 국제 PCT 출원번호 PCT/2020/049975에 기재되어 있으며, 이는 그 전문이 본원에 참조로 포함된다.
표 15. 아데노신 염기 편집기 9(ABE9) 변이체. 표에서 "단량체"는 표시된 변경을 포함하는 단일 TadA*7.10을 포함하는 ABE를 나타내고 "이종이량체"는
이. 콜라이
TadA 아데노신 데아미나아제에 융합된 표시된 변경을 포함하는 TadA*7.10을 포함하는 ABE를 나타낸다.
_
일부 구현예에서, 염기 편집기는 본원에 기재된 바와 같은 ABE 7*10 참조 서열에 대한 변경을 함유하는 아미노산 서열을 포함하는 아데노신 데아미나아제 변이체를 포함한다. 표 15.1에 사용된 용어 "단량체"는 기술된 변형을 포함하는 TadA*7.10의 단량체 형태를 의미한다. 표 15.1에 사용된 용어 "이종이량체"는 설명된 변경을 포함하는 TadA*7.10에 융합된 특정 야생형 이. 콜라이 TadA 아데노신 데아미나아제를 의미한다.
표 15.1. 아데노신 데아미나아제 염기 편집기 변이체
일부 구현예에서, 염기 편집기는 우라실 글리코실라제 억제제(UGI)의 전부 또는 부분을 포함하는 도메인을 포함한다. 일부 구현예에서, 염기 편집기는 핵산 폴리머라아제의 전부 또는 부분을 포함하는 도메인을 포함한다. 일부 구현예에서, 염기 편집기는 도메인으로서 핵산 폴리머라아제(NAP)의 전부 또는 부분을 포함할 수 있다. 예를 들어, 염기 편집기는 진핵생물 NAP의 전부 또는 부분을 포함할 수 있다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 DNA 폴리머라아제다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 손상통과 폴리머라아제 활성을 갖는다. 일부 경우에, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 손상통과 DNA 폴리머라아제다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 Rev7, Rev1 복합체, 폴리머라아제 이오타, 폴리머라아제 카파, 또는 폴리머라아제 에타이다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 진핵생물 폴리머라아제 알파, 베타, 감마, 델타, 엡실론, 감마, 에타, 이오타, 카파, 람다, 뮤, 또는 누 구성요소이다. 일부 구현예에서, 염기 편집기 내로 혼입된 NAP 또는 이의 부분은 핵산 폴리머라아제(예를 들어, 트랜스레전(translesion) DNA 폴리머라아제)와 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 99.5% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, 염기 편집기에 혼입된 핵산 폴리머라아제 또는 이의 부분은 트랜스레전 (translesion) DNA 폴리머라아제이다.
일부 구현예에서, 염기 편집기의 도메인은 다중 도메인을 포함할 수 있다. 예를 들어, Cas9로부터 유래된 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인을 포함하는 염기 편집기는 야생형 또는 천연 Cas9의 REC 로브 및 NUC 로브에 상응하는 REC 로브 및 NUC 로브를 포함할 수 있다. 또 다른 예에서, 염기 편집기는 RuvCI 도메인, BH 도메인, REC1 도메인, REC2 도메인, RuvCII 도메인, L1 도메인, HNH 도메인, L2 도메인, RuvCIII 도메인, WED 도메인, TOPO 도메인 또는 CTD 도메인 중 하나 이상을 포함할 수 있다. 일부 구현예에서, 염기 편집기의 하나 이상의 도메인은 도메인을 포함하는 폴리펩티드의 야생형 버전에 비해 돌연변이(예를 들어, 치환, 삽입, 결실)를 포함한다. 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인의 HNH 도메인은 H840A 치환을 포함할 수 있다. 또 다른 예에서, 폴리뉴클레오티드 프로그래밍 가능한 DNA 결합 도메인의 RuvCI 도메인은 D10A 치환을 포함할 수 있다.
본원에 개시된 염기 편집기의 상이한 도메인(예를 들어, 인접한 도메인)은 하나 이상의 링커 도메인(예를 들어, XTEN 링커 도메인)을 사용하거나 또는 사용하지 않고 서로 연결될 수 있다. 일부 구현예에서, 링커 도메인은 결합(예를 들어, 공유 결합), 화학 기, 또는 2 개의 분자 또는 모이어티를 연결하는 분자, 예를 들어, 융합 단백질의 2 개의 도메인, 예컨대, 예를 들어, 제1 도메인(예를 들어, Cas9-유래 도메인) 및 제2 도메인(예를 들어, 아데노신 데아미나아제 도메인 또는 사이티딘 데아미나아제 도메인)일 수 있다. 일부 구현예에서, 링커는 공유 결합(예를 들어, 탄소-탄소 결합, 디술피드 결합, 탄소-헤테로 원자 결합 등)이다. 특정 구현예에서, 링커는 아미드 결합의 탄소 질소 결합이다. 특정 구현예에서, 링커는 환형 또는 비환형, 치환 또는 비치환, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커이다. 특정 구현예에서, 링커는 중합체성(예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르 등)이다. 특정 구현예에서, 링커는 아미노알칸산의 단량체, 이량체, 또는 중합체를 포함한다. 일부 구현예에서, 링커는 아미노알칸산(예를 들어, 글리신, 에탄산, 알라닌, 베타-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산 등)을 포함한다. 일부 구현예에서, 링커는 아미노헥산산(Ahx)의 단량체, 이량체, 또는 중합체를 포함한다. 특정 구현예에서, 링커는 탄소환형 모이어티(예를 들어, 사이클로펜탄, 사이클로헥산)를 기반으로 한다. 다른 구현예에서, 링커는 폴리에틸렌 글리콜 모이어티(PEG)를 포함한다. 특정 구현예에서, 링커는 아릴 또는 헤테로아릴 모이어티를 포함한다. 특정 구현예에서, 링커는 페닐 고리를 기반으로 한다. 링커는 펩티드에서 링커까지 친핵체(예를 들어, 티올, 아미노)의 부착을 용이하게 하는 작용화된 모이어티를 포함할 수 있다. 임의의 친전자체가 링커의 일부로 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클(Michael) 수용체, 알킬 할라이드, 아릴 할라이드, 아실 할라이드, 및 이소티오시아네이트를 포함하나 이에 제한되지 않는다. 일부 구현예에서, 링커는 Cas9 뉴클레아제 도메인을 포함하는 RNA-프로그래밍 가능한 뉴클레아제의 gRNA 결합 도메인, 및 핵산 편집 단백질의 촉매 도메인을 연결한다. 일부 구현예에서, 링커는 dCas9 및 제2 도메인(예를 들어, UGI 등)을 연결한다.
링커
특정 구현예에서, 링커는 본 발명의 임의의 펩티드 또는 펩티드 도메인을 연결하는 데 사용될 수 있다. 링커는 공유 결합만큼 단순할 수 있거나, 또는 많은 원자 길이의 중합체성 링커일 수 있다. 특정 구현예에서, 링커는 폴리펩티드이거나 또는 아미노산을 기반으로 한다. 특정 구현예에서, 폴리펩티드 또는 아미노산 기반 링커는 본 발명의 임의의 폴리뉴클레오티드에 의해 코딩될 수 있다. 일부 구현예에서, 데아미나아제 도메인 및/또는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인을 코딩하는 폴리뉴클레오티드 또는 이의 단편은 링커 폴리뉴클레오티드 서열을 포함한다. 일부 구현예에서, 데아미나아제 도메인 및/또는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 또는 이의 단편을 코딩하는 폴리뉴클레오티드, 및 링커 폴리뉴클레오티드 서열은 오픈 리딩 프레임 내에 삽입된 인트론을 포함한다. 일부 구현예에서, 인트론은 링커 폴리뉴클레오티드 서열 내에 삽입된다.
다른 구현예에서, 링커는 펩티드와 유사하지 않다. 특정 구현예에서, 링커는 공유 결합(예를 들어, 탄소-탄소 결합, 디술피드 결합, 탄소-헤테로원자 결합 등)이다. 특정 구현예에서, 링커는 아미드 결합의 탄소-질소 결합이다. 특정 구현예에서, 링커는 환형 또는 비환형, 치환 또는 비치환, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커이다. 특정 구현예에서, 링커는 중합체성(예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르 등)이다. 특정 구현예에서, 링커는 아미노알칸산의 단량체, 이량체, 또는 중합체를 포함한다. 특정 구현예에서, 링커는 아미노알칸산(예를 들어, 글리신, 에탄산, 알라닌, 베타-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산 등)을 포함한다. 특정 구현예에서, 링커는 아미노헥산산(Ahx)의 단량체, 이량체, 또는 중합체를 포함한다. 특정 구현예에서, 링커는 탄소환형 모이어티(예를 들어, 사이클로펜탄, 사이클로헥산)를 기반으로 한다. 다른 구현예에서, 링커는 폴리에틸렌 글리콜 모이어티(PEG)를 포함한다. 다른 구현예에서, 링커는 아미노산을 포함한다. 특정 구현예에서, 링커는 펩티드를 포함한다. 특정 구현예에서, 링커는 아릴 또는 헤테로아릴 모이어티를 포함한다. 특정 구현예에서, 링커는 페닐 고리를 기반으로 한다. 링커는 펩티드에서 링커까지 친핵체(예를 들어, 티올, 아미노)의 부착을 용이하게 하는 작용화된 모이어티를 포함할 수 있다. 임의의 친전자체는 링커의 일부로 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클 수용체, 알킬 할라이드, 아릴 할라이드, 아실 할라이드, 및 이소티오시아네이트를 포함하지만 이에 제한되지 않는다.
전형적으로, 링커는 2 개의 기, 분자, 또는 다른 모이어티 사이에 위치하거나, 또는 이에 의해 플랭킹되고 공유 결합을 통해 서로 연결되어, 2 개를 연결한다. 링커는 아미노산 또는 복수의 아미노산(예를 들어, 펩티드 또는 단백질)이다. 일부 구현예에서, 링커는 유기 분자, 그룹, 중합체, 또는 화학적 모이어티이다. 일부 구현예에서, 링커는 2-100 개의 아미노산 길이, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, 또는 150-200 개의 아미노산 길이이다. 일부 구현예에서, 링커는 약 3 내지 약 104 개(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100 개)의 아미노산 길이이다. 더 길거나 또는 더 짧은 링커가 또한 고려된다.
일부 구현예에서, 본원에 제공된 임의의 융합 단백질은 링커를 통해 서로 융합된 사이티딘 또는 아데노신 데아미나아제 및 Cas9 도메인을 포함한다. 사이티딘 또는 아데노신 데아미나아제 핵염기 편집기에 대한 활성을 위한 최적의 길이를 달성하기 위해 사이티딘 또는 아데노신 데아미나아제 및 Cas9 도메인 사이의 다양한 링커 길이 및 유연성이 이용될 수 있다(예를 들어, (GGGS)n(서열번호: 334), (GGGGS)n(서열번호: 335) 및 (G)n을 형성하는 매우 유연한 링커에서 (EAAAK)n(서열번호: 336), (SGGS)n(서열번호: 443), SGSETPGTSESATPES(서열번호: 337)(예를 들어, Guilinger JP, 등, Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82를 참조하며; 전체 내용이 본원에 참조로 포함됨) 및 (XP)n을 형성하는 보다 강성 링커까지). 일부 구현예에서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15이다. 일부 구현예에서, 링커는 (GGS)n 모티프를 포함하며, 여기서 n은 1, 3, 또는 7이다. 일부 구현예에서, 본원에 제공된 임의의 융합의 사이티딘 데아미나아제 또는 아데노신 데아미나아제 및 Cas9 도메인은 XTEN 링커로도 지칭될 수 있는 아미노산 서열 SGSETPGTSESATPES (서열번호: 237)를 포함하는 링커를 통해 융합된다.
일부 구현예에서, 염기 편집기의 도메인은 하기 아미노산 서열을 포함하는 링커를 통해 융합된다:
SGGSSGSETPGTSESATPESSGGS(서열번호: 444),
SGGSSGGSSGSETPGTSESATPESSGGSSGGS(서열번호: 445), 또는 GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS(서열번호: 446).
일부 구현예에서, 염기 편집기의 도메인은 XTEN 링커로도 지칭될 수 있는 아미노산 서열 SGSETPGTSESATPES(서열번호: 237)을 포함하는 링커를 통해 융합된다. 일부 구현예에서, 링커는 아미노산 서열 SGGS를 포함한다. 일부 구현예에서, 링커는 길이가 24개의 아미노산이다. 일부 구현예에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPES(서열번호: 447)을 포함한다. 일부 구현예에서, 링커는 길이가 40개의 아미노산이다. 일부 구현예에서, 링커는 아미노산 서열: SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS(서열번호: 448)을 포함한다. 일부 구현예에서, 링커는 길이가 64개의 아미노산이다. 일부 구현예에서, 링커는 아미노산 서열: SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS(서열번호: 449)을 포함한다. 일부 구현예에서, 링커는 길이가 92개의 아미노산이다. 일부 구현예에서, 링커는 아미노산 서열: PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS(서열번호: 450)을 포함한다.
일부 구현예에서, 링커는 복수의 프롤린 잔기를 포함하고, 길이가 5-21, 5-14, 5-9, 5-7개의 아미노산인, 예를 들어, PAPAP(서열번호: 451), PAPAPA(서열번호: 452)이다. ), PAPAPAP (서열번호: 453), PAPAPAPA (서열번호: 454), P(AP)4 (서열번호: 455), P(AP)7 (서열번호: 456), P(AP)10 (서열번호: 457)을 포함한다 (예를 들어, Tan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement. Nat Commun. 2019 Jan 25;10(1):439을 참조하며; 전체 내용은 여기에 참조로 포함된다). 이러한 프롤린이-풍부한 링커는 “강성(rigid)”링커라고도 한다.
또 다른 구현예에서, 염기 편집기 시스템은 데아미나아제(DNA 데아미나아제), 예를 들어 아데노신 또는 사이티딘 데아미나아제와 비공유적으로 상호작용하고, 최소 또는 감소된 방관자 또는 표적-인접 효과로, 특이적 편집을 위해 표적 폴리뉴클레오티드 서열에서 표적 핵염기에 아데노신 또는 사이티딘 데아미나아제를 일시적으로 유인하는 구성요소(단백질)을 포함한다. 데아미나아제-상호작용 단백질을 포함하는 이러한 비-공유 시스템 및 방법은 DNA 데아미나아제를 특정 게놈 표적 핵염기로 유인하고, 온-타겟 및 표적-인접 편집의 사건을 분리하도록 작용하여, 보다 정확한 단일 염기 치환 돌연변이의 달성을 향상시킨다. 일 구현예에서, 데아미나아제-상호작용 단백질은 데아미나아제의 활성(촉매) 부위가 표적 핵염기(예를 들어, 각각 아데노신 또는 사이티딘)와 결합하는 것을 차단하거나 방해하지 않고 데아미나아제(예를 들어, 아데노신 데아미나아제 또는 사이티딘 데아미나아제)에 결합한다. "MagnEdit"로 지칭되는 이러한 시스템은 Cas9 및 gRNA 복합체에 연결된 상호작용하는 단백질을 포함하고, 공동-발현된 아데노신 또는 사이티딘 데아미나아제(외인성 또는 내인성)을 유인하여 특정 게놈 표적 부위를 편집하기 위해 할 수 있고, 이는 McCann, J. 등, 2020, "MagnEdit - interacting factors that recruit DNA-editing enzymes to single base targets," Life-Science-Alliance, Vol. 3, No. 4 (e201900606), (doi 10.26508/Isa.201900606)에 기재되어 있으며, 이의 내용은 그 전문이 본원에 참조로 포함된다. 일 구현예에서, DNA 데아미나아제는 본원에 기재된 바와 같은 아데노신 데아미나아제 변이체(예를 들어, TadA*8)이다.
또 다른 구현예에서, "Suntag"로 불리는 시스템은 염기 편집기의 단백질(예를 들어, 아데노신 데아미나아제 또는 사이티딘 데아미나아제) 구성요소 또는 이의 다중 카피를 폴리뉴클레오티드 표적 부위로 모집하여 인접 표적 편집이 감소된 부위에서 염기 편집을 달성하는 데 사용되는 비-공유적으로 상호작용하는 구성요소를 포함하고, 이는 예를 들어, Tanenbaum, M.E. 등, "A protein tagging system for signal amplification in gene expression and fluorescence imaging," Cell. 2014 October 23; 159(3): 635-646. doi:10.1016/j.cell.2014.09.039; 및 Huang, Y.-H. 등, 2017, "DNA epigenome editing using CRISPR-Cas SunTag-directed DNMT3A," Genome Biol 18: 176. doi:10.1186/s13059-017-1306-z에 기재된 바와 같고, 이의 내용은 각각 그 전문이 본원에 참조로 포함된다. 일 구현예에서, DNA 데아미나아제는 본원에 기재된 바와 같은 아데노신 데아미나아제 변이체(예를 들어, TadA*8)이다.
가이드 RNA를 갖는 핵산 프로그래밍 가능한 DNA 결합 단백질
염기 편집 및/또는 세포 내 염기 편집기 불활성화를 위한 조성물 및 방법이 본원에 제공된다. 본원에서 추가로 제공되는 것은, 가이드 다중핵산 서열, 예를 들어 가이드 RNA 서열, 또는 본원에 제공된 바와 같은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 이상의 가이드 RNA 서열의 조합을 포함하는 조성물이다. 일부 구현예에서, 본원에 제공된 염기 편집용 조성물은 염기 편집기, 예를 들어 염기 편집기를 코딩하는 폴리뉴클레오티드, 예를 들어 C-염기 편집기 또는 A-염기 편집기를 추가로 포함한다. 예를 들어, 염기 편집을 위한 조성물은 BE, BE4, ABE, 및 제공된 하나 이상의 가이드 RNA의 조합을 코딩하는 mRNA 서열을 포함할 수 있다. 일부 구현예에서, 염기 편집기를 코딩하는 폴리뉴클레오티드는 이종성 인트론을 포함한다. 염기 편집용 조성물은 염기 편집기 폴리펩티드 및 본원에 제공된 임의의 가이드 RNA 중 하나 이상의 조합을 포함할 수 있다. 이러한 조성물은 전기천공, 뉴클레오펙션, 바이러스 형질도입 또는 형질감염과 같은 다양한 전달 접근법을 통해 염기 편집을 수행하거나 세포 내 염기 편집기를 불활성화하는 데 사용될 수 있다. 일부 구현예에서, 염기 편집 및/또는 염기 편집기 불활성화를 위한 조성물은 염기 편집기를 코딩하는 mRNA 서열 및 전기천공을 위해 본원에 제공된 하나 이상의 가이드 RNA 서열의 조합을 포함한다. 일부 구현예에서, 염기 편집기를 코딩하는 mRNA 서열은 이종성 인트론을 포함한다.
본 개시내용의 일부 양태는 본원에 제공된 임의의 융합 단백질, 및 융합 단백질의 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인(예를 들어, Cas9(예를 들어, dCas9, 뉴클레아제 활성 Cas9, 또는 Cas9 니카아제) 또는 Cas12)에 결합된 가이드 RNA를 포함하는 복합체를 제공한다. 이러한 복합체는 리보뉴클레오단백질(RNP)이라고도 한다. 일부 구현예에서, 가이드 핵산(예를 들어, 가이드 RNA)은 15 내지 100 개의 뉴클레오티드 길이이며 표적 서열에 상보적인 적어도 10 개의 인접한 뉴클레오티드의 서열을 포함한다. 일부 구현예에서, 가이드 RNA는 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 개의 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 RNA는 표적 서열에 상보적인 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40 개의 인접한 뉴클레오티드의 서열을 포함한다. 일부 구현예에서, 표적 서열은 DNA 서열이다. 일부 구현예에서, 표적 서열은 RNA 서열이다. 일부 구현예에서, 표적 서열은 박테리아, 효모, 진균, 곤충, 식물 또는 동물의 게놈 내의 서열이다. 일부 구현예에서, 표적 서열은 인간의 게놈 내의 서열이다. 일부 구현예에서, 표적 서열의 3' 말단 단부는 표준 PAM 서열 (NGG)에 바로 인접한다. 일부 구현예들에서, 표적 서열의 3' 말단 단부는 비-표준 PAM 서열(예를 들어, 표 6 또는 5'-NAA-3'에 열거된 서열)에 바로 인접한다. 일부 구현예들에서, 가이드 핵산(예를 들어, 가이드 RNA)은 관심 유전자 (예를 들어 질환 또는 장애와 관련된 유전자) 서열에 상보적이다.
본 개시내용의 일부 양태는 본원에 제공된 융합 단백질 또는 복합체를 사용하는 방법을 제공한다. 예를 들어, 본 개시내용의 일부 양태는 DNA 분자를 본원에 제공된 임의의 융합 단백질, 및 적어도 하나의 가이드 RNA와 접촉시키는 단계를 포함하는 방법을 제공하며, 여기서 가이드 RNA는 약 15-100 개의 뉴클레오티드 길이이며 표적 서열에 상보적인 적어도 10 개의 인접한 뉴클레오티드의 서열을 포함한다. 일부 구현예에서, 표적 서열의 3' 말단 단부는 AGC, GAG, TTT, GTG, 또는 CAA 서열에 바로 인접한다. 일부 구현예에서, 표적 서열의 3' 말단 단부는 NGA, NGCG, NGN, NNGRRT, NNNRRT, NGCG, NGCN, NGTN, NGTN, NGTN, 또는 5'(TTTV) 서열에 바로 인접한다. 일부 구현예에서, 표적 서열의 3' 말단 단부는 예를 들어 TTN, DTTN, GTTN, ATTN, ATTC, DTTNT, WTTN, HATY, TTTN, TTTV, TTTC, TG, RTR, 또는 YTN PAM부위에 바로 인접한다.
각각의 서열에서 특이적 위치 및 잔기의 넘버링은 사용되는 특정 단백질 및 넘버링 방식에 따라 달라짐이 이해될 것이다. 넘버링은 예를 들어, 성숙 단백질의 전구체 및 성숙 단백질 자체에서 상이할 수 있고, 종 간의 서열 차이는 넘버링에 영향을 미칠 수 있다. 당업자는 당업계에 잘 알려진 방법, 예를 들어, 서열 정렬 및 상동성 잔기의 결정에 의해 임의의 상동성 단백질 및 각각의 암호화 핵산에서 각각의 잔기를 식별할 수 있을 것이다.
표적 부위, 예를 들어, 편집될 돌연변이를 포함하는 부위에 본원에 개시된 임의의 융합 단백질을 표적화하기 위해, 전형적으로 가이드 RNA와 함께 융합 단백질을 공발현하는 것이 필요함이 당업자에게 명백할 것이다. 본원의 다른 곳에서 보다 상세히 설명되는 바와 같이, 가이드 RNA는 전형적으로 napDNAbp(예를 들어, Cas9 또는 Cas12) 결합을 허용하는 tracrRNA 프레임워크, 및 napDNAbp:핵산 편집 효소/도메인 융합 단백질에 서열 특이성을 부여하는 가이드 서열을 포함한다. 대안적으로, 가이드 RNA 및 tracrRNA는 2 개의 핵산 분자로서 개별적으로 제공될 수 있다. 일부 구현예에서, 가이드 RNA는 구조를 포함하며, 여기서 가이드 서열은 표적 서열에 상보적인 서열을 포함한다. 가이드 서열은 전형적으로 20 개의 뉴클레오티드 길이이다. napDNAbp:핵산 편집 효소/도메인 융합 단백질을 특이적 게놈 표적 부위에 표적화하기 위한 적합한 가이드 RNA의 서열은 본 개시내용에 기초하여 당업자에게 명백할 것이다. 이러한 적합한 가이드 RNA 서열은 전형적으로 편집될 표적 뉴클레오티드의 상류 또는 하류에 있는 50 개의 뉴클레오티드 내에서 핵산 서열에 상보적인 가이드 서열을 포함한다. 임의의 제공된 융합 단백질을 특이적 표적 서열에 표적화하기에 적합한 일부 예시적인 가이드 RNA 서열이 본원에 제공된다.
sgRNA의 별개의 부분은 Cas9(예를 들어, SpyCas9) 및/또는 DNA 표적과 상호작용하는 다양한 특성을 형성할 것으로 예측된다. 6개의 보존된 모듈은 천연 crRNA:tracrRNA 듀플렉스 및 Cas9 엔도뉴클레아제 활성을 지시하는 단일 가이드 RNA(sgRNA) 내에서 식별되었다(Briner 등, Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell. 2014 Oct 23;56(2):333-339 참조). 6개의 모듈은 DNA 표적화를 담당하는 스페이서, 상부 스템, 벌지(bulge), CRISPR 반복부:tracrRNA 듀플렉스에 의해 형성된 하부 스템, 넥서스, 및 tracrRNA의 3' 말단 단부으로부터의 헤어핀을 포함한다. 상부 및 하부 스템은 주로 포스페이트 백본과의 서열-독립적 상호작용을 통해 Cas9와 상호작용한다. 일부 구현예에서, 상부 스템은 분배가능하다. 일부 구현예에서, 하부 스템의 염기에서의 보존된 우라실 뉴클레오티드 서열은 분배가능하다. 벌지는 Cas9의 Rec1 도메인과의 특이적 측쇄 상호작용에 참여한다. U44의 핵염기는 Tyr 325 및 His 328의 측쇄와 상호작용하는 반면, G43은 Tyr 329와 상호작용한다. 넥서스는 sgRNA:Cas9 상호작용의 핵심을 형성하고 sgRNA와 Cas9 및 표적 DNA 사이의 교차점에 있다. A51 및 A52의 핵염기는 Phe 1105의 측쇄와 상호작용하고; U56은 Arg 457 및 Asn 459와 상호작용하고; U59의 핵염기는 Arg 74, Asn 77, Pro 475, Leu 455, Phe 446, 및 Ile 448의 측쇄에 의해 정의된 소수성 포켓에 삽입되고; C60은 Leu 455, Ala 456, 및 Asn 459와 상호작용하고, C61은 Arg 70의 측쇄와 상호작용하고, 이는 이어서 C15와 상호작용한다. 일부 구현예에서, 이들 돌연변이 중 하나 이상은 sgRNA:Cas9 상호작용을 최적화하기 위해 Cas9(예를 들어, spyCas9)에 대한 sgRNA의 벌지 및/또는 넥서스에서 이루어진다.
또한, tracrRNA 넥서스 및 헤어핀은 Cas9 쌍형성에 중요하고, 상이한 Cas9 단백질을 분리하는 교차 직교성 장벽으로 교환될 수 있으며, 이는 직교 Cas9 단백질의 추가 용도에 중요하다. 일부 구현예에서, 넥서스 및 헤어핀은 표적 직교 Cas9 단백질로 교환된다. 일부 구현예에서, sgRNA는 보다 컴팩트하고 입체형태적으로 안정한 가이드 RNA를 설계하기 위해 상부 스템, 헤어핀 1, 및/또는 하부 스템의 서열 유연성이 분배된다. 일부 구현예에서, 모듈은 다양한 키메라 가이드를 갖는 단일 Cas9를 사용하여 또는 키메라 sgRNA의 상이한 조합을 갖는 직교 시스템을 동시에 사용하여 멀티플렉스 편집을 최적화하도록 변형된다. 가이드 기능 모듈 및 이의 방법에 관한 상세사항은, 예를 들어 Briner 등, Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell. 2014 Oct 23;56(2):333-339에 기재되어 있고, 이의 내용은 그 전문이 본원에 참조로 포함된다. 본원에 개시된 염기 편집기의 도메인은 임의의 순서로 배열될 수 있다. 예를 들어, 폴리뉴클레오티드-프로그래밍 가능한 뉴클레오티드-결합 도메인(예를 들어, Cas9 또는 Cas12) 및 데아미나아제 도메인(예를 들어, 사이티딘 또는 아데노신 데아미나아제)을 포함하는 융합 단백질을 포함하는 염기 편집기의 비제한적인 예는 다음과 같이 배열될 수 있다:
NH2-[핵염기 편집 도메인]-링커1-[핵염기 편집 도메인]-COOH;
NH2-[데아미나아제]-링커1-[핵염기 편집 도메인]-COOH;
NH2-[데아미나아제]-링커1-[핵염기 편집 도메인]-링커2-[UGI]-COOH;
NH2-[데아미나아제]-링커1-[핵염기 편집 도메인]-COOH;
NH2-[아데노신 데아미나아제]-링커1-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-COOH;
NH2-[데아미나아제]-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[데아미나아제]-[이노신 BER 억제제]-[핵염기 편집 도메인]-COOH;
NH2-[이노신 BER 억제제]-[데아미나아제]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-[이노신 BER 억제제]-COOH;
NH2-[핵염기 편집 도메인]-[이노신 BER 억제제]-[데아미나아제]-COOH;
NH2-[이노신 BER 억제제]-[핵염기 편집 도메인]-[데아미나아제]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[데아미나아제]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[데아미나아제]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-[핵염기 편집 도메인]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[데아미나아제]-링커2-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[핵염기 편집 도메인]-링커1-[데아미나아제]-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-링커2-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[핵염기 편집 도메인]-[데아미나아제]-[핵염기 편집 도메인]-[이노신 BER 억제제]-COOH;
NH2-[이노신 BER 억제제]-[핵염기 편집 도메인]-링커1-[데아미나아제]-링커2-[핵염기 편집 도메인]-COOH;
NH2-[이노신 BER 억제제]-[핵염기 편집 도메인]-링커1-[데아미나아제]-[핵염기 편집 도메인]-COOH;
NH2-[이노신 BER 억제제]-[핵염기 편집 도메인]-[데아미나아제]-링커2-[핵염기 편집 도메인]-COOH; 또는
NH2-[이노신 BER 억제제]NH2-[핵염기 편집 도메인]-[데아미나아제]-[핵염기 편집 도메인]-COOH.
일부 구현예에서, 본원에 제공되는 염기 편집 융합 단백질은 예를 들어, 표적 염기가 정의된 영역(예를 들어, "탈아미노화 윈도우") 내에 배치되는 정확한 위치에 위치할 필요가 있다. 일부 구현예에서, 표적은 4 개의 염기 영역 내에 있을 수 있다. 일부 구현예에서, 이러한 정의된 표적 영역은 PAM의 상류에 있는 대략 15 개의 염기일 수 있다. Komor, A.C., 등, "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., 등, "Programmable base editing of AㆍT to GㆍC in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); 및 Komor, A.C., 등, "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017)을 참조하며, 이의 전체 내용이 본원에 참조로 포함된다.
정의된 표적 영역은 탈아미노화 윈도우일 수 있다. 탈아미노화 윈도우는 염기 편집기가 표적 뉴클레오티드에 작용하고 탈아미노화하는 정의된 영역일 수 있다. 일부 구현예에서, 탈아미노화 윈도우는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 염기 영역 내에 있다. 일부 구현예에서, 탈아미노화 윈도우는 PAM의 상류에 있는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 개의 염기이다.
본 개시내용의 염기 편집기는 표적 폴리뉴클레오티드 서열의 편집을 용이하게 하는 임의의 도메인, 특성 또는 아미노산 서열을 포함할 수 있다. 예를 들어, 일부 구현예에서, 염기 편집기는 핵 국재화 서열(NLS)를 포함한다. 일부 구현예에서, 염기 편집기의 NLS는 데아미나아제 도메인과 napDNAbp 도메인 사이에 국재화되어 있다. 일부 구현예에서, 염기 편집기의 NLS는 napDNAbp 도메인에 대해 C-말단에 국재화된다.
융합 단백질에 포함될 수 있는 단백질 도메인의 비제한적인 예는 데아미나아제 도메인(예를 들어, 아데노신 데아미나아제 또는 사이티딘 데아미나아제), 우라실 글리코실라제 억제제(UGI) 도메인, 에피토프 태그, 리포터 유전자 서열, 및/또는 본원에 기재된 활성 중 하나 이상을 갖는 단백질 도메인을 포함할 수 있다.
도메인은 에피토프 태그, 리포터 단백질, 다른 결합 도메인으로 검출되거나 표지될 수 있다. 에피토프 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그, 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는 글루타티온-5-트랜스퍼라제(GST), 홀스래디쉬 퍼옥시다제(horseradish peroxidase, HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP), 및 청색 형광 단백질(BFP)을 포함한 자가형광 단백질을 포함하나 이에 제한되지 않는다. 추가적인 단백질 서열은 DNA 분자에 결합하거나 또는 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD) 융합, GAL4 DNA 결합 도메인 융합, 및 단순 포진 바이러스(HSV) BP16 단백질 융합을 포함하지만 이에 제한되지 않는 다른 세포 분자에 결합하는 아미노산 서열을 포함할 수 있다.
사이티딘 또는 아데노신 데아미나아제 및 Cas9 도메인을 포함하는 융합 단백질의 사용
본 개시내용의 일부 양태는 본원에 제공된 융합 단백질 또는 복합체를 사용하는 방법을 제공한다. 예를 들어, 본 개시내용의 일부 양태는 DNA 분자를 본원에 제공된 임의의 융합 단백질 및 본원에 기재된 적어도 하나의 가이드 RNA와 접촉시키는 단계를 포함하는 방법을 제공한다.
일부 구현예에서, 본 발명의 융합 단백질은 관심 표적 유전자 또는 폴리뉴클레오티드 서열을 편집하는데 사용된다. 특히, 본 명세서에 기술된 사이티딘 데아미나아제 또는 아데노신 데아미나아제 핵염기 편집기는 표적 서열 내에서 다중 돌연변이를 만들 수 있다. 이러한 돌연변이는 표적의 기능에 영향을 미칠 수 있다. 예를 들어, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 핵염기 편집기를 사용하여 조절 영역을 표적으로 하는 경우 조절 영역의 기능이 변경되고 하류 단백질의 발현이 감소되거나 제거된다. 또 다른 예에서, 사이티딘 데아미나아제 또는 아데노신 데아미나아제 핵염기 편집기를 사용하여 염기 편집기를 코딩하는 폴리뉴클레오티드 서열에 혼입된 이종성 인트론의 스플라이스 수용체 또는 스플라이스 공여체 부위를 표적화하는 경우, 인트론의 스플라이싱이 변경되고 염기 편집기의 발현 또는 활성이 줄어들거나 제거된다.
각 서열의 특정 위치 또는 잔기의 넘버링은 사용된 특정 단백질 및 넘버링 체계에 따라 달라지는 것으로 이해될 것이다. 넘버링은 성숙한 단백질의 전구체와 성숙한 단백질 자체에서 다를 수 있으며 종마다 서열의 차이가 넘버링에 영향을 줄 수 있다. 당업자는 당업계에 널리 공지된 방법, 예를 들어 서열 정렬 및 상동 잔기의 결정에 의해 임의의 상동성 단백질 및 각각의 코딩 핵산 내의 각각의 잔기를 확인할 수 있을 것이다.
본 명세서에 개시된 바와 같이 Cas9 도메인 및 사이티딘 또는 아데노신 데아미나아제를 포함하는 임의의 융합 단백질을 표적 부위, 예를 들어 돌연변이를 포함하는 부위에 표적화하는 것은 당업자에게 명백할 것이다. 편집된 경우 일반적으로 가이드 RNA(예: sgRNA)와 함께 융합 단백질을 공동 발현하는 것이 필요하다. 본원의 다른 곳에서 더 자세히 설명된 바와 같이, 가이드 RNA는 일반적으로 Cas9 결합을 허용하는 tracrRNA 프레임워크, 및 Cas9:핵산 편집 효소/도메인 융합 단백질에 서열 특이성을 부여하는 가이드 서열을 포함한다. 대안적으로, 가이드 RNA 및 tracrRNA는 2개의 핵산 분자로서 별도로 제공될 수 있다. 일부 구현예에서, 가이드 RNA는 구조를 포함하고, 여기서 가이드 서열은 표적 서열에 상보적인 서열을 포함한다. 가이드 서열의 길이는 일반적으로 20개 뉴클레오티드이다. Cas9:핵산 편집 효소/도메인 융합 단백질을 특정 게놈 표적 부위에 표적화하기 위한 적합한 가이드 RNA의 서열은 본 개시내용에 기초하여 당업자에게 명백할 것이다. 이러한 적합한 가이드 RNA 서열은 전형적으로 편집될 표적 뉴클레오티드의 상류 또는 하류 50개 뉴클레오티드 내의 핵산 서열에 상보적인 가이드 서열을 포함한다. 제공된 임의의 융합 단백질을 특정 표적 서열에 표적화하는데 적합한 일부 예시적인 가이드 RNA 서열이 본원에 제공된다.
염기 편집기 효율
일부 구현예에서, 본원에 제공된 방법의 목적은 유전자 편집을 통해 유전자 및/또는 유전자 생성물을 변경하는 것이다. 핵염기 편집 단백질은 in vitro 또는 in vivo에서 유전자 편집-기반 인간 치료제로 사용될 수 있다. 본원에 제공된 핵염기 편집 단백질, 예를 들어, 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예를 들어, Cas9) 및 핵염기 편집 도메인(예를 들어, 아데노신 데아미나아제 도메인 또는 사이티딘 데아미나아제 도메인)을 포함하는 융합 단백질은 A에서 G로의 또는 C에서 T로의 뉴클레오티드를 편집하기 위해 사용될 수 있다는 것이 당업자에 의해 이해될 것이다. 일부 구현예에서, 염기 편집기는 자기-불활성화 염기 편집기이며, 여기서 불활성화는 염기 편집기를 코딩하는 폴리뉴클레오티드에 존재하는 인트론을 편집함으로써 유도된다.
유리하게도, 본원에 제공된 바와 같은 염기 편집 시스템은, CRISPR가 할 수 있는 것처럼, 이중-가닥 DNA 절단을 생성하지 않고, 공여체 DNA 주형을 필요로 하지 않고, 그리고 과잉의 확률적 삽입 및 결실을 유도하지 않고, 게놈 편집을 제공한다. 일부 구현예에서, 본 개시내용은 유의한 수의 의도되지 않은 돌연변이, 예컨대 의도되지 않은 점 돌연변이를 생성하지 않으면서, 의도된 돌연변이, 예를 들어 핵산(예를 들어, 대상체의 게놈 내 핵산)내의 종결 코돈을 효율적으로 생성하는 염기 편집기를 제공한다. 일부 구현예에서, 의도된 돌연변이는 의도된 돌연변이를 생성하도록 특이적으로 설계된 가이드 폴리뉴클레오티드(예를 들어, gRNA)에 결합된 특이적 염기 편집기(예를 들어, 아데노신 염기 편집기 또는 사이티딘 염기 편집기)에 의해 생성되는 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 질환 또는 장애와 연관된 표적 항원과 연관된 유전자이다. 일부 구현예에서, 의도된 돌연변이는 질환 또는 장애와 연관된 표적 항원과 연관된 유전자에서 아데닌(A)에서 구아닌(G)으로의 점 돌연변이(예를 들어, SNP)이다. 일부 구현예에서, 의도된 돌연변이는 유전자의 코딩 영역 또는 비-코딩 영역(예를 들어, 조절 영역 또는 요소) 내의 아데닌 (A)에서 구아닌 (G)으로의 점 돌연변이이다.
일부 구현예에서, 의도된 돌연변이는 질병 또는 장애와 관련된 표적 항원과 관련된 유전자의 사이토신(C)에서 티민(T)으로의 점 돌연변이(예를 들어, SNP)이다. 일부 구현예에서, 의도된 돌연변이는 유전자의 코딩 영역 또는 비코딩 영역(예를 들어, 조절 영역 또는 요소) 내의 사이토신(C)에서 티민(T)으로의 점 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 종결 코돈, 예를 들어 유전자의 코딩 영역 내의 조기 종결 코돈을 생성하는 점 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 종결 코돈을 제거하는 돌연변이이다.
일부 구현예에서, 의도된 편집은 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 있다. 일부 구현예에서, 의도된 편집은 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위에 있다. 일부 구현예에서, 의도된 편집은 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 있는 아데닌(A)에서 구아닌(G)으로의 점 돌연변이(예를 들어, SNP)이다. 일부 구현예에서, 의도된 편집은 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위 내의 아데닌(A)에서 구아닌(G)으로의 점 돌연변이이다. 일부 구현예에서, 의도된 편집은 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 있는 사이토신(C)에서 티민(T)으로의 점 돌연변이(예: SNP)이다. 일부 구현예에서, 의도된 돌연변이는 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위 내의 사이토신(C)에서 티민(T)으로의 점 돌연변이이다.
본 발명의 염기 편집기는 유리하게는 유의한 비율의 인델을 생성하지 않으면서 단백질을 암호화하는 특이적 뉴클레오티드 염기를 변형시킨다. 본원에서 사용된 바와 같은 "인델"은 핵산 내의 뉴클레오티드 염기의 삽입 또는 결실을 지칭한다. 이러한 삽입 또는 결실은 유전자의 코딩 영역 내에서 프레임 시프트 돌연변이를 야기할 수 있다. 일부 구현예에서, 핵산 내에 많은 수의 삽입 또는 결실(즉, 인델)을 생성함이 없이, 핵산 내의 특이적 뉴클레오티드를 효율적으로 변형(예를 들어, 돌연변이)하는 염기 편집기를 생성하는 것이 바람직하다. 일부 구현예에서, 핵산 내에 많은 수의 삽입 또는 결실(즉, 인델)을 생성함이 없이, 핵산 내의 특이적 뉴클레오티드를 효율적으로 변형(예를 들어, 돌연변이 또는 메틸화)하는 염기 편집기를 생성하는 것이 바람직하다. 특정 구현예에서, 본원에 제공된 임의의 염기 편집기는 인델에 대해 의도된 변형(예를 들어, 메틸화)을 생성할 수 있다. 특정 구현예에서, 본원에 제공된 임의의 염기 편집기는 인델에 대해 더 큰 비율의 의도된 변형(예를 들어, 돌연변이)을 생성할 수 있다.
일부 구현예에서, 본원에 제공된 염기 편집기는 1:1 초과의 의도된 돌연변이 대 인델의 비율(즉, 의도된 점 돌연변이:의도되지 않은 점 돌연변이)를 생성할 수 있다. 일부 구현예에서, 본원에 제공된 염기 편집기는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 200:1, 적어도 300:1, 적어도 400:1, 적어도 500:1, 적어도 600:1, 적어도 700:1, 적어도 800:1, 적어도 900:1, 또는 적어도 1000:1 이상인 의도된 돌연변이 대 인델의 비율을 생성할 수 있다. 의도된 돌연변이 및 인델의 수는 임의의 적합한 방법을 사용하여 결정될 수 있다.
일부 구현예에서, 본원에 제공된 염기 편집기는 핵산의 영역에서 인델의 형성을 제한할 수 있다. 일부 구현예에서, 영역은 염기 편집기에 의해 표적화된 뉴클레오티드 또는 염기 편집기에 의해 표적화된 뉴클레오티드의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개 뉴클레오티드 내의 영역에 있다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 핵산 영역에서 인델의 형성을 1% 미만, 1.5% 미만, 2% 미만, 2.5% 미만, 3% 미만, 3.5% 미만, 4% 미만, 4.5% 미만, 5% 미만, 6% 미만, 7% 미만, 8% 미만, 9% 미만, 10% 미만, 12% 미만, 15% 미만, 또는 20% 미만으로 제한할 수 있다. 핵산 영역에서 형성된 인델의 수는 핵산(예를 들어, 세포의 게놈 내 핵산)이 염기 편집기에 노출된 시간의 양에 따라 달라질 수 있다. 일부 구현예에서, 인델의 임의의 수 또는 비율은 핵산(예를 들어, 세포의 게놈 내 핵산)을 염기 편집기에 노출시키고 적어도 1 시간, 적어도 2 시간, 적어도 6 시간, 적어도 12 시간, 적어도 24 시간, 적어도 36 시간, 적어도 48 시간, 적어도 3 일, 적어도 4 일, 적어도 5 일, 적어도 7 일, 적어도 10 일, 또는 적어도 14 일 후에 결정된다.
본 개시내용의 일부 양태는 본원에 제공된 임의의 염기 편집기가 상당한 수의 의도되지 않은 돌연변이를 생성하지 않고 핵산(예를 들어, 대상체의 게놈 내의 핵산)에서 의도된 돌연변이를 효율적으로 생성할 수 있다는 인식에 기초한다(예를 들어, 허위 오프-타겟 편집 또는 방관자 편집). 일부 구현예에서, 의도된 돌연변이는 의도된 돌연변이를 생성하도록 특이적으로 설계된, gRNA에 결합된 특이적 염기 편집기에 의해 생성되는 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 종결 코돈, 예를 들어 유전자의 코딩 영역 내의 조기 종결 코돈을 생성하는 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 종결 코돈을 제거하는 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 유전자의 스플라이싱을 변경하는 돌연변이이다. 일부 구현예에서, 의도된 돌연변이는 유전자(예를 들어, 유전자 프로모터 또는 유전자 억제자)의 조절 서열을 변경시키는 돌연변이이다.
일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 1:1 초과의 의도된 돌연변이 대 의도되지 않은 돌연변이의 비율(예를 들어, 의도된 돌연변이: 의도되지 않은 돌연변이)를 생성할 수 있다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 150:1, 적어도 200:1, 적어도 250:1, 적어도 500:1, 또는 적어도 1000:1 이상인 의도된 돌연변이 대 의도되지 않은 돌연변이의 비율을 생성할 수 있다. 본원에 기재된 염기 편집기의 특징은 임의의 융합 단백질, 또는 본원에 제공된 융합 단백질을 사용하는 방법에 적용될 수 있다는 것이 이해되어야 한다.
염기 편집은 종종 유전 변형, 유전자 변형 및 핵산 서열의 변형과 같은 "변형"으로 지칭되며, 변형은 염기 편집 변형이라는 문맥에 기초하여 명백하게 이해될 수 있다. 따라서, 염기 편집 변형은 예를 들어, 본 개시내용 전반에 걸쳐 논의된 데아미나아제 활성의 결과로서 뉴클레오티드 염기 수준에서의 변형이며, 이는 이어서 유전자 서열의 변화를 초래하고, 유전자 생성물에 영향을 미칠 수 있다. 따라서, 본질적으로, 본원에 기재된 유전자 편집 변형은 구조적으로 및/또는 기능적으로 유전자의 변형을 초래할 수 있으며, 여기서 유전자 생성물의 발현은 변형될 수 있고, 예를 들어, 유전자의 발현은 녹아웃되거나; 또는 반대로, 향상되거나, 또는 일부 상황에서는, 유전자 기능 또는 활성이 변형될 수 있다. 본원에 개시된 방법을 사용하여, 염기 편집 효율은 염기 편집이 수행되는 유전자의 녹다운 효율로서 결정될 수 있으며, 여기서 염기 편집은 유전자의 발현을 녹다운하도록 의도된다. 녹다운 수준은 임의의 검출 검정, 예컨대 단백질 발현 수준에 대한 검정, 예를 들어 유세포 분석; RNA 발현을 검출하기 위한 검정, 예컨대 정량적 RT-PCR, 노던 블롯 분석, 또는 임의의 다른 적합한 검정, 예컨대 파이로시퀀싱에 의해 발현 수준을 결정함으로써 정량적으로 검증될 수 있고; 뉴클레오티드 시퀀싱 반응에 의해 질적으로 검증될 수 있다.
일부 구현예에서, 변형, 예를 들어 단일 염기 편집은 유전자 표적 발현의 적어도 10% 감소를 초래한다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화 발현의 적어도 10% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적 발현의 적어도 20% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적화 발현의 적어도 30% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적 발현의 적어도 40% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 유전자 표적 발현의 적어도 50% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 60% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 70% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 80% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 90% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 91% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 92% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 93% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 94% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 95% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 96% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 97% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 98% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적 유전자 발현의 적어도 99% 감소를 초래할 수 있다. 일부 구현예에서, 염기 편집 효율은 표적화되는 유전자의 녹아웃(유전자 발현의 100% 녹다운)을 초래할 수 있다.
일부 구현예에서, 본원에 제공된 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 50% 미만, 40% 미만, 30% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.9% 미만, 0.8% 미만, 0.7% 미만, 0.6% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 0.2% 미만, 0.1% 미만, 0.09% 미만, 0.08% 미만, 0.07% 미만, 0.06% 미만, 0.05% 미만, 0.04% 미만, 0.03% 미만, 0.02% 미만, 또는 0.01% 미만의 인델 형성을 초래한다.
일부 구현예에서, 표적화된 변형, 예를 들어 단일 염기 편집은 상이한 가이드 RNA를 사용한 염기 편집을 위해 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 상이한 내인성 서열을 동시에 표적화하는데 사용된다. 일부 구현예에서, 표적화된 변형, 예를 들어 단일 염기 편집은 상이한 가이드 RNA를 사용한 염기 편집을 위해 적어도 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 50개 이상의 상이한 내인성 유전자 서열을 순차적으로 표적화하는데 사용된다.
본 개시내용의 일부 양태는 본원에 제공된 임의의 염기 편집기가 유의한 수의 의도되지 않은 돌연변이, 예컨대 의도되지 않은 점 돌연변이(즉, 방관자의 돌연변이)를 생성하지 않고 핵산(예를 들어, 대상체의 게놈 내 핵산)에서 점 돌연변이와 같은 의도된 돌연변이를 효율적으로 생성할 수 있다는 인식에 기초한다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 적어도 0.01%의 의도된 돌연변이(즉, 적어도 0.01% 염기 편집 효율)를 생성할 수 있다. 일부 구현예에서, 본원에 제공된 임의의 염기 편집기는 의도된 돌연변이의 적어도 0.01%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 99%를 생성할 수 있다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 50% 미만, 40% 미만, 30% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.9% 미만, 0.8% 미만, 0.7% 미만, 0.6% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 0.2% 미만, 0.1% 미만, 0.09% 미만, 0.08% 미만, 0.07% 미만, 0.06% 미만, 0.05% 미만, 0.04% 미만, 0.03% 미만, 0.02% 미만, 또는 0.01% 미만의 인델 형성을 초래한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 0.8% 미만의 인델 형성을 초래한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 최대 0.8% 인델 형성을 초래한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 0.3% 미만의 인델 형성을 초래한다. 일부 구현예에서, 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 염기 편집기 시스템에 비해 표적 폴리뉴클레오티드 서열에서 더 낮은 인델 형성을 초래한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 표적 폴리뉴클레오티드 서열에서 더 낮은 인델 형성을 초래한다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 염기 편집기 시스템과 비교하여 인델 빈도가 감소한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 염기 편집기 시스템과 비교하여 인델 빈도가 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 감소한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 염기 편집기 시스템은 ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 인델 빈도가 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 감소한다.
본 발명은 효율 및 특이성이 증가된 아데노신 데아미나아제 변이체(예를 들어, ABE8 변이체)를 제공한다. 특히, 본원에 기재된 아데노신 데아미나아제 변이체는 폴리뉴클레오티드 내에서 원하는 염기를 편집할 가능성이 높고, 변경되도록 의도되지 않은 염기(예를 들어, "방관자")를 편집할 가능성이 적다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 방관자 편집 또는 돌연변이가 감소된다. 일부 구현예에서, 의도되지 않은 편집 또는 돌연변이는 방관자 돌연변이 또는 방관자 편집, 예를 들어, 표적 뉴클레오티드 서열의 표적 창에서 의도되지 않은 또는 비-표적 위치의 표적 염기(예를 들어, A 또는 C)의 염기 편집이다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 방관자 편집 또는 돌연변이가 감소된다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 방관자 편집 또는 돌연변이가 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%까지 감소된다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 방관자 편집 또는 돌연변이가 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 또는 적어도 3.0 배까지 감소된다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 허위 편집이 감소된다. 일부 구현예에서, 의도되지 않은 편집 또는 돌연변이는 허위 돌연변이 또는 허위 편집, 예를 들어, 게놈의 의도되지 않은 또는 비-표적 영역에서 표적 염기(예를 들어, A 또는 C)의 비-특이적 편집 또는 가이드 독립적 편집이다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템에 비해 허위 편집이 감소된다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 허위 편집이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%까지 감소된다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집 시스템은 ABE7 염기 편집기, 예를 들어, ABE7.10을 포함하는 염기 편집기 시스템과 비교하여 허위 편집이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 또는 적어도 3.0 배까지 감소된다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 염기 편집 효율을 갖는다. 일부 구현예에서, 염기 편집 효율은 세포의 집단에서 편집된 핵염기의 백분율을 계산함으로서 측정될 수 있다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 세포의 집단에서 편집된 핵염기에 의해 측정된 바와 같이 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 염기 편집 효율을 갖는다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기와 비교하여 염기 편집 효율이 더 높다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기, 예를 들어, ABE7.10과 비교하여 염기 편집 효율이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 100%, 적어도 105%, 적어도 110%, 적어도 115%, 적어도 120%, 적어도 125%, 적어도 130%, 적어도 135%, 적어도 140%, 적어도 145%, 적어도 150%, 적어도 155%, 적어도 160%, 적어도 165%, 적어도 170%, 적어도 175%, 적어도 180%, 적어도 185%, 적어도 190%, 적어도 195%, 적어도 200%, 적어도 210%, 적어도 220%, 적어도 230%, 적어도 240%, 적어도 250%, 적어도 260%, 적어도 270%, 적어도 280%, 적어도 290%, 적어도 300%, 적어도 310%, 적어도 320%, 적어도 330%, 적어도 340%, 적어도 350%, 적어도 360%, 적어도 370%, 적어도 380%, 적어도 390%, 적어도 400%, 적어도 450%, 또는 적어도 500% 더 높다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기, 예를 들어, ABE7.10과 비교하여 염기 편집 효율이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 3.1 배, 적어도 3.2, 적어도 3.3 배, 적어도 3.4 배, 적어도 3.5 배, 적어도 3.6 배, 적어도 3.7 배, 적어도 3.8 배, 적어도 3.9 배, 적어도 4.0 배, 적어도 4.1 배, 적어도 4.2 배, 적어도 4.3 배, 적어도 4.4 배, 적어도 4.5 배, 적어도 4.6 배, 적어도 4.7 배, 적어도 4.8 배, 적어도 4.9 배, 또는 적어도 5.0 배 더 높다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 온-타겟 염기 편집 효율을 갖는다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 세포의 집단에서 편집된 표적 핵염기에 의해 측정된 바와 같이 적어도 0.01%, 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 온-타겟 염기 편집 효율을 갖는다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기와 비교하여 온-타겟 염기 편집 효율이 더 높다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기, 예를 들어, ABE7.10과 비교하여 온-타겟 염기 편집 효율이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 100%, 적어도 105%, 적어도 110%, 적어도 115%, 적어도 120%, 적어도 125%, 적어도 130%, 적어도 135%, 적어도 140%, 적어도 145%, 적어도 150%, 적어도 155%, 적어도 160%, 적어도 165%, 적어도 170%, 적어도 175%, 적어도 180%, 적어도 185%, 적어도 190%, 적어도 195%, 적어도 200%, 적어도 210%, 적어도 220%, 적어도 230%, 적어도 240%, 적어도 250%, 적어도 260%, 적어도 270%, 적어도 280%, 적어도 290%, 적어도 300%, 적어도 310%, 적어도 320%, 적어도 330%, 적어도 340%, 적어도 350%, 적어도 360%, 적어도 370%, 적어도 380%, 적어도 390%, 적어도 400%, 적어도 450%, 또는 적어도 500% 더 높다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 ABE7 염기 편집기, 예를 들어, ABE7.10과 비교하여 온-타겟 염기 편집 효율이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 3.1 배, 적어도 3.2 배, 적어도 3.3 배, 적어도 3.4 배, 적어도 3.5 배, 적어도 3.6 배, 적어도 3.7 배, 적어도 3.8 배, 적어도 3.9 배, 적어도 4.0 배, 적어도 4.1 배, 적어도 4.2 배, 적어도 4.3 배, 적어도 4.4 배, 적어도 4.5 배, 적어도 4.6 배, 적어도 4.7 배, 적어도 4.8 배, 적어도 4.9 배, 또는 적어도 5.0 배 더 높다.
본원에 기재된 ABE 염기 편집기 변이체는 플라스미드, 벡터, LNP 복합체, 또는 mRNA를 통해 호스트 세포로 전달될 수 있다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 mRNA로서 호스트 세포로 전달된다. 일부 구현예에서, 핵산 기반 전달 시스템, 예를 들어, mRNA를 통해 전달된 ABE8 염기 편집기는 편집된 핵염기에 의해 측정된 바와 같이 적어도 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 온-타겟 편집 효율을 갖는다. 일부 구현예에서, mRNA 시스템에 의해 전달된 ABE8 염기 편집기는 플라스미드 또는 벡터 시스템에 의해 전달된 ABE8 염기 편집기와 비교하여 염기 편집 효율이 더 높다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 100%, 적어도 105%, 적어도 110%, 적어도 115%, 적어도 120%, 적어도 125%, 적어도 130%, 적어도 135%, 적어도 140%, 적어도 145%, 적어도 150%, 적어도 155%, 적어도 160%, 적어도 165%, 적어도 170%, 적어도 175%, 적어도 180%, 적어도 185%, 적어도 190%, 적어도 195%, 적어도 200%, 적어도 210%, 적어도 220%, 적어도 230%, 적어도 240%, 적어도 250%, 적어도 260%, 적어도 270%, 적어도 280%, 적어도 290%, 적어도 300% 이상, 적어도 310%, 적어도 320%, 적어도 330%, 적어도 340%, 적어도 350%, 적어도 360%, 적어도 370%, 적어도 380%, 적어도 390%, 적어도 400%, 적어도 450%, 또는 적어도 500% 온-타겟 편집 효율을 갖는다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 3.1 배, 적어도 3.2 배, 적어도 3.3 배, 적어도 3.4 배, 적어도 3.5 배, 적어도 3.6 배, 적어도 3.7 배, 적어도 3.8 배, 적어도 3.9 배, 적어도 4.0 배, 적어도 4.1 배, 적어도 4.2 배, 적어도 4.3 배, 적어도 4.4 배, 적어도 4.5 배, 적어도 4.6 배, 적어도 4.7 배, 적어도 4.8 배, 적어도 4.9 배, 또는 적어도 5.0 배 더 높은 온-타겟 편집 효율을 갖는다.
일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 임의의 염기 편집기 시스템은 표적 폴리뉴클레오티드 서열에서 50% 미만, 40% 미만, 30% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.9% 미만, 0.8% 미만, 0.7% 미만, 0.6% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 0.2% 미만, 0.1% 미만, 0.09% 미만, 0.08% 미만, 0.07% 미만, 0.06% 미만, 0.05% 미만, 0.04% 미만, 0.03% 미만, 0.02% 미만, 또는 0.01% 미만의 오프-타겟 편집을 초래한다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드된 오프-타겟 편집 효율이 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드된 오프-타겟 편집 효율이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드된 편집의 효율이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 또는 적어도 3.0 배 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드된 오프-타겟 편집 효율이 적어도 약 2.2 배 감소한다.
일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드-독립적 오프-타겟 편집 효율이 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드-독립적 오프-타겟 편집 효율이 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 더 낮다. 일부 구현예에서, 본원에 기재된 임의의 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드-독립적 오프-타겟 편집 효율이 적어도 1.1 배, 적어도 1.2 배, 적어도 1.3 배, 적어도 1.4 배, 적어도 1.5 배, 적어도 1.6 배, 적어도 1.7 배, 적어도 1.8 배, 적어도 1.9 배, 적어도 2.0 배, 적어도 2.1 배, 적어도 2.2 배, 적어도 2.3 배, 적어도 2.4 배, 적어도 2.5 배, 적어도 2.6 배, 적어도 2.7 배, 적어도 2.8 배, 적어도 2.9 배, 적어도 3.0 배, 적어도 5.0 배, 적어도 10.0 배, 적어도 20.0 배, 적어도 50.0 배, 적어도 70.0 배, 적어도 100.0 배, 적어도 120.0 배, 적어도 130.0 배, 또는 적어도 150.0 배 더 낮다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체는 플라스미드 또는 벡터 시스템에 의해 전달될 때와 비교하여 mRNA 시스템에 의해 전달될 때 가이드-독립적 오프-타겟 편집 효율(예를 들어, 허위 RNA 탈아미노화)이 134.0 배 감소한다. 일부 구현예에서, 본원에 기재된 ABE 염기 편집기 변이체는 게놈에 걸쳐 가이드-독립적 돌연변이율을 증가시키지 않는다.
일부 구현예에서, 단일 유전자 전달 이벤트(예를 들어, 형질도입, 형질감염, 전기천공 또는 임의의 다른 방법에 의함)는 세포의 게놈 내의 5개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 6개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 7개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 전기천공 이벤트는 세포의 게놈 내의 8개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 9개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 10개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 20개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 30개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 40개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다. 일부 구현예에서, 단일 유전자 전달 이벤트는 세포의 게놈 내의 50개의 서열의 염기 편집을 표적화하는 데 사용될 수 있다.
일부 구현예에서, 본원에 기재된 방법, 예를 들어, 염기 편집 방법은 오프-타겟 효과가 최소 내지 전혀 없다.
일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 50%의 성공적으로 편집된 세포 집단(즉, 성공적으로 조작된 세포)을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 55%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 60%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 65%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 70%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 75%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 80%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 85%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 90%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 적어도 95%의 성공적으로 편집된 세포 집단을 초래한다. 일부 구현예에서, 본원에 기재된 염기 편집 방법은 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 성공적으로 편집된 세포 집단을 초래한다.
일부 구현예에서, 염기 편집 개입 후의 살아있는 세포 회수율은 염기 편집 이벤트 시에 출발 세포 집단의 적어도 60%, 70%, 80%, 90%보다 더 크다. 일부 구현예에서, 상기 기재된 바와 같은 살아있는 세포 회수율은 약 70%이다. 일부 구현예에서, 상기 기재된 바와 같은 살아있는 세포 회수율은 약 75%이다. 일부 구현예에서, 상기 기재된 바와 같은 살아있는 세포 회수율은 약 80%이다. 일부 구현예에서, 상기 기재된 바와 같은 살아있는 세포 회수율은 약 85%이다. 일부 구현예에서, 상기 기재된 바와 같은 살아있는 세포 회수율은 염기 편집 이벤트 시에 집단 내의 세포의 약 90%, 또는 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 또는 100%이다.
일부 구현예에서, 조작된 세포 집단은 시험관내에서 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 15배, 약 20배, 약 25배, 약 30배, 약 35배, 약 40배, 약 45배, 약 50배 또는 약 100배 추가로 확장될 수 있다.
의도된 돌연변이 및 인델의 수는 예를 들어, 국제 PCT 출원 번호 PCT/2017/045381(WO2018/027078) 및 PCT/US2016/058344(WO2017/070632); Komor, A.C., 등, "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., 등, "Programmable base editing of AㆍT to GㆍC in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); 및 Komor, A.C., 등, "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017)에 기재된 바와 같이, 임의의 적합한 방법을 사용하여 결정될 수 있으며; 상기 문헌의 전체 내용이 본원에 참조로 포함된다.
일부 구현예에서, 인델 빈도를 계산하기 위해, 인델이 발생할 수 있는 창의 양쪽 측면을 플랭킹하는 2 개의 10-bp 서열에 대한 정확한 일치에 대해 서열분석 판독물이 스캐닝된다. 정확한 일치가 위치하지 않는 경우, 판독물은 분석에서 제외된다. 이 인델 윈도우의 길이가 참조 서열과 정확히 일치하는 경우 판독물은 인델을 함유하지 않는 것으로 분류된다. 인델 윈도우가 참조 서열 보다 더 길거나 또는 더 짧은 2 개 이상의 염기인 경우, 서열분석 판독물은 각각 삽입 또는 결실로 분류된다. 일부 구현예에서, 본원에 제공된 염기 편집기는 핵산 영역에서 인델의 형성을 제한할 수 있다. 일부 구현예에서, 영역은 염기 편집기에 의해 표적화된 뉴클레오티드 또는 염기 편집기에 의해 표적화된 뉴클레오티드의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 뉴클레오티드 내의 영역에 있다.
표적 뉴클레오티드 영역에서 형성된 인델의 수는 핵산(예를 들어, 세포의 게놈 내 핵산)이 염기 편집기에 노출된 시간의 양에 따라 달라질 수 있다. 일부 구현예에서, 인델의 수 또는 비율은 표적 뉴클레오티드 서열(예를 들어, 세포의 게놈 내 핵산)을 염기 편집기에 노출시키고 적어도 1시간, 적어도 2시간, 적어도 6시간, 적어도 12시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 7일, 적어도 10일, 또는 적어도 14일 후에 결정된다. 본원에 기재된 바와 같은 염기 편집기의 특징은 임의의 융합 단백질, 또는 본원에 제공된 융합 단백질의 사용 방법에 적용될 수 있음이 이해되어야 한다.
염기 편집기 효율에 대한 상세한 설명은 국제 PCT 출원 번호 PCT/2017/045381 (WO 2018/027078) 및 PCT/US2016/058344 (WO 2017/070632)에 기재되어 있으며, 이의 각각은 그 전문이 본원에 참조로 포함된다. 또한, Komor, A.C., 등, "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016); Gaudelli, N.M., 등, "Programmable base editing of AㆍT to GㆍC in genomic DNA without DNA cleavage" Nature 551, 464-471 (2017); 및 Komor, A.C., 등, "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity" Science Advances 3:eaao4774 (2017)을 참조한다. 일부 구현예에 있어서, 본원에 제공된 방법을 사용하여 하나 이상의 유전자에서 복수의 핵염기 쌍을 편집하는 것은 적어도 하나의 의도된 돌연변이의 형성을 초래한다. 일부 구현예에서, 상기 적어도 하나의 의도된 돌연변이의 상기 형성은 유전자의 정상 기능 파괴를 초래한다. 일부 구현예에서, 상기 적어도 하나의 의도된 돌연변이 결과의 상기 형성은 유전자에 의해 암호화되는 단백질의 발현을 감소시키거나 제거한다. 멀티플렉스 편집은 본원에 제공된 임의의 방법 또는 방법의 조합을 사용하여 달성될 수 있다는 것이 이해되어야 한다.
멀티플렉스 편집
일부 구현예에서, 본원에 제공된 염기 편집기 시스템은 하나 이상의 유전자 또는 폴리뉴클레오티드 서열에서 복수의 핵염기 쌍을 멀티플렉스 편집할 수 있다. 일부 구현예에서, 복수의 핵염기 쌍은 동일한 유전자 또는 하나 이상의 유전자에 위치하며, 여기서 적어도 하나의 유전자는 상이한 유전자좌에 위치한다. 일부 구현예에서, 멀티플렉스 편집은 하나 이상의 가이드 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 멀티플렉스 편집은 하나 이상의 염기 편집기 시스템을 포함할 수 있다. 일부 구현예에서, 멀티플렉스 편집은 단일 가이드 폴리뉴클레오티드 또는 복수의 가이드 폴리뉴클레오티드가 있는 하나 이상의 염기 편집기 시스템을 포함할 수 있다. 일부 구현예에서, 멀티플렉스 편집은 단일 염기 편집기 시스템이 있는 하나 이상의 가이드 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 멀티플렉스 편집은 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하거나 또는 필요로 하지 않는 적어도 하나의 가이드 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 멀티플렉스 편집은 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하지 않는 적어도 하나의 가이드 폴리뉴클레오티드 및 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하는 적어도 하나의 가이드 폴리뉴클레오티드의 믹스를 포함할 수 있다. 본원에 기재된 바와 같은 임의의 염기 편집기를 사용한 멀티플렉스 편집의 특징은 본원에 제공된 임의의 염기 편집기를 사용하는 방법의 임의의 조합에 적용될 수 있음이 이해되어야 한다. 또한 본원에 기재된 바와 같은 임의의 염기 편집기를 사용한 멀티플렉스 편집은 복수의 핵염기 쌍의 순차적 편집을 포함할 수 있음이 이해되어야 한다.
일부 구현예에서, 복수의 핵염기 쌍은 하나 이상의 유전자에 있다. 일부 구현예에서, 복수의 핵염기 쌍은 동일한 유전자에 있다. 일부 구현예에서, 하나 초과의 유전자 중 적어도 하나의 유전자는 상이한 유전자좌에 위치한다.
일부 구현예에서, 편집은 적어도 하나의 단백질 코딩 영역에서 복수의 핵염기 쌍의 편집이다. 일부 구현예에서, 편집은 적어도 하나의 단백질 비-코딩 영역에서 복수의 핵염기 쌍의 편집이다. 일부 구현예에서, 편집은 적어도 하나의 단백질 코딩 영역 및 적어도 하나의 단백질 비-코딩 영역에서 복수의 핵염기 쌍의 편집이다.
일부 구현예에서, 편집은 최소 하나의 단백질 코딩 영역, 적어도 하나의 단백질 비코딩 영역, 또는 적어도 하나의 단백질 코딩 영역 및 적어도 하나의 단백질 비코딩 영역에서 복수의 핵염기 쌍을 편집하는 것이다.
일부 구현예에서, 편집은 하나 이상의 가이드 폴리뉴클레오티드와 함께 이루어진다. 일부 구현예에서, 염기 편집기 시스템은 하나 이상의 염기 편집기 시스템을 포함할 수 있다. 일부 구현예에서, 염기 편집기 시스템은 단일 가이드 폴리뉴클레오티드 또는 복수의 가이드 폴리뉴클레오티드와 함께 하나 이상의 염기 편집기 시스템을 포함할 수 있다. 일부 구현예에서, 편집은 단일 염기 편집기 시스템이 있는 하나 이상의 가이드 폴리뉴클레오티드와 함께 이루어진다. 일부 구현예에서, 편집은 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하지 않는 적어도 하나의 가이드 폴리뉴클레오티드 또는 PAM 서열을 필요로 하는 적어도 하나의 가이드 폴리뉴클레오티드와 함께 이루어지거나, 또는 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하지 않는 적어도 하나의 가이드 폴리뉴클레오티드 및 표적 폴리뉴클레오티드 서열에 대한 결합을 표적화하기 위해 PAM 서열을 필요로 하는 적어도 하나의 가이드 폴리뉴클레오티드의 믹스와 함께 이루어진다. 본원에 기재된 바와 같은 임의의 염기 편집기를 사용한 멀티플렉스 편집의 특징은 본원에 제공된 임의의 염기 편집기를 사용하는 방법의 임의의 조합에 적용될 수 있음이 이해되어야 한다. 또한 편집은 복수의 핵염기 쌍의 순차적 편집을 포함할 수 있음이 이해되어야 한다.
일부 구현예에 있어서, 하나 이상의 유전자 내의 복수의 핵염기 쌍의 멀티플렉스 편집이 가능한 염기 편집기 시스템은 ABE7, ABE8, 및/또는 ABE9 염기 편집기 중 하나를 포함한다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 멀티플렉스 편집이 가능한 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 멀티플렉스 편집이 가능한 염기 편집기 시스템에 비해 더 높은 멀티플렉스 편집 효율을 갖는다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 멀티플렉스 편집이 가능한 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 멀티플렉스 편집이 가능한 염기 편집기 시스템과 비교하여 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 100%, 적어도 105%, 적어도 110%, 적어도 115%, 적어도 120%, 적어도 125%, 적어도 130%, 적어도 135%, 적어도 140%, 적어도 145%, 적어도 150%, 적어도 155%, 적어도 160%, 적어도 165%, 적어도 170%, 적어도 175%, 적어도 180%, 적어도 185%, 적어도 190%, 적어도 195%, 적어도 200%, 적어도 210%, 적어도 220%, 적어도 230%, 적어도 240%, 적어도 250%, 적어도 260%, 적어도 270%, 적어도 280%, 적어도 290%, 적어도 300% 더 높은, 적어도 310%, 적어도 320%, 적어도 330%, 적어도 340%, 적어도 350%, 적어도 360%, 적어도 370%, 적어도 380%, 적어도 390%, 적어도 400%, 적어도 450%, 또는 적어도 500% 더 높은 멀티플렉스 편집의 효율을 갖는다. 일부 구현예에서, 본원에 기재된 ABE8 염기 편집기 변이체 중 하나를 포함하는 멀티플렉스 편집이 가능한 염기 편집기 시스템은 ABE7 염기 편집기 중 하나를 포함하는 멀티플렉스 편집이 가능한 염기 편집기 시스템과 비교하여 적어도 1.1배, 적어도 1.2배, 적어도 1.3배, 적어도 1.4배, 적어도 1.5배, 적어도 1.6배, 적어도 1.7배, 적어도 1.8배, 적어도 1.9배, 적어도 2.0배, 적어도 2.1배, 적어도 2.2배, 적어도 2.3배, 적어도 2.4배, 적어도 2.5배, 적어도 2.6배, 적어도 2.7배, 적어도 2.8배, 적어도 2.9배, 적어도 3.0배, 적어도 3.1배, 적어도 3.2배, 적어도 3.3배, 적어도 3.4배, 적어도 3.5배, 적어도 4.0배, 적어도 4.5배, 적어도 5.0배, 적어도 5.5배, 또는 적어도 6.0배 더 높은 멀티플렉스 편집 효율을 갖는다.
전달 시스템
폴리뉴클레오티드 서열(예를 들어, 유전자 또는 인트론)에서 하나 이상의 뉴클레오티드를 표적화하는 핵염기 편집기의 적합성은 본원에 기술된 바와 같이 평가된다. 일 구현예에서, 관심 단일 세포는 리포터(예를 들어, GFP)를 코딩하는 소량의 벡터와 함께 본원에 기술된 염기 편집 시스템을 코딩하는 핵산 분자 또는 분자들로 형질감염, 형질도입 또는 달리 변형된다. 이들 세포는 당업계에 공지된 임의의 세포주(예를 들어, HEK293T 세포)일 수 있다. 대안적으로, 일차 세포(예를 들어, 인간)가 사용될 수 있다. 세포는 조직 생검, 수술, 혈액, 혈장, 혈청 또는 기타 생물학적 체액 등을 통해 피험자 또는 개인으로부터 얻을 수도 있다. 그러한 세포는 최종 세포 표적과 관련될 수 있다.
전달은 바이러스 벡터를 사용하여 수행될 수 있다. 일 구현예에서, 형질감염은 지질 형질감염(예를 들어, 리포펙타민(Lipofectamine) 또는 퓨진(Fugene))을 사용하거나 전기천공에 의해 수행될 수 있다. 형질감염 후 리포터(예: GFP)의 발현은 형광 현미경이나 유세포 분석을 통해 결정되어 일관되고 높은 수준의 형질감염을 확인할 수 있다. 이러한 예비 형질감염은 다양한 핵염기 편집기로 구성되어 어떤 편집기 조합이 가장 큰 활성을 제공하는지 결정할 수 있다. 시스템은 하나 이상의 서로 다른 벡터를 포함할 수 있다. 일 구현예에서, 염기 편집기는 원하는 세포 유형, 우선적으로 진핵 세포, 바람직하게는 포유동물 세포 또는 인간 세포의 발현을 위해 코돈 최적화된다.
핵염기 편집기의 활성은 본원에 기술된 바와 같이, 즉 표적 서열의 변경을 검출하기 위해 세포의 게놈을 서열분석함으로써 평가된다. Sanger 시퀀싱의 경우 정제된 PCR 앰플리콘은 플라스미드 백본에 클로닝되고, 변형되고, 미니프렙되고 단일 프라이머로 시퀀싱된다. 서열분석은 차세대 서열분석(NGS) 기술을 사용하여 수행될 수도 있다. 차세대 시퀀싱을 사용하는 경우 앰플리콘은 의도된 절단 부위가 비대칭으로 배치된 300-500bp일 수 있다. PCR 후에는 처리량이 많은 시퀀싱(예: Illumina MiSeq에서)에 사용하기 위해 차세대 시퀀싱 어댑터 및 바코드(예: Illumina 멀티플렉스 어댑터 및 인덱스)를 앰플리콘 끝에 추가할 수 있다. 초기 테스트에서 가장 높은 수준의 표적 특이적 변경을 유도하는 융합 단백질을 선택하여 추가 평가를 수행할 수 있다.
특정 구현예에서, 핵염기 편집기는 관심 폴리뉴클레오티드를 표적화하는 데 사용된다. 일 구현예에서, 본 발명의 핵염기 편집기는 세포의 게놈 내에서 하나 이상의 관심 핵산 서열을 표적화하여 표적 유전자(들)를 변경시키는 데 사용되는 하나 이상의 가이드 RNA와 함께 세포에 전달된다. 일부 구현예에서, 염기 편집기는 하나 이상의 관심 유전자의 서열에 하나 이상의 편집물을 도입하기 위해 하나 이상의 가이드 RNA에 의해 표적화된다. 일부 구현예에서, 하나 이상의 관심 유전자의 서열에 대한 하나 이상의 편집은 호스트 세포에서 유전자에 의해 코딩된 단백질의 발현을 감소시키거나 제거한다. 일부 구현예에서, 하나 이상의 관심 유전자에 의해 코딩되는 하나 이상의 단백질의 발현은 호스트 세포에서 완전히 녹아웃되거나 제거된다.
일부 구현예에서, 본 발명의 핵염기 편집기 또는 핵염기 편집기를 코딩하는 폴리뉴클레오티드는 염기 편집기를 코딩하는 폴리뉴클레오티드 서열 내의 이종성 인트론을 표적화하는 하나 이상의 가이드 RNA와 함께 세포(예를 들어, 호스트 세포)에 전달되고, 이로써 표적 인트론(예: 스플라이스 수용체, 스플라이스 공여체 부위)을 변경한다. 일부 구현예에서, 인트론 서열에 대한 하나 이상의 편집은 염기 편집 활성의 발현, 활성 또는 수준을 감소시키거나 제거한다.
일부 구현예에서, 호스트 세포는 박테리아 세포, 식물 세포, 곤충 세포, 인간 세포 또는 포유동물 세포로부터 선택된다. 일부 구현예에서, 호스트 세포는 포유동물 세포이다. 일부 구현예에서, 호스트 세포는 인간 세포이다. 일부 구현예에서, 세포는 시험관 내(in vitro)에 있다. 일부 구현예에서, 세포는 생체 내(in vivo)에 있다.
염기 편집기 시스템의 핵산-기반 전달
본 개시내용에 따른 염기 편집기 시스템을 암호화하는 핵산 분자는 당업계에 공지된 방법 또는 본원에 기재된 바와 같이 시험관내 또는 생체내에서 대상체에게 투여되거나 세포 내로 전달될 수 있다. 일부 구현예에서, 자기-불활성화 염기 편집기를 코딩하는 핵산 분자에는 세포 내 염기 편집기의 수준, 발현 또는 활성을 감소시키기 위해 편집될 수 있는 인트론이 포함된다. 예를 들어, 데아미나아제(예를 들어, 사이티딘 또는 아데닌 데아미나아제)를 포함하는 염기 편집기 시스템은 벡터(예를 들어, 바이러스 또는 비-바이러스 벡터)에 의해, 또는 네이키드 DNA, DNA 복합체, 지질 나노입자, 또는 상기 언급된 조성물의 조합에 의해 전달될 수 있다.
유기 또는 무기일 수 있는 나노입자는 염기 편집기 시스템 또는 이의 구성요소를 전달하는 데 유용하다. 나노입자는 당업계에 널리 공지되어 있고, 임의의 적합한 나노입자가 염기 편집기 시스템 또는 이의 구성요소, 또는 이러한 구성요소를 암호화하는 핵산 분자를 전달하는 데 사용될 수 있다. 일 예에서, 유기(예를 들어, 지질 및/또는 중합체) 나노입자는 본 개시내용의 특정 구현예에서 전달 비히클로서 사용하기에 적합하다.
나노입자 제형 및/또는 유전자 전달에 사용하기 위한 예시적인 지질은 표 16(하기)에 나타낸다.
표 16
표 17은 유전자 전달 및/또는 나노입자 제형에 사용하기 위한 예시적인 중합체를 열거한다.
표 17
표 18은 본원에 기재된 융합 단백질을 임호화하는 폴리뉴클레오티드에 대한 전달 방법을 요약한다.
표 18
또 다른 양태에서, 염기 편집기 시스템 구성요소 또는 이러한 구성요소를 코딩하는 핵산, 예를 들어 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예, Cas9), 예를 들어 Cas9 또는 이의 변이체, 및 관심 핵산 서열을 표적화하는 gRNA의 전달은 리보뉴클레오단백질(RNP)를 세포에 전달함으로써 달성될 수 있다. RNP는 표적화 gRNA와의 복합체에 폴리뉴클레오티드 프로그래밍 가능한 뉴클레오티드 결합 도메인(예, Cas9)을 포함한다. RNP 또는 본원에 기재된 폴리뉴클레오티드는 전기천공법, 뉴클레오펙션, 또는 예를 들어, 전체 내용이 참조로 포함되어 있는 Zuris, J.A. 등, 2015, Nat. Biotechnology, 33(1):73-80에 보고된 바와 같은 양이온성 지질-매개 방법과 같은 공지된 방법을 사용하여 세포에 전달될 수 있다. RNP는 CRISPR 염기 편집 시스템, 특히 1차 세포와 같이 형질감염이 어려운 세포에 사용하기에 유리하다. 게다가, RNP는 또한 특히 CRISPR 플라스미드에 사용될 수 있는 진핵생물 프로모터, 예를 들어, CMV 또는 EF1A가 잘 발현되지 않을 때, 세포에서 단백질 발현과 함께 발생할 수 있는 어려움을 완화할 수 있다. 유리하게는, RNP의 사용은 외래 DNA의 세포 내로의 전달을 필요로 하지 않는다. 더욱이, 핵산 결합 단백질 및 gRNA 복합체를 포함하는 RNP는 시간 경과에 따라 분해되기 때문에, RNP의 사용은 오프-타겟 효과를 제한할 가능성이 있다. 플라스미드 기반 기술과 유사한 방식으로, RNP를 사용하여 결합 단백질(예를 들어, Cas9 변이체)을 전달하고 상동성 지정 복구(HDR)를 지시할 수 있다.
염기 편집기 시스템을 코딩하는 핵산 분자는 예를 들어 형질감염 또는 전기천공을 통해 네이키드 DNA 또는 RNA로 세포에 직접 전달될 수 있거나 표적 세포의 흡수를 촉진하는 분자(예: N-아세틸갈락토사민)에 접합될 수 있다. 염기 편집기 시스템 및/또는 해당 구성요소를 코딩하는 벡터도 사용할 수 있다. 특정 구현예에서, 폴리뉴클레오티드, 예를 들어 염기 편집기 시스템 또는 이의 기능적 구성요소를 코딩하는 mRNA는 본원에 기술된 바와 같이 하나 이상의 가이드 RNA와 공동-전기천공될 수 있다.
핵산 벡터는 본원에 기술된 융합 단백질의 도메인을 코딩하는 하나 이상의 서열을 포함할 수 있다. 벡터는 또한 핵 국소화 신호, 핵소체 국소화 신호 또는 미토콘드리아 국소화 신호에 작동 가능하게 연결된 염기 편집기 시스템의 단백질 구성요소를 코딩할 수 있다. 한 예로서, 벡터는 하나 이상의 핵 국소화 서열(예를 들어, SV40으로부터의 핵 국소화 서열) 및 하나 이상의 데아미나아제를 포함하는 Cas9 코딩 서열을 포함할 수 있다.
벡터는 또한 임의의 적합한 수의 조절/제어 요소, 예를 들어 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, Kozak 공통 서열 또는 내부 리보솜 진입 부위(IRES)를 포함할 수 있다. 이들 요소는 당해 분야에 잘 알려져 있다.
본 개시내용에 따른 벡터는 재조합 바이러스 벡터를 포함한다. 예시적인 바이러스 벡터는 상기에 제시되어 있다. 당업계에 공지된 다른 바이러스 벡터도 사용될 수 있다. 또한 바이러스 입자를 사용하여 염기 편집기 시스템 구성요소를 핵산 및/또는 단백질 형태로 전달할 수 있다. 예를 들어, "빈" 바이러스 입자를 조립하여 염기 편집기 시스템이나 구성요소를 화물로 포함할 수 있다. 바이러스 벡터와 바이러스 입자는 표적 조직 특이성을 변경하기 위해 표적 리간드를 혼입하도록 조작될 수도 있다.
본 명세서에 기술된 벡터는 베이스 편집기 시스템 또는 그 구성요소의 발현을 구동하기 위한 조절 요소를 포함할 수 있다. 이러한 벡터에는 역위 긴 말단 반복부(AAV ITR)가 있는 아데노 관련 바이러스가 포함된다. AAV ITR의 사용은 벡터에서 공간을 차지할 수 있는 추가적인 프로모터 요소에 대한 필요성을 제거하는 데 유리할 수 있다. 확보된 추가적인 공간은 가이드 핵산 또는 선택가능한 마커와 같은 추가적인 요소의 발현을 구동하는 데 사용될 수 있다. ITR 활성은 과발현으로 인한 잠재적인 독성을 감소시키는 데 사용될 수 있다.
임의의 적합한 프로모터는 염기 편집기 시스템 또는 이의 구성요소 및, 적절한 경우, 가이드 핵산의 발현을 구동하는 데 사용될 수 있다. 보편적인 발현을 위해, 프로모터는 CMV, CAG, CBh, PGK, SV40, 페리틴(Ferritin) 중쇄 또는 경쇄를 포함한다. 뇌 또는 다른 CNS 세포 발현의 경우, 적합한 프로모터는 다음을 포함할 수 있다: 모든 뉴런의 경우 SynapsinI, 흥분성 뉴런의 경우 CaMKII알파, GABA성 뉴런의 경우 GAD67 또는 GAD65 또는 VGAT. 간 세포 발현의 경우, 적합한 프로모터는 알부민 프로모터를 포함한다. 폐 세포 발현의 경우, 적합한 프로모터는 SP-B를 포함한다. 내피 세포의 경우, 적합한 프로모터는 ICAM을 포함한다. 조혈 세포 발현에 적합한 프로모터는 IFN베타 또는 CD45를 포함한다. 골아세포 발현에 적합한 프로모터는 OG-2를 포함할 수 있다.
일부 구현예에서, 본 개시내용의 염기 편집기 시스템은 별도의 프로모터가 동일한 핵산 분자 내에서 염기 편집기 및 호환성 가이드 핵산의 발현을 구동할 수 있도록 충분히 작은 크기의 것이다. 예를 들면, 벡터 또는 바이러스 벡터는 염기 편집기를 암호화하는 핵산에 작동가능하게 연결된 제1 프로모터 및 가이드 핵산에 작동가능하게 연결된 제2 프로모터를 포함할 수 있다.
가이드 핵산의 발현을 구동하는 데 사용되는 프로모터는 다음을 포함할 수 있다: Pol II 프로모터의 U6 또는 H1 사용 같은 Pol III 프로모터 및 gRNA 아데노 연관 바이러스(AAV)를 발현하는 인트론 카세트.
특정 구현예에서, 본 발명의 융합 단백질은 바이러스 벡터(예를 들어, 아데노-연관 바이러스(AAV), AAV3, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh8, AAV10, 및 이의 변이체), 또는 임의의 바이러스 벡터의 적합한 캡시드 단백질에 존재하는 폴리뉴클레오티드에 의해 암호화된다. 따라서, 일부 양태에서, 본 개시내용은 융합 단백질의 바이러스 전달에 관한 것이다. 바이러스 벡터의 예로는 레트로바이러스 벡터(예를 들어, 말로니 뮤린 백혈병 바이러스, MML-V), 아데노바이러스 벡터(예를 들어, AD100), 렌티바이러스 벡터(HIV 및 FIV-기반 벡터), 헤르페스바이러스 벡터(예를 들어, HSV-2)가 포함된다.
바이러스 벡터
본원에 기재된 염기 편집기는 바이러스 벡터와 함께 전달될 수 있다. 일부 구현예에서, 본원에 개시된 염기 편집기는 바이러스 벡터에 함유된 핵산 상에 암호화될 수 있다. 일부 구현예에서, 염기 편집기 시스템의 하나 이상의 구성요소는 하나 이상의 바이러스 벡터 상에 암호화될 수 있다. 예를 들어, 염기 편집기 및 가이드 핵산은 단일 바이러스 벡터 상에서 암호화될 수 있다. 다른 구현예에서, 염기 편집기 및 가이드 핵산은 상이한 바이러스 벡터 상에 암호화된다. 어느 경우든, 염기 편집기 및 가이드 핵산은 각각 프로모터 및 종결인자에 작동가능하게 연결될 수 있다. 바이러스 벡터 상에서 암호화되는 구성요소의 조합은 선택된 바이러스 벡터의 카고 크기 제한에 의해 결정될 수 있다.
염기 편집기를 설계하기 위한 개시된 전략은 바이러스 벡터 내로 패키징될 수 있는 염기 편집기를 생성하는 데 유용할 수 있다. 염기 편집기의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 배양물 또는 호스트에서 특이적 세포에 바이러스를 표적화하고 핵 또는 호스트 세포 게놈에 바이러스 페이로드를 수송하는 고도로 진화된 과정의 이점을 취한다. 바이러스 벡터는 배양물, 환자(생체내)에서 세포에 직접적으로 투여될 수 있거나, 또는 시험관내에서 세포를 처리하는 데 사용될 수 있고, 변형된 세포는 임의적으로 환자(생체외)에게 투여될 수 있다. 통상적인 바이러스 기반 시스템은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 및 단순 포진 바이러스 벡터를 포함할 수 있다. 호스트 게놈 내로의 혼입은 레트로바이러스, 렌티바이러스, 및 아데노-연관 바이러스 유전자 전달 방법으로 가능하며, 종종 삽입된 이식유전자의 장기간 발현을 초래한다. 추가적으로, 높은 형질도입 효율이 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.
바이러스 벡터는 렌티바이러스(예를 들어, HIV 및 FIV-기반 벡터), 아데노바이러스(예를 들어, AD100), 레트로바이러스 (예를 들어, 말로니 뮤린 백혈병 바이러스, MML-V), 헤르페스바이러스 벡터(예를 들어, HSV-2), 및 아데노-연관 바이러스(AAV), 또는 다른 플라스미드 또는 바이러스 벡터 유형을 사용하여, 특히, 예를 들어, 미국 특허 번호 8,454,972(아데노바이러스에 대한 제형, 용량), 미국 특허 번호 8,404,658(AAV에 대한 제형, 용량) 및 미국 특허 번호 5,846,946(DNA 플라스미드에 대한 제형, 용량) 및 렌티바이러스, AAV 및 아데노바이러스를 수반하는 임상 시험 및 임상 시험에 관한 간행물로부터의 제형 및 용량을 사용하여 전달될 수 있다. 예를 들어, AAV의 경우, 투여 경로, 제형 및 용량은 미국 특허 번호 8,454,972 및 AAV를 수반하는 임상 시험에서와 같을 수 있다. 아데노바이러스의 경우, 투여 경로, 제형 및 용량은 미국 특허 번호 8,404,658 및 아데노바이러스를 수반하는 임상 시험에서와 같을 수 있다. 플라스미드 전달의 경우, 투여 경로, 제형 및 용량은 미국 특허 번호 5,846,946 및 플라스미드를 수반하는 임상 연구에서와 같을 수 있다. 용량은 평균 70 kg 개체(예를 들어 성인 남성)를 기준으로 하거나 이에 추정될 수 있고, 상이한 체중 및 종의 환자, 대상체, 포유동물에 대해 조정될 수 있다. 투여 빈도는 연령, 성별, 일반적인 건강, 환자 또는 대상체의 다른 병태 및 다루어지는 특정 병태 또는 증상을 포함한 일반적 요인에 따라 의사 또는 수의사(예를 들어, 의사, 수의사)의 영역 내에 있다. 바이러스 벡터는 관심 조직 내로 주입될 수 있다. 세포-유형 특이적 염기 편집을 위해, 염기 편집기 및 임의적인 가이드 핵산의 발현은 세포-유형 특이적 프로모터에 의해 구동될 수 있다.
레트로바이러스의 향성은 외래 외피 단백질을 혼입하여, 표적 세포의 잠재적인 표적 집단으로 확장함으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분할 세포를 형질도입하거나 또는 감염시킬 수 있고 전형적으로 높은 바이러스 역가를 생성하는 레트로바이러스 벡터이다. 따라서 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 달라질 것이다. 레트로바이러스 벡터는 외래 서열의 최대 6-10 kb에 대한 패키징 용량을 갖는 시스-작용 긴 말단 반복부로 구성된다. 최소 시스-작용 LTR은 벡터의 복제 및 패키징에 충분하며, 이어서 치료적 유전자를 표적 유전자 내로 혼입하는 데 사용되어 영구적인 이식유전자 발현을 제공한다. 광범위하게 사용되는 레트로바이러스 벡터는 뮤린 백혈병 바이러스(MuLV), 긴팔원숭이 백혈병 바이러스(GaLV), 시미안 면역 결핍 바이러스(SIV), 인간 면역 결핍 바이러스(HIV), 및 이의 조합에 기초한 것들을 포함한다(예를 들어, Buchscher 등, J. Virol. 66:2731-2739 (1992); Johann 등, J. Virol. 66:1635-1640 (1992); Sommnerfelt 등, Virol. 176:58-59 (1990); Wilson 등, J. Virol. 63:2374-2378 (1989); Miller 등, J. Virol. 65:2220-2224 (1991); PCT/US94/05700 참조).
레트로바이러스 벡터, 특히 렌티바이러스 벡터는 표적 세포 내로의 효율적인 혼입을 위해 주어진 길이보다 더 작은 폴리뉴클레오티드 서열을 필요로 할 수 있다. 예를 들어, 9 kb 초과 길이의 레트로바이러스 벡터는 더 작은 크기의 것과 비교하여 낮은 바이러스 역가를 초래할 수 있다. 일부 양태에서, 본 개시내용의 염기 편집기는 레트로바이러스 벡터를 통해 표적 세포 내로의 효율적인 패키징 및 전달을 가능하게 하기에 충분한 크기이다. 일부 구현예에서, 염기 편집기는 가이드 핵산 및/또는 표적화가능한 뉴클레아제 시스템의 다른 구성요소와 함께 발현될 때조차 효율적인 패키징 및 전달을 허용하기 위한 크기이다.
패키징 세포는 전형적으로 호스트 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포, 및 레트로바이러스를 패키징하는 psi.2 세포 또는 PA317 세포를 포함한다. 유전자 요법에 사용되는 바이러스 벡터는 일반적으로 핵산 벡터를 바이러스 입자 내로 패키징하는 세포주를 생산함으로써 생성된다. 벡터는 전형적으로 호스트 내로의 패키징 및 후속 혼입에 필요한 최소 바이러스 서열을 함유하며, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 대한 발현 카세트로 대체된다. 누락 바이러스 기능은 전형적으로 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 요법에 사용되는 아데노-연관 바이러스(“”벡터는 전형적으로 호스트 게놈 내로의 패키징 및 혼입에 필요한 AAV 게놈으로부터 ITR 서열만을 보유한다. 바이러스 DNA는 다른 AAV 유전자, 즉 rep 및 cap를 암호화하는 헬퍼 플라스미드를 함유하지만, ITR 서열이 결여되어 있는 세포주에 패키징될 수 있다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염될 수 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진할 수 있다. 헬퍼 플라스미드는 일부 경우에 ITR 서열의 결여로 인해 상당한 양으로 패키징되지 않는다. 아데노바이러스로의 오염은 예를 들어, 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다.
일시적 발현이 바람직한 적용에서, 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율이 가능하고 세포 분열을 필요로 하지 않는다. 이러한 벡터를 사용하여, 높은 역가 및 발현 수준이 수득되었다. 이 벡터는 비교적 간단한 시스템에서 다량으로 생성될 수 있다. AAV 벡터는 또한 예를 들어, 핵산 및 펩티드의 시험관내 생산에서, 그리고 생체내 및 생체외 유전자 요법 절차를 위해 표적 핵산으로 세포를 형질도입하는 데 사용될 수 있다(예를 들어, West 등, Virology 160:38-47 (1987); 미국 특허 번호 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994) 참조. 재조합 AAV 벡터의 구축은 미국 특허 번호 5,173,414; Tratschin 등, Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, 등, Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); 및 Samulski 등, J. Virol. 63:03822-3828 (1989)를 포함한 다수의 간행물에 기재되어 있다.
일부 구현예에서, AAV 벡터는 본원에 제공된 바와 같은 염기 편집기 또는 염기 편집기 시스템을 코딩하는 폴리뉴클레오티드로 관심 세포를 형질도입하는 데 사용된다. AAV는 파르보바이러스 패밀리에 속하는 작은 단일 가닥 DNA 의존성 바이러스이다. 4.7 kb 야생형 (wt) AAV 게놈은 각각 4개의 복제 단백질 및 3개의 캡시드 단백질을 암호화하는 2개의 유전자로 구성되고, 145-bp 역전 말단 반복부(ITR)에 의해 어느 한 측면에 플랭킹된다. 비리온은 동일한 오픈 리딩 프레임으로부터, 그러나 차동 스플라이싱(Vp1) 및 대체 번역 시작 부위(각각 Vp2 및 Vp3)로부터 1:1:10 비율로 생성된 3개의 캡시드 단백질, Vp1, Vp2 및 Vp3으로 구성된다. Vp3은 비리온에서 가장 풍부한 서브유닛이며 바이러스의 향성을 정의하는 세포 표면에서 수용체 인식에 참여한다. 바이러스 감염성에서 기능하는 포스포리파제 도메인은 Vp1의 고유한 N 말단에서 식별되었다.
wt AAV와 유사하게, 재조합 AAV(rAAV)는 시스-작용 145-bp ITR을 활용하여 벡터 이식유전자 카세트를 플랭킹하여, 외래 DNA의 패키닝을 위해 최대 4.5 kb를 제공한다. 감염 후, rAAV는 본 발명의 융합 단백질을 발현하고 원형 머리-대-꼬리 연쇄체(concatemer)에서 에피솜으로 존재함으로써 호스트 게놈 내로의 혼입 없이 지속될 수 있다. 시험관내 및 생체내에서 이 시스템을 사용한 rAAV 성공의 많은 예가 있지만, 제한된 패키징 용량은 유전자의 코딩 서열의 길이가 wt AAV 게놈의 크기보다 더 크거나 또는 동일할 때 AAV-매개 유전자 전달의 사용을 제한하였다.
바이러스 벡터는 적용에 기초하여 선택될 수 있다. 예를 들어, 생체내 유전자 전달의 경우, AAV는 다른 바이러스 벡터보다 유리할 수 있다. 일부 구현예에서, AAV는 낮은 독성을 허용하며, 이는 면역 반응을 활성화시킬 수 있는 세포 입자의 초원심분리를 필요로 하지 않는 정제 방법에 기인할 수 있다. 일부 구현예에서, AAV는 호스트 게놈에 혼입되지 않기 때문에 삽입 돌연변이생성을 유발할 가능성이 낮다. 아데노바이러스는 통상적으로 이들이 유도하는 강한 면역원성 반응 때문에 백신으로 사용된다. 바이러스 벡터의 패키징 용량은 벡터 내로 패키징될 수 있는 염기 편집기의 크기를 제한할 수 있다.
AAV는 2개의 145개의 염기 역전 말단 반복부(ITR)를 포함하는 약 4.5 Kb 또는 4.75 Kb의 패키징 용량을 갖는다. 이는 개시된 염기 편집기뿐만 아니라 프로모터 및 전사 종결인자가 단일 바이러스 벡터에 적합할 수 있음을 의미한다. 4.5 또는 4.75 Kb 초과의 작제물은 유의하게 감소된 바이러스 생산을 야기할 수 있다. 예를 들어, SpCas9는 매우 크고, 유전자 자체는 4.1 Kb를 초과하며, 이는 AAV 내로 패킹하기 어렵다. 따라서, 본 개시내용의 구현예는 종래의 염기 편집기보다 길이가 더 짧은 개시된 염기 편집기를 활용하는 것을 포함한다. 일부 예에서 염기 편집기는 4kb 미만이다. 개시된 염기 편집기는 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2 kb, 또는 1.5 kb 미만일 수 있다. 일부 구현예에서, 개시된 염기 편집기는 길이가 4.5 kb 이하이다.
AAV는 AAV1, AAV2, AAV5 또는 이들의 임의의 조합일 수 있다. 표적화될 세포와 관련하여 AAV의 유형을 선택할 수 있고; 예를 들어, 뇌 또는 뉴런 세포를 표적화하기 위해 AAV 혈청형 1, 2, 5 또는 하이브리드 캡시드 AAV1, AAV2, AAV5 또는 이들의 임의의 조합을 선택할 수 있고; 심장 조직을 표적화하기 위해 AAV4를 선택할 수 있다. AAV8은 간으로의 전달에 유용하다. 이들 세포에 관한 특정 AAV 혈청형의 도표는 Grimm, D. 등, J. Virol. 82: 5887-5911 (2008))에서 찾을 수 있다.
일부 구현예에서, 렌티바이러스 벡터는 본원에 제공된 바와 같은 염기 편집기 또는 염기 편집기 시스템을 코딩하는 폴리뉴클레오티드로 관심 세포를 형질도입하는 데 사용된다. 렌티바이러스는 유사분열 세포 및 유사분열 후 세포 둘 모두에서 이들의 유전자를 감염시키고 발현시키는 능력을 갖는 복합 레트로바이러스이다. 가장 흔히 알려진 렌티바이러스는 광범위한 세포 유형을 표적화하는 다른 바이러스의 외피 당단백질을 사용하는 인간 면역결핍 바이러스(HIV)이다.
렌티바이러스는 다음과 같이 제조될 수 있다. pCasES10(렌티바이러스 전달 플라스미드 백본 함유)을 클로닝한 후, HEK293FT를 낮은 계대(p=5)에서 10% 소 태아 혈청을 함유하고 항생제가 없는 DMEM에서 형질감염 전날 50% 합류가 되도록 T-75 플라스크에 시딩하였다. 20 시간 후, 배지를 OptiMEM(무혈청) 배지로 교체하고 4 시간 후 형질감염을 수행하였다. 세포를 10 μg의 렌티바이러스 전달 플라스미드(pCasES10) 및 다음 패키징 플라스미드로 형질감염시켰다: 5 μg의 pMD2.G(VSV-g 위형), 및 7.5 μg의 psPAX2(gag/pol/rev/tat). 형질감염은 양이온성 지질 전달제(50 μl 리포펙타민(Lipofectamine) 2000 및 100 μl 및 시약)를 함유하는 4 mL OptiMEM에서 수행될 수 있다. 6 시간 후, 배지를 10% 소 태아 혈청을 함유하는 무항생제 DMEM으로 교체한다. 이러한 방법은 세포 배양 동안 혈청을 사용하지만, 무혈청 방법이 선호된다.
렌티바이러스는 다음과 같이 정제될 수 있다. 48 시간 후 바이러스 상청액을 수확한다. 상청액을 먼저 파편을 제거하고 0.45 μm 낮은 단백질 결합(PVDF) 필터를 통해 여과한다. 그런 다음 이들을 초원심분리기에서 2 시간 동안 24,000 rpm으로 회전시킨다. 바이러스 펠릿을 4℃에서 밤새 50 μl의 DMEM에 재현탁한다. 그런 다음 이들을 분취하고 -80℃에서 즉시 동결시킨다.
또 다른 구현예에서, 말 전염성 빈혈 바이러스(EIAV)를 기반으로 한 최소 비-영장류 렌티바이러스 벡터가 또한 고려된다. 또 다른 구현예에서, 혈관형성 억제 단백질 엔도스타틴 및 안지오스타틴을 발현하는 말 전염성 빈혈 바이러스-기반 렌티바이러스 유전자 요법 벡터인 RetinoStat®가 망막하 주사를 통해 전달되는 것으로 고려된다. 또 다른 구현예에서, 자기-불활성화 렌티바이러스 벡터의 사용이 고려된다.
시스템의 임의의 RNA, 예를 들어 가이드 RNA 또는 염기 편집기-암호화 mRNA는 RNA의 형태로 전달될 수 있다. 염기 편집기-암호화 mRNA는 시험관내 전사를 사용하여 생성될 수 있다. 예를 들어, 뉴클레아제 mRNA는 다음 요소를 함유하는 PCR 카세트를 사용하여 합성될 수 있다: T7 프로모터, 선택적인 코작 서열(GCCACC), 뉴클레아제 서열, 및 베타 글로빈-polyA 꼬리로부터의 3' UTR과 같은 3' UTR. 카세트는 T7 폴리머라아제에 의한 전사에 사용될 수 있다. 가이드 폴리뉴클레오티드(예를 들어, gRNA)는 또한 T7 프로모터, 이어서 서열 "GG", 및 가이드 폴리뉴클레오티드 서열을 함유하는 카세트로부터 시험관내 전사를 사용하여 전사될 수 있다.
발현을 향상시키고 가능한 독성을 감소시키기 위해, 염기 편집기-코딩 서열 및/또는 가이드 핵산은 예를 들어 슈도 U 또는 5-메틸-C와 같은 변형된 뉴크렐오시드를 포함하도록 변형될 수 있다.
AAV 벡터의 작은 패키징 용량은 이 크기를 초과하는 다수의 유전자의 전달 및/또는 큰 생리학적 조절 요소의 사용을 어렵게 만든다. 이러한 어려움은 예를 들어, 전달될 단백질(들)을 2 개 이상의 단편으로 나눔으로써 해결될 수 있으며, 여기서 N-말단 단편은 스플릿 인테인-N에 융합되고 C-말단 단편은 스플릿 인테인-C에 융합된다. 그런 다음 이들 단편은 2 개 이상의 AAV 벡터로 패키징된다. 본원에 사용된 바와 같이, "인테인"은 플랭킹 N-말단 및 C-말단 엑스테인(예를 들어, 연결될 단편)을 결찰하는 자기-스플라이싱 단백질 인트론(예를 들어, 펩티드)을 지칭한다. 이종성 단백질 단편을 연결하기 위한 특정 인테인의 사용은 예를 들어, Wood 등, J. Biol. Chem. 289(21); 14512-9 (2014)에 기재되어 있다. 예를 들어, 별도의 단백질 단편과 융합된 경우, 인테인 IntN 및 IntC는 서로를 인식하고, 스스로를 스플라이싱하고 이들이 융합된 단백질 단편의 플랭킹 N- 및 C-말단 엑스테인을 동시에 결찰시켜, 2 개의 단백질 단편으로부터 전장 단백질을 재구축한다. 다른 적합한 인테인은 당업자에게 명백할 것이다.
본 발명의 융합 단백질의 단편은 길이가 다양할 수 있다. 일부 구현예에서, 단백질 단편은 길이가 2개의 아미노산 내지 약 1000개의 아미노산 범위이다. 일부 구현예에서, 단백질 단편은 길이가 약 5개의 아미노산 내지 약 500개의 아미노산 범위이다. 일부 구현예에서, 단백질 단편은 길이가 약 20개의 아미노산 내지 약 200개의 아미노산 범위이다. 일부 구현예에서, 단백질 단편은 길이가 약 10개의 아미노산 내지 약 100개의 아미노산의 범위이다. 다른 길이의 적합한 단백질 단편은 당업자에게 명백할 것이다.
일 구현예에서, 이중 AAV 벡터는 큰 이식유전자 발현 카세트를 2 개의 별도의 절반(5' 및 3' 말단 단부, 또는 머리 및 꼬리)으로 분할함으로써 생성되며, 여기서 카세트의 각각의 절반은 단일 AAV 벡터(5 kb 미만)에 패키징된다. 그런 다음, 다음과 같은 두 이중 AAV 벡터에 의해 동일한 세포의 공동 감염 시 전장 이식유전자 발현 카세트에 의한 재조립이 달성된다: (1) 5' 및 3' 게놈 사이의 상동 재조합(HR)(이중 AAV 중첩 벡터); (2) 5' 및 3' 게놈의 ITR-매개 꼬리-대-머리 연쇄체화(이중 AAV 트랜스-스플라이싱 벡터); 또는 (3) 이들 2 가지 메커니즘의 조합(이중 AAV 하이브리드 벡터). 생체내에서 이중 AAV 벡터의 사용은 전장 단백질의 발현을 초래한다. 이중 AAV 벡터 플랫폼의 사용은 4.7 kb 초과 크기의 이식유전자에 대한 효율적이고 실행가능한 유전자 전달 전략을 나타낸다.
인테인
인테인(개재 단백질)은 단백질 스플라이싱으로 공지된 과정을 수행하는 다양한 여러 유기체에서 발견되는 자가-처리 도메인이다. 단백질 스플라이싱은 펩티드 결합의 절단 및 형성 둘 모두로 이루어진 다단계 생화학 반응이다. 단백질 스플라이싱의 내인성 기질은 인테인-함유 유기체에서 발견되는 단백질이지만, 인테인은 또한 사실상 임의의 폴리펩티드 백본을 화학적으로 조작하는 데 사용될 수 있다.
단백질 스플라이싱에서, 인테인은 2 개의 펩티드 결합을 절단함으로써 전구체 폴리펩티드를 자체적으로 절제하여, 새로운 펩티드 결합의 형성을 통해 플랭킹 엑스테인(외부 단백질) 서열을 결찰시킨다. 이 재배열은 번역후(또는 가능한 동시 번역으로) 발생한다. 인테인-매개 단백질 스플라이싱은 자발적으로 발생하며, 인테인 도메인의 접힘만을 필요로 한다.
인테인의 약 5%는 스플릿 인테인이며, 각각이 하나의 엑스테인에 융합된 N-인테인 및 C-인테인인 2 개의 별도의 폴리펩티드로서 전사 및 번역된다. 번역 시, 인테인 단편은 자발적으로 및 비-공유적으로 표준 인테인 구조 내로 조립되어 단백질 스플라이싱을 트랜스로 수행한다. 단백질 스플라이싱의 메커니즘은 인테인-엑스테인 접합부에서 2 개의 펩티드 결합의 절단 및 N- 및 C-엑스테인 사이에 새로운 펩티드 결합의 형성을 초래하는 일련의 아실-전달 반응을 수반한다. 이 과정은 N-엑스테인 및 인테인의 N-말단을 연결하는 펩티드 결합의 활성화로 개시된다. 사실상 모든 인테인은 N-말단에서 C-말단 N-엑스테인 잔기의 카르보닐 탄소를 공격하는 시스테인 또는 세린을 갖는다. 이러한 N에서 O/S로의 아실-이동은 흔히 발견되는 아스파르테이트와 함께 보존된 트레오닌 및 히스티딘(TXXH 모티프(서열번호: 17)로 지칭됨)에 의해 용이하게 되어, 선형 (티오)에스테르 중간체의 형성을 초래한다. 다음으로, 이 중간체는 시스테인, 세린, 또는 트레오닌인 첫번째 C-엑스테인 잔기(+1)의 친핵체 공격에 의해 트랜스-(티오)에스테르화에 적용된다. 생성된 분지형 (티오)에스테르 중간체는 고유한 형태인 인테인의 고도로 보존된 C-말단 아스파라긴의 환화를 통해 분해된다. 이 과정은 히스티딘(고도로 보존된 HNF 모티프에서 발견) 및 끝에서 두번째 히스티딘에 의해 용이하게 되고 또한 아스파르테이트를 수반할 수 있다. 이 숙신이미드 형성 반응은 반응성 복합체로부터 인테인을 절제하고 비-펩티드성 결합을 통해 부착된 엑스테인을 남겨 둔다. 이 구조는 인테인-독립적 방식으로 안정된 펩티드 결합 내로 빠르게 재배열된다.
일부 구현예에서, 스플릿 인테인은 Gp41.1, IMPDH.1, NrdJ.1 및 Gp41.8로부터 선택된다(Carvajal-Vallejos, Patricia 등. "Unprecedented rates and efficiency presents for new natural 분할 인테인 from metagenomic source." J. Biol.Chem., vol.287,34(2012)).
인테인의 비제한적인 예에는 dnaE 인테인, Cfa-N(예: 스플릿 인테인-N) 및 Cfa-C(예: 스플릿 인테인-C) 인테인 쌍(예를 들어, 문헌[Stevens 등., J Am Chem Soc. 2016 Feb. 24;138(7):2162-5, 본원에 참조로 포함됨)] 및 DnaE을 기반으로 하는 합성 인테인을 포함하는 당업계에 알려진 임의의 인테인 또는 인테인-쌍이 포함된다. 본 개시내용에 따라 사용될 수 있는 인테인 쌍의 비제한적 예에는 Cfa DnaE 인테인, Ssp GyrB 인테인, Ssp DnaX 인테인, Ter DnaE3 인테인, Ter ThyX 인테인, Rma DnaB 인테인 및 Cne Prp8 인테인(예를 들어, 미국 특허 제8,394,604호, 본원에 참조로 포함됨)에 설명되어 있다. 인테인의 예시적인 뉴클레오티드 및 아미노산 서열은 서열 목록의 서열번호: 482-489에 제공되어 있다.
스플릿 Cas9의 N 말단 부분과 C-말단 부분의 결합을 위해 스플릿 Cas9의 N 말단 부분과 스플릿 Cas9의 C 말단 부분에 각각 Intein-N과 intein-C가 융합될 수 있다. 예를 들어, 일부 구현예에서 인테인-N은 스플릿 Cas9의 N-말단 부분의 C-말단에 융합되어, 즉 N--[스플릿 Cas9의 N-말단 부분]-[인테인-N]--C의 구조를 형성한다. 일부 구현예에서, 인테인-C는 스플릿 Cas9의 C-말단 부분의 N-말단에 융합된다. 일부 구현혜에서, 인테인-C는 스플릿 Cas9의 C-말단 부분의 N-말단에 융합되어, 즉 N-[인테인-C]―[스플릿 Cas9의 C-말단 부분]-C의 구조를 형성한다. 인테인이 융합되는 단백질을 연결하기 위한(예를 들어, 스플릿 Cas9) 인테인 매개 단백질 스플라이싱의 메커니즘은 예를 들어 Shah 등., Chem Sci. 2014년; 5(1):446-461(본원에 참조로 포함됨)에 기재된 바와같이, 이 기술분야에 알려져 있다. 인테인을 설계하고 사용하는 방법은 당업계에 공지되어 있으며, 예를 들어 WO2014004336, WO2017132580, US20150344549 및 US20180127780에 기술되어 있고, 이들 각각은 그 전체가 본원에 참조로 포함된다.
일부 구현예에서, 뉴클레아제의 부분 또는 단편(예를 들어, Cas9)은 인테인에 융합된다. 뉴클레아제는 인테인의 N-말단 또는 C-말단에 융합될 수 있다. 일부 구현예에서, 융합 단백질의 부분 또는 단편은 인테인에 융합되고 AAV 캡시드 단백질에 융합된다. 인테인, 뉴클레아제 및 캡시드 단백질은 임의의 배열로 함께 융합될 수 있다(예를 들어, 뉴클레아제-인테인-캡시드, 인테인-뉴클레아제-캡시드, 캡시드-인테인-뉴클레아제 등). 일부 구현예에서, 염기 편집기(예를 들어, ABE, CBE)의 N-말단 단편은 스플릿 인테인-N에 융합되고, C-말단 단편은 스플릿 인테인-C에 융합된다. 이들 단편은 이어서 2개 이상의 AAV 벡터로 패키징된다. 일부 구현예에서, 인테인의 N-말단은 융합 단백질의 C-말단에 융합되고, 인테인의 C-말단은 AAV 캡시드 단백질의 N-말단에 융합된다.
일부 구현예에서, 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인(예를 들어, Cas9)의 N-말단 단편은 스플릿 인테인-N에 융합되고 C-말단 단편은 스플릿 인테인-C에 융합된다. 일부 구현예에서, 스플릿 인테인-N에 융합된 데아미나아제 도메인(예를 들어, 아데노신 또는 사이티딘 데아미나아제)의 N-말단 단편 및 C-말단 단편은 스플릿 인테인-C에 융합된다.
이들 단편은 이어서 2개 이상의 AAV 벡터로 패키징된다. 일부 구현예에서, 인테인을 특징으로 하는 염기 편집기 (예를 들어, 자기-불활성화 염기 편집기)를 코딩하는 폴리뉴클레오티드는 인트론을 포함한다. 일부 구현예에서, 인테인의 N-말단은 융합 단백질의 C-말단에 융합되고, 인테인의 C-말단은 AAV 캡시드 단백질의 N-말단에 융합된다.
일 구현예에서, 인테인은 AAV 캡시드 단백질 상에 그래프트된 사이티딘 또는 아데노신 염기 편집기 단백질의 단편 또는 부분을 연결하는 데 사용된다. 이종성 단백질 단편을 연결하기 위한 특정 인테인의 사용은 예를 들어, Wood 등, J. Biol. Chem. 289(21); 14512-9 (2014)에 기재되어 있다. 예를 들어, 별개의 단백질 단편에 융합될 때, 인테인 IntN 및 IntC는 서로를 인식하고, 스스로를 스플라이싱하고, 이들이 융합된 단백질 단편의 플랭킹 N- 및 C-말단 엑스테인을 동시에 결찰시켜, 2 개의 단백질 단편으로부터 전장 단백질을 재구축한다. 다른 적합한 인테인은 당업자에게 명백할 것이다.
일부 구현예에서, ABE는 SpCas9의 선택된 영역 내의 Ala, Ser, Thr, 또는 Cys 잔기에서 N- 및 C-말단 단편으로 스플릿되었다. 이들 영역은 Cas9 결정 구조 분석에 의해 식별된 루프 영역에 상응한다.
각 단편의 N-말단은 인테인-N에 융합되고 각 단편의 C-말단은 아미노산 위치 S303, T310, T313, S355, A456, S460, A463, T466, S469, T472, T474, C574, S577, A589, 및 S590에서 인테인 C에 융합되며, 이는 하기 서열(“참조 서열”이라 부름)에서 대문자로 표시된다.
(서열번호: 250).
약제학적 조성물
일부 양태에서, 본 발명은 임의의 폴리뉴클레오티드, 벡터, 세포, 염기 편집기(예를 들어, 자기-불활성화 염기 편집기), 염기 편집기 시스템, 가이드 폴리뉴클레오티드, 융합 단백질, 또는 융합 단백질-가이드 폴리뉴클레오티드 복합체를 포함하는 약제학적 조성물이 제공된다.
본 발명의 약제학적 조성물은 공지된 기술에 따라 제조될 수 있다. 예를 들어, Remington, The Science And Practice of Pharmacy (21st ed. 2005)를 참조한다. 일반적으로, 세포 또는 이의 집단은 투여 또는 저장에 앞서 적절한 담체와 혼합되며, 일부 구현예에서, 약제학적 조성물은 추가로 약제학적으로 허용되는 담체를 포함한다. 적합한 약제학적으로 허용되는 담체는 일반적으로 약제학적 조성물을 대상체에게 투여하는 것을 보조하거나, 약제학적 조성물을 전달가능한 제조물로 가공하는 것을 보조하거나, 또는 투여 전에 약제학적 조성물을 저장하는 것을 보조하는 불활성 물질을 포함한다. 약제학적으로 허용되는 담체는 제형의 형태, 농도, 점도, pH, 약동학적 특성, 용해도를 안정화시키거나, 최적화하거나, 또는 달리 변경할 수 있는 제제를 포함할 수 있다. 이러한 제제는 완충제, 습윤제, 유화제, 희석제, 캡슐화제, 및 피부 침투 증진제를 포함한다. 예를 들어, 담체는 식염수, 완충 식염수, 덱스트로스, 아르기닌, 수크로스, 물, 글리세롤, 에탄올, 소르비톨, 덱스트란, 나트륨 카르복시메틸 셀룰로스, 및 이들의 조합을 포함할 수 있지만, 이에 제한되지 않는다.
약제학적으로-허용되는 담체로서 역할을 할 수 있는 물질의 일부 비제한적인 예는 다음을 포함한다: (1) 당, 예컨대 락토스, 글루코스 및 수크로스; (2) 전분, 예컨대 옥수수 전분 및 감자 전분; (3) 셀룰로스, 및 이의 유도체, 예컨대 나트륨 카르복시메틸 셀룰로스, 메틸셀룰로스, 에틸 셀룰로스, 미세결정질 셀룰로스 및 셀룰로스 아세테이트; (4) 분말화 트라가칸트; (5) 맥아; (6) 젤라틴; (7) 윤활제, 예컨대 마그네슘 스테아레이트, 나트륨 라우릴 술페이트 및 활석; (8) 부형제, 예컨대 코코아 버터 및 좌제 왁스; (9) 오일, 예컨대 땅콩유, 면실유, 홍화유, 참깨유, 올리브유, 옥수수유 및 대두유; (10) 글리콜, 예컨대 프로필렌 글리콜; (11) 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜(PEG); (12) 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; (13) 한천; (14) 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; (15) 알긴산; (16) 무발열원수; (17) 등장성 염수; (18) 링거(Ringer) 용액; (19) 에틸 알코올; (20) pH 완충 용액; (21) 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; (22) 증량제, 예컨대 폴리펩티드 및 아미노산 (23) 혈청 알코올, 예컨대 에탄올; 및 (23) 약제학적 제형에서 이용되는 다른 무독성 호환성 물질. 습윤제, 착색제, 방출제, 코팅제, 감미제, 향미제, 방향제, 방부제 및 산화방지제가 또한 제형에 존재할 수 있다.
약제학적 조성물은 미리 결정된 수준에서 약 5.0 내지 약 8.0의 범위에서와 같은 생리학적 pH를 반영하는 제형의 pH를 유지하기 위해 하나 이상의 pH 완충 화합물을 포함할 수 있다. 수성 액체 제형에 사용되는 pH 완충 화합물은 아미노산 또는 히스티딘과 같은 아미노산의 혼합물 또는 히스티딘 및 글리신과 같은 아미노산의 혼합물일 수 있다. 대안적으로, pH 완충 화합물은 바람직하게는 미리 결정된 수준에서 약 5.0 내지 약 8.0의 범위에서와 같은 제형의 pH를 유지하고, 칼슘 이온을 킬레이트화하지 않는 제제이다. 이러한 pH 완충 화합물의 예시적인 예는 이미다졸 및 아세테이트 이온을 포함하나 이에 제한되지 않는다. pH 완충 화합물은 미리 결정된 수준에서 제형의 pH를 유지하기에 적합한 임의의 양으로 존재할 수 있다.
약제학적 조성물은 또한 하나 이상의 삽투압 조절제, 즉, 개인 수혜자의 혈류 및 혈액 세포에 허용가능한 수준으로 제형의 삼투압 특성(예를 들어, 등장성, 삼투압, 및/또는 삼투 압력)을 조절하는 화합물을 함유할 수 있다. 삽투압 조절제는 칼슘 이온을 킬레이트화하지 않는 제제일 수 있다. 삽투압 조절제는 제형의 삼투압 특성을 조절하는 당업자에게 알려지거나 또는 이용가능한 임의의 화합물일 수 있다. 당업자는 본 발명의 제형에 사용하기 위한 주어진 삽투압 조절제의 적합성을 경험적으로 결정할 수 있다. 적합한 유형의 삽투압 조절제의 예시적인 예는 다음을 포함하나 이에 제한되지 않는다: 염, 예컨대 나트륨 클로라이드 및 나트륨 아세테이트; 당, 예컨대 수크로스, 덱스트로스, 및 만니톨; 아미노산, 예컨대 글리신; 및 이러한 제제 및/또는 제제의 유형 중 하나 이상의 혼합물. 삽투압 조절제(들)는 제형의 삼투압 특성을 조절하기에 충분한 임의의 농도로 존재할 수 있다.
변형된 세포 또는 이의 집단 및 담체에 더하여, 본 발명의 약제학적 조성물은 질병 치료에 유용한 적어도 하나의 추가 치료제를 포함할 수 있다. 예를 들어, 본원에 기술된 약제학적 조성물의 일부 구현예는 화학요법제를 추가로 포함한다. 일부 구현예에서, 약제학적 조성물은 사이토카인 펩티드 또는 사이토카인 펩티드를 코딩하는 핵산 서열을 추가로 포함한다. 일부 구현예에서, 세포 또는 그의 집단을 포함하는 약제학적 조성물은 추가 치료제와 별도로 투여될 수 있다.
본 발명의 유전적으로 변형된 세포의 치료적 용도에 관한 한 가지 고려사항은 최적 또는 만족스러운 효과를 달성하는데 필요한 세포의 양이다. 투여되는 세포의 양은 치료 대상에 따라 달라질 수 있다. 한 구현예에서, 104 내지 1010사이, 105 내지 109 사이, 또는 106 내지 108사이의 유전적으로 변형된 세포가 인간 대상체에 투여된다. 일부 구현예에서, 적어도 약 1 x 108, 2 x 108, 3 x 108, 4 x 108, 및 5 x 108개의 본 발명의 유전적으로 변형된 세포가 인간 대상체에 투여된다. 정확한 유효 용량을 결정하는 것은 크기, 연령, 성별, 체중 및 상태를 포함한 각 개별 피험자의 요인을 기반으로 할 수 있다. 투여량은 본 개시내용 및 해당 분야의 지식으로부터 당업자에 의해 쉽게 확인될 수 있다.
당업자는 본 발명의 방법에서 투여될 조성물 중 세포의 수 및 선택적인 첨가제, 비히클 및/또는 담체의 양을 쉽게 결정할 수 있다. 일반적으로 첨가제(세포 외에)는 인산염 완충 식염수에 용액 0.001~50%(중량)의 양으로 존재하며, 활성 성분은 약 0.0001 내지 약 5 중량%, 바람직하게는 약 0.0001 내지 약 1 중량%, 더욱 더 바람직하게는 약 0.0001 내지 약 0.05 중량% 또는 약 0.001 내지 약 20 중량%, 바람직하게는 약 0.01 내지 약 10 중량%, 더욱 더 바람직하게는 약 0.05 내지 약 5wt%과 같이 마이크로그램에서 밀리그램 정도의 단위로 존재한다. 물론, 동물 또는 인간에게 투여될 임의의 조성물 및 임의의 특정 투여 방법에 대해, 따라서 독성, 예를 들어 적합한 동물 모델(예를 들어, 마우스와 같은 설치류)에서 치사량(LD) 및 LD50을 결정하며; 및 적합한 반응을 이끌어내는 조성물(들)의 투여량, 그 안의 성분의 농도, 및 조성물(들)을 투여하는 시기를 결정하는 것이 바람직하다. 이러한 결정은 당업자의 지식, 본 개시 내용 및 여기에 인용된 문서로부터의 과도한 실험을 요구하지 않는다. 그리고, 무리한 실험 없이 순차적 투여 시점을 확인할 수 있다.
일부 구현예에서, 약제학적 조성물은 대상체에게 전달하기 위해 제형화된다. 본원에 기재된 약제학적 조성물을 투여하는 적합한 경로는 다음을 포함하지만 이에 제한되지 않는다: 국소, 피하, 경피, 피내, 병변내, 관절내, 복강내, 방광내, 경점막, 치은, 치간, 와우내, 경고막, 기관내, 경막외, 척추강내, 근육내, 정맥내, 혈관내, 골내, 안구주위, 종양내, 대뇌내, 및 뇌실내 투여.
일부 구현예에서, 본원에 기재된 약제학적 조성물은 질환 부위에 국부적으로 투여된다. 일부 구현예에서, 본원에 기재된 약제학적 조성물은 주사에 의해, 카테터에 의해, 좌제에 의해, 또는 삽입물에 의해 대상체에게 투여되며, 삽입물은 시알라스틱 막, 또는 섬유와 같은 막을 포함한 다공성, 비-다공성, 또는 젤라틴성 물질이다.
다른 구현예에서, 본원에 기재된 약제학적 조성물은 제어 방출 시스템으로 전달된다. 일 구현예에서, 펌프가 사용될 수 있다(예를 들어, Langer, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald 등, 1980, Surgery 88:507; Saudek 등, 1989, N. Engl. J. Med. 321:574 참조). 또 다른 구현예에서, 중합체성 물질이 사용될 수 있다. (예를 들어, Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61 참조. 또한 Levy 등, 1985, Science 228: 190; During 등, 1989, Ann. Neurol. 25:351; Howard 등, 1989, J. Neurosurg. 71: 105 참조.) 예를 들어, 상기 Langer에서 다른 제어 방출 시스템이 논의되고 있다.
일부 구현예에서, 약제학적 조성물은 대상체, 예를 들어, 인간에게 정맥내 또는 피하 투여에 적합한 조성물로서 일상적인 절차에 따라 제형화된다. 일부 구현예에서, 주사에 의해 투여하기 위한 약제학적 조성물은 가용화제로서 사용하기 위한 멸균 등장성 용액 및 주사 부위에서 통증을 완화하기 위한 리그노카인과 같은 국부 마취제이다. 일반적으로, 성분은 개별적으로 또는 예를 들어, 활성제의 양을 나타내는 앰플 또는 샤셰(sachette)와 같은 완전 밀폐 용기에서 건조 동결건조 분말 또는 무수 농축물로서 단위 투여 형태로 함께 공급된다. 약제가 주입에 의해 투여되는 경우, 멸균 약제학적 등급 물 또는 염수를 함유하는 주입 병으로 분배될 수 있다. 약제학적 조성물이 주사에 의해 투여되는 경우, 성분이 투여 전에 혼합될 수 있도록 주사용 멸균수 또는 염수의 앰플이 제공될 수 있다.
전신 투여를 위한 약제학적 조성물은 액체, 예를 들어, 멸균 염수, 락테이트화 링거 또는 행크 용액일 수 있다. 또한, 약제학적 조성물은 고체 형태이고 사용 직전에 재용해되거나 또는 현탁될 수 있다. 동결건조된 형태가 또한 고려된다. 약제학적 조성물은 비경구 투여에도 적합한 리소솜 또는 미세결정과 같은 지질 입자 또는 소포 내에 함유될 수 있다. 입자는 조성물이 그 안에 함유되어 있는 한, 단층 또는 다층과 같은 임의의 적합한 구조일 수 있다. 화합물은 낮은 수준(5-10 mol%)의 양이온성 지질인 융해성 지질 디올레오일포스파티딜에탄올아민(DOPE)을 함유하는 "안정화된 플라스미드-지질 입자"(SPLP)에 포획되고, 폴리에틸렌글리콜(PEG) 코팅에 의해 안정화될 수 있다(Zhang Y. P. 등, Gene Ther. 1999, 6: 1438-47). 이러한 입자 및 소포에 대해 N-[l-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸-암모늄메틸술페이트, 또는 "DOTAP"와 같은 양으로 하전된 지질이 특히 바람직하다. 이러한 지질 입자의 제조는 널리 공지되어 있다. 예를 들어, 미국 특허 번호 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016; 및 4,921,757을 참조하며; 각각이 본원에 참조로 포함된다.
본원에 기재된 약제학적 조성물은 예를 들어, 단위 용량으로 투여되거나 또는 패키징될 수 있다. 용어 "단위 용량"은 본원의 개시내용의 약제학적 조성물과 관련하여 사용될 때 대상체에 대한 단일 투여량으로 적합한 물리적으로 별개의 단위를 지칭하며, 각각의 단위는 필요한 희석제; 즉, 담체, 또는 비히클과 관련하여 원하는 치료적 효과를 생성하기 위해 계산된 미리 결정된 활성 물질의 양을 함유한다.
또한, 약제학적 조성물은 (a) 동결건조된 형태의 본 발명의 화합물을 함유하는 용기 및 (b) 약제학적으로 허용되는 희석제(예를 들어, 본 발명의 동결건조된 화합물의 재구성 및 희석에 사용되는 멸균물을 함유하는 제2 용기를 포함하는 약제학적 키트로 제공될 수 있다. 이러한 용기(들)과 임의적으로 관련된 것은 의약품 또는 생물학적 제품의 제조, 사용 또는 판매를 규제하는 정부 기관에 의해 규정된 형태의 안내문이며, 이 안내문은 인간 투여를 위한 제조, 사용 또는 판매 기관의 승인을 반영한다.
또 다른 측면에서, 상기 기재된 질환의 치료에 유용한 물질을 함유하는 제조 물품이 포함된다. 일부 구현예에서, 제조 물품은 용기 또는 라벨을 포함한다. 적합한 용기는 예를 들어, 병, 바이알, 주사기, 및 테스트 튜브를 포함한다. 용기는 유리 또는 플라스틱과 같은 다양한 물질로부터 형성될 수 있다. 일부 구현예에서, 용기는 본원에 기재된 질환을 치료하기에 효과적인 조성물을 보유하고 멸균 접근 포트를 가질 수 있다. 예를 들어, 용기는 정맥내 용액 백 또는 피하 주사 바늘에 의해 뚫릴 수 있는 스토퍼가 있는 바이알일 수 있다. 조성물 내 활성제는 본 발명의 화합물이다. 일부 구현예에서, 용기 상의 또는 관련된 라벨은 조성물이 선택 질환을 치료하는 데 사용됨을 나타낸다. 제조 물품은 약제학적으로-허용되는 완충제, 예컨대 포스페이트-완충 염수, 링거 용액, 또는 덱스트로스 용액을 포함하는 제2 용기를 추가로 포함할 수 있다. 다른 완충제, 희석제, 충전제, 바늘, 주사기, 및 사용 설명서가 있는 패키지 삽입물을 포함한 상업적 및 사용자 관점에서 바람직한 다른 물질을 추가로 포함할 수 있다.
일부 구현예에서, 본원에 기재된 임의의 융합 단백질, gRNA, 및/또는 복합체는 약제학적 조성물의 일부로 제공된다. 일부 구현예에서, 약제학적 조성물은 본원에 제공된 임의의 융합 단백질을 포함한다. 일부 구현예에서, 약제학적 조성물은 본원에 제공된 임의의 복합체를 포함한다. 일부 구현예에서, 약제학적 조성물은 gRNA 및 양이온성 지질과 복합체를 형성하는 RNA-가이드된 뉴클레아제(예를 들어, Cas9)를 포함하는 리보뉴클레오단백질 복합체를 포함한다. 일부 구현예에서 약제학적 조성물은 gRNA, 핵산 프로그래밍 가능한 DNA 결합 단백질, 양이온성 지질, 및 약제학적으로 허용되는 부형제를 포함한다. 약제학적 조성물은 임의적으로 하나 이상의 추가적인 치료적 활성 물질을 포함할 수 있다.
일부 구현예에서, 본원에 제공된 조성물은 대상체 내에서 표적화된 게놈 변형을 달성하기 위해 대상체, 예를 들어 인간 대상체에게 투여된다. 일부 구현예에서, 세포는 대상체로부터 수득되고, 본원에 제공된 임의의 약제학적 조성물과 접촉된다. 일부 구현예에서, 대상체로부터 제거되고 생체외에서 약제학적 조성물과 접촉된 세포는, 선택적으로 세포에서 원하는 게놈 변형이 달성되거나 검출된 후에, 대상체 내로 재도입된다. 뉴클레아제를 포함하는 약제학적 조성물을 전달하는 방법은 공지되어 있고, 예를 들어 미국 특허 번호 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824에 기재되어 있고; 이들 모두의 개시내용은 그 전문이 본원에 참조로 포함된다. 본원에 제공된 약제학적 조성물에 대한 설명은 주로 인간에게 투여하기에 적합한 약제학적 조성물에 관한 것이지만, 당업자는 이러한 조성물이 일반적으로 동물 또는 각종 유기체, 예를 들어 수의학적 용도에 투여하기에 적합하다는 것을 이해할 것이다.
다양한 동물에게 투여하기에 적합한 조성물을 제공하기 위해 인간에게 투여하기에 적합한 약제학적 조성물의 변형은 잘 이해되고, 통상적으로 숙련된 수의학적 약리학자는 단지 보통의 실험으로 이러한 변형을 설계 및/또는 수행할 수 있다. 약제학적 조성물의 투여가 고려되는 대상체는 인간 및/또는 다른 영장류; 포유동물, 가축, 반려동물, 및 소, 돼지, 말, 양, 고양이, 개, 마우스, 및/또는 랫트와 같은 상업적으로 관련된 포유동물; 및/또는 닭, 오리, 거위, 및/또는 칠면조와 같은 상업적으로 관련된 조류를 포함하는 조류를 포함하지만 이에 제한되지 않는다.
본원에 기재된 약제학적 조성물의 제형은 약리학 분야에서 공지되거나 이후 개발될 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 활성 성분(들)을 부형제 및/또는 하나 이상의 다른 부성분과 연관시키는 단계, 및 그 후, 필요하거나 및/또는 바람직한 경우, 생성물을 원하는 단일- 또는 다중-용량 단위로 형상화 및/또는 패키징하는 단계를 포함한다. 약제학적 제형은 추가적으로 약제학적으로 허용되는 부형제를 포함할 수 있으며, 이는 본원에서 사용되는 바와 같이, 원하는 특정 투약 형태에 적합하도록, 임의의 및 모든 용매, 분산 배지, 희석제, 또는 다른 액체 비히클, 분산 또는 현탁 보조제, 표면 활성제, 등장화제, 증점제 또는 유화제, 보존제, 고체 결합제, 윤활제 등을 포함한다. Remington's The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006; 그 전문이 본원에 참조로 포함됨)는 약제학적 조성물을 제형화하는 데 사용되는 다양한 부형제 및 이의 제조를 위한 공지된 기술을 개시한다. 뉴클레아제를 포함하는 약제학적 조성물을 생성하기 위한 추가의 적합한 방법, 시약, 부형제 및 용매에 대해, 그 전문이 본원에 참조로 포함된 PCT 출원 PCT/US2010/055131 (공보 번호 WO2011/053982 A8, 2010 년 11 월 2 일 출원)을 또한 참조한다.
임의의 통상적인 부형제 배지가, 예컨대 임의의 바람직하지 않은 생물학적 효과를 생성하거나 또는 달리 약제학적 조성물의 임의의 다른 구성요소(들)와 유해한 방식으로 상호작용함으로써, 물질 또는 이의 유도체와 호환가능하지 않은 한, 이의 사용은 본 개시내용의 범주 내에 있는 것으로 고려된다.
상기 기재된 바와 같은 조성물은 유효량으로 투여될 수 있다. 유효량은 투여 방식, 치료되는 특정 조건, 및 원하는 결과에 의존할 것이다. 이는 또한 병태의 단계, 대상체의 연령 및 신체 상태, 병행 요법의 성질(존재하는 경우), 및 의사에게 널리 공지된 유사 인자에 의존할 수 있다. 치료적 적용을 위해, 이는 의학적으로 바람직한 결과를 달성하기에 충분한 양이다.
일부 구현예에서, 본 개시내용에 따른 조성물은 임의의 다양한 질환, 장애 및/또는 병태의 치료에 사용될 수 있다.
치료 방법
본 발명의 일부 측면은, 필요한 대상체를 치료하는 방법을 제공하며, 이 방법은 본원에 기술된 바와 같은 유효 치료량의 약학 조성물을 필요한 대상체에게 투여하는 단계를 포함한다. 보다 구체적으로, 치료 방법은 적어도 하나의 편집된 유전자를 갖는 하나 이상의 세포를 포함하는 하나 이상의 약제학적 조성물을 이를 필요로 하는 대상체에 투여하는 것을 포함한다. 다른 구현예에서, 본 발명의 방법은 염기 편집기 폴리펩티드(예를 들어, 자기-불활성화 염기 편집기) 및 적어도 하나의 폴리펩티드를 코딩하는 핵산 분자를 표적화할 수 있는 하나 이상의 가이드 RNA를 발현시키거나 세포 내로 도입하는 것을 포함한다.
일 구현예에서, 대상체는 적어도 0.1×105 세포, 적어도0.5×105 세포, 적어도 1×105 세포, 적어도 5×105 세포, 적어도 1×106 세포, 적어도 0.5×107 세포, 적어도 1×107 세포, 적어도 0.5×108 세포, 적어도 1×108 세포, 적어도 0.5×109 세포, 적어도 1×109 세포, 적어도 2×109 세포, 적어도 3×109 세포, 적어도 4×109 세포, 적어도 5×109 세포, 또는 적어도 1×1010 세포가 투여된다. 특정 구현예에서, 약 1×107 세포 내지 약1×109 세포, 약 2×107 세포 내지 약 0.9×109 세포, 약 3×107 세포 내지 약 0.8×109 세포, 약 4×107 세포 내지 약 0.7×109 세포, 약 5×107 세포 내지 약 0.6×109 세포, 또는 약 5×107 세포 내지 약 0.5×109 세포가 투여된다.
일부 구현예에서, 대상체는 체중의 적어도 0.1×104 cells/kg, 체중의 적어도 0.5× 104 cells/kg, 체중의 적어도 1×104 cells/kg, 체중의 적어도 5×104 cells/kg, 체중의 적어도 1×105 cells/kg, 체중의 적어도 0.5×106 cells/kg, 체중의 적어도 1×106 cells/kg, 체중의 적어도 0.5×107 cells/kg, 체중의 적어도 1×107 cells/kg, 체중의 적어도 0.5×108 cells/kg, 체중의 적어도 1×108 cells/kg, 체중의 적어도 2×108 cells/kg, 체중의 적어도 3×108 cells/kg, 체중의 적어도 4×108 cells/kg, 체중의 적어도 5×108 cells/kg, 또는 체중의 적어도 1×109 cells/kg으로 투여된다. 특정 구현예에서, 체중의 약 1×106 cells/kg 내지 체중의 약 1×108 cells/kg, 체중의 약 2×106 cells/kg 내지 체중의 약 0.9× 108 cells/kg, 체중의 약 3×106 cells/kg 내지 체중의 약 0.8×108 cells/kg, 체중의 약 4×106 cells/kg내지 체중의 약 0.7×108 cells/kg, 체중의 약 5×106 cells/kg 내지 체중의 약 0.6×108 cells/kg, 체중의 약 5×106 cells/kg 내지 체중의 약 0.5×108 cells/kg로 대상체에 투여된다.
당업자는 특정 구현예에서 고려되는 제약 조성물의 다중 투여가 원하는 치료법에 영향을 미치기 위해 필요할 수 있음을 인식할 것이다. 예를 들어, 조성물은 대상체에게 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 1년, 2년, 5년, 10년 이상의 기간에 걸쳐 1회, 2회, 3회, 4회, 5회, 6회, 7회, 8회, 9회 또는 10회 이상 투여될 수 있다. 임의의 이러한 방법에서, 방법은 대상체에게 유효량의 편집된 세포, 염기 편집기 시스템 또는 이러한 시스템을 코딩하는 폴리뉴클레오티드를 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 하루에 1회 이상의 용량으로 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 하루에 2회 이상의 용량으로 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 하루에 3회 이상의 용량으로 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 주당 1회 이상의 용량으로 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 주당 2회 이상의 용량으로 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 주당 3회 이상의 용량으로 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 매월 1회 이상의 용량으로 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 매월 2회 이상의 용량으로 투여하는 것을 포함할 수 있다. 임의의 이러한 방법에서, 방법은 편집된 세포의 유효량을 매월 3회 이상의 용량으로 투여하는 것을 포함할 수 있다.
본원에서 고려되는 약제학적 조성물의 투여는 주입, 수혈 또는 비경구를 포함하나 이에 제한되지 않는 통상적인 기술을 사용하여 수행될 수 있다. 일부 구현예에서, 비경구 투여에는 혈관내, 정맥내, 근육내, 동맥내, 척수강내, 종양내, 피내, 복강내, 경기관, 피하, 표피하, 관절내, 피막하, 거미막하 및 흉골내로 주입 또는 주사하는 것이 포함된다.
일부 구현예에서, 본원에 기술된 조성물(예를 들어, 편집된 세포, 염기 편집기 시스템)은 인간 대상체의 체중 1kg당 약 0.5-30mg의 투여량으로 투여된다. 다른 구현예에서, 투여되는 조성물의 양은 인간 대상체의 체중 1kg당 약 0.5-20mg이다. 다른 구현예에서, 투여되는 조성물의 양은 인간 대상체의 체중 1kg당 약 0.5-10mg이다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상체의 체중 1kg 당 약 0.04 mg, 약 0.08 mg, 약 0.16 mg, 약 0.32 mg, 약 0.64 mg, 약 1.25 mg, 약 1.28 mg, 약 1.92 mg, 약 2.5 mg, 약 3.56 mg, 약 3.75 mg, 약 5.0 mg, 약 7.12 mg, 약 7.5 mg, 약 10 mg, 약 14.24 mg, 약 15 mg, 약 20 mg, 또는 약 30 mg이다. 또 다른 구현예에서, 투여되는 복합 조성물의 양은 인간 대상체의 체중 1kg 당 약 1.92 mg, 약 3.75 mg, 약 7.5 mg, 약 15.0 mg, 또는 약 30.0 mg이고, 조성물은 주 2회 투여된다. 다른 구현예에서, 투여되는 조성물의 양은 인간 대상체의 체중 1kg당 약 1.28 mg, 약 2.56 mg, 약 5.0 mg, 약 10 mg, 또는 약 20 mg이고, 조성물은 일주일에 2회 투여된다. 다른 구현예에서, 투여되는 조성물의 양은 인간 대상체의 체중 1kg당 약 1.92 mg, 약 3.75 mg, 약 7.5 mg, 약 15.0 mg, 또는 약 30.0 mg이고, 조성물은 일주일에 1회 투여된다. 다른 구현예에서, 투여되는 조성물의 양은 인간 대상체의 체중 1kg당 약 1.28 mg, 약 2.56 mg, 약 5.0 mg, 약 10 mg, 또는 약 20 mg이고, 조성물은 일주일에 1회 투여된다. 다른 구현예에서, 투여되는 조성물의 양은 인간 대상체의 체중 1kg당 약 1.92 mg, 약 3.75 mg, 약 7.5 mg, 약 15.0 mg, 또는 약 30.0 mg이고, 조성물은 3일, 5일 1회 또는 7일 동안 7번 투여된다. 다른 구현예에서, 조성물은 1일 1회, 7일 기간에 7회 정맥내로 투여된다. 또 다른 구현예에서, 투여되는 조성물의 양은 인간 대상체의 체중 1kg당 약 1.28mg, 약 2.56mg, 약 5.0mg, 약 10mg, 또는 약 20mg이고, 조성물은 3일, 5일 1회 또는 7일 동안 7번 투여된다. 다른 구현예에서, 조성물은 1일 1회, 7일 기간에 7회 정맥내로 투여된다.
일부 구현예에서, 조성물은 0.25시간, 0.5시간, 1시간, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 또는 12시간의 기간에 걸쳐 투여된다. 다른 구현예에서, 조성물은 0.25-2시간의 기간에 걸쳐 투여된다. 다른 구현예에서, 조성물은 1시간에 걸쳐 점진적으로 투여된다. 다른 구현예에서, 조성물은 2시간에 걸쳐 점진적으로 투여된다.
키트
본 발명은 염기 편집기를 자기-불활성화하는 기능을 갖춘 키트를 제공한다. 일부 구현예에서, 키트는 자기-불활성화 염기 편집기를 코딩하는 이종성 인트론을 포함하는 폴리뉴클레오티드를 포함한다. 일부 구현예에서, 인트론은 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 또는 이의 단편을 코딩하는 폴리뉴클레오티드에 존재한다. 일부 구현예에서, 인트론은 데아미나아제를 코딩하는 폴리뉴클레오티드에 존재한다. 일부 구현예에서, 키트는 하나 이상의 가이드 폴리뉴클레오티드(예를 들어, 게놈 서열을 표적으로 하는 가이드 폴리뉴클레오티드, 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드에 존재하는 이종성 인트론을 표적으로 하는 가이드 폴리뉴클레오티드)를 추가로 포함한다. 일부 구현예에서, 키트는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 및 데아미나아제를 포함하는 자기-불활성화 염기 편집기, 및 하나 이상의 가이드 폴리뉴클레오티드를 포함하는 염기 편집기 시스템을 포함한다. 일부 구현예에서, 키트는 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함하며, 여기서 폴리뉴클레오티드의 오픈 리딩 프레임은 이종성 인트론을 포함한다. 일부 구현예에서, 키트는 하나 이상의 가이드 폴리뉴클레오티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함한다. 일부 구현예에서, 키트에는 본원에 제공된 폴리뉴클레오티드, 염기 편집기, 염기 편집기 시스템, 세포 또는 벡터 중 임의의 것을 포함하는 세포가 포함된다.
키트는 본 명세서에 기술된 염기 편집기(예를 들어 자기-불활성화 염기 편집기)를 사용하거나 불활성화하기 위한 지시서를 추가로 포함할 수 있다. 다른 실시예에서, 지시서는 다음 중 적어도 하나를 포함한다: 주의 사항; 경고; 임상 연구; 및/또는 참조. 지시서는 용기에 직접 인쇄되거나(있는 경우), 용기에 부착된 라벨로, 또는 용기에 들어 있거나 용기와 함께 제공되는 별도의 시트, 팜플렛, 카드 또는 폴더로 인쇄될 수 있다. 추가 구현예에서, 키트는 적합한 작동 매개변수에 대한 라벨 또는 별도의 삽입물(포장 삽입물) 형태의 지시서를 포함할 수 있다. 또 다른 구현예에서, 키트는 검출, 교정 또는 표준화를 위한 표준(들)으로 사용될 적절한 양성 및 음성 대조 또는 대조 샘플이 들어 있는 하나 이상의 용기를 포함할 수 있다. 키트는 (멸균) 인산염 완충 식염수, 링거액 또는 포도당 용액과 같은 약학적으로 허용되는 완충액을 포함하는 두 번째 용기를 추가로 포함할 수 있다. 이는 다른 완충제, 희석제, 필터, 바늘, 주사기 및 사용 지침이 포함된 패키지 삽입물을 포함하여 상업적 및 사용자 관점에서 바람직한 다른 재료를 추가로 포함할 수 있다.
다른 구현예에서, 설명서는 다음 중 적어도 하나를 포함한다: 예방책; 경고; 임상 연구; 및/또는 참고문헌. 설명서는 용기(존재하는 경우) 상에 직접 인쇄되거나, 또는 용기에 부착된 라벨로, 또는 용기 내에 또는 용기와 함께 공급되는 별도의 시트, 팜플렛, 카드, 또는 폴더로 인쇄될 수 있다. 추가 구현예에서, 키트는 적합한 작동 매개변수에 대한 라벨 또는 별도의 삽입물(패키지 삽입물) 형태의 설명서를 포함할 수 있다. 또한 또 다른 구현예에서, 키트는 검출, 교정, 또는 표준화를 위한 표준(들)으로 사용될 적절한 양성 및 음성 대조군 또는 대조군 샘플이 있는 하나 이상의 용기를 포함할 수 있다. 키트는 (멸균) 포스페이트-완충 식염수, 링거 용액, 또는 덱스트로스 용액과 같은 약제학적으로 허용되는 완충제를 포함하는 제2 용기를 추가로 포함할 수 있다. 이는 상업적 및 사용자 관점에서 바람직한 다른 물질을 추가로 포함할 수 있으며, 이는 다른 완충제, 희석제, 필터, 바늘, 주사기, 및 사용 설명서가 있는 패키지 삽입물을 포함한다.
본 발명의 실행은, 달리 나타내지 않는 한, 당업자의 이해의 범위 내에 있는 분자 생물학(재조합 기술 포함), 미생물학, 세포 생물학, 생화학 및 면역학의 통상적인 기술을 이용한다. 이러한 기술은 “Cloning: A Laboratory Manual", second edition (Sambrook, 1989); "Oligonucleotide Synthesis" (Gait, 1984); "Animal Cell Culture" (Freshney, 1987); "Methods in Enzymology" "Handbook of Experimental Immunology" (Weir, 1996); "Gene Transfer Vectors for Mammalian Cells" (Miller 및 Calos, 1987); "Current Protocols in Molecular Biology" (Ausubel, 1987); "PCR: The Polymerase Chain Reaction", (Mullis, 1994); "Current Protocols in Immunology" (Coligan, 1991)와 같은 문헌에 충분히 설명되어 있다. 이러한 기술은 본 발명의 폴리뉴클레오티드 및 폴리펩티드의 생산에 적용가능하며, 그 자체로 구현예에 본 발명을 제조하고 실행하는 데 고려될 수 있다. 특정 구현예에 특히 유용한 기술은 하기 섹션에서 논의될 것이다.
하기 실시예는 본 발명의 검정, 스크리닝, 및 치료 방법을 만들고 사용하는 방법에 대한 완전한 개시 및 설명과 함께 당업자에게 제공하기 위해 제시되며, 발명자가 자신의 발명으로 간주하는 범위를 제한하는 것을 의도하지 않는다.
실시예
실시예 1: 데아미나아제 도메인의 촉매 불활성화에 의한 자기-불활성화
통상적인 아데닌 염기 편집기(ABE)는 진화된 TadA 효소를 활용하여 아데닌 DNA 염기를 탈아미노화하여 2'-데옥시 이노신 생성물을 생성하며, 이는 DNA 복구 동안 세포에 의해 2'-데옥시구아노신으로 인식된다 (Gaudelli, N. M., 등. (2017). Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature, 551(7681), 464-471; Gaudelli, N. M., 등. (2020). Directed evolution of adenine base editors with increased activity and therapeutic application. Nat Biotechnol, 38(7), 892-900; Richter, M. F., 등. (2020). Phage-assisted evolution of an adenine base editor with improved Cas domain compatibility and activity. Nature Biotechnology, 38(7), 883-891). TaA는 데탈아미노화 활성을 갖는 4개의 촉매성 잔기를 함유한다: His57 (H57), Glu59 (E59), Cys87 (C87), or Cys90 (C90) (Kim, J., 등. (2006). Structural and kinetic characterization of Escherichia coli TadA, the wobble-specific tRNA deaminase. Biochemistry, 45(20), 6407-6416).
1) 코딩 DNA를 세포에 전달한 후 ABE의 자기-불활성화에 이러한 부위를 활용할 수 있는지, 및 2) 두 개의 가이드 RNA 및 ABE를 코딩하는 DNA의 공동 전달이, 관심 대상 게놈 표적 부위 및 ABE를 코딩하는 에피소멀(episomal) DNA 를 동시에 효과적으로 편집하여 TadA 촉매 잔기를 비활성 아미노산으로 변환할 수 있는지를 확인하기 위하여 개념 증명 분석이 수립되었다 (도 1A). 분석은 HEK293T 세포의 플라스미드 리포펙션(plasmid lipofection)을 사용하였는데, DNA 벡터는 4개의 TadA 촉매 잔기(His57 (H57), Glu59 (E59), Cys87 (C87), 또는 Cys90 (C90)) 중 하나를 표적으로 하는 가이드 RNA 및 세포 게놈 내의 특정 부위를 표적하는 제2 가이드 RNA를 코딩한다. 세포를 리포펙션 후 5일 동안 배양하고, 세포 게놈 DNA와 회수된 플라스미드 DNA를 모두 포함하는 세포 용해물에서 생성된 각 표적 앰플리콘에 대해 일루미나 차세대 시퀀싱을 수행하였다. 편집된 경우 TadA 잔기가 촉매적으로 불활성인지 확인하기 위해 상응하는 돌연변이가 ABE7.10-m의 TadA 서브유닛에 있는 대조 플라스미드(아미노산 치환 H57R, E59G, C87R, 또는 C90R를 제공)에 미리 장착(pre-installed)되었고, 이들의 염기 편집 활성은 세포 게놈 표적 부위에서만 평가되었다. 각 경우에, 미리 장착된 돌연변이는 관심 부위에서 사실상 편집을 생성하지 않았고 (A에서 G로의 변환 <0.1%), 이는 이러한 TadA 돌연변이가 비활성화되었음을 컨펌하였다(도 1B). 기능성 ABE7.10-m으로 형질감염된 샘플에서 게놈 부위에서의 편집과 회수된 염기 편집기 플라스미드에서의 편집을 모두 평가하였다. TadA의 표적 부위 중 2개(H57R 및 E59G)만이 해당 자기-불활성화 가이드 RNA에 의해 상당히 편집된 반면, 게놈 표적에서의 편집 속도는 스크램블된 자기-불활성화 가이드 RNA(scrambled self-inactivating guide RNA)를 함유하는 대조군의 속도와 유사했다. 이는 촉매 부위에서의 자기-편집 비율이 상대적으로 낮았지만 (A에서 G로의 변환 <5%), 염기 편집기 ABE를 코딩하는 DNA를 표적하는 것이 가능했고, 호스트 게놈 내에서 온-타겟 편집 효율은 편집기의 자기-불활성화로 인해 부정적 영향을 받지 않았다.
자기-불활성화 속도가 향상될 수 있는지 여부를 결정하기 위해 TadA 내의 코돈 사용을 최적화하여 편집이 발생하도록 최적화된 스페이서 서열을 생성하였다. TadA 내에서 사용가능한 NGG PAM이 주어지면, E59 코돈의 표적 아데노신은 ABE7.10의 편집 윈도우 내에서 더 유리한 위치로 예상되는 위치와 최근 설명된 ABE8 변이체 (E59의 경우 A7 위치 vs. H57의 경우 A9 위치)(도 1C)에 위치한다. 따라서 E59 위치가 최적화되었다. 표적 영역에서 TadA의 가능한 모든 동의어 코돈 사용은 생물정보학적으로 분석되었으며, 높은 RSCU (relative synonymous codon usage) 점수에 우선순위를 부여하고 각각의 상응하는 가이드 RNA에 대해 낮은 in silico 오프 타겟 예측 프로파일에 우선순위를 지정하여 순위를 매겼다. 그런 다음, ABE7.10-m에 비해 관심있는 세포 게놈 표적에 대해 더 높은 편집 효율성을 별도로 입증한 ABE8.5-m의 맥락에서 17개의 후보를 테스트했다. 플라스미드 기반 분석을 사용하여 분석한 편집의 자기-불활성화 비율은 다양하고 전반적으로 낮았으나(<5%)(도 1D), 반면 세포 게놈 부위에서의 편집은 변이체 전반에 걸쳐 약 30~50% 범위였다. 새로운 변이체 4개, 1세대 변이체 2개, 스크램블 가이드 RNA를 특징으로 하는 1세대 변이체 (모두ABE8.5-m의 맥락에 있음)이, 이후에 AAV2로 패키징되어 ARPE로 변환되었다. 세포 게놈 및 AAV 이식유전자(transgene) 내 편집 결과는 최대 5주까지 여러 시점에서 평가되었다. 세포 게놈 유전자좌는 5주차에 테스트된 모든 변종에 걸쳐 NGS 판독의 약 70~76%에서 편집되었지만(도 1E), 가장 최적화된 변이체에서 동일 시점에서의 복구된 편집 DNA에서는 자기-불활성화 편집량(abundance of self-inactivation edits)이 낮았다 (3.54%) (도 1F). 그러나 동일 분석에서 최적화되지 않은 1세대 변이체와 비교하면 새로운 변이체의 자기-불활성화 비율은 최대 10.4-배까지 향상되었다.
ABE DNA의 자기-불활성화 비율은 일반적으로 플라스미드-기반 및 바이러스-기반 in vitro 분석에서 낮았지만, 회수된 에피소멀 DNA에 대한 자기 불활성화를 측정하는 것에서는 기능적 불활성화 비율이 과소보고될 수 있다는 점이 의심되었다. 예를 들어, 형질 도입된 AAV2의 일부만이 in vitro에서 세포핵으로 수송되는 것으로 보고되었다. (Xiao, P.-J., Li, C., 등. (2012). Quantitative 3D Tracing of Gene-delivery Viral Vectors in Human Cells and Animal Tissues. Molecular Therapy, 20(2), 317-328). 분석에서 AAV 또는 LNP 입자의 일부가 세포질 내에 캡슐화되어 있는 경우, 아마도 염기 편집기에서 접근할 수 없으며, 추가 염기 편집기 mRNA 및 단백질을 만들기 위해 전사되지도 않을 것이다. 세포 내 mRNA는 주어진 시간에 발현되는 단백질을 더 잘 나타내기 때문에, 측정된 양의 차이를 조사하기 위해 mRNA에서 준비된 DNA와 cDNA 모두에 대해 표적화된 앰플리콘 시퀀싱을 수행하였고, 새로운 실험에서 자기-불활성화의 측정된 양의 차이를 조사하였다. 5개의 AAV2-패키지 편집기 변이체와 가이드 RNA가 ARPE-19 세포에 형질도입되었다. 게놈 표적 부위에서, 형질도입 후 2주 후에 테스트된 5개 변이체 모두에서 편집이 강력하였다 (A에서 G로 편집 ~80%) (도 1G). 자기-불활성화 비율은 회수된 에피소멀 DNA에서 측정했을 때 다른 변이체를 사용한 이전 연구와 다시 유사했지만 (<3%), mRNA에서 제조된 cDNA의 표적화된 앰플리콘 시퀀싱은 편집된 ABE 전사체의 비율이 5가지 변이체에서 평균 48.5%에 근접한 것으로 나타났다. 이러한 결과는 성공적으로 핵으로 전달되어 활발하게 전사된 ABE DNA의 비율이 효율적으로 자기-불활성화되어-2주 후에 거의 50% 가까이 비활성화됨-게놈 표적에서의 동시 편집이 매우 효율적으로 유지됨을 시사한다. 이러한 결과는 또한 유사한 접근방식이 CBE의 자기-불활성화를 위해 수행될 수 있음을 시사하는데, 예를 들어 아연 배위를 담당하는 APOBEC 활성 부위 잔기(Cys 또는 His)는 C에서 T 염기로의 변환을 목표로 하여 두 경우 모두 Tyr을 생성할 수 있다.
실시예 2. 염기 편집 시작 코돈의 돌연변이에 의한 자기-불활성화
또 다른 접근법에서는 ABE의 시작 코돈이 편집기 시작 코돈의 첫 번째 뉴클레오티드를 염기 편집하여 자기-불활성화를 목표로 하였으며, Met1Val 돌연변이(ATG>GTG)가 발생하였다. 대안적으로, 상보적인 DNA 가닥을 표적화함으로써 시작 코돈의 두 번째 뉴클레오티드에서 염기 편집이 가능하며, 이는 Met1Thr 돌연변이(ATG>ACG)를 초래한다. 먼저 이러한 돌연변이가 염기 편집기의 번역을 효과적으로 방지하는지 확인하기 위해 원하는 돌연변이를 ABE8.5-m 발현 플라스미드에 미리 설치하였다. Met1이 돌연변이되면 TadA의 다운스트림 Met12가 대체 시작 코돈으로 기능하는 경우 절단 편집기(truncated editor)가 생성될 가능성이 있다. 이 문제를 회피하기 위한 노력의 일환으로 프레임 외부 ATG 서열이 Met12의 업스트림에 존재하도록 His8의 코돈 사용을 조정하고 세포 게놈 내 관심 부위에서의 염기 편집을 측정하여 돌연변이들의 편집 발현 방지능을 결정하였다 (도 2A). Met1Thr 돌연변이는 Met1Val보다 관심 부위에서의 편집을 더 효과적으로 방지하였고, 프레임외 시작 코돈의 추가로 편집이 절반으로 더 감소하였다 (도 2B).
스트렙토코쿠스 파이오게네스(Streptococcus pyogenes) Cas9의 니카아제 변이체를 함유하는 ABE8.5-m DNA에서 Met1Thr 염기 편집을 수행하기 위해 TadA 내에서 프로토스페이서의 편집 윈도우 내부에 자기-불활성화를 위한 표적 염기를 배치할 위치에 NGG PAM서열이 요구되었다. 이러한 조정을 수행하기 위해, TadA 돌연변이 Phe8Trp, Phe8Val 또는 Phe8Ala를 갖는 편집기의 변이체를 제조하여 Met1에서 염기 편집에 활용될 수 있는 3개의 서로 다른 NGG PAM 서열을 생성하였다 (도 2C). 각 변이체는 변경되지 않은 대조군 ABE8.5-m과 비교하여 동일한 효율성으로 세포 개놈 부위를 편집할 수 있었으며, 이는 TadA에서 Phe8의 이러한 돌연변이가 잘 허용된다는 것을 시사한다. 회수된 에피소멀 편집기 DNA의 표적 앰플리콘 시퀀싱에 의해 측정된 자기-불활성화 비율은 각 변이체에 대해 가변적이고 낮았으며 (<3% 염기 변환), 모든 새로운 변이체에 걸쳐 게놈 표적의 동시 편집은 불활성화 가이드 RNA가 결여된 대조군 ABE8.5-m 만큼 효율적이었다 (도 2E). 이러한 결과는 세포 게놈 내의 원하는 위치에서 편집 효율성을 희생하지 않고 단일 A-to-G (A에서 G로의) 염기 편집을 통해 시작 코돈을 비-Met 아미노산으로 변환함으로써 염기 편집기를 자기-불활성화할 수도 있음을 보여준다. 이러한 결과는 또한 번역 개시를 방지하거나 억제하기 위해 Met 시작 코돈이 Ile로 전환될 수 있는 CBE 의 자기-불활성화에 대해 유사한 접근법이 수행될 수 있음을 시사한다.
실시예 3. 맞춤형, 자기-불활성화를 위해 염기 편집기를 코딩하는 폴리뉴클레오티드에 인트론 삽입
ABE 자기-불활성화의 유용성을 최대화하기 위해서는, 선택된 ABE의 임의의 변이체에 전반에 걸쳐 이상적 접근 방식이 일반화되어야 하며, 이는 PAM 요구사항(PAM requirement), 편집 윈도우, 및 주어진 표적 부위에서의 상대적 활성에 따라 달라질 수 있다. TadA 활성 부위 잔기, 시작 코돈, 또는 편집기 내 기타 특정 잔기 내에서 편집하여 ABE를 자기-불활성화하기 위한 전략은, 각각 표적 부위의 국소 아미노산 서열 및 효소에 의해 허용되는(tolerated) 임의의 허용 돌연변이(permissive mutations)에 의해 제한된다. 이러한 한계에 대한 해결책 개발을 위해, ABE를 코딩하는 DNA에 작은 인트론을 혼입하는 것의 유용성을 조사하였다 (도 3A). 인트론은 일반적으로 5'-말단에 콘센서스 스플라이스 공여체 서열인 GT, 및 3'-말단에 콘센서스 스플라이스 수용체 서열, AG를 특징으로 한다. 이러한 각 부위는 ABE의 표적이 되어 콘센서스 서열을 각각 GC 및 GG로 변환함으로써 스플라이싱을 중단할 수 있다. 편집기 내의 스플라이스 부위 중 하나가 중단되면, 인트론 시퀀스가 완전히 또는 부분적으로 유지될 수 있으며 이로 인해 염기 편집기 시퀀스의 조기 종료 또는 프레임 이동(frameshift)이 발생할 수 있다. 이 접근법의 주요 진보는 인트론을 맞춤화하고, 이상적인 편집 위치, 프로토스페이서 및 PAM을 제공하는 편집기의 도움이 되는 부분 내에 삽입할 수 있어 자기-불활성화 표적 서열의 설계에 유연성을 제공한다는 것이며, 선택한 염기 편집기 변이체에 따라 지시하는 바와 같은, 효율적인 염기 편집을 촉진할 수 있다는 점이다.
CBE의 인트론-기반 불활성화는 비코딩 DNA 가닥의 C에서 T로의 편집을 통해 GT를 AT로 변환하거나 AG를 AA로 각각 변환함으로써 표준(canonical) 스플라이스 공여체 또는 수용체 부위를 파괴함으로써 가능하다. 또한, 인트론은 대안적으로 Cas9 또는 링커 영역과 같은 편집기의 다른 서브유닛에 삽입될 수 있고, 이는 순환 순열된(circularly permuted) 염기 편집기 변이체 또는 편집기의 다른 구성을 불활성화하는 데 더 유리할 수 있다(Huang, T. P., 등. (2019). Circularly permuted and PAM-modified Cas9 variants broaden the targeting scope of base editors. Nat Biotechnol, 37(6), 626-631; Nguyen Tran, M. T., 등. (2020) Engineering domain-inlaid SaCas9 adenine base editors with reduced RNA off-targets and increased on-target DNA editing. Nat Commun, 11(1), 4871).
ABE의 진화된 TadA 컴포넌트는 원래 박테리아에서 유래하였으므로 기본적으로 인트론이 부족하다. 인트론의 포함이 ABE 발현에 해로운지 확인하기 위해 인트론 함유 ABE 변이체에 의해 촉매되는 게놈 표적 부위에서 편집 속도를 측정하고 인트론이 없는 대조군 ABE와 비교하였다. 자기-불활성화 가이드 RNA는 실험에 포함되지 않았다. 편집기의 전체 크기를 최대한 작게 유지하기 위해 작은 인트론(≤ ~150 bp)만 테스트하였다. 인간 베타 글로빈 및 마우스 IgG 유전자로부터 유래된 9개의 인간 인트론 세트와 1개의 키메라 인트론을 TadA의 코돈 87 바로 뒤에 삽입하였다. 또한, 인트론의 위치가 편집 속도에 영향을 미치는지 확인하기 위해 인트론의 서브유닛을 TadA에서 코돈 62 바로 뒤 또는 코돈 23의 두 번째 뉴클레오티드 뒤에 삽입하였다. 각각의 인트론 위치는 검사 중인 편집기 변이체의 알려진 염기 편집 윈도우 내에 필요한 인트론 편집을 배치하는 TadA 코딩 서열 내의 NGG PAM 서열에 대한 상대적인 근접성을 위해 선택되었다. HEK293T 세포의 게놈 표적 부위에서 이러한 인트론 함유 변이체의 편집 효율성은 인트론 서열과 TadA 내 삽입 위치에 따라 달라졌으며 (도 3B), 이는 일부 구성이 다른 구성보다 더 효율적으로 스플라이싱되었음을 시사한다. TadA 잔기 87 (NF1, PAX2, EEF1A1, Chimera, and SLC50A1)에 있는 5개의 서로 다른 인트론은 게놈 DNA에서 높은 편집 효율성을 유지하였다. 또한 인트론 키메라 및 ABCB11은 TadA의 잔기 62 또는 23에 삽입될 때 상대적으로 높은 수준의 편집을 허용하였다. 나머지 4개의 인트론(BRSK2, PLXNB3, TMPRSS6, and IL32)을 포함하는 ABE 변이체는 관심 부위에서 편집을 생성하지 않거나 대조군에 비해 편집 속도가 크게 감소하였다. TadA 잔기 87에서 7개의 추가 인트론의 활성을 테스트한 결과 모두 동등하게 잘 허용되었다(tolerated) (도 3C). 이러한 데이터는 맞춤형 인트론 서열이 게놈 부위에서 편집 활성을 희생하지 않고 ABE 유전자의 TadA 서브유닛에 삽입될 수 있음을 나타낸다.
이 시스템에서는, 진행생물에서 발견되는 공통 스플라이스 공여체 및 수용체 서열을 특징으로 하는 인트론이 선택되었다. 그러나 이러한 디뉴클레오티드 서열은 모든 진핵생물 인트론에 걸쳐 완전히 보존되지 않으며 돌연변이에 대한 민감도는 다양할 수 있다. 따라서 원하는 스플라이스 수용체 부위 또는 공여체 부위 편집은 TadA 인트론 내에 미리 설치되었고, 염기 편집 활동을 게놈 부위에서 평가하여 인트론이 없는 ABE8.5-m과 비교하여 해당 불활성화 수준을 결정하였다. TadA 잔기 87의 인트론 NF1, PAX2, EEF1A1, ANTXRL, PKHD1L1, PADI1, HMCN2, ENPEP-gecko, 및 HMCN2-salmon은 미리 설치된 스플라이스 수용체 돌연변이에 의해 완전히 파괴되었다 (도 3D). 이 9개의 인트론 구성은 이전 실험에서 볼 수 있듯이 돌연변이가 없는 경우 가장 효율적인 ABE 변이체 중 하나였고, 이는 이러한 변이체가 단일 A-to-G(A에서 G로의 변환) 염기의 존재 여부에 따라 바이너리 모드(binary fashion)로 기능함을 시사한다. NR1 및 PAX2 인트론도 스플라이스 공여체 돌연변이에 의해 불활성화 되었지만 EEF1A1은 그렇지 않았다. 키메라 인트론은 스플라이스 공여체 또는 수용체 부위의 돌연변이에 의해 완전히 교란되지 않은 유일한 변종이었다. 미리 설치된 스플라이스 수용체 또는 공여체 돌연변이가 있거나 없는 추가 구성도 테스트되었으며, 이는 TadA 잔기 18, 59 또는 129에 위치한 NF1 인트론이 스플라이스 수용체 돌연변이에 의해 완전히 불활성화되고 EEF1A1이 TadA 잔기 18 또는 59에 위치할 때 스플라이스 수용체 돌연변이에 의해 불활성화되었음을 추가로 입증하였다 (도 3E). 이러한 데이터는 TadA 내의 비천연 인트론(unnatural intron)의 스플라이싱이 스플라이싱 부위에서 A에서 G로의 치환에 의해 완전히 중단될 수 있으며, 편집이 DNA의 염기 편집 활동을 제거할 수 있음을 보여주었다. 또한, 이러한 데이터는 편집기를 사용하여 인트론을 배치하면 스플라이스 부위 돌연변이에 대한 민감도와 인트론의 전반적인 스플라이싱 성능에 영향을 미칠 수 있음을 보여준다.
인트론 변이체가 각각의 스플라이스 부위에서 효율적으로 염기 편집될 수 있는지 확인하기 위해 HEK293T 세포를 ABE 변이체, 매칭되는 자기-불활성화 가이드 RNA, 및 게놈 부위를 표적으로 하는 가이드 RNA를 코딩하는 플라스미드로 리포펙션하였다. TadA 잔기 87에 있는 인트론 NF1 및 PAX2의 스플라이스 공여체 부위를 표적으로 하여 게놈 부위에서 높은 편집 속도를 유지하였고, 인트론 공여체 부위 내 자기-불활성화 편집 정도는 회수된 플라스미드 DNA에서 ~6%만큼 높았다 (도 3F). 대안적으로, TadA 잔기 87에서 NF1의 스플라이스 수용체 부위에서의 자기-불활성화 편집 양은 30%였으며, 동시에 게놈 부위에서도 효율적인 편집을 유지하였다 (도 3G).
TadA 잔기 87 (NF1, PAX2, 및 EEF1A1)에서 잘 수행된 인트론의 추가 구성을 평가하였다. 이 세트는 TadA의 코돈 129, 59, 및 18 뒤에 삽입되었고, 상응하는 미리 설치된 스플라이스-수용체 돌연변이도 준비되었다. 미리 설치된 돌연변이가 결여된 NF1 변이체의 편집 효율은 인트론이 삽입된 위치에 따라 달라졌다 (도 3H). PAX2 및 EEF1A1은 모든 구성에서 높은 게놈 편집을 유지했으나, 돌연변이가 사전 설치된 경우 이러한 인트론은 TadA 내의 모든 위치에서 일관되게 불활성화되지 않았다.
자기-불활성화 가이드 RNA에 의해 표적화되는 이들 변이체 각각의 능력을 조사하였다. TadA 잔기 59에서 NF1의 자기-불활성화 속도는 TadA 잔기 87에서 NF1의 것과 유사했다 (도 3I). 또한, 인트론 서열 ANTXRL, PKHD1L1, PADI1 및 ENPEP-gecko는 스플라이스 수용체 부위에서 가이드 의존적 자기-불활성화에 대해 TadA 잔기 87에서 테트스되었으며, 이는 이 인트론 세트는 이 구성에서 돌연변이에 의해 완전히 불활성화되는 것으로 이전에 검증되었기 때문이다. 이들은 동일 실험에서 NF1, PAX2 및 EEF1A1과 비교되었으며, NF1이 자기-불활성화 가이드 RNA에 의해 가장 효율적으로 표적화되었고, PAX2 및 ANTXRL이 그 뒤를 이었다 (도 3J). 나머지 인트론 각각은 유사하고 낮은 수준의 가이드 RNA 의존적 자기-불활성화를 나타냈다. 특히, 인트론 또는 자기-불활성화 가이드 RNA가 결여된 ABE8.5-m 변이체와 비교하여, 이들 예 중 어느 것에서도 자기-불활성화 가이드 RNA의 존재로 인해 게놈 부위의 염기 편집 활동이 방해받지 않았다. 이러한 데이터는 인트론이 TadA 내에 전략적으로 배치되어 가이드 RNA 의존적 방식으로 시간이 지남에 따라 염기 편집 활동을 차단하는 데 활용될 수 있는 수정 가능한 염기 편집 표적 부위를 제공할 수 있음을 보여주었다. 이러한 결과는 또한 자기-불활성화 속도가 추가 가이드 RNA에 의해 지시되는 호스트 게놈 DNA 내의 원하는 부위에서 효율적인 염기 편집을 동시에 허용할 만큼 충분히 느리다는 것을 입증하였다.
회수된 에피소멀 DNA의 시퀀싱에 의한 자기-불활성화 비율이 인트론 기반 연구에서 자기-불활성화의 기능적 수준을 과소보고하는지 확인하기 위해, TadA 잔기 87에서 NF1 또는 PAX2 인트론, 스플라이스 수용체 부위를 표적하는 매칭 자기-불활성화 가이드 RNA, 및 게놈 부위를 표적하는 제2 가이드 RNA를 함유하는 ABE8.5-m을 발현하는 플라스미드로 리포펙션을 다시 수행하였다. 표적 앰플리콘 시퀀싱을 통해 인트론 변이체로 처리된 세포의 게놈 DNA에서 관찰된 편집양은 인트론 또는 자기-표적화 가이드 RNA가 없는 대조군 ABE8.5-m 편집기의 편집양과 유사했다. 회수된 에피소멀 DNA로부터 측정된 자기-불활성화 편집양은 NF1 및 PAX2에 대해 각각 5.38% 및 4.16%였다. 세포의 RNA로부터 기능성 불활성화 비율을 결정하기 위해, RNAseq 분석을 수행하였으며, 스플라이싱된 ABE 전사체와 스플라이싱되지 않은 ABE 전사체 사이의 크기 차이로 인하여 발생할 수 있는 가능한 PCR 편향을 피하기 위해 전체 mRNA에 대해 분석하였다. 플라스미드에서 측정된 인지된 불활성화 비율과는 완전히 대조적으로, NF1 전사체의 >84%는 편집되고, 스플라이싱되지 않은 인트론을 함유했으며, 전사체의 3.7%만이 기능적으로 스플라이싱되었다 (도 3L). 나머지 ABE 전사체의 대부분 (11.25%)에는 전사체 내에 유지된 편집되지 않은 인트론이 함유되어 있어 번역 중에 조기 종료가 발생하고, 소수의 전사체(0.66%)가 대안적으로 스플라이싱되었다. 유사하게, PAX2 전사체의 >79%는 편집되고, 스플라이싱되지 않은 인트론을 포함하였으며, 전사체의 ~16.5%는 기능적으로 스플라이싱되었다 (도 3M). 이러한 데이터는 5일간의 실험이 끝났을 때 활발하게 전사된 ABE DNA의 대부분이 스플라이싱 발생을 방지하는 편집된 인트론 서열을 포함하고 있음을 시사하므로 염기 편집기의 발현이 감소했을 것이라고 또한 합리적으로 가정할 수 있다.
마지막으로, TadA 잔기 87에 위치한 NF1 인트론을 AAV 전달로 테스트하였다. 편집기 및 가이드 RNA는 AAV2에 패키징되었고, 이는 in vitro에서 ARPE-19 세포를 변환하는데 사용되었으며, 편집 속도는 변환 후 2-주에 평가되었다. 표적 앰플리콘 시퀀싱을 통해 게놈 DNA 편집은 원하는 표적 부위(~76% A-에서-G)에서 강력했지만, 회수된 AAV 게놈의 편집 비율은 인트론의 스플라이스 수용체 부위에서 낮았다(~5.4% A-에서-G) (도 3N). 대조적으로, 전체 mRNA에 대한 RNA-seq 분석은 전사체의 ~88.5%가 편집되고, 유지된 인트론을 포함하는 훨씬 더 높은 자기-불활성화 효율을 보여주었다. 이 데이터는 AAV에 의해 전달된 염기 편집기가 두 번째 가이드 RNA에 의해 수행되는 효율적인 게놈 편집을 허용하는 시간 단위로 스플라이싱을 변경하여 자기-불활성화될 수 있음을 보여준다.
실시예 4: 표적 게놈 부위의 동시 자기-불활성화 및 염기 편집의 효율성 평가
ABE8.5-m 및 가이드 RNA의 다양한 조합을 포함하는 염기 편집기 시스템을 사용하여 동시 자기-불활성화 및 표적(즉, “원하는”) 게놈 부위 염기 편집의 효율성을 평가하기 위한 실험이 수행되었다. 가이드 RNA 중 하나는 표적 게놈 부위를 편집하는 데 사용되었고, 다른 하나는 ABE8.5-m의 자기-불활성화에 사용되었다. 자기-불활성화를 위한 두 가지 다른 전략을 사용하여 자기-불활성화 및 대상 부위 염기 편집의 효율성 평가를 위한 실험이 수행되었다. 전략에는 1) E59G 변경을 통한 ABE8.5-m의 TadA 촉매 부위 변경을 통한 자기-불활성화, 2) ABE8.5-m을 코딩하는 폴리뉴클레오티드 내에 삽입되는 NF1 또는 PAX2 인트론의 스플라이스-수용체 부위 변경을 통한 자기-불활성화가 포함되었다. 인트론은 ABE8.5-m의 TadA 데아미나아제의 코돈 87 다음에 ABE8.5-m을 코딩하는 폴리뉴클레오티드 내에 삽입되었다. E59G 자기-불활성화 변경은 가이드 RNA v1, v122, v224, v139, v110, 또는 v113을 사용하여 도입되었다 (서열은 표 1B에 제공된다). NF1의 스플라이스-수용체 부위에 대한 자기-불활성화 변경은 가이드 g235를 사용하여 도입되었고 (표 1B 참조), PAX2의 스플라이스 수용체 부위에 대한 자기-불활성화 변경은 가이드 g239를 사용하여 도입되었다 (표 1B 참조). 이 예 전체에서, 표적 게놈 부위를 편집하는 데 사용된 가이드는 g756이었다 (표 1B 참조). ARPE-19 세포는 NF1 또는 PAX2 인트론 삽입 유무에 관계없이 ABE8.5-m을 코딩하는 폴리뉴클레오티드를 함유하는 AAV2 바이러스 입자를 사용하여, 도 4A 내지 4C에 도시된 바와 같이, 표적 게놈 부위의 염기 편집 및 ABE8.5-m의 TadA 데아미나아제 도메인을 코딩하는 폴리뉴클레오티드의 부위에 대해 자기-불활성화를 촉진하기 위한 가이드 RNA와 함께 감염되었다. 게놈 부위에서의 원하는 (즉, “표적”) 염기 변환 및 ABE8.5-m의 자기-불활성화에 대한 백분율(%)을 DNA 차세대 시퀀싱 및/또는 RNA-seq.을 사용하여 측정하였다. 측정은 형질도입 후 1, 3, 5주에 이루어졌다. 음성 대조군으로서, 세포는 또한 서열-스크램블(“scrmbl”가이드를 사용하여 형질도입되었다. 도 4A 내지 4C에 도시된 바와 같이, ABE8.5-m 염기 편집기 시스템은 표적 게놈 부위를 자기-불활성화하고 편집하는 것이 동시에 가능했다. 다음으로, 표적 게놈 부위의 염기 편집 및 ABE8.5-m의 자기-불활성화에 대한 AAV2 용량의 효과를 결정하기 위해 적정 실험을 수행하였다 (도 5A 및 5B 참조). ABE8.5-m는 위에서 설명한 대로 ABE8.5-m 내에 삽입된 NF1 인트론의 스플라이스 수용체 부위를 변경하거나, 또는 위에서 설명한 대로, 가이드 RNA v110을 사용하여, E59G 변경을 도입하여 자기-불활성화되었다 (표 1B 참조). ARPE-19 세포는 NF1 또는 AAV2 인트론 삽입 유무에 관계없이 ABE8.5-m을 코딩하는 폴리뉴클레오티드를 함유하는 AAV2 바이러스 입자를 사용하여, 도 5A 및 5B에 도시된 바와 같이, 표적 게놈 부위의 염기 편집 및 ABE8.5-m의 TadA 데아미나아제 도메인을 코딩하는 폴리뉴클레오티드의 부위에 대해 자기-불활성화 염기-편집을 촉진하기 위한 가이드 RNA와 함께 감염되었다. 세포는 89k vg/세포 (높음), 17 k vg/세포 (중간) 또는 9k vg/세포 (낮음)의 용량으로 AAV2 입자를 사용하여 형질도입되었다. 형질도입 후 3, 7, 14주 후에 수행된 차세대 DNA 시퀀싱 측정을 통해 결정된 바와 같이, 표적 게놈 부위의 염기 편집 효율성은 투여량에 따라 증가하는 반면, 자기-불활성화 비율은 평가된 투여량 전반에 걸쳐 동일하게 유지되는 것으로 확인되었다. 또한 자기-불활성화 및 표적 게놈 부위 변경 모두에 대한 염기 편집 효율성은 시간에 따라 증가하는 것으로 관찰되었다.
다음으로, 위에서 설명한 두 가지 자기-불활성화 전략을 사용하여 동시 표적 게놈 부위 염기 편집 및 자기-불활성화에 대한 효율성을 결정하기 위한 실험을 수행하였다 (도 6A 및 6B 참조). E59G 자기-불활성화 변경은 가이드 RNA v110을 사용하여 도입되었다 (표 1B 참조). NF1의 스플라이스-수용체 부위에 대한 자기-불활성화 변경은 가이드 g235를 사용하여 도입되었고, PAX2의 스플라이스 수용체 부위에 대한 자기-불활성화 변경은 가이드 g239를 사용하여 도입되었다. 표적 게놈 부위를 편집하는 데 사용된 가이드는 g756이었다 (표 1B 참조).
ARPE-19 세포는 NF1 또는 PAX2인트론 삽입 유무에 관계없이 ABE8.5-m을 코딩하는 폴리뉴클레오티드를 함유하는 AAV2 바이러스 입자를 사용하여, 도 6A 및 6B에 도시된 바와 같이, 표적 게놈 부위의 염기 편집 및 ABE8.5-m의 TadA 데아미나아제 도메인을 코딩하는 폴리뉴클레오티드의 부위에 대해 자기-불활성화를 촉진하기 위한 가이드 RNA와 함께 감염되었다. 게놈 부위에서의 원하는 (즉, “표적”) 염기 변환 및 ABE8.5-m의 자기-불활성화에 대한 백분율(%)을 DNA 차세대 시퀀싱 및/또는 RNA-seq.을 사용하여 측정하였다. 측정은 형질도입 후 4, 7, 및 14주에 이루어졌다. 도 6A 및 6B에 도시된 바와 같이, ABE8.5-m 염기 편집기 시스템은 표적 게놈 부위를 동시에 자기-불활성화하고 편집할 수 있었다.
위에서 설명한 두 가지 자기-불활성화 전략을 사용하여 동시 표적 게놈 부위 염기 편집 및 자기-불활성화에 대한 효율성을 결정하기 위한 실험을 수행하였으며 (도 7A 및 7B 참조), 여기서 세포는 플라스미드를 사용하여 형질도입되었다 (즉, 리포펙션). E59G 자기-불활성화 변경은 가이드 RNA v110을 사용하여 도입되었다 (표 1B 참조). NF1의 스플라이스-수용체 부위에 대한 자기-불활성화 변경은 가이드 g235를 사용하여 도입되었다. 표적 게놈 부위를 편집하는 데 사용된 가이드는 g756이었다 (표 1A 참조).
HEK293T 세포는, 도 7A 및 7B에 도시된 바와 같이, 표적 게놈 부위의 염기 편집 및 ABE8.5-m의 TadA 데아미나아제 도메인을 코딩하는 폴리뉴클레오티드의 부위에 대해 자기-불활성화 염기 편집을 촉진하기 위한 가이드 RNA와 함께, NF1 인트론 삽입 유무에 관계없이 ABE8.5-m을 코딩하는 폴리뉴클레오티드를 함유하는 지질 나노 입자와 접촉시켰다. 게놈 부위에서의 원하는 (즉, “표적”) 염기 변환 및 ABE8.5-m의 자기-불활성화에 대한 백분율(%)을 각각 DNA 차세대 시퀀싱 및/또는 RNA-seq.을 사용하여 측정하였다. 음성 대조군으로서, 세포는 또한 서열-스크램블(“”가이드를 사용하여 형질도입되었다. 형질도입 후 2주 및 7주에 측정을 수행하였다. 도 7A 및 7B에 도시된 바와 같이, ABE8.5-m 염기 편집기 시스템은 표적 게놈 부위를 자기-불활성화하고 편집하는 것을 동시에 수행할 수 있었으며, 자기-불활성화 및 표적 게놈 부위 편집의 효율성은 모두 시간이 지남에 따라 증가하였다.
다음으로, AAV8 바이러스 입자를 사용하여 세포를 형질도입한 위에서 설명한 두 가지 자기-불활성화 전략 (도 8A 및 8B 참조)을 사용하여 동시 표적 게놈 부위 염기 편집 및 자기-불활성화에 대한 효율성을 결정하기 위한 실험을 수행하였다. E59G 자기-불활성화 변경은 가이드 RNA v110을 사용하여 도입되었다 (표 1B 참조). NF1의 스플라이스-수용체 부위에 대한 자기-불활성화 변경은 가이드 g235를 사용하여 도입되었다. 표적 게놈 부위 편집에 사용된 가이드는 g756이었다 (표 1B 참조). ARPE-19 세포는, 도 8A 및 8B에 도시된 바와 같이, 표적 게놈 부위의 염기 편집 및 ABE8.5-m의 TadA 데아미나아제 도메인을 코딩하는 폴리뉴클레오티드 부위에 대한 자기-불활성화 염기-편집을 촉진하기 위하여 가이드 RNA와 함께, NF1 인트론 삽입 유무에 관계없이, ABE8.5-m을 코딩하는 폴리뉴클레오티드를 함유하는 AAV8 바이러스 입자를 사용하여 감염되었다. 게놈 부위에서의 원하는 (즉, “표적”) 염기 변환 및 ABE8.5-m의 자기-불활성화에 대한 백분율(%)을 DNA 차세대 시퀀싱 및/또는 RNA-seq.을 사용하여 측정하였다. 음성 대조군으로서, 세포는 또한 서열-스크램블(“”가이드를 사용하여 형질도입되었다. 형질도입 후 4주(도 8A) 및 4주(도 8B)에 측정을 수행하였다. 도 8A 및 8B에 도시된 바와 같이, ABE8.5-m 염기 편집기 시스템은 표적 게놈 부위를 자기-불활성화하고 편집하는 것을 동시에 수행할 수 있었다.
상기 실시예는 다음의 재료 및 방법을 사용하였다.
일반적인 방법
실시예 1-3에서 사용된 작제물은 USER 효소 클로닝, 제한 효소 소화 및 T4 DNA 결찰, Gibson 어셈블리를 통해 생성되거나, 또는 Genewiz에 의해 합성되었다. 모든 PCR 반응에는 푸션 U DNA 폴리머라아제 그린 멀티플렉스 PCR 마스터 믹스(Phusion U DNA Polymerase Green MultiPlex PCR Master Mix, Thermo Fisher) 또는 Q5 핫 스타트 HiFi 2x 마스터 믹스 (Q5 Hot Start HiFi 2x Master Mix, New England Biolabs)가 사용되었다. 인트론은 IDT(Integrated DNA Technologies)로부터 유전자 단편을 주문하였다. 플라스미드 리포펙션에 의해 수행된 실험 및 AAV 형질도입에 의해 수행된 실험을 포함한 모든 실험은, Cfa(GEP) 스플릿 인테인 융합을 사용하여 재조합된 스플릿 염기 편집기를 사용하였고, 여기서 편집기는 Asn309와 Thr310에 해당하는 아미노산 잔기 사이에서 스플릿되었고, Cas9 및 잔기 310은 Thr310Cys으로 돌연변이 되었다. 스플릿 편집기는 각각 공동-형질감염 또는 공동-형질도입이 필요한 두 개의 개별 플라스미드 또는 AAV 벡터에 의해 코딩되었다. 각 ABE 단편은 CMV 프로모터로부터 발현되었다. 하나 이상의 가이드 RNA는 또한 염기 편집기의 N-말단 스플릿을 코딩하는 벡터에서 직렬로(in tandem) 코딩되었고, 가이드 RNA는 U6 프로모터를 사용하여 발현되었다. 가이드 RNA는 IDT에서 주문한 어닐링된, 상보적 올리고의 결찰을 통해 소화된 수용체 플라스미드(digested recipient plasmids)에 삽입되었다. 가이드 올리고는 샘플을 95℃에서 3분 동안 가열하고, 0.1℃/초의 속도로 20℃로 냉각하여 IDT 이중 완충액에서 어닐링되었다. 플라스미드 DNA는 100 μg/mL 카르베니실린(carbenicillin)을 함유하는 LB 배지에서 성장한 Mach1 (Thermo Fisher) 또는 NEB 안정한 세포 배양물 (New England Biolabs) 35 mL로부터 QIAGEN 플라스미드 플러스 키트를 사용하여 준비되었다. 게놈 표적 부위를 표적으로 하는 모든 실험에서, 원하는 편집은 연구에 사용된 모든 세포주에 렌티바이러스로 혼입된 ABCA4 c.5882G>A 점 돌연변이의 A에서 G로의 변환에 해당한다. 세포의 리포펙션 또는 형질도입으로 인한 편집 활성은 기술적 복제물로부터 측정하였다.
AAV 생산 및 적정
rAAV 벡터는 HEK293T 세포의 현탁배양물을 (a) AAV Rep 유전자 및 Cap 유전자, (b) 반전 말단 반복부 (inverted terminal repeat, ITR) 서열이 측면에 있는 트랜스유전자, 및 (c) AAV 복제에 필요한(헬퍼 플라스미드) 아데노바이러스 유전자 (E4, E2a 및 VA)를 함유하는 플라스미드로 일시적 삼중 형질감염(transient triple transfection)을 사용하여 제조되었다. 형질감염 72시간 후, 세포를 용해시키고 Triton X-100, MgCl2 및 터보뉴클레아제(Turbonuclease)를 각각 최종농도 0.25% (v/v), 2 mM, 및 10 U/ml로 첨가하여 패키징되지 않은 DNA를 제거하였다. 용해는 쉐이커 인큐베이터에서 37°C에서 2-5시간 동안 수행되었다. 세포 용해물은 정제 심층 필터(clarification depth filter)를 통해 여과된 후 0.2-마이크론 여과를 수행하였다. 정제된 용해물을 Cytiva AKTA 퓨어 크로마토그래피 시스템을 사용하여, 친화성 크로마토그래피 컬럼에 로딩하였다. 포획된 AAV는 pH 2.5-3에서 용출 완충액을 사용하여 용출되었다. 용출액을 포착하고 pH를 즉시 중화하였다. 차거나 빈(full and empty) AAV 입자를 염화세슘 밀도 구배 초원심분리에 의해 분리하였다. 찬(full) AAV 입자를 함유하는 밴드를 수집하고, 역가를 qPCR로 결정하였다. 찬 입자 샘플을 CsCl 스톡 용액에서 최종 목표 농도로 희석하고, 적절한 사이즈의 투석 카세트(MWCO 100 kDa)을 사용하여 제형 완충액(10 mM Na2HPO4, 2 mM KH2PO4, 2.7 mM KCl, 192 mM NaCl, 0.001% Pluronic F-68; pH 7.4)으로 투석하였다. 투석액은 단백질 결합이 낮은 0.1-마이크론 주사기 필터를 사용하여 여과한 후 분취하여 -80°C에서 보관하였다. 최종 AAV 역가는 바이알화된 물질로부터 액적 디지털 PCR (ddPCR)을 사용하여 결정되었다. 내독소 수준, 응집 상태, 삼투압 및 pH와 같은 기타 품질 속성도 또한 결정되었다.
렌티바이러스 삽입을 사용한 혼입된 관심 표적 부위를 함유하는 세포주의 생성
렌티바이러스 생산 플라스미드는 엑손 42 전 72-bp에서 시작하여 엑손 42 후 123-bp까지의 서열 및 ABCA4 c.5882G>A 에 해당하는 점 돌연변이를 포함하는 인간 ABCA4 유전자 단편을 코딩하는 5' Hpal 및 3' Apal 측면 g-블록 (5' HpaI and 3' ApaI flanked g-block, IDT에서 입수)을 사용한 제한 클로닝(restriction cloning)에 의해 생성되었다. G-블록을 Hpal/Apal 분해된 pLenti6.4 R4R2 V5-DEST벡터 (Thermo Fisher Scientific)에 연결하고, 최종 플라스미드를 Vigene Biosciences에서 소규모 렌티바이러스 생산에 사용하였다. 렌티바이러스는 HEK293T 세포 [CRL-3216, American Type Cell Culture Collection (ATCC)] 및 ARPE-19 세포 (CRL-2302, ATCC)를 감염 다중도 (multiplicity of infection, MOI) 0.3-10 IFU/세포로 형질도입하는 데 사용되었다. 안정적으로 혼입된 세포는 10 μg/mL 블라스티시딘(blasticidin)이 보충된 기본 배지(base media)에서 성장하여 선택되었고, 일단 확립되면, 세포는 5 μg/mL의 블라스티시딘이 보충된 기본 배지에서 유지되었다. MOI에 의해 풀링된 각 세포 집단 내의 세포당 렌티바이러스 혼입(lentiviral integrations) 평균 수는 바이러스 혼입된 ABCA4 단편(virally integrated ABCA4 fragment)과 내인성 ABCA4 유전자좌(endogenous ABCA4 locus)를 동시에 증폭시키기 위해 프라이머 oBTx361 및 oBTx362를 사용하는 표적 앰플리콘 서열분석에 의해 평가되었다. 각 샘플의 바이러스 혼입수는 ABCA4 c.5882G>A 돌연변이를 함유하는 NGS 판독수에 2를 곱하고, 야생형 판독수로 나눈 값으로 추정하였다 (혼입수 = 돌연변이 판독수 X 2 / WT 판독수). 모든 염기 편집 실험에는 세포당 평균 2개 이하의 혼입을 함유하는 세포주 풀이 사용되었다.
HEK293T 세포의 배양
세포를 5% CO2와 함께 37°C에서 배양하였다. 렌티바이러스 혼입 세포는 10%(v/v) 우태아 혈청 (A31606-02, Thermo Fisher Scientific) 및 5 μg/ml 블라스티시딘 S HCl (A1113903, Thermo Fisher Scientific)이 함유된 둘베코 변형 이글스 배지 플러스 글루타맥스 (Dulbecco's modified Eagles medium plus Glutamax, 10566-016, Thermo Fisher Scientific)에서 유지하였고, ATCC에 의한 배양 방법을 따랐다.
ARPE-19 세포의 배양
세포를 5% CO2와 함께 37°C에서 배양하였다. 렌티바이러스 혼입 세포는 10%(v/v) 우태아 혈청 (A31606-02, Thermo Fisher Scientific) 및 5 μg/ml 블라스티시딘 S HCl (A1113903, Thermo Fisher Scientific)이 함유된 둘베코 변형 이글 배지/배양 혼합물 F-12(DMEM/F-12) (11320033, Thermo Fisher Scientific)에서 유지하였고, ATCC에 의한 배양 방법을 따랐다.
플라스미드 형질감염
HEK293T 세포를 Corning® CellBIND®웰 다중 웰 플레이트 (3338, Corning)에 10% (v/v) FBS를 포함하고, 블라스티시딘이 없는 둘베코 변형 이글스 배지 플러스 글루타맥스에 웰당 35,000 세포 밀도로 접종하였다. 세포는 접종 후 ~24시간 동안 형질감염되었다. 스플릿 염기 편집기 및 최대 2개의 가이드 RNA를 함유하는 상보적 플라스미드 쌍을 1:1 몰비로 결합하여 총 1000 ng에 도달한 후 1.5 μL 리포펙타민 2000 (Thermo Fisher Scientific) 및 Opti-MEM 환원 혈청 배지 (Thermo Fisher Scientific)를 첨가하여 총 부피 25 μl로 하였다. 반응 혼합물을 제조사 지시서에 따라 웰에 첨가하였다. 세포 용해 전 5-일(120 시간) 동안 48시간마다 배지를 교체하였다.
AAV 형질도입
ARPE-19 세포를 Corning® CellBIND® 48웰 다중 웰 플레이트에 웰당 23,000개 세포의 밀도로 10% FBS를 포함하고, 블라스티시딘이 없는 DMEM/F-12 배지에 접종하였다. 접종 후 약 24시간 후에 배지를 제거하고 스플릿 염기 편집기를 포함하는 2개의 AAV 각각을 FBS가 결여된 DMEM/F-12의 웰당 총 부피 125μl로 세포당 바이러스당 50,000개의 바이러스 게놈으로 희석하였다. 세포를 37°C, 5% CO2, 3시간 동안 바이러스와 함께 배양하고 20% FBS가 포함된 DMEM/F-12 125μl를 각 샘플에 첨가하여 최종 농도가 10% FBS가 되도록 하였다. 표준 AAV 형질도입 실험을 위해 세포 용해 전 14-일 동안 48시간마다 배지를 DMEM/F-12 및 10% FBS로 교체하였다. 시간 경과 실험의 경우, 5-주 동안 7일마다 복제물을 용해시켰다.
게놈 DNA 및 편집기 DNA의 추출
배지를 제거하고 세포를 100μl의 1x PBS(Thermo Fisher)로 두 번 세척한 후 75 μl의 세포 용해 완충액(10mM Tris·HCl(pH 8.0) + 0.05% SDS + 100μg/mL Proteinase K)을 첨가하였다. 웰을 피펫 팁(다중 채널 사용)으로 긁어내고 즉시 96웰 플레이트로 옮겼다. 96웰 플레이트를 55°C에서 1시간 동안 배양한 후 95°C에서 20분 동안 열 불활성화하였다. 그런 다음 샘플을 -20°C에 보관하였다.
대안적으로, 자기-불활성화 분석에 영향을 미치는 잔류 세포외 플라스미드 DNA의 존재 가능성을 완화하기 위한 시도로 용해 전에 Turbo DNAse(Thermo Fisher)를 포함한 추가 세척 단계를 테스트하였다. Turbo DNase를 첨가하거나 첨가하지 않은 경우 NGS 분석에서도 동일한 결과가 나오므로 후속 실험에서는 Turbo DNAse를 제외하였다.
표적 앰플리콘 서열분석을 위한 mRNA의 cDNA로의 역전사
제조사의 프로토콜에 따라 MagMAX™ mirVana™를 사용하여 총 RNA를 분리하였다. RevertAid RT Reverse Transcription Kit(K1691, Thermo Fisher Scientific)을 사용하여 총 RNA를 cDNA로 역전사시켰으며, 반응에서 무작위 6량체 프라이머(random hexamer primer)를 제외하고 고정된 올리고 dT 프라이머를 대신 사용했다는 점을 제외하고는 제조업체의 프로토콜을 따랐다(5' - TTTTTTTTTTTTTTTTTTTTNN(서열번호 481)). 역전사 반응을 25°C에서 10분, 37°C에서 60분, 95°C에서 5분 동안 배양하였다. 조 cDNA는 다운스트림 응용 분야에서 직접 사용되었다.
표적 앰플리콘 시퀀싱 DNA 및 cDNA 샘플
세포 용해물 (2 μL) 또는 cDNA를 Q5 Hot Start HiFi 2x 마스터 믹스와 5' Illumina 어댑터 오버행을 포함하는 각 프라이머 0.5 μM이 포함된 25 μL PCR 반응에 첨가하였다. 각 샘플은 두 개의 고유한 프라이머 쌍을 사용하여 두 개의 별도 반응으로 증폭되었다: 한 쌍은 관심 있는 세포 게놈 부위(oBTx360 및 oBTx368) 옆에 있고 다른 쌍은 편집기 DNA 서열의 원하는 편집 부위 옆에 있다. 프라이머 oBTx360 및 oBTx368은 ABCA4의 엑손 42 및 ABCA4 단편 옆에 있는 V5 태그에 프라이밍하여 렌티바이러스로 혼입된 게놈 표적 부위를 선택적으로 증폭시킨다. PCR 반응은 다음과 같이 수행되었다: 95°C에서 2분, 30주기 (95°C에서 15초, 65°C에서 20초, 72°C에서 20초), 및 최종 72°C 연장 2분 동안. 증폭 후, 증폭된 관심 부위를 포함하는 2μL의 조 PCR 산물은 0.5 μM의 각 고유 Illumina 바코드 프라이머 쌍과 Q5 Hot Start High-Fidelity 2X Master Mix 총 부피 25μL를 사용하여 바코드화되었다. 반응은 다음과 같이 수행되었다: 98°C에서 2분, 10주기 (98°C에서 20초, 60°C에서 30초, 72°C에서 30초), 최종 72°C 연장 2 분 동안. 그런 다음 동일한 양의 바코드 PCR 산물을 모으고 0.6X 비드/샘플 비율을 사용하는 SPRISelect 상자성 비드(Beckman Coulter)를 사용하여 세척하였다. 용출된 DNA 농축액은 Qubit 4(Thermo Fisher Scientific)를 사용하여 정량화하고 제조사의 프로토콜에 따라 Illumina MiSeq 장비를 사용하여 서열을 분석하였다.
총 mRNA의 RNA-seq
위에서 설명한대로 세포를 배양하고 형질 감염시켰다. 실험이 끝나면 배지를 제거하고 세포를 50 μL TrypLE™Express Enzyme(1X), 페놀 레드(12605036, Thermo Fisher Scientific)로 분리 및 해리하였다. 그런 다음 세포를 펠렛화하고 완전 배지로 한 번 세척한 다음 두 개의 펠렛으로 나누었다: 하나는 위에서 설명한 대로 DNA의 표적 서열 분석에 사용하고 다른 하나는 RNA-seq에 사용되었다. 제조사의 프로토콜에 따라 MagMAX™ mirVana™를 사용하여 총 RNA를 분리하였다. 다음으로, 제조사의 지시서 (NEBNext Poly(A) mRNA Magnetic Isolation Module(NEB E7490)과 함께 사용하기 위한 프로토콜)에 따라 Illumina (E7760L, New England Biolabs)용 NEBNext Ultra II Directional RNA Library Prep Kit를 사용하여 200ng의 총 RNA를 처리하였다. 최종 cDNA 산물은 TapeStation(Agilent)로 정량하고, 4nM으로 노멀라이즈하였으며, 동일 부피로 모은 다음 제조사의 프로토콜에 따라 Illumina NextSeq 550 기기를 사용하여 시퀀싱하였다.
앰플리콘(Amplicon) 시퀀싱 분석 세부정보
1. FASTQ 파일은, 다음 파라미터와 함께, 일루미나 blc2fastq (v2.20.0.422)를 사용하여 MiSeq 기기에서 생성된 베이스 콜 파일(BCF)에서 생성되었다.
Bcl2fastq \
--무시-미싱-bcls\
--무시-미싱-필터 \
--무시-미싱-포지션\
--무시-미싱-컨트롤\
--오토-셋-to-제로-바코드-미스매치\
--파인드-어댑터-함께(with)-슬라이딩-윈도우\
--어댑터-스트린전시 0.9\
--마스크-쇼트-어댑터-리드(reads) 35\
--미니멈-트림드(trimmed)-리드(read)-길이 35\
2. 그런 다음 생성된 FASTQ 파일은 일루미나 TruSeq 어댑터를 클립(clip)하도록 설정된 파라미터와 함께 트리모메틱(Trimmomatic, v0.39)를 사용하여 처리되었고, 20개 염기보다 더 짧은 리드(reads)는 제외되고, 4-bp 슬라이딩 윈도우에서 평균 염기 양(Phread 점수)이 15 아래로 떨어지는 경우 남아있는 리드(reads)의 3'말단을 트리밍(trim)하고, 3 또는 그 이하의 양 점수인 임의의 염기를 리드의 말단에서 트리밍하였으며, 1라운드 PCR 프라이머로부터 도입된 4개의 랜덤화된 염기를 트리밍하였다.
트리모메틱을 실행하는 데 다음 명령이 사용되었다:
트리모메틱 SE-phread33 $인풋_fastq $아웃풋_fastq\
일루미나클립:일루민_어댑터.fa:2:30:10\
리딩:3 트레이닝:3\
슬라이딩 윈도우:4:15\
민렌(MINLEN):20\
헤드크롭(HEADCROP):4
3. 트리밍된 리드는 --매우-센시티브 플래그가 지정된 말단-에서-말단(end-to-end) 모드에서 bowtie2(v.2.35)를 사용하여 예상된 앰플리콘 서열로 정렬되었다.bowtie2로 생성된 SAM 파일은 샘툴(samtools, v1.9)를 사용하여 BAM 파일로 변환, 정렬 및 색인화되었다.
4. (3) 단계에서 생성된 BAM 파일은 뱀-리드카운트(bam-readcounts) 도구를 사용하여 처리되었으며 (github.com/genome/bam-readcount) 정렬의 각 위치에서 비참조 염기, 삭제 및 삽입 수를 요약하는 일반 텍스트 파일을 생성한다. 편집률에 대한 통계에서 신뢰도가 낮은 베이스 콜을 제외하기 위해 비참조 베이스를 계산하기 위한 최소 베이스 품질(Phred 점수)을 29로 설정했다. 대상 부위의 각 위치에 대한 편집 비율은 정렬의 지정된 위치에서 베이스 품질 임계값을 통과하는 총 염기 수에 대한 지정된 유형(예: G)의 비참조 염기의 비율로 계산되었다.
총 mRNA 시퀀싱 세부정보(Total mRNA sequencing analysis details)
레인 수준 FASTQ 파일은 ReadGroup을 지정하고 게놈 정렬 BAM 파일 및 전사체 정렬 BAM 파일을 출력하도록 파라미터가 설정된 STAR(v2.7.2a)를 사용하여 인간 게놈(Gencode GRCh38v31 기본 어셈블리) 및 염기 편집기 구성을 포함하는 맞춤형 게놈에 별도로 정렬되었다. 단계에서 생성된 각 샘플에 대한 레인 수준 게놈 정렬을 병합하고 좌표별로 정렬하고 Picard(v2.20.5)를 사용하여 중복 표시하였다. 그런 다음 편집 속도의 시각화 및 정량화를 위해 BAM 파일을 IGV에 로드하였다.
다른 구현예
전술된 설명으로부터, 다양한 용법 및 조건으로 조정되도록 본원에 기재된 발명에 변경 및 변형이 이루어질 수 있음이 명백할 것이다. 이러한 구현예는 또한 다음 청구범위의 범주 내에 있다. 본원의 변수의 임의의 정의에서 요소 목록의 인용은 해당 변수를 나열된 요소의 임의의 단일 요소로 또는 조합(또는 하위조합)하여 정의하는 것을 포함한다.
본원에서 구현예의 언급은 해당 구현예를 임의의 단일 구현예로 또는 임의의 다른 구현예 또는 이의 부분과 조합하여 포함한다.
본 명세서에 언급된 모든 특허 및 간행물은 각각의 개별 특허 및 간행물이 참조로 포함되는 것으로 구체적으로 그리고 개별적으로 표시된 것과 동일한 범위로 본원에 참조로 포함된다.
SEQUENCE LISTING
<110> BEAM THERAPEUTICS INC.
<120> COMPOSITIONS AND METHODS FOR THE SELF-INACTIVATION OF BASE
EDITORS
<130> 180802-049001/PCT
<140> PCT/US22/31419
<141> 2022-05-27
<150> 63/194,431
<151> 2021-05-28
<160> 547
<170> PatentIn version 3.5
<210> 1
<211> 167
<212> PRT
<213> Escherichia coli
<220>
<221> misc_feature
<222> (1)..(167)
<223> TadA*7.10 (ecTadA) polypeptide sequence
<400> 1
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp
165
<210> 2
<211> 4092
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at P153 polynucleotide sequence
<220>
<221> misc_feature
<222> (1)..(6)
<223> Kozak sequence
<220>
<221> misc_feature
<222> (7)..(57)
<223> Sequence encoding N-terminal nuclear localization signal
<220>
<221> misc_feature
<222> (58)..(513)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (514)..(531)
<223> Sequence encoding a linker
<220>
<221> misc_feature
<222> (532)..(1029)
<223> Sequence encoding TadA*8
<220>
<221> misc_feature
<222> (1030)..(1089)
<223> Sequence encoding Xten20 linker
<220>
<221> misc_feature
<222> (1090)..(3954)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (3955)..(4002)
<223> Sequence encoding C-terminal NLS
<220>
<221> misc_feature
<222> (4003)..(4008)
<223> Seqquence encoding GS linker
<220>
<221> misc_feature
<222> (4009)..(4089)
<223> Sequence encoding 3x hemagglutinin (HA) tag
<400> 2
gccaccatgg ccccaaagaa gaagcggaag gtcggtatcc acggagtccc agcagccgcc 60
accagatcct tcatcctgaa gatcgagccc aacgaggaag tgaagaaagg cctctggaaa 120
acccacgagg tgctgaacca cggaatcgcc tactacatga atatcctgaa gctgatccgg 180
caagaggcca tctacgagca ccacgagcag gaccccaaga atcccaagaa ggtgtccaag 240
gccgagatcc aggccgagct gtgggatttc gtgctgaaga tgcagaagtg caacagcttc 300
acacacgagg tggacaagga cgaggtgttc aacatcctga gagagctgta cgaggaactg 360
gtgcccagca gcgtggaaaa gaagggcgaa gccaaccagc tgagcaacaa gtttctgtac 420
cctctggtgg accccaacag ccagtctgga aagggaacag ccagcagcgg cagaaagccc 480
agatggtaca acctgaagat tgccggcgat cccggaggct ctggaggaag ctccgaagtc 540
gagttttccc atgagtactg gatgagacac gcattgactc tcgcaaagag ggctcgagat 600
gaacgcgagg tgcccgtggg ggcagtactc gtgctcaaca atcgcgtaat cggcgaaggt 660
tggaataggg caatcggact ccacgacccc actgcacatg cggaaatcat ggcccttcga 720
cagggagggc ttgtgatgca gaattatcga ctttatgatg cgacgctgta cgtcacgttt 780
gaaccttgcg taatgtgcgc gggagctatg attcactccc gcattggacg agttgtattc 840
ggtgttcgca acgccaagac gggtgccgca ggttcactga tggacgtgct gcatcatcca 900
ggcatgaacc accgggtaga aatcacagaa ggcatattgg cggacgaatg tgcggcgctg 960
ttgtgtcgtt tttttcgcat gcccaggcgg gtctttaacg cccagaaaaa agcacaatcc 1020
tctactgacg gctcttctgg atctgaaaca cctggcacaa gcgagagcgc cacccctgag 1080
agctctggct cctgggaaga agagaagaag aagtgggaag aagataagaa aaaggacccg 1140
ctggccaaga tcctgggcaa gctggctgag tacggactga tccctctgtt catcccctac 1200
accgacagca acgagcccat cgtgaaagaa atcaagtgga tggaaaagtc ccggaaccag 1260
agcgtgcggc ggctggataa ggacatgttc attcaggccc tggaacggtt cctgagctgg 1320
gagagctgga acctgaaagt gaaagaggaa tacgagaagg tcgagaaaga gtacaagacc 1380
ctggaagaga ggatcaaaga ggacatccag gctctgaagg ctctggaaca gtatgagaaa 1440
gagcggcaag aacagctgct gcgggacacc ctgaacacca acgagtaccg gctgagcaag 1500
agaggcctta gaggctggcg ggaaatcatc cagaaatggc tgaaaatgga cgagaacgag 1560
ccctccgaga agtacctgga agtgttcaag gactaccagc ggaagcaccc tagagaggcc 1620
ggcgattaca gcgtgtacga gttcctgtcc aagaaagaga accacttcat ctggcggaat 1680
caccctgagt acccctacct gtacgccacc ttctgcgaga tcgacaagaa aaagaaggac 1740
gccaagcagc aggccacctt cacactggcc gatcctatca atcaccctct gtgggtccga 1800
ttcgaggaaa gaagcggcag caacctgaac aagtacagaa tcctgaccga gcagctgcac 1860
accgagaagc tgaagaaaaa gctgacagtg cagctggacc ggctgatcta ccctacagaa 1920
tctggcggct gggaagagaa gggcaaagtg gacattgtgc tgctgcccag ccggcagttc 1980
tacaaccaga tcttcctgga catcgaggaa aagggcaagc acgccttcac ctacaaggat 2040
gagagcatca agttccctct gaagggcaca ctcggcggag ccagagtgca gttcgacaga 2100
gatcacctga gaagataccc tcacaaggtg gaaagcggca acgtgggcag aatctacttc 2160
aacatgaccg tgaacatcga gcctacagag tccccagtgt ccaagtctct gaagatccac 2220
cgggacgact tccccaaggt ggtcaacttc aagcccaaag aactgaccga gtggatcaag 2280
gacagcaagg gcaagaaact gaagtccggc atcgagtccc tggaaatcgg cctgagagtg 2340
atgagcatcg acctgggaca gagacaggcc gctgccgcct ctattttcga ggtggtggat 2400
cagaagcccg acatcgaagg caagctgttt ttcccaatca agggcaccga gctgtatgcc 2460
gtgcacagag ccagcttcaa catcaagctg cccggcgaga cactggtcaa gagcagagaa 2520
gtgctgcgga aggccagaga ggacaatctg aaactgatga accagaagct caacttcctg 2580
cggaacgtgc tgcacttcca gcagttcgag gacatcaccg agagagagaa gcgggtcacc 2640
aagtggatca gcagacaaga gaacagcgac gtgcccctgg tgtaccagga tgagctgatc 2700
cagatccgcg agctgatgta caagccttac aaggactggg tcgccttcct gaagcagctc 2760
cacaagagac tggaagtcga gatcggcaaa gaagtgaagc actggcggaa gtccctgagc 2820
gacggaagaa agggcctgta cggcatctcc ctgaagaaca tcgacgagat cgatcggacc 2880
cggaagttcc tgctgagatg gtccctgagg cctaccgaac ctggcgaagt gcgtagactg 2940
gaacccggcc agagattcgc catcgaccag ctgaatcacc tgaacgccct gaaagaagat 3000
cggctgaaga agatggccaa caccatcatc atgcacgccc tgggctactg ctacgacgtg 3060
cggaagaaga aatggcaggc taagaacccc gcctgccaga tcatcctgtt cgaggatctg 3120
agcaactaca acccctacga ggaaaggtcc cgcttcgaga acagcaagct catgaagtgg 3180
tccagacgcg agatccccag acaggttgca ctgcagggcg agatctatgg cctgcaagtg 3240
ggagaagtgg gcgctcagtt cagcagcaga ttccacgcca agacaggcag ccctggcatc 3300
agatgtagcg tcgtgaccaa agagaagctg caggacaatc ggttcttcaa gaatctgcag 3360
agagagggca gactgaccct ggacaaaatc gccgtgctga aagagggcga tctgtaccca 3420
gacaaaggcg gcgagaagtt catcagcctg agcaaggatc ggaagtgcgt gaccacacac 3480
gccgacatca acgccgctca gaacctgcag aagcggttct ggacaagaac ccacggcttc 3540
tacaaggtgt actgcaaggc ctaccaggtg gacggccaga ccgtgtacat ccctgagagc 3600
aaggaccaga agcagaagat catcgaagag ttcggcgagg gctacttcat tctgaaggac 3660
ggggtgtacg aatgggtcaa cgccggcaag ctgaaaatca agaagggcag ctccaagcag 3720
agcagcagcg agctggtgga tagcgacatc ctgaaagaca gcttcgacct ggcctccgag 3780
ctgaaaggcg aaaagctgat gctgtacagg gaccccagcg gcaatgtgtt ccccagcgac 3840
aaatggatgg ccgctggcgt gttcttcgga aagctggaac gcatcctgat cagcaagctg 3900
accaaccagt actccatcag caccatcgag gacgacagca gcaagcagtc tatgaaaagg 3960
ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa agggatccta cccatacgat 4020
gttccagatt acgcttatcc ctacgacgtg cctgattatg catacccata tgatgtcccc 4080
gactatgcct aa 4092
<210> 3
<211> 1361
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at P153 polypeptide sequence
<400> 3
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
20 25 30
Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
35 40 45
Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
50 55 60
His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
65 70 75 80
Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
85 90 95
Ser Phe Thr His Glu Val Asp Lys Asp Glu Val Phe Asn Ile Leu Arg
100 105 110
Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
115 120 125
Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
130 135 140
Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
145 150 155 160
Tyr Asn Leu Lys Ile Ala Gly Asp Pro Gly Gly Ser Gly Gly Ser Ser
165 170 175
Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu
180 185 190
Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu
195 200 205
Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly
210 215 220
Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly
225 230 235 240
Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val
245 250 255
Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg
260 265 270
Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala
275 280 285
Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg Val
290 295 300
Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys
305 310 315 320
Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala
325 330 335
Gln Ser Ser Thr Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser
340 345 350
Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Trp Glu Glu Glu Lys Lys
355 360 365
Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
370 375 380
Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Tyr Thr Asp
385 390 395 400
Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
405 410 415
Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
420 425 430
Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
435 440 445
Tyr Glu Lys Val Glu Lys Glu Tyr Lys Thr Leu Glu Glu Arg Ile Lys
450 455 460
Glu Asp Ile Gln Ala Leu Lys Ala Leu Glu Gln Tyr Glu Lys Glu Arg
465 470 475 480
Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
485 490 495
Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
500 505 510
Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
515 520 525
Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
530 535 540
Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
545 550 555 560
Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
565 570 575
Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
580 585 590
His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
595 600 605
Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
610 615 620
Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
625 630 635 640
Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
645 650 655
Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
660 665 670
Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
675 680 685
Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
690 695 700
Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
705 710 715 720
Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
725 730 735
Ile His Arg Asp Asp Phe Pro Lys Val Val Asn Phe Lys Pro Lys Glu
740 745 750
Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
755 760 765
Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
770 775 780
Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
785 790 795 800
Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
805 810 815
Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
820 825 830
Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
835 840 845
Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
850 855 860
Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
865 870 875 880
Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
885 890 895
Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
900 905 910
Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
915 920 925
Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
930 935 940
Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
945 950 955 960
Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
965 970 975
Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
980 985 990
Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
995 1000 1005
Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp
1010 1015 1020
Gln Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu
1025 1030 1035
Ser Asn Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser
1040 1045 1050
Lys Leu Met Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala
1055 1060 1065
Leu Gln Gly Glu Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala
1070 1075 1080
Gln Phe Ser Ser Arg Phe His Ala Lys Thr Gly Ser Pro Gly Ile
1085 1090 1095
Arg Cys Ser Val Val Thr Lys Glu Lys Leu Gln Asp Asn Arg Phe
1100 1105 1110
Phe Lys Asn Leu Gln Arg Glu Gly Arg Leu Thr Leu Asp Lys Ile
1115 1120 1125
Ala Val Leu Lys Glu Gly Asp Leu Tyr Pro Asp Lys Gly Gly Glu
1130 1135 1140
Lys Phe Ile Ser Leu Ser Lys Asp Arg Lys Cys Val Thr Thr His
1145 1150 1155
Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Thr
1160 1165 1170
Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys Ala Tyr Gln Val
1175 1180 1185
Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp Gln Lys Gln
1190 1195 1200
Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu Lys Asp
1205 1210 1215
Gly Val Tyr Glu Trp Val Asn Ala Gly Lys Leu Lys Ile Lys Lys
1220 1225 1230
Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser Asp Ile
1235 1240 1245
Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly Glu Lys
1250 1255 1260
Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro Ser Asp
1265 1270 1275
Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu Arg Ile
1280 1285 1290
Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr Ile Glu
1295 1300 1305
Asp Asp Ser Ser Lys Gln Ser Met Lys Arg Pro Ala Ala Thr Lys
1310 1315 1320
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
1325 1330 1335
Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1340 1345 1350
Pro Tyr Asp Val Pro Asp Tyr Ala
1355 1360
<210> 4
<211> 4092
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at K255 polynucleotide sequence
<220>
<221> misc_feature
<222> (1)..(6)
<223> Kozak sequence
<220>
<221> misc_feature
<222> (7)..(57)
<223> Sequence encoding N-terminal nuclear localization signal (NLS)
<220>
<221> misc_feature
<222> (58)..(822)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (823)..(840)
<223> Sequence encoding a linker
<220>
<221> misc_feature
<222> (841)..(1338)
<223> Sequence encoding TadA*8
<220>
<221> misc_feature
<222> (1339)..(1398)
<223> Sequence encoding Xten20 linker
<220>
<221> misc_feature
<222> (1399)..(3954)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (3955)..(4002)
<223> Sequence encoding C-terminal NLS
<220>
<221> misc_feature
<222> (4003)..(4008)
<223> Sequence encoding a GS linker
<220>
<221> misc_feature
<222> (4009)..(4089)
<223> Sequence encoding 3x hemagglutinin (HA) tag
<400> 4
gccaccatgg ccccaaagaa gaagcggaag gtcggtatcc acggagtccc agcagccgcc 60
accagatcct tcatcctgaa gatcgagccc aacgaggaag tgaagaaagg cctctggaaa 120
acccacgagg tgctgaacca cggaatcgcc tactacatga atatcctgaa gctgatccgg 180
caagaggcca tctacgagca ccacgagcag gaccccaaga atcccaagaa ggtgtccaag 240
gccgagatcc aggccgagct gtgggatttc gtgctgaaga tgcagaagtg caacagcttc 300
acacacgagg tggacaagga cgaggtgttc aacatcctga gagagctgta cgaggaactg 360
gtgcccagca gcgtggaaaa gaagggcgaa gccaaccagc tgagcaacaa gtttctgtac 420
cctctggtgg accccaacag ccagtctgga aagggaacag ccagcagcgg cagaaagccc 480
agatggtaca acctgaagat tgccggcgat ccctcctggg aagaagagaa gaagaagtgg 540
gaagaagata agaaaaagga cccgctggcc aagatcctgg gcaagctggc tgagtacgga 600
ctgatccctc tgttcatccc ctacaccgac agcaacgagc ccatcgtgaa agaaatcaag 660
tggatggaaa agtcccggaa ccagagcgtg cggcggctgg ataaggacat gttcattcag 720
gccctggaac ggttcctgag ctgggagagc tggaacctga aagtgaaaga ggaatacgag 780
aaggtcgaga aagagtacaa gaccctggaa gagaggatca aaggaggctc tggaggaagc 840
tccgaagtcg agttttccca tgagtactgg atgagacacg cattgactct cgcaaagagg 900
gctcgagatg aacgcgaggt gcccgtgggg gcagtactcg tgctcaacaa tcgcgtaatc 960
ggcgaaggtt ggaatagggc aatcggactc cacgacccca ctgcacatgc ggaaatcatg 1020
gcccttcgac agggagggct tgtgatgcag aattatcgac tttatgatgc gacgctgtac 1080
gtcacgtttg aaccttgcgt aatgtgcgcg ggagctatga ttcactcccg cattggacga 1140
gttgtattcg gtgttcgcaa cgccaagacg ggtgccgcag gttcactgat ggacgtgctg 1200
catcatccag gcatgaacca ccgggtagaa atcacagaag gcatattggc ggacgaatgt 1260
gcggcgctgt tgtgtcgttt ttttcgcatg cccaggcggg tctttaacgc ccagaaaaaa 1320
gcacaatcct ctactgacgg ctcttctgga tctgaaacac ctggcacaag cgagagcgcc 1380
acccctgaga gctctggcga ggacatccag gctctgaagg ctctggaaca gtatgagaaa 1440
gagcggcaag aacagctgct gcgggacacc ctgaacacca acgagtaccg gctgagcaag 1500
agaggcctta gaggctggcg ggaaatcatc cagaaatggc tgaaaatgga cgagaacgag 1560
ccctccgaga agtacctgga agtgttcaag gactaccagc ggaagcaccc tagagaggcc 1620
ggcgattaca gcgtgtacga gttcctgtcc aagaaagaga accacttcat ctggcggaat 1680
caccctgagt acccctacct gtacgccacc ttctgcgaga tcgacaagaa aaagaaggac 1740
gccaagcagc aggccacctt cacactggcc gatcctatca atcaccctct gtgggtccga 1800
ttcgaggaaa gaagcggcag caacctgaac aagtacagaa tcctgaccga gcagctgcac 1860
accgagaagc tgaagaaaaa gctgacagtg cagctggacc ggctgatcta ccctacagaa 1920
tctggcggct gggaagagaa gggcaaagtg gacattgtgc tgctgcccag ccggcagttc 1980
tacaaccaga tcttcctgga catcgaggaa aagggcaagc acgccttcac ctacaaggat 2040
gagagcatca agttccctct gaagggcaca ctcggcggag ccagagtgca gttcgacaga 2100
gatcacctga gaagataccc tcacaaggtg gaaagcggca acgtgggcag aatctacttc 2160
aacatgaccg tgaacatcga gcctacagag tccccagtgt ccaagtctct gaagatccac 2220
cgggacgact tccccaaggt ggtcaacttc aagcccaaag aactgaccga gtggatcaag 2280
gacagcaagg gcaagaaact gaagtccggc atcgagtccc tggaaatcgg cctgagagtg 2340
atgagcatcg acctgggaca gagacaggcc gctgccgcct ctattttcga ggtggtggat 2400
cagaagcccg acatcgaagg caagctgttt ttcccaatca agggcaccga gctgtatgcc 2460
gtgcacagag ccagcttcaa catcaagctg cccggcgaga cactggtcaa gagcagagaa 2520
gtgctgcgga aggccagaga ggacaatctg aaactgatga accagaagct caacttcctg 2580
cggaacgtgc tgcacttcca gcagttcgag gacatcaccg agagagagaa gcgggtcacc 2640
aagtggatca gcagacaaga gaacagcgac gtgcccctgg tgtaccagga tgagctgatc 2700
cagatccgcg agctgatgta caagccttac aaggactggg tcgccttcct gaagcagctc 2760
cacaagagac tggaagtcga gatcggcaaa gaagtgaagc actggcggaa gtccctgagc 2820
gacggaagaa agggcctgta cggcatctcc ctgaagaaca tcgacgagat cgatcggacc 2880
cggaagttcc tgctgagatg gtccctgagg cctaccgaac ctggcgaagt gcgtagactg 2940
gaacccggcc agagattcgc catcgaccag ctgaatcacc tgaacgccct gaaagaagat 3000
cggctgaaga agatggccaa caccatcatc atgcacgccc tgggctactg ctacgacgtg 3060
cggaagaaga aatggcaggc taagaacccc gcctgccaga tcatcctgtt cgaggatctg 3120
agcaactaca acccctacga ggaaaggtcc cgcttcgaga acagcaagct catgaagtgg 3180
tccagacgcg agatccccag acaggttgca ctgcagggcg agatctatgg cctgcaagtg 3240
ggagaagtgg gcgctcagtt cagcagcaga ttccacgcca agacaggcag ccctggcatc 3300
agatgtagcg tcgtgaccaa agagaagctg caggacaatc ggttcttcaa gaatctgcag 3360
agagagggca gactgaccct ggacaaaatc gccgtgctga aagagggcga tctgtaccca 3420
gacaaaggcg gcgagaagtt catcagcctg agcaaggatc ggaagtgcgt gaccacacac 3480
gccgacatca acgccgctca gaacctgcag aagcggttct ggacaagaac ccacggcttc 3540
tacaaggtgt actgcaaggc ctaccaggtg gacggccaga ccgtgtacat ccctgagagc 3600
aaggaccaga agcagaagat catcgaagag ttcggcgagg gctacttcat tctgaaggac 3660
ggggtgtacg aatgggtcaa cgccggcaag ctgaaaatca agaagggcag ctccaagcag 3720
agcagcagcg agctggtgga tagcgacatc ctgaaagaca gcttcgacct ggcctccgag 3780
ctgaaaggcg aaaagctgat gctgtacagg gaccccagcg gcaatgtgtt ccccagcgac 3840
aaatggatgg ccgctggcgt gttcttcgga aagctggaac gcatcctgat cagcaagctg 3900
accaaccagt actccatcag caccatcgag gacgacagca gcaagcagtc tatgaaaagg 3960
ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa agggatccta cccatacgat 4020
gttccagatt acgcttatcc ctacgacgtg cctgattatg catacccata tgatgtcccc 4080
gactatgcct aa 4092
<210> 5
<211> 1361
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at K255 polypeptide sequence
<400> 5
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
20 25 30
Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
35 40 45
Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
50 55 60
His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
65 70 75 80
Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
85 90 95
Ser Phe Thr His Glu Val Asp Lys Asp Glu Val Phe Asn Ile Leu Arg
100 105 110
Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
115 120 125
Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
130 135 140
Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
145 150 155 160
Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
165 170 175
Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
180 185 190
Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Tyr Thr Asp
195 200 205
Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
210 215 220
Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
225 230 235 240
Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
245 250 255
Tyr Glu Lys Val Glu Lys Glu Tyr Lys Thr Leu Glu Glu Arg Ile Lys
260 265 270
Gly Gly Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp
275 280 285
Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu
290 295 300
Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu
305 310 315 320
Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu
325 330 335
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu
340 345 350
Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala
355 360 365
Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg
370 375 380
Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His
385 390 395 400
Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp
405 410 415
Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val
420 425 430
Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser Gly
435 440 445
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
450 455 460
Glu Asp Ile Gln Ala Leu Lys Ala Leu Glu Gln Tyr Glu Lys Glu Arg
465 470 475 480
Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
485 490 495
Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
500 505 510
Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
515 520 525
Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
530 535 540
Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
545 550 555 560
Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
565 570 575
Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
580 585 590
His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
595 600 605
Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
610 615 620
Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
625 630 635 640
Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
645 650 655
Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
660 665 670
Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
675 680 685
Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
690 695 700
Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
705 710 715 720
Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
725 730 735
Ile His Arg Asp Asp Phe Pro Lys Val Val Asn Phe Lys Pro Lys Glu
740 745 750
Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
755 760 765
Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
770 775 780
Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
785 790 795 800
Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
805 810 815
Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
820 825 830
Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
835 840 845
Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
850 855 860
Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
865 870 875 880
Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
885 890 895
Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
900 905 910
Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
915 920 925
Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
930 935 940
Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
945 950 955 960
Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
965 970 975
Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
980 985 990
Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
995 1000 1005
Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp
1010 1015 1020
Gln Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu
1025 1030 1035
Ser Asn Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser
1040 1045 1050
Lys Leu Met Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala
1055 1060 1065
Leu Gln Gly Glu Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala
1070 1075 1080
Gln Phe Ser Ser Arg Phe His Ala Lys Thr Gly Ser Pro Gly Ile
1085 1090 1095
Arg Cys Ser Val Val Thr Lys Glu Lys Leu Gln Asp Asn Arg Phe
1100 1105 1110
Phe Lys Asn Leu Gln Arg Glu Gly Arg Leu Thr Leu Asp Lys Ile
1115 1120 1125
Ala Val Leu Lys Glu Gly Asp Leu Tyr Pro Asp Lys Gly Gly Glu
1130 1135 1140
Lys Phe Ile Ser Leu Ser Lys Asp Arg Lys Cys Val Thr Thr His
1145 1150 1155
Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Thr
1160 1165 1170
Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys Ala Tyr Gln Val
1175 1180 1185
Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp Gln Lys Gln
1190 1195 1200
Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu Lys Asp
1205 1210 1215
Gly Val Tyr Glu Trp Val Asn Ala Gly Lys Leu Lys Ile Lys Lys
1220 1225 1230
Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser Asp Ile
1235 1240 1245
Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly Glu Lys
1250 1255 1260
Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro Ser Asp
1265 1270 1275
Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu Arg Ile
1280 1285 1290
Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr Ile Glu
1295 1300 1305
Asp Asp Ser Ser Lys Gln Ser Met Lys Arg Pro Ala Ala Thr Lys
1310 1315 1320
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
1325 1330 1335
Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1340 1345 1350
Pro Tyr Asp Val Pro Asp Tyr Ala
1355 1360
<210> 6
<211> 4092
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at D306 polynucleotide sequence
<220>
<221> misc_feature
<222> (1)..(6)
<223> Kozak sequence
<220>
<221> misc_feature
<222> (7)..(57)
<223> Sequence encoding N-terminal nuclear localization signal (NLS)
<220>
<221> misc_feature
<222> (58)..(975)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (976)..(993)
<223> Sequence encoding a linker
<220>
<221> misc_feature
<222> (994)..(1491)
<223> Sequence encoding TadA*8
<220>
<221> misc_feature
<222> (1492)..(1551)
<223> Sequence encoding Xten20 linker
<220>
<221> misc_feature
<222> (1552)..(3954)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (3955)..(4002)
<223> Sequence encoding C-terminal NLS
<220>
<221> misc_feature
<222> (4003)..(4008)
<223> Sequence encoding a GS linker
<220>
<221> misc_feature
<222> (4009)..(4089)
<223> Sequence encoding 3x hemagglutinin (HA) tag
<400> 6
gccaccatgg ccccaaagaa gaagcggaag gtcggtatcc acggagtccc agcagccgcc 60
accagatcct tcatcctgaa gatcgagccc aacgaggaag tgaagaaagg cctctggaaa 120
acccacgagg tgctgaacca cggaatcgcc tactacatga atatcctgaa gctgatccgg 180
caagaggcca tctacgagca ccacgagcag gaccccaaga atcccaagaa ggtgtccaag 240
gccgagatcc aggccgagct gtgggatttc gtgctgaaga tgcagaagtg caacagcttc 300
acacacgagg tggacaagga cgaggtgttc aacatcctga gagagctgta cgaggaactg 360
gtgcccagca gcgtggaaaa gaagggcgaa gccaaccagc tgagcaacaa gtttctgtac 420
cctctggtgg accccaacag ccagtctgga aagggaacag ccagcagcgg cagaaagccc 480
agatggtaca acctgaagat tgccggcgat ccctcctggg aagaagagaa gaagaagtgg 540
gaagaagata agaaaaagga cccgctggcc aagatcctgg gcaagctggc tgagtacgga 600
ctgatccctc tgttcatccc ctacaccgac agcaacgagc ccatcgtgaa agaaatcaag 660
tggatggaaa agtcccggaa ccagagcgtg cggcggctgg ataaggacat gttcattcag 720
gccctggaac ggttcctgag ctgggagagc tggaacctga aagtgaaaga ggaatacgag 780
aaggtcgaga aagagtacaa gaccctggaa gagaggatca aagaggacat ccaggctctg 840
aaggctctgg aacagtatga gaaagagcgg caagaacagc tgctgcggga caccctgaac 900
accaacgagt accggctgag caagagaggc cttagaggct ggcgggaaat catccagaaa 960
tggctgaaaa tggacggagg ctctggagga agctccgaag tcgagttttc ccatgagtac 1020
tggatgagac acgcattgac tctcgcaaag agggctcgag atgaacgcga ggtgcccgtg 1080
ggggcagtac tcgtgctcaa caatcgcgta atcggcgaag gttggaatag ggcaatcgga 1140
ctccacgacc ccactgcaca tgcggaaatc atggcccttc gacagggagg gcttgtgatg 1200
cagaattatc gactttatga tgcgacgctg tacgtcacgt ttgaaccttg cgtaatgtgc 1260
gcgggagcta tgattcactc ccgcattgga cgagttgtat tcggtgttcg caacgccaag 1320
acgggtgccg caggttcact gatggacgtg ctgcatcatc caggcatgaa ccaccgggta 1380
gaaatcacag aaggcatatt ggcggacgaa tgtgcggcgc tgttgtgtcg tttttttcgc 1440
atgcccaggc gggtctttaa cgcccagaaa aaagcacaat cctctactga cggctcttct 1500
ggatctgaaa cacctggcac aagcgagagc gccacccctg agagctctgg cgagaacgag 1560
ccctccgaga agtacctgga agtgttcaag gactaccagc ggaagcaccc tagagaggcc 1620
ggcgattaca gcgtgtacga gttcctgtcc aagaaagaga accacttcat ctggcggaat 1680
caccctgagt acccctacct gtacgccacc ttctgcgaga tcgacaagaa aaagaaggac 1740
gccaagcagc aggccacctt cacactggcc gatcctatca atcaccctct gtgggtccga 1800
ttcgaggaaa gaagcggcag caacctgaac aagtacagaa tcctgaccga gcagctgcac 1860
accgagaagc tgaagaaaaa gctgacagtg cagctggacc ggctgatcta ccctacagaa 1920
tctggcggct gggaagagaa gggcaaagtg gacattgtgc tgctgcccag ccggcagttc 1980
tacaaccaga tcttcctgga catcgaggaa aagggcaagc acgccttcac ctacaaggat 2040
gagagcatca agttccctct gaagggcaca ctcggcggag ccagagtgca gttcgacaga 2100
gatcacctga gaagataccc tcacaaggtg gaaagcggca acgtgggcag aatctacttc 2160
aacatgaccg tgaacatcga gcctacagag tccccagtgt ccaagtctct gaagatccac 2220
cgggacgact tccccaaggt ggtcaacttc aagcccaaag aactgaccga gtggatcaag 2280
gacagcaagg gcaagaaact gaagtccggc atcgagtccc tggaaatcgg cctgagagtg 2340
atgagcatcg acctgggaca gagacaggcc gctgccgcct ctattttcga ggtggtggat 2400
cagaagcccg acatcgaagg caagctgttt ttcccaatca agggcaccga gctgtatgcc 2460
gtgcacagag ccagcttcaa catcaagctg cccggcgaga cactggtcaa gagcagagaa 2520
gtgctgcgga aggccagaga ggacaatctg aaactgatga accagaagct caacttcctg 2580
cggaacgtgc tgcacttcca gcagttcgag gacatcaccg agagagagaa gcgggtcacc 2640
aagtggatca gcagacaaga gaacagcgac gtgcccctgg tgtaccagga tgagctgatc 2700
cagatccgcg agctgatgta caagccttac aaggactggg tcgccttcct gaagcagctc 2760
cacaagagac tggaagtcga gatcggcaaa gaagtgaagc actggcggaa gtccctgagc 2820
gacggaagaa agggcctgta cggcatctcc ctgaagaaca tcgacgagat cgatcggacc 2880
cggaagttcc tgctgagatg gtccctgagg cctaccgaac ctggcgaagt gcgtagactg 2940
gaacccggcc agagattcgc catcgaccag ctgaatcacc tgaacgccct gaaagaagat 3000
cggctgaaga agatggccaa caccatcatc atgcacgccc tgggctactg ctacgacgtg 3060
cggaagaaga aatggcaggc taagaacccc gcctgccaga tcatcctgtt cgaggatctg 3120
agcaactaca acccctacga ggaaaggtcc cgcttcgaga acagcaagct catgaagtgg 3180
tccagacgcg agatccccag acaggttgca ctgcagggcg agatctatgg cctgcaagtg 3240
ggagaagtgg gcgctcagtt cagcagcaga ttccacgcca agacaggcag ccctggcatc 3300
agatgtagcg tcgtgaccaa agagaagctg caggacaatc ggttcttcaa gaatctgcag 3360
agagagggca gactgaccct ggacaaaatc gccgtgctga aagagggcga tctgtaccca 3420
gacaaaggcg gcgagaagtt catcagcctg agcaaggatc ggaagtgcgt gaccacacac 3480
gccgacatca acgccgctca gaacctgcag aagcggttct ggacaagaac ccacggcttc 3540
tacaaggtgt actgcaaggc ctaccaggtg gacggccaga ccgtgtacat ccctgagagc 3600
aaggaccaga agcagaagat catcgaagag ttcggcgagg gctacttcat tctgaaggac 3660
ggggtgtacg aatgggtcaa cgccggcaag ctgaaaatca agaagggcag ctccaagcag 3720
agcagcagcg agctggtgga tagcgacatc ctgaaagaca gcttcgacct ggcctccgag 3780
ctgaaaggcg aaaagctgat gctgtacagg gaccccagcg gcaatgtgtt ccccagcgac 3840
aaatggatgg ccgctggcgt gttcttcgga aagctggaac gcatcctgat cagcaagctg 3900
accaaccagt actccatcag caccatcgag gacgacagca gcaagcagtc tatgaaaagg 3960
ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa agggatccta cccatacgat 4020
gttccagatt acgcttatcc ctacgacgtg cctgattatg catacccata tgatgtcccc 4080
gactatgcct aa 4092
<210> 7
<211> 1361
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at D306 polypeptide sequence
<400> 7
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
20 25 30
Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
35 40 45
Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
50 55 60
His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
65 70 75 80
Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
85 90 95
Ser Phe Thr His Glu Val Asp Lys Asp Glu Val Phe Asn Ile Leu Arg
100 105 110
Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
115 120 125
Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
130 135 140
Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
145 150 155 160
Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
165 170 175
Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
180 185 190
Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Tyr Thr Asp
195 200 205
Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
210 215 220
Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
225 230 235 240
Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
245 250 255
Tyr Glu Lys Val Glu Lys Glu Tyr Lys Thr Leu Glu Glu Arg Ile Lys
260 265 270
Glu Asp Ile Gln Ala Leu Lys Ala Leu Glu Gln Tyr Glu Lys Glu Arg
275 280 285
Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
290 295 300
Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
305 310 315 320
Lys Met Asp Gly Gly Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His
325 330 335
Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp
340 345 350
Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val
355 360 365
Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala
370 375 380
His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn
385 390 395 400
Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val
405 410 415
Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe
420 425 430
Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val
435 440 445
Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile
450 455 460
Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg Met Pro
465 470 475 480
Arg Arg Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly
485 490 495
Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
500 505 510
Ser Ser Gly Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
515 520 525
Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
530 535 540
Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
545 550 555 560
Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
565 570 575
Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
580 585 590
His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
595 600 605
Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
610 615 620
Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
625 630 635 640
Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
645 650 655
Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
660 665 670
Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
675 680 685
Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
690 695 700
Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
705 710 715 720
Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
725 730 735
Ile His Arg Asp Asp Phe Pro Lys Val Val Asn Phe Lys Pro Lys Glu
740 745 750
Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
755 760 765
Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
770 775 780
Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
785 790 795 800
Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
805 810 815
Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
820 825 830
Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
835 840 845
Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
850 855 860
Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
865 870 875 880
Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
885 890 895
Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
900 905 910
Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
915 920 925
Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
930 935 940
Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
945 950 955 960
Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
965 970 975
Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
980 985 990
Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
995 1000 1005
Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp
1010 1015 1020
Gln Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu
1025 1030 1035
Ser Asn Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser
1040 1045 1050
Lys Leu Met Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala
1055 1060 1065
Leu Gln Gly Glu Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala
1070 1075 1080
Gln Phe Ser Ser Arg Phe His Ala Lys Thr Gly Ser Pro Gly Ile
1085 1090 1095
Arg Cys Ser Val Val Thr Lys Glu Lys Leu Gln Asp Asn Arg Phe
1100 1105 1110
Phe Lys Asn Leu Gln Arg Glu Gly Arg Leu Thr Leu Asp Lys Ile
1115 1120 1125
Ala Val Leu Lys Glu Gly Asp Leu Tyr Pro Asp Lys Gly Gly Glu
1130 1135 1140
Lys Phe Ile Ser Leu Ser Lys Asp Arg Lys Cys Val Thr Thr His
1145 1150 1155
Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Thr
1160 1165 1170
Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys Ala Tyr Gln Val
1175 1180 1185
Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp Gln Lys Gln
1190 1195 1200
Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu Lys Asp
1205 1210 1215
Gly Val Tyr Glu Trp Val Asn Ala Gly Lys Leu Lys Ile Lys Lys
1220 1225 1230
Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser Asp Ile
1235 1240 1245
Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly Glu Lys
1250 1255 1260
Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro Ser Asp
1265 1270 1275
Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu Arg Ile
1280 1285 1290
Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr Ile Glu
1295 1300 1305
Asp Asp Ser Ser Lys Gln Ser Met Lys Arg Pro Ala Ala Thr Lys
1310 1315 1320
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
1325 1330 1335
Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1340 1345 1350
Pro Tyr Asp Val Pro Asp Tyr Ala
1355 1360
<210> 8
<211> 4092
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at D980 polynucleotide sequence
<220>
<221> misc_feature
<222> (1)..(6)
<223> Kozak sequence
<220>
<221> misc_feature
<222> (7)..(57)
<223> Sequence encoding N-terminal nuclear localization signal (NLS)
<220>
<221> misc_feature
<222> (58)..(2997)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (2998)..(3015)
<223> Sequence encoding a linker
<220>
<221> misc_feature
<222> (3016)..(3513)
<223> Sequence encoding TadA*8
<220>
<221> misc_feature
<222> (3514)..(3573)
<223> Sequence encoding Xten20 linker
<220>
<221> misc_feature
<222> (3574)..(3954)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (3955)..(4002)
<223> Sequence encoding C-terminal NLS
<220>
<221> misc_feature
<222> (4003)..(4008)
<223> Sequence encoding a GS linker
<220>
<221> misc_feature
<222> (4009)..(4089)
<223> Sequence encoding 3x hemagglutinin (HA) tag
<400> 8
gccaccatgg ccccaaagaa gaagcggaag gtcggtatcc acggagtccc agcagccgcc 60
accagatcct tcatcctgaa gatcgagccc aacgaggaag tgaagaaagg cctctggaaa 120
acccacgagg tgctgaacca cggaatcgcc tactacatga atatcctgaa gctgatccgg 180
caagaggcca tctacgagca ccacgagcag gaccccaaga atcccaagaa ggtgtccaag 240
gccgagatcc aggccgagct gtgggatttc gtgctgaaga tgcagaagtg caacagcttc 300
acacacgagg tggacaagga cgaggtgttc aacatcctga gagagctgta cgaggaactg 360
gtgcccagca gcgtggaaaa gaagggcgaa gccaaccagc tgagcaacaa gtttctgtac 420
cctctggtgg accccaacag ccagtctgga aagggaacag ccagcagcgg cagaaagccc 480
agatggtaca acctgaagat tgccggcgat ccctcctggg aagaagagaa gaagaagtgg 540
gaagaagata agaaaaagga cccgctggcc aagatcctgg gcaagctggc tgagtacgga 600
ctgatccctc tgttcatccc ctacaccgac agcaacgagc ccatcgtgaa agaaatcaag 660
tggatggaaa agtcccggaa ccagagcgtg cggcggctgg ataaggacat gttcattcag 720
gccctggaac ggttcctgag ctgggagagc tggaacctga aagtgaaaga ggaatacgag 780
aaggtcgaga aagagtacaa gaccctggaa gagaggatca aagaggacat ccaggctctg 840
aaggctctgg aacagtatga gaaagagcgg caagaacagc tgctgcggga caccctgaac 900
accaacgagt accggctgag caagagaggc cttagaggct ggcgggaaat catccagaaa 960
tggctgaaaa tggacgagaa cgagccctcc gagaagtacc tggaagtgtt caaggactac 1020
cagcggaagc accctagaga ggccggcgat tacagcgtgt acgagttcct gtccaagaaa 1080
gagaaccact tcatctggcg gaatcaccct gagtacccct acctgtacgc caccttctgc 1140
gagatcgaca agaaaaagaa ggacgccaag cagcaggcca ccttcacact ggccgatcct 1200
atcaatcacc ctctgtgggt ccgattcgag gaaagaagcg gcagcaacct gaacaagtac 1260
agaatcctga ccgagcagct gcacaccgag aagctgaaga aaaagctgac agtgcagctg 1320
gaccggctga tctaccctac agaatctggc ggctgggaag agaagggcaa agtggacatt 1380
gtgctgctgc ccagccggca gttctacaac cagatcttcc tggacatcga ggaaaagggc 1440
aagcacgcct tcacctacaa ggatgagagc atcaagttcc ctctgaaggg cacactcggc 1500
ggagccagag tgcagttcga cagagatcac ctgagaagat accctcacaa ggtggaaagc 1560
ggcaacgtgg gcagaatcta cttcaacatg accgtgaaca tcgagcctac agagtcccca 1620
gtgtccaagt ctctgaagat ccaccgggac gacttcccca aggtggtcaa cttcaagccc 1680
aaagaactga ccgagtggat caaggacagc aagggcaaga aactgaagtc cggcatcgag 1740
tccctggaaa tcggcctgag agtgatgagc atcgacctgg gacagagaca ggccgctgcc 1800
gcctctattt tcgaggtggt ggatcagaag cccgacatcg aaggcaagct gtttttccca 1860
atcaagggca ccgagctgta tgccgtgcac agagccagct tcaacatcaa gctgcccggc 1920
gagacactgg tcaagagcag agaagtgctg cggaaggcca gagaggacaa tctgaaactg 1980
atgaaccaga agctcaactt cctgcggaac gtgctgcact tccagcagtt cgaggacatc 2040
accgagagag agaagcgggt caccaagtgg atcagcagac aagagaacag cgacgtgccc 2100
ctggtgtacc aggatgagct gatccagatc cgcgagctga tgtacaagcc ttacaaggac 2160
tgggtcgcct tcctgaagca gctccacaag agactggaag tcgagatcgg caaagaagtg 2220
aagcactggc ggaagtccct gagcgacgga agaaagggcc tgtacggcat ctccctgaag 2280
aacatcgacg agatcgatcg gacccggaag ttcctgctga gatggtccct gaggcctacc 2340
gaacctggcg aagtgcgtag actggaaccc ggccagagat tcgccatcga ccagctgaat 2400
cacctgaacg ccctgaaaga agatcggctg aagaagatgg ccaacaccat catcatgcac 2460
gccctgggct actgctacga cgtgcggaag aagaaatggc aggctaagaa ccccgcctgc 2520
cagatcatcc tgttcgagga tctgagcaac tacaacccct acgaggaaag gtcccgcttc 2580
gagaacagca agctcatgaa gtggtccaga cgcgagatcc ccagacaggt tgcactgcag 2640
ggcgagatct atggcctgca agtgggagaa gtgggcgctc agttcagcag cagattccac 2700
gccaagacag gcagccctgg catcagatgt agcgtcgtga ccaaagagaa gctgcaggac 2760
aatcggttct tcaagaatct gcagagagag ggcagactga ccctggacaa aatcgccgtg 2820
ctgaaagagg gcgatctgta cccagacaaa ggcggcgaga agttcatcag cctgagcaag 2880
gatcggaagt gcgtgaccac acacgccgac atcaacgccg ctcagaacct gcagaagcgg 2940
ttctggacaa gaacccacgg cttctacaag gtgtactgca aggcctacca ggtggacgga 3000
ggctctggag gaagctccga agtcgagttt tcccatgagt actggatgag acacgcattg 3060
actctcgcaa agagggctcg agatgaacgc gaggtgcccg tgggggcagt actcgtgctc 3120
aacaatcgcg taatcggcga aggttggaat agggcaatcg gactccacga ccccactgca 3180
catgcggaaa tcatggccct tcgacaggga gggcttgtga tgcagaatta tcgactttat 3240
gatgcgacgc tgtacgtcac gtttgaacct tgcgtaatgt gcgcgggagc tatgattcac 3300
tcccgcattg gacgagttgt attcggtgtt cgcaacgcca agacgggtgc cgcaggttca 3360
ctgatggacg tgctgcatca tccaggcatg aaccaccggg tagaaatcac agaaggcata 3420
ttggcggacg aatgtgcggc gctgttgtgt cgtttttttc gcatgcccag gcgggtcttt 3480
aacgcccaga aaaaagcaca atcctctact gacggctctt ctggatctga aacacctggc 3540
acaagcgaga gcgccacccc tgagagctct ggcggccaga ccgtgtacat ccctgagagc 3600
aaggaccaga agcagaagat catcgaagag ttcggcgagg gctacttcat tctgaaggac 3660
ggggtgtacg aatgggtcaa cgccggcaag ctgaaaatca agaagggcag ctccaagcag 3720
agcagcagcg agctggtgga tagcgacatc ctgaaagaca gcttcgacct ggcctccgag 3780
ctgaaaggcg aaaagctgat gctgtacagg gaccccagcg gcaatgtgtt ccccagcgac 3840
aaatggatgg ccgctggcgt gttcttcgga aagctggaac gcatcctgat cagcaagctg 3900
accaaccagt actccatcag caccatcgag gacgacagca gcaagcagtc tatgaaaagg 3960
ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa agggatccta cccatacgat 4020
gttccagatt acgcttatcc ctacgacgtg cctgattatg catacccata tgatgtcccc 4080
gactatgcct aa 4092
<210> 9
<211> 1361
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at D980 polypeptide sequence
<400> 9
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
20 25 30
Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
35 40 45
Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
50 55 60
His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
65 70 75 80
Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
85 90 95
Ser Phe Thr His Glu Val Asp Lys Asp Glu Val Phe Asn Ile Leu Arg
100 105 110
Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
115 120 125
Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
130 135 140
Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
145 150 155 160
Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
165 170 175
Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
180 185 190
Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Tyr Thr Asp
195 200 205
Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
210 215 220
Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
225 230 235 240
Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
245 250 255
Tyr Glu Lys Val Glu Lys Glu Tyr Lys Thr Leu Glu Glu Arg Ile Lys
260 265 270
Glu Asp Ile Gln Ala Leu Lys Ala Leu Glu Gln Tyr Glu Lys Glu Arg
275 280 285
Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
290 295 300
Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
305 310 315 320
Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
325 330 335
Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
340 345 350
Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
355 360 365
Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
370 375 380
Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
385 390 395 400
His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
405 410 415
Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
420 425 430
Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
435 440 445
Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
450 455 460
Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
465 470 475 480
Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
485 490 495
Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
500 505 510
Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
515 520 525
Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
530 535 540
Ile His Arg Asp Asp Phe Pro Lys Val Val Asn Phe Lys Pro Lys Glu
545 550 555 560
Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
565 570 575
Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
580 585 590
Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
595 600 605
Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
610 615 620
Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
625 630 635 640
Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
645 650 655
Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
660 665 670
Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
675 680 685
Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
690 695 700
Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
705 710 715 720
Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
725 730 735
Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
740 745 750
Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
755 760 765
Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
770 775 780
Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
785 790 795 800
Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
805 810 815
Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln
820 825 830
Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn
835 840 845
Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met
850 855 860
Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu
865 870 875 880
Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg
885 890 895
Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr
900 905 910
Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu
915 920 925
Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu
930 935 940
Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg
945 950 955 960
Lys Cys Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln
965 970 975
Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys
980 985 990
Ala Tyr Gln Val Asp Gly Gly Ser Gly Gly Ser Ser Glu Val Glu Phe
995 1000 1005
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg
1010 1015 1020
Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu
1025 1030 1035
Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu
1040 1045 1050
His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly
1055 1060 1065
Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr
1070 1075 1080
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
1085 1090 1095
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr
1100 1105 1110
Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met
1115 1120 1125
Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys
1130 1135 1140
Ala Ala Leu Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe
1145 1150 1155
Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser Gly
1160 1165 1170
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
1175 1180 1185
Gly Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp Gln Lys Gln
1190 1195 1200
Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu Lys Asp
1205 1210 1215
Gly Val Tyr Glu Trp Val Asn Ala Gly Lys Leu Lys Ile Lys Lys
1220 1225 1230
Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser Asp Ile
1235 1240 1245
Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly Glu Lys
1250 1255 1260
Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro Ser Asp
1265 1270 1275
Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu Arg Ile
1280 1285 1290
Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr Ile Glu
1295 1300 1305
Asp Asp Ser Ser Lys Gln Ser Met Lys Arg Pro Ala Ala Thr Lys
1310 1315 1320
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
1325 1330 1335
Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1340 1345 1350
Pro Tyr Asp Val Pro Asp Tyr Ala
1355 1360
<210> 10
<211> 4092
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at K1019 polynucleotide sequence
<220>
<221> misc_feature
<222> (1)..(6)
<223> Kozak sequence
<220>
<221> misc_feature
<222> (7)..(57)
<223> Sequence encoding N-terminal nuclear localization signal (NLS)
<220>
<221> misc_feature
<222> (58)..(3114)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (3115)..(3132)
<223> Sequence encoding a linker
<220>
<221> misc_feature
<222> (3133)..(3630)
<223> Sequence encoding TadA*8
<220>
<221> misc_feature
<222> (3631)..(3690)
<223> Sequence encoding Xten20 linker
<220>
<221> misc_feature
<222> (3691)..(3954)
<223> Sequence encoding BhCas12b
<220>
<221> misc_feature
<222> (3955)..(4002)
<223> Sequence encoding C-terminal NLS
<220>
<221> misc_feature
<222> (4003)..(4008)
<223> Sequence encoding GS linker
<220>
<221> misc_feature
<222> (4009)..(4089)
<223> Sequence encoding 3x hemagglutinin (HA) tag
<400> 10
gccaccatgg ccccaaagaa gaagcggaag gtcggtatcc acggagtccc agcagccgcc 60
accagatcct tcatcctgaa gatcgagccc aacgaggaag tgaagaaagg cctctggaaa 120
acccacgagg tgctgaacca cggaatcgcc tactacatga atatcctgaa gctgatccgg 180
caagaggcca tctacgagca ccacgagcag gaccccaaga atcccaagaa ggtgtccaag 240
gccgagatcc aggccgagct gtgggatttc gtgctgaaga tgcagaagtg caacagcttc 300
acacacgagg tggacaagga cgaggtgttc aacatcctga gagagctgta cgaggaactg 360
gtgcccagca gcgtggaaaa gaagggcgaa gccaaccagc tgagcaacaa gtttctgtac 420
cctctggtgg accccaacag ccagtctgga aagggaacag ccagcagcgg cagaaagccc 480
agatggtaca acctgaagat tgccggcgat ccctcctggg aagaagagaa gaagaagtgg 540
gaagaagata agaaaaagga cccgctggcc aagatcctgg gcaagctggc tgagtacgga 600
ctgatccctc tgttcatccc ctacaccgac agcaacgagc ccatcgtgaa agaaatcaag 660
tggatggaaa agtcccggaa ccagagcgtg cggcggctgg ataaggacat gttcattcag 720
gccctggaac ggttcctgag ctgggagagc tggaacctga aagtgaaaga ggaatacgag 780
aaggtcgaga aagagtacaa gaccctggaa gagaggatca aagaggacat ccaggctctg 840
aaggctctgg aacagtatga gaaagagcgg caagaacagc tgctgcggga caccctgaac 900
accaacgagt accggctgag caagagaggc cttagaggct ggcgggaaat catccagaaa 960
tggctgaaaa tggacgagaa cgagccctcc gagaagtacc tggaagtgtt caaggactac 1020
cagcggaagc accctagaga ggccggcgat tacagcgtgt acgagttcct gtccaagaaa 1080
gagaaccact tcatctggcg gaatcaccct gagtacccct acctgtacgc caccttctgc 1140
gagatcgaca agaaaaagaa ggacgccaag cagcaggcca ccttcacact ggccgatcct 1200
atcaatcacc ctctgtgggt ccgattcgag gaaagaagcg gcagcaacct gaacaagtac 1260
agaatcctga ccgagcagct gcacaccgag aagctgaaga aaaagctgac agtgcagctg 1320
gaccggctga tctaccctac agaatctggc ggctgggaag agaagggcaa agtggacatt 1380
gtgctgctgc ccagccggca gttctacaac cagatcttcc tggacatcga ggaaaagggc 1440
aagcacgcct tcacctacaa ggatgagagc atcaagttcc ctctgaaggg cacactcggc 1500
ggagccagag tgcagttcga cagagatcac ctgagaagat accctcacaa ggtggaaagc 1560
ggcaacgtgg gcagaatcta cttcaacatg accgtgaaca tcgagcctac agagtcccca 1620
gtgtccaagt ctctgaagat ccaccgggac gacttcccca aggtggtcaa cttcaagccc 1680
aaagaactga ccgagtggat caaggacagc aagggcaaga aactgaagtc cggcatcgag 1740
tccctggaaa tcggcctgag agtgatgagc atcgacctgg gacagagaca ggccgctgcc 1800
gcctctattt tcgaggtggt ggatcagaag cccgacatcg aaggcaagct gtttttccca 1860
atcaagggca ccgagctgta tgccgtgcac agagccagct tcaacatcaa gctgcccggc 1920
gagacactgg tcaagagcag agaagtgctg cggaaggcca gagaggacaa tctgaaactg 1980
atgaaccaga agctcaactt cctgcggaac gtgctgcact tccagcagtt cgaggacatc 2040
accgagagag agaagcgggt caccaagtgg atcagcagac aagagaacag cgacgtgccc 2100
ctggtgtacc aggatgagct gatccagatc cgcgagctga tgtacaagcc ttacaaggac 2160
tgggtcgcct tcctgaagca gctccacaag agactggaag tcgagatcgg caaagaagtg 2220
aagcactggc ggaagtccct gagcgacgga agaaagggcc tgtacggcat ctccctgaag 2280
aacatcgacg agatcgatcg gacccggaag ttcctgctga gatggtccct gaggcctacc 2340
gaacctggcg aagtgcgtag actggaaccc ggccagagat tcgccatcga ccagctgaat 2400
cacctgaacg ccctgaaaga agatcggctg aagaagatgg ccaacaccat catcatgcac 2460
gccctgggct actgctacga cgtgcggaag aagaaatggc aggctaagaa ccccgcctgc 2520
cagatcatcc tgttcgagga tctgagcaac tacaacccct acgaggaaag gtcccgcttc 2580
gagaacagca agctcatgaa gtggtccaga cgcgagatcc ccagacaggt tgcactgcag 2640
ggcgagatct atggcctgca agtgggagaa gtgggcgctc agttcagcag cagattccac 2700
gccaagacag gcagccctgg catcagatgt agcgtcgtga ccaaagagaa gctgcaggac 2760
aatcggttct tcaagaatct gcagagagag ggcagactga ccctggacaa aatcgccgtg 2820
ctgaaagagg gcgatctgta cccagacaaa ggcggcgaga agttcatcag cctgagcaag 2880
gatcggaagt gcgtgaccac acacgccgac atcaacgccg ctcagaacct gcagaagcgg 2940
ttctggacaa gaacccacgg cttctacaag gtgtactgca aggcctacca ggtggacggc 3000
cagaccgtgt acatccctga gagcaaggac cagaagcaga agatcatcga agagttcggc 3060
gagggctact tcattctgaa ggacggggtg tacgaatggg tcaacgccgg caagggaggc 3120
tctggaggaa gctccgaagt cgagttttcc catgagtact ggatgagaca cgcattgact 3180
ctcgcaaaga gggctcgaga tgaacgcgag gtgcccgtgg gggcagtact cgtgctcaac 3240
aatcgcgtaa tcggcgaagg ttggaatagg gcaatcggac tccacgaccc cactgcacat 3300
gcggaaatca tggcccttcg acagggaggg cttgtgatgc agaattatcg actttatgat 3360
gcgacgctgt acgtcacgtt tgaaccttgc gtaatgtgcg cgggagctat gattcactcc 3420
cgcattggac gagttgtatt cggtgttcgc aacgccaaga cgggtgccgc aggttcactg 3480
atggacgtgc tgcatcatcc aggcatgaac caccgggtag aaatcacaga aggcatattg 3540
gcggacgaat gtgcggcgct gttgtgtcgt ttttttcgca tgcccaggcg ggtctttaac 3600
gcccagaaaa aagcacaatc ctctactgac ggctcttctg gatctgaaac acctggcaca 3660
agcgagagcg ccacccctga gagctctggc ctgaaaatca agaagggcag ctccaagcag 3720
agcagcagcg agctggtgga tagcgacatc ctgaaagaca gcttcgacct ggcctccgag 3780
ctgaaaggcg aaaagctgat gctgtacagg gaccccagcg gcaatgtgtt ccccagcgac 3840
aaatggatgg ccgctggcgt gttcttcgga aagctggaac gcatcctgat cagcaagctg 3900
accaaccagt actccatcag caccatcgag gacgacagca gcaagcagtc tatgaaaagg 3960
ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa agggatccta cccatacgat 4020
gttccagatt acgcttatcc ctacgacgtg cctgattatg catacccata tgatgtcccc 4080
gactatgcct aa 4092
<210> 11
<211> 1361
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: BhCas12b GGSGGS-ABE8-Xten20
at K1019 polypeptide sequence
<400> 11
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
20 25 30
Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
35 40 45
Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
50 55 60
His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
65 70 75 80
Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
85 90 95
Ser Phe Thr His Glu Val Asp Lys Asp Glu Val Phe Asn Ile Leu Arg
100 105 110
Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
115 120 125
Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
130 135 140
Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
145 150 155 160
Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
165 170 175
Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
180 185 190
Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Tyr Thr Asp
195 200 205
Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
210 215 220
Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
225 230 235 240
Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
245 250 255
Tyr Glu Lys Val Glu Lys Glu Tyr Lys Thr Leu Glu Glu Arg Ile Lys
260 265 270
Glu Asp Ile Gln Ala Leu Lys Ala Leu Glu Gln Tyr Glu Lys Glu Arg
275 280 285
Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
290 295 300
Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
305 310 315 320
Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
325 330 335
Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
340 345 350
Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
355 360 365
Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
370 375 380
Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
385 390 395 400
His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
405 410 415
Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
420 425 430
Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
435 440 445
Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
450 455 460
Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
465 470 475 480
Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
485 490 495
Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
500 505 510
Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
515 520 525
Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
530 535 540
Ile His Arg Asp Asp Phe Pro Lys Val Val Asn Phe Lys Pro Lys Glu
545 550 555 560
Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
565 570 575
Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
580 585 590
Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
595 600 605
Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
610 615 620
Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
625 630 635 640
Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
645 650 655
Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
660 665 670
Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
675 680 685
Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
690 695 700
Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
705 710 715 720
Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
725 730 735
Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
740 745 750
Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
755 760 765
Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
770 775 780
Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
785 790 795 800
Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
805 810 815
Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln
820 825 830
Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn
835 840 845
Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met
850 855 860
Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu
865 870 875 880
Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg
885 890 895
Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr
900 905 910
Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu
915 920 925
Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu
930 935 940
Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg
945 950 955 960
Lys Cys Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln
965 970 975
Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys
980 985 990
Ala Tyr Gln Val Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp
995 1000 1005
Gln Lys Gln Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile
1010 1015 1020
Leu Lys Asp Gly Val Tyr Glu Trp Val Asn Ala Gly Lys Gly Gly
1025 1030 1035
Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met
1040 1045 1050
Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu
1055 1060 1065
Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
1070 1075 1080
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
1085 1090 1095
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn
1100 1105 1110
Tyr Arg Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys
1115 1120 1125
Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
1130 1135 1140
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu
1145 1150 1155
Met Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile
1160 1165 1170
Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Arg
1175 1180 1185
Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys Lys Ala
1190 1195 1200
Gln Ser Ser Thr Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1205 1210 1215
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Leu Lys Ile Lys Lys
1220 1225 1230
Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser Asp Ile
1235 1240 1245
Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly Glu Lys
1250 1255 1260
Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro Ser Asp
1265 1270 1275
Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu Arg Ile
1280 1285 1290
Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr Ile Glu
1295 1300 1305
Asp Asp Ser Ser Lys Gln Ser Met Lys Arg Pro Ala Ala Thr Lys
1310 1315 1320
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
1325 1330 1335
Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1340 1345 1350
Pro Tyr Asp Val Pro Asp Tyr Ala
1355 1360
<210> 12
<211> 208
<212> PRT
<213> Petromyzon marinus
<220>
<221> MISC_FEATURE
<222> (1)..(208)
<223> tr|A5H718|A5H718_PETMA Cytosine deaminase OS=Petromyzon marinus
OX=7757 PE=2 SV=1 amino acid sequence; PmCDA1 polypeptide
sequence
<400> 12
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 13
<211> 766
<212> DNA
<213> Petromyzon marinus
<220>
<221> misc_feature
<222> (1)..(766)
<223> EF094822.1 Petromyzon marinus isolate PmCDA.21 cytosine deaminase
mRNA, complete cds; PmCDA1 polynucleotide sequence
<400> 13
tgacacgaca cagccgtgta tatgaggaag ggtagctgga tggggggggg gggaatacgt 60
tcagagagga cattagcgag cgtcttgttg gtggccttga gtctagacac ctgcagacat 120
gaccgacgct gagtacgtga gaatccatga gaagttggac atctacacgt ttaagaaaca 180
gtttttcaac aacaaaaaat ccgtgtcgca tagatgctac gttctctttg aattaaaacg 240
acggggtgaa cgtagagcgt gtttttgggg ctatgctgtg aataaaccac agagcgggac 300
agaacgtgga attcacgccg aaatctttag cattagaaaa gtcgaagaat acctgcgcga 360
caaccccgga caattcacga taaattggta ctcatcctgg agtccttgtg cagattgcgc 420
tgaaaagatc ttagaatggt ataaccagga gctgcggggg aacggccaca ctttgaaaat 480
ctgggcttgc aaactctatt acgagaaaaa tgcgaggaat caaattgggc tgtggaacct 540
cagagataac ggggttgggt tgaatgtaat ggtaagtgaa cactaccaat gttgcaggaa 600
aatattcatc caatcgtcgc acaatcaatt gaatgagaat agatggcttg agaagacttt 660
gaagcgagct gaaaaacgac ggagcgagtt gtccattatg attcaggtaa aaatactcca 720
caccactaag agtcctgctg tttaagaggc tatgcggatg gttttc 766
<210> 14
<211> 145
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(145)
<223> tr|Q6QJ80|Q6QJ80_HUMAN Activation-induced cytidine deaminase
OS=Homo sapiens OX=9606 GN=AICDA PE=2 SV=1; AID polypeptide
sequence
<400> 14
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Ala Pro
130 135 140
Val
145
<210> 15
<211> 10681
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (1)..(10681)
<223> NG_011588.1:5001-15681 Homo sapiens activation induced cytidine
deaminase (AICDA), RefSeqGene (LRG_17) on chromosome 12; nucleic
acid sequence of the CDS of human AID; polynucleotide sequence
<400> 15
agagaaccat cattaattga agtgagattt ttctggcctg agacttgcag ggaggcaaga 60
agacactctg gacaccacta tggacaggta aagaggcagt cttctcgtgg gtgattgcac 120
tggccttcct ctcagagcaa atctgagtaa tgagactggt agctatccct ttctctcatg 180
taactgtctg actgataaga tcagcttgat caatatgcat atatattttt tgatctgtct 240
ccttttcttc tattcagatc ttatacgctg tcagcccaat tctttctgtt tcagacttct 300
cttgatttcc ctctttttca tgtggcaaaa gaagtagtgc gtacaatgta ctgattcgtc 360
ctgagatttg taccatggtt gaaactaatt tatggtaata atattaacat agcaaatctt 420
tagagactca aatcatgaaa aggtaatagc agtactgtac taaaaacggt agtgctaatt 480
ttcgtaataa ttttgtaaat attcaacagt aaaacaactt gaagacacac tttcctaggg 540
aggcgttact gaaataattt agctatagta agaaaatttg taattttaga aatgccaagc 600
attctaaatt aattgcttga aagtcactat gattgtgtcc attataagga gacaaattca 660
ttcaagcaag ttatttaatg ttaaaggccc aattgttagg cagttaatgg cacttttact 720
attaactaat ctttccattt gttcagacgt agcttaactt acctcttagg tgtgaatttg 780
gttaaggtcc tcataatgtc tttatgtgca gtttttgata ggttattgtc atagaactta 840
ttctattcct acatttatga ttactatgga tgtatgagaa taacacctaa tccttatact 900
ttacctcaat ttaactcctt tataaagaac ttacattaca gaataaagat tttttaaaaa 960
tatatttttt tgtagagaca gggtcttagc ccagccgagg ctggtctcta agtcctggcc 1020
caagcgatcc tcctgcctgg gcctcctaaa gtgctggaat tatagacatg agccatcaca 1080
tccaatatac agaataaaga tttttaatgg aggatttaat gttcttcaga aaattttctt 1140
gaggtcagac aatgtcaaat gtctcctcag tttacactga gattttgaaa acaagtctga 1200
gctataggtc cttgtgaagg gtccattgga aatacttgtt caaagtaaaa tggaaagcaa 1260
aggtaaaatc agcagttgaa attcagagaa agacagaaaa ggagaaaaga tgaaattcaa 1320
caggacagaa gggaaatata ttatcattaa ggaggacagt atctgtagag ctcattagtg 1380
atggcaaaat gacttggtca ggattatttt taacccgctt gtttctggtt tgcacggctg 1440
gggatgcagc tagggttctg cctcagggag cacagctgtc cagagcagct gtcagcctgc 1500
aagcctgaaa cactccctcg gtaaagtcct tcctactcag gacagaaatg acgagaacag 1560
ggagctggaa acaggcccct aaccagagaa gggaagtaat ggatcaacaa agttaactag 1620
caggtcagga tcacgcaatt catttcactc tgactggtaa catgtgacag aaacagtgta 1680
ggcttattgt attttcatgt agagtaggac ccaaaaatcc acccaaagtc ctttatctat 1740
gccacatcct tcttatctat acttccagga cactttttct tccttatgat aaggctctct 1800
ctctctccac acacacacac acacacacac acacacacac acacacacac acaaacacac 1860
accccgccaa ccaaggtgca tgtaaaaaga tgtagattcc tctgcctttc tcatctacac 1920
agcccaggag ggtaagttaa tataagaggg atttattggt aagagatgat gcttaatctg 1980
tttaacactg ggcctcaaag agagaatttc ttttcttctg tacttattaa gcacctatta 2040
tgtgttgagc ttatatatac aaagggttat tatatgctaa tatagtaata gtaatggtgg 2100
ttggtactat ggtaattacc ataaaaatta ttatcctttt aaaataaagc taattattat 2160
tggatctttt ttagtattca ttttatgttt tttatgtttt tgatttttta aaagacaatc 2220
tcaccctgtt acccaggctg gagtgcagtg gtgcaatcat agctttctgc agtcttgaac 2280
tcctgggctc aagcaatcct cctgccttgg cctcccaaag tgttgggata cagtcatgag 2340
ccactgcatc tggcctagga tccatttaga ttaaaatatg cattttaaat tttaaaataa 2400
tatggctaat ttttacctta tgtaatgtgt atactggcaa taaatctagt ttgctgccta 2460
aagtttaaag tgctttccag taagcttcat gtacgtgagg ggagacattt aaagtgaaac 2520
agacagccag gtgtggtggc tcacgcctgt aatcccagca ctctgggagg ctgaggtggg 2580
tggatcgctt gagccctgga gttcaagacc agcctgagca acatggcaaa acgctgtttc 2640
tataacaaaa attagccggg catggtggca tgtgcctgtg gtcccagcta ctagggggct 2700
gaggcaggag aatcgttgga gcccaggagg tcaaggctgc actgagcagt gcttgcgcca 2760
ctgcactcca gcctgggtga caggaccaga ccttgcctca aaaaaataag aagaaaaatt 2820
aaaaataaat ggaaacaact acaaagagct gttgtcctag atgagctact tagttaggct 2880
gatattttgg tatttaactt ttaaagtcag ggtctgtcac ctgcactaca ttattaaaat 2940
atcaattctc aatgtatatc cacacaaaga ctggtacgtg aatgttcata gtacctttat 3000
tcacaaaacc ccaaagtaga gactatccaa atatccatca acaagtgaac aaataaacaa 3060
aatgtgctat atccatgcaa tggaatacca ccctgcagta caaagaagct acttggggat 3120
gaatcccaaa gtcatgacgc taaatgaaag agtcagacat gaaggaggag ataatgtatg 3180
ccatacgaaa ttctagaaaa tgaaagtaac ttatagttac agaaagcaaa tcagggcagg 3240
catagaggct cacacctgta atcccagcac tttgagaggc cacgtgggaa gattgctaga 3300
actcaggagt tcaagaccag cctgggcaac acagtgaaac tccattctcc acaaaaatgg 3360
gaaaaaaaga aagcaaatca gtggttgtcc tgtggggagg ggaaggactg caaagaggga 3420
agaagctctg gtggggtgag ggtggtgatt caggttctgt atcctgactg tggtagcagt 3480
ttggggtgtt tacatccaaa aatattcgta gaattatgca tcttaaatgg gtggagttta 3540
ctgtatgtaa attatacctc aatgtaagaa aaaataatgt gtaagaaaac tttcaattct 3600
cttgccagca aacgttattc aaattcctga gccctttact tcgcaaattc tctgcacttc 3660
tgccccgtac cattaggtga cagcactagc tccacaaatt ggataaatgc atttctggaa 3720
aagactaggg acaaaatcca ggcatcactt gtgctttcat atcaaccatg ctgtacagct 3780
tgtgttgctg tctgcagctg caatggggac tcttgatttc tttaaggaaa cttgggttac 3840
cagagtattt ccacaaatgc tattcaaatt agtgcttatg atatgcaaga cactgtgcta 3900
ggagccagaa aacaaagagg aggagaaatc agtcattatg tgggaacaac atagcaagat 3960
atttagatca ttttgactag ttaaaaaagc agcagagtac aaaatcacac atgcaatcag 4020
tataatccaa atcatgtaaa tatgtgcctg tagaaagact agaggaataa acacaagaat 4080
cttaacagtc attgtcatta gacactaagt ctaattatta ttattagaca ctatgatatt 4140
tgagatttaa aaaatcttta atattttaaa atttagagct cttctatttt tccatagtat 4200
tcaagtttga caatgatcaa gtattactct ttcttttttt tttttttttt ttttttttga 4260
gatggagttt tggtcttgtt gcccatgctg gagtggaatg gcatgaccat agctcactgc 4320
aacctccacc tcctgggttc aagcaaagct gtcgcctcag cctcccgggt agatgggatt 4380
acaggcgccc accaccacac tcggctaatg tttgtatttt tagtagagat ggggtttcac 4440
catgttggcc aggctggtct caaactcctg acctcagagg atccacctgc ctcagcctcc 4500
caaagtgctg ggattacaga tgtaggccac tgcgcccggc caagtattgc tcttatacat 4560
taaaaaacag gtgtgagcca ctgcgcccag ccaggtattg ctcttataca ttaaaaaata 4620
ggccggtgca gtggctcacg cctgtaatcc cagcactttg ggaagccaag gcgggcagaa 4680
cacccgaggt caggagtcca aggccagcct ggccaagatg gtgaaacccc gtctctatta 4740
aaaatacaaa cattacctgg gcatgatggt gggcgcctgt aatcccagct actcaggagg 4800
ctgaggcagg aggatccgcg gagcctggca gatctgcctg agcctgggag gttgaggcta 4860
cagtaagcca agatcatgcc agtatacttc agcctgggcg acaaagtgag accgtaacaa 4920
aaaaaaaaaa atttaaaaaa agaaatttag atcaagatcc aactgtaaaa agtggcctaa 4980
acaccacatt aaagagtttg gagtttattc tgcaggcaga agagaaccat cagggggtct 5040
tcagcatggg aatggcatgg tgcacctggt ttttgtgaga tcatggtggt gacagtgtgg 5100
ggaatgttat tttggaggga ctggaggcag acagaccggt taaaaggcca gcacaacaga 5160
taaggaggaa gaagatgagg gcttggaccg aagcagagaa gagcaaacag ggaaggtaca 5220
aattcaagaa atattggggg gtttgaatca acacatttag atgattaatt aaatatgagg 5280
actgaggaat aagaaatgag tcaaggatgg ttccaggctg ctaggctgct tacctgaggt 5340
ggcaaagtcg ggaggagtgg cagtttagga cagggggcag ttgaggaata ttgttttgat 5400
cattttgagt ttgaggtaca agttggacac ttaggtaaag actggagggg aaatctgaat 5460
atacaattat gggactgagg aacaagttta ttttattttt tgtttcgttt tcttgttgaa 5520
gaacaaattt aattgtaatc ccaagtcatc agcatctaga agacagtggc aggaggtgac 5580
tgtcttgtgg gtaagggttt ggggtccttg atgagtatct ctcaattggc cttaaatata 5640
agcaggaaaa ggagtttatg atggattcca ggctcagcag ggctcaggag ggctcaggca 5700
gccagcagag gaagtcagag catcttcttt ggtttagccc aagtaatgac ttccttaaaa 5760
agctgaagga aaatccagag tgaccagatt ataaactgta ctcttgcatt ttctctccct 5820
cctctcaccc acagcctctt gatgaaccgg aggaagtttc tttaccaatt caaaaatgtc 5880
cgctgggcta agggtcggcg tgagacctac ctgtgctacg tagtgaagag gcgtgacagt 5940
gctacatcct tttcactgga ctttggttat cttcgcaata aggtatcaat taaagtcggc 6000
tttgcaagca gtttaatggt caactgtgag tgcttttaga gccacctgct gatggtatta 6060
cttccatcct tttttggcat ttgtgtctct atcacattcc tcaaatcctt ttttttattt 6120
ctttttccat gtccatgcac ccatattaga catggcccaa aatatgtgat ttaattcctc 6180
cccagtaatg ctgggcaccc taataccact ccttccttca gtgccaagaa caactgctcc 6240
caaactgttt accagctttc ctcagcatct gaattgcctt tgagattaat taagctaaaa 6300
gcatttttat atgggagaat attatcagct tgtccaagca aaaattttaa atgtgaaaaa 6360
caaattgtgt cttaagcatt tttgaaaatt aaggaagaag aatttgggaa aaaattaacg 6420
gtggctcaat tctgtcttcc aaatgatttc ttttccctcc tactcacatg ggtcgtaggc 6480
cagtgaatac attcaacatg gtgatcccca gaaaactcag agaagcctcg gctgatgatt 6540
aattaaattg atctttcggc tacccgagag aattacattt ccaagagact tcttcaccaa 6600
aatccagatg ggtttacata aacttctgcc cacgggtatc tcctctctcc taacacgctg 6660
tgacgtctgg gcttggtgga atctcaggga agcatccgtg gggtggaagg tcatcgtctg 6720
gctcgttgtt tgatggttat attaccatgc aattttcttt gcctacattt gtattgaata 6780
catcccaatc tccttcctat tcggtgacat gacacattct atttcagaag gctttgattt 6840
tatcaagcac tttcatttac ttctcatggc agtgcctatt acttctctta caatacccat 6900
ctgtctgctt taccaaaatc tatttcccct tttcagatcc tcccaaatgg tcctcataaa 6960
ctgtcctgcc tccacctagt ggtccaggta tatttccaca atgttacatc aacaggcact 7020
tctagccatt ttccttctca aaaggtgcaa aaagcaactt cataaacaca aattaaatct 7080
tcggtgaggt agtgtgatgc tgcttcctcc caactcagcg cacttcgtct tcctcattcc 7140
acaaaaaccc atagccttcc ttcactctgc aggactagtg ctgccaaggg ttcagctcta 7200
cctactggtg tgctcttttg agcaagttgc ttagcctctc tgtaacacaa ggacaatagc 7260
tgcaagcatc cccaaagatc attgcaggag acaatgacta aggctaccag agccgcaata 7320
aaagtcagtg aattttagcg tggtcctctc tgtctctcca gaacggctgc cacgtggaat 7380
tgctcttcct ccgctacatc tcggactggg acctagaccc tggccgctgc taccgcgtca 7440
cctggttcac ctcctggagc ccctgctacg actgtgcccg acatgtggcc gactttctgc 7500
gagggaaccc caacctcagt ctgaggatct tcaccgcgcg cctctacttc tgtgaggacc 7560
gcaaggctga gcccgagggg ctgcggcggc tgcaccgcgc cggggtgcaa atagccatca 7620
tgaccttcaa aggtgcgaaa gggccttccg cgcaggcgca gtgcagcagc ccgcattcgg 7680
gattgcgatg cggaatgaat gagttagtgg ggaagctcga ggggaagaag tgggcgggga 7740
ttctggttca cctctggagc cgaaattaaa gattagaagc agagaaaaga gtgaatggct 7800
cagagacaag gccccgagga aatgagaaaa tggggccagg gttgcttctt tcccctcgat 7860
ttggaacctg aactgtcttc tacccccata tccccgcctt tttttccttt tttttttttt 7920
gaagattatt tttactgctg gaatactttt gtagaaaacc acgaaagaac tttcaaagcc 7980
tgggaagggc tgcatgaaaa ttcagttcgt ctctccagac agcttcggcg catccttttg 8040
gtaaggggct tcctcgcttt ttaaattttc tttctttctc tacagtcttt tttggagttt 8100
cgtatatttc ttatattttc ttattgttca atcactctca gttttcatct gatgaaaact 8160
ttatttctcc tccacatcag ctttttcttc tgctgtttca ccattcagag ccctctgcta 8220
aggttccttt tccctccctt ttctttcttt tgttgtttca catctttaaa tttctgtctc 8280
tccccagggt tgcgtttcct tcctggtcag aattcttttc tccttttttt tttttttttt 8340
tttttttttt aaacaaacaa acaaaaaacc caaaaaaact ctttcccaat ttactttctt 8400
ccaacatgtt acaaagccat ccactcagtt tagaagactc tccggcccca ccgaccccca 8460
acctcgtttt gaagccattc actcaatttg cttctctctt tctctacagc ccctgtatga 8520
ggttgatgac ttacgagacg catttcgtac tttgggactt tgatagcaac ttccaggaat 8580
gtcacacacg atgaaatatc tctgctgaag acagtggata aaaaacagtc cttcaagtct 8640
tctctgtttt tattcttcaa ctctcacttt cttagagttt acagaaaaaa tatttatata 8700
cgactcttta aaaagatcta tgtcttgaaa atagagaagg aacacaggtc tggccaggga 8760
cgtgctgcaa ttggtgcagt tttgaatgca acattgtccc ctactgggaa taacagaact 8820
gcaggacctg ggagcatcct aaagtgtcaa cgtttttcta tgacttttag gtaggatgag 8880
agcagaaggt agatcctaaa aagcatggtg agaggatcaa atgtttttat atcaacatcc 8940
tttattattt gattcatttg agttaacagt ggtgttagtg atagattttt ctattctttt 9000
cccttgacgt ttactttcaa gtaacacaaa ctcttccatc aggccatgat ctataggacc 9060
tcctaatgag agtatctggg tgattgtgac cccaaaccat ctctccaaag cattaatatc 9120
caatcatgcg ctgtatgttt taatcagcag aagcatgttt ttatgtttgt acaaaagaag 9180
attgttatgg gtggggatgg aggtatagac catgcatggt caccttcaag ctactttaat 9240
aaaggatctt aaaatgggca ggaggactgt gaacaagaca ccctaataat gggttgatgt 9300
ctgaagtagc aaatcttctg gaaacgcaaa ctcttttaag gaagtcccta atttagaaac 9360
acccacaaac ttcacatatc ataattagca aacaattgga aggaagttgc ttgaatgttg 9420
gggagaggaa aatctattgg ctctcgtggg tctcttcatc tcagaaatgc caatcaggtc 9480
aaggtttgct acattttgta tgtgtgtgat gcttctccca aaggtatatt aactatataa 9540
gagagttgtg acaaaacaga atgataaagc tgcgaaccgt ggcacacgct catagttcta 9600
gctgcttggg aggttgagga gggaggatgg cttgaacaca ggtgttcaag gccagcctgg 9660
gcaacataac aagatcctgt ctctcaaaaa aaaaaaaaaa aaaaagaaag agagagggcc 9720
gggcgtggtg gctcacgcct gtaatcccag cactttggga ggccgagccg ggcggatcac 9780
ctgtggtcag gagtttgaga ccagcctggc caacatggca aaaccccgtc tgtactcaaa 9840
atgcaaaaat tagccaggcg tggtagcagg cacctgtaat cccagctact tgggaggctg 9900
aggcaggaga atcgcttgaa cccaggaggt ggaggttgca gtaagctgag atcgtgccgt 9960
tgcactccag cctgggcgac aagagcaaga ctctgtctca gaaaaaaaaa aaaaaaagag 10020
agagagagag aaagagaaca atatttggga gagaaggatg gggaagcatt gcaaggaaat 10080
tgtgctttat ccaacaaaat gtaaggagcc aataagggat ccctatttgt ctcttttggt 10140
gtctatttgt ccctaacaac tgtctttgac agtgagaaaa atattcagaa taaccatatc 10200
cctgtgccgt tattacctag caacccttgc aatgaagatg agcagatcca caggaaaact 10260
tgaatgcaca actgtcttat tttaatctta ttgtacataa gtttgtaaaa gagttaaaaa 10320
ttgttacttc atgtattcat ttatatttta tattattttg cgtctaatga ttttttatta 10380
acatgatttc cttttctgat atattgaaat ggagtctcaa agcttcataa atttataact 10440
ttagaaatga ttctaataac aacgtatgta attgtaacat tgcagtaatg gtgctacgaa 10500
gccatttctc ttgattttta gtaaactttt atgacagcaa atttgcttct ggctcacttt 10560
caatcagtta aataaatgat aaataatttt ggaagctgtg aagataaaat accaaataaa 10620
ataatataaa agtgatttat atgaagttaa aataaaaaat cagtatgatg gaataaactt 10680
g 10681
<210> 16
<211> 198
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(198)
<223> human AID polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(30)
<223> Nuclear localization sequence
<220>
<221> MISC_FEATURE
<222> (183)..(198)
<223> Nuclear export signal
<400> 16
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 17
<211> 4
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(4)
<223> TXXH motif peptide sequence
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa is any amino acid
<400> 17
Thr Xaa Xaa His
1
<210> 18
<211> 198
<212> PRT
<213> Canis lupus familiaris
<220>
<221> MISC_FEATURE
<222> (1)..(198)
<223> Canine AID (clAID) polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(30)
<223> Nuclear localization sequence
<220>
<221> MISC_FEATURE
<222> (183)..(198)
<223> Nuclear export signal
<400> 18
Met Asp Ser Leu Leu Met Lys Gln Arg Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Ala Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Lys Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 19
<211> 199
<212> PRT
<213> Bos Taurus
<220>
<221> MISC_FEATURE
<222> (1)..(199)
<223> Bovine AID (btAID) polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(30)
<223> Nuclear localization sequence
<220>
<221> MISC_FEATURE
<222> (183)..(199)
<223> Nuclear export signal
<400> 19
Met Asp Ser Leu Leu Lys Lys Gln Arg Gln Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Pro Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ala Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Asp Lys Glu Arg Lys Ala Glu Pro Glu Gly Leu Arg
115 120 125
Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp
130 135 140
Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe
145 150 155 160
Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln
165 170 175
Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp
180 185 190
Ala Phe Arg Thr Leu Gly Leu
195
<210> 20
<211> 239
<212> PRT
<213> Rattus
<220>
<221> MISC_FEATURE
<222> (1)..(239)
<223> Rat AID polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(26)
<223> Nuclear localization sequence
<220>
<221> MISC_FEATURE
<222> (194)..(239)
<223> Nuclear export signal
<400> 20
Met Ala Val Gly Ser Lys Pro Lys Ala Ala Leu Val Gly Pro His Trp
1 5 10 15
Glu Arg Glu Arg Ile Trp Cys Phe Leu Cys Ser Thr Gly Leu Gly Thr
20 25 30
Gln Gln Thr Gly Gln Thr Ser Arg Trp Leu Arg Pro Ala Ala Thr Gln
35 40 45
Asp Pro Val Ser Pro Pro Arg Ser Leu Leu Met Lys Gln Arg Lys Phe
50 55 60
Leu Tyr His Phe Lys Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr
65 70 75 80
Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser
85 90 95
Leu Asp Phe Gly Tyr Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu
100 105 110
Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys
115 120 125
Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala
130 135 140
Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg
145 150 155 160
Ile Phe Thr Ala Arg Leu Thr Gly Trp Gly Ala Leu Pro Ala Gly Leu
165 170 175
Met Ser Pro Ala Arg Pro Ser Asp Tyr Phe Tyr Cys Trp Asn Thr Phe
180 185 190
Val Glu Asn His Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu
195 200 205
Asn Ser Val Arg Leu Ser Arg Arg Leu Arg Arg Ile Leu Leu Pro Leu
210 215 220
Tyr Glu Val Asp Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu
225 230 235
<210> 21
<211> 198
<212> PRT
<213> Mus musculus
<220>
<221> MISC_FEATURE
<222> (1)..(198)
<223> Mouse (mAID) AID polypeptide sequence
<400> 21
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 22
<211> 229
<212> PRT
<213> Rattus norvegicus
<220>
<221> MISC_FEATURE
<222> (1)..(229)
<223> rAPOBEC-1 polypeptide sequence
<400> 22
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 23
<211> 229
<212> PRT
<213> Mesocricetus auratus
<220>
<221> MISC_FEATURE
<222> (1)..(229)
<223> maAPOBEC-1 polypeptide sequence
<400> 23
Met Ser Ser Glu Thr Gly Pro Val Val Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Asp Ala Phe Phe Asp Gln Gly Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Arg Trp Gly Gly Arg His
35 40 45
Asn Ile Trp Arg His Thr Gly Gln Asn Thr Ser Arg His Val Glu Ile
50 55 60
Asn Phe Ile Glu Lys Phe Thr Ser Glu Arg Tyr Phe Tyr Pro Ser Thr
65 70 75 80
Arg Cys Ser Ile Val Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Lys Ala Ile Thr Glu Phe Leu Ser Gly His Pro Asn Val Thr Leu
100 105 110
Phe Ile Tyr Ala Ala Arg Leu Tyr His His Thr Asp Gln Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Arg Gly Val Thr Ile Arg Ile Met
130 135 140
Thr Glu Gln Glu Tyr Cys Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Ser Asn Glu Val Tyr Trp Pro Arg Tyr Pro Asn Leu Trp Met Arg
165 170 175
Leu Tyr Ala Leu Glu Leu Tyr Cys Ile His Leu Gly Leu Pro Pro Cys
180 185 190
Leu Lys Ile Lys Arg Arg His Gln Tyr Pro Leu Thr Phe Phe Arg Leu
195 200 205
Asn Leu Gln Ser Cys His Tyr Gln Arg Ile Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Phe Ile
225
<210> 24
<211> 236
<212> PRT
<213> Pongo pygmaeus
<220>
<221> MISC_FEATURE
<222> (1)..(236)
<223> ppAPOBEC-1 polypeptide sequence
<400> 24
Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Ser Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg
35 40 45
Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Arg Phe His Ser Ser Ile
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Gln Ala Ile Arg Glu Phe Leu Ser Gln His Pro Gly Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Ala Phe Phe Arg Leu
195 200 205
His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu
210 215 220
Ala Thr Gly Leu Ile His Pro Ser Val Thr Trp Arg
225 230 235
<210> 25
<211> 236
<212> PRT
<213> Oryctolagus cuniculus
<220>
<221> MISC_FEATURE
<222> (1)..(236)
<223> ocAPOBEC1 polypeptide sequence
<400> 25
Met Ala Ser Glu Lys Gly Pro Ser Asn Lys Asp Tyr Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro Trp Glu Phe Glu Val Phe Phe Asp Pro Gln Glu Leu
20 25 30
Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Ala Ser Ser
35 40 45
Lys Thr Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Leu Glu Lys Leu Thr Ser Glu Gly Arg Leu Gly Pro Ser Thr
65 70 75 80
Cys Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Met Ala Ile Arg Glu Phe Leu Ser Gln His Pro Gly Val Thr Leu
100 105 110
Ile Ile Phe Val Ala Arg Leu Phe Gln His Met Asp Arg Arg Asn Arg
115 120 125
Gln Gly Leu Lys Asp Leu Val Thr Ser Gly Val Thr Val Arg Val Met
130 135 140
Ser Val Ser Glu Tyr Cys Tyr Cys Trp Glu Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Lys Ala Ala Gln Trp Pro Arg Tyr Pro Pro Arg Trp Met Leu
165 170 175
Met Tyr Ala Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg His Gln Lys Gln Leu Thr Phe Phe Ser Leu
195 200 205
Thr Pro Gln Tyr Cys His Tyr Lys Met Ile Pro Pro Tyr Ile Leu Leu
210 215 220
Ala Thr Gly Leu Leu Gln Pro Ser Val Pro Trp Arg
225 230 235
<210> 26
<211> 235
<212> PRT
<213> Monodelphis domestica
<220>
<221> MISC_FEATURE
<222> (1)..(235)
<223> mdAPOBEC-1 polypeptide sequence
<400> 26
Met Asn Ser Lys Thr Gly Pro Ser Val Gly Asp Ala Thr Leu Arg Arg
1 5 10 15
Arg Ile Lys Pro Trp Glu Phe Val Ala Phe Phe Asn Pro Gln Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Asn Gln Asn
35 40 45
Ile Trp Arg His Ser Asn Gln Asn Thr Ser Gln His Ala Glu Ile Asn
50 55 60
Phe Met Glu Lys Phe Thr Ala Glu Arg His Phe Asn Ser Ser Val Arg
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser
85 90 95
Lys Ala Ile Arg Lys Phe Leu Asp His Tyr Pro Asn Val Thr Leu Ala
100 105 110
Ile Phe Ile Ser Arg Leu Tyr Trp His Met Asp Gln Gln His Arg Gln
115 120 125
Gly Leu Lys Glu Leu Val His Ser Gly Val Thr Ile Gln Ile Met Ser
130 135 140
Tyr Ser Glu Tyr His Tyr Cys Trp Arg Asn Phe Val Asp Tyr Pro Gln
145 150 155 160
Gly Glu Glu Asp Tyr Trp Pro Lys Tyr Pro Tyr Leu Trp Ile Met Leu
165 170 175
Tyr Val Leu Glu Leu His Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Lys Ile Ser Gly Ser His Ser Asn Gln Leu Ala Leu Phe Ser Leu Asp
195 200 205
Leu Gln Asp Cys His Tyr Gln Lys Ile Pro Tyr Asn Val Leu Val Ala
210 215 220
Thr Gly Leu Val Gln Pro Phe Val Thr Trp Arg
225 230 235
<210> 27
<211> 224
<212> PRT
<213> Pongo pygmaeus
<220>
<221> MISC_FEATURE
<222> (1)..(224)
<223> ppAPOBEC-2 polypeptide sequence
<400> 27
Met Ala Gln Lys Glu Glu Ala Ala Ala Ala Thr Glu Ala Ala Ser Gln
1 5 10 15
Asn Gly Glu Asp Leu Glu Asn Leu Asp Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Gly Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Ala
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Ile Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Leu
145 150 155 160
Glu Ile Gln Asp Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Val Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Gln Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 28
<211> 224
<212> PRT
<213> Bos Taurus
<220>
<221> MISC_FEATURE
<222> (1)..(224)
<223> btAPOBEC-2 polypeptide sequence
<400> 28
Met Ala Gln Lys Glu Glu Ala Ala Ala Ala Ala Glu Pro Ala Ser Gln
1 5 10 15
Asn Gly Glu Glu Val Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala His Tyr Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Ser Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Thr
85 90 95
Asn His Ala Glu Glu Ala Phe Phe Asn Ser Ile Met Pro Thr Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Met Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Val Lys Thr Leu Asn Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Ile Gln Ala Ala Leu Arg Lys Leu Lys Glu Ala Gly Cys Arg Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Ile Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 29
<211> 440
<212> PRT
<213> Mus musculus
<220>
<221> MISC_FEATURE
<222> (1)..(440)
<223> mAPOBEC-3-(1) polypeptide sequence
<400> 29
Met Gln Pro Gln Arg Leu Gly Pro Arg Ala Gly Met Gly Pro Phe Cys
1 5 10 15
Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro Ile Arg Asn Leu Ile
20 25 30
Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn Leu Gly Tyr Ala Lys
35 40 45
Gly Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val Thr Arg Lys Asp Cys
50 55 60
Asp Ser Pro Val Ser Leu His His Gly Val Phe Lys Asn Lys Asp Asn
65 70 75 80
Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe His Asp Lys Val Leu
85 90 95
Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile Thr Trp Tyr Met Ser
100 105 110
Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Ile Val Arg Phe Leu Ala
115 120 125
Thr His His Asn Leu Ser Leu Asp Ile Phe Ser Ser Arg Leu Tyr Asn
130 135 140
Val Gln Asp Pro Glu Thr Gln Gln Asn Leu Cys Arg Leu Val Gln Glu
145 150 155 160
Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu Phe Lys Lys Cys Trp
165 170 175
Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe Arg Pro Trp Lys Arg
180 185 190
Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys Leu Gln Glu Ile Leu
195 200 205
Arg Pro Cys Tyr Ile Ser Val Pro Ser Ser Ser Ser Ser Thr Leu Ser
210 215 220
Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr Arg Phe Trp Val Glu
225 230 235 240
Gly Arg Arg Met Asp Pro Leu Ser Glu Glu Glu Phe Tyr Ser Gln Phe
245 250 255
Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr His Arg Met Lys Pro
260 265 270
Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly Gln Ala Pro Leu Lys
275 280 285
Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe
290 295 300
Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys
305 310 315 320
Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala
325 330 335
Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg
340 345 350
Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys Ser Leu
355 360 365
Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp Leu Pro Gln Phe Thr
370 375 380
Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg Pro Phe Trp Pro Trp
385 390 395 400
Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln Arg Arg Leu Arg Arg
405 410 415
Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val Asn Asp Phe Gly Asn
420 425 430
Leu Gln Leu Gly Pro Pro Met Ser
435 440
<210> 30
<211> 429
<212> PRT
<213> Mus musculus
<220>
<221> MISC_FEATURE
<222> (1)..(429)
<223> APOBEC-3-(2) (Mouse APOBEC-3) polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (71)..(108)
<223> Nucleic acid editing domain
<220>
<221> MISC_FEATURE
<222> (288)..(319)
<223> Nucleic acid editing domain
<400> 30
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Leu Gly Tyr Ala Lys Gly Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val
35 40 45
Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val Phe
50 55 60
Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe
65 70 75 80
His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile
85 90 95
Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Ile
100 105 110
Val Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe Ser
115 120 125
Ser Arg Leu Tyr Asn Val Gln Asp Pro Glu Thr Gln Gln Asn Leu Cys
130 135 140
Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu
145 150 155 160
Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe
165 170 175
Arg Pro Trp Lys Arg Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys
180 185 190
Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser Ser
195 200 205
Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr
210 215 220
Arg Phe Cys Val Glu Gly Arg Arg Met Asp Pro Leu Ser Glu Glu Glu
225 230 235 240
Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr
245 250 255
His Arg Met Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly
260 265 270
Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His
275 280 285
Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln
290 295 300
Val Thr Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
305 310 315 320
Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His
325 330 335
Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys
340 345 350
Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp
355 360 365
Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg
370 375 380
Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln
385 390 395 400
Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val
405 410 415
Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425
<210> 31
<211> 430
<212> PRT
<213> Rattus
<220>
<221> MISC_FEATURE
<222> (1)..(430)
<223> APOBEC-3 polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (72)..(109)
<223> Nucleic acid editing domain
<220>
<221> MISC_FEATURE
<222> (289)..(320)
<223> Nucleic acid editing domain
<400> 31
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Arg Leu Arg Tyr Ala Ile Asp Arg Lys Asp Thr Phe Leu Cys Tyr Glu
35 40 45
Val Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val
50 55 60
Phe Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp
65 70 75 80
Phe His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys
85 90 95
Ile Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln
100 105 110
Val Leu Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe
115 120 125
Ser Ser Arg Leu Tyr Asn Ile Arg Asp Pro Glu Asn Gln Gln Asn Leu
130 135 140
Cys Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr
145 150 155 160
Glu Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg
165 170 175
Phe Arg Pro Trp Lys Lys Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser
180 185 190
Lys Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser
195 200 205
Ser Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu
210 215 220
Thr Arg Phe Cys Val Glu Arg Arg Arg Val His Leu Leu Ser Glu Glu
225 230 235 240
Glu Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr
245 250 255
Tyr His Gly Val Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn
260 265 270
Gly Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln
275 280 285
His Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser
290 295 300
Gln Val Ile Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys
305 310 315 320
Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu
325 330 335
His Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln
340 345 350
Lys Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met
355 360 365
Asp Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys
370 375 380
Arg Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr
385 390 395 400
Gln Arg Arg Leu His Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu
405 410 415
Val Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425 430
<210> 32
<211> 199
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(199)
<223> hAPOBEC-3A polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (70)..(106)
<223> Nucleic acid editing domain
<400> 32
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 33
<211> 373
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(373)
<223> hAPOBEC-3F polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (65)..(99)
<223> Nucleic acid editing domain
<220>
<221> MISC_FEATURE
<222> (248)..(283)
<223> Nucleic acid editing domain
<400> 33
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Arg
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Gln Pro Glu His
50 55 60
His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro
65 70 75 80
Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro Cys
85 90 95
Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu His Pro Asn
100 105 110
Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu Arg
115 120 125
Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg Val
130 135 140
Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe Val
145 150 155 160
Tyr Ser Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn
165 170 175
Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met
180 185 190
Glu Ala Met Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Arg
195 200 205
Lys Ala Tyr Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val
210 215 220
Val Lys His His Ser Pro Val Ser Trp Lys Arg Gly Val Phe Arg Asn
225 230 235 240
Gln Val Asp Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser
245 250 255
Trp Phe Cys Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr
260 265 270
Trp Tyr Thr Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala
275 280 285
Glu Phe Leu Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala
290 295 300
Arg Leu Tyr Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Arg Ser
305 310 315 320
Leu Ser Gln Glu Gly Ala Ser Val Glu Ile Met Gly Tyr Lys Asp Phe
325 330 335
Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn Asp Asp Glu Pro Phe Lys
340 345 350
Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu Phe Leu Asp Ser Lys Leu
355 360 365
Gln Glu Ile Leu Glu
370
<210> 34
<211> 370
<212> PRT
<213> Rhesus macaque
<220>
<221> MISC_FEATURE
<222> (1)..(370)
<223> Rhesus macaque APOBEC-3G polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(61)
<223> Cytoplasmic localization signal
<400> 34
Met Val Glu Pro Met Asp Pro Arg Thr Phe Val Ser Asn Phe Asn Asn
1 5 10 15
Arg Pro Ile Leu Ser Gly Leu Asn Thr Val Trp Leu Cys Cys Glu Val
20 25 30
Lys Thr Lys Asp Pro Ser Gly Pro Pro Leu Asp Ala Lys Ile Phe Gln
35 40 45
Gly Lys Val Tyr Ser Lys Ala Lys Tyr His Pro Glu Met Arg Phe Leu
50 55 60
Arg Trp Phe His Lys Trp Arg Gln Leu His His Asp Gln Glu Tyr Lys
65 70 75 80
Val Thr Trp Tyr Val Ser Trp Ser Pro Cys Thr Arg Cys Ala Asn Ser
85 90 95
Val Ala Thr Phe Leu Ala Lys Asp Pro Lys Val Thr Leu Thr Ile Phe
100 105 110
Val Ala Arg Leu Tyr Tyr Phe Trp Lys Pro Asp Tyr Gln Gln Ala Leu
115 120 125
Arg Ile Leu Cys Gln Lys Arg Gly Gly Pro His Ala Thr Met Lys Ile
130 135 140
Met Asn Tyr Asn Glu Phe Gln Asp Cys Trp Asn Lys Phe Val Asp Gly
145 150 155 160
Arg Gly Lys Pro Phe Lys Pro Arg Asn Asn Leu Pro Lys His Tyr Thr
165 170 175
Leu Leu Gln Ala Thr Leu Gly Glu Leu Leu Arg His Leu Met Asp Pro
180 185 190
Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro Trp Val Ser Gly Gln
195 200 205
His Glu Thr Tyr Leu Cys Tyr Lys Val Glu Arg Leu His Asn Asp Thr
210 215 220
Trp Val Pro Leu Asn Gln His Arg Gly Phe Leu Arg Asn Gln Ala Pro
225 230 235 240
Asn Ile His Gly Phe Pro Lys Gly Arg His Ala Glu Leu Cys Phe Leu
245 250 255
Asp Leu Ile Pro Phe Trp Lys Leu Asp Gly Gln Gln Tyr Arg Val Thr
260 265 270
Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Met Ala
275 280 285
Lys Phe Ile Ser Asn Asn Glu His Val Ser Leu Cys Ile Phe Ala Ala
290 295 300
Arg Ile Tyr Asp Asp Gln Gly Arg Tyr Gln Glu Gly Leu Arg Ala Leu
305 310 315 320
His Arg Asp Gly Ala Lys Ile Ala Met Met Asn Tyr Ser Glu Phe Glu
325 330 335
Tyr Cys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
340 345 350
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
355 360 365
Ala Ile
370
<210> 35
<211> 384
<212> PRT
<213> Pan troglodytes
<220>
<221> MISC_FEATURE
<222> (1)..(384)
<223> Chimpanzee APOBEC-3G polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(60)
<223> Cytoplasmic localization signal
<220>
<221> MISC_FEATURE
<222> (65)..(100)
<223> Nucleic acid editing domain
<220>
<221> MISC_FEATURE
<222> (257)..(291)
<223> Nucleic acid editing domain
<400> 35
Met Lys Pro His Phe Arg Asn Pro Val Glu Arg Met Tyr Gln Asp Thr
1 5 10 15
Phe Ser Asp Asn Phe Tyr Asn Arg Pro Ile Leu Ser His Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Lys Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Val Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Ser Asn Phe Asn Asn
195 200 205
Glu Leu Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Leu His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu His Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Asn Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Lys Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser
355 360 365
Gln Ala Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 36
<211> 377
<212> PRT
<213> Chlorocebus sabaeus
<220>
<221> MISC_FEATURE
<222> (1)..(377)
<223> Green monkey APOBEC-3G polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(60)
<223> Cytoplasmic localization signal
<220>
<221> MISC_FEATURE
<222> (65)..(100)
<223> Nucleic acid editing domain
<220>
<221> MISC_FEATURE
<222> (257)..(290)
<223> Nucleic acid editing domain
<400> 36
Met Asn Pro Gln Ile Arg Asn Met Val Glu Gln Met Glu Pro Asp Ile
1 5 10 15
Phe Val Tyr Tyr Phe Asn Asn Arg Pro Ile Leu Ser Gly Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Asp Pro Ser Gly Pro Pro
35 40 45
Leu Asp Ala Asn Ile Phe Gln Gly Lys Leu Tyr Pro Glu Ala Lys Asp
50 55 60
His Pro Glu Met Lys Phe Leu His Trp Phe Arg Lys Trp Arg Gln Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Val Ser Trp Ser Pro
85 90 95
Cys Thr Arg Cys Ala Asn Ser Val Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Lys
115 120 125
Pro Asp Tyr Gln Gln Ala Leu Arg Ile Leu Cys Gln Glu Arg Gly Gly
130 135 140
Pro His Ala Thr Met Lys Ile Met Asn Tyr Asn Glu Phe Gln His Cys
145 150 155 160
Trp Asn Glu Phe Val Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys
165 170 175
Asn Leu Pro Lys His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu Leu
180 185 190
Leu Arg His Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn
195 200 205
Lys Pro Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Cys Tyr Lys Val
210 215 220
Glu Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
225 230 235 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys Leu Asp
260 265 270
Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe
275 280 285
Ser Cys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn Asn Lys His Val
290 295 300
Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys
305 310 315 320
Gln Glu Gly Leu Arg Thr Leu His Arg Asp Gly Ala Lys Ile Ala Val
325 330 335
Met Asn Tyr Ser Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Asp Arg
340 345 350
Gln Gly Arg Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln
355 360 365
Ala Leu Ser Gly Arg Leu Arg Ala Ile
370 375
<210> 37
<211> 384
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(384)
<223> Human APOBEC-3G polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(60)
<223> Cytoplasmic localization signal
<220>
<221> MISC_FEATURE
<222> (65)..(100)
<223> Nucleic acid editing domain
<220>
<221> MISC_FEATURE
<222> (257)..(291)
<223> Nucleic acid editing domain
<400> 37
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
195 200 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
355 360 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
370 375 380
<210> 38
<211> 382
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(382)
<223> Human APOBEC-3B polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (66)..(100)
<223> Nucleic acid editing domain
<220>
<221> MISC_FEATURE
<222> (251)..(289)
<223> Nucleic acid editing domain
<400> 38
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr Phe Lys Pro Gln
50 55 60
Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ser Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Thr Ile Met Asp Tyr Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln Gln Phe Met Pro Trp Tyr Lys Phe Asp Glu
165 170 175
Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Tyr Leu
180 185 190
Met Asp Pro Asp Thr Phe Thr Phe Asn Phe Asn Asn Asp Pro Leu Val
195 200 205
Leu Arg Arg Arg Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp
210 215 220
Asn Gly Thr Trp Val Leu Met Asp Gln His Met Gly Phe Leu Cys Asn
225 230 235 240
Glu Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu
245 250 255
Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile
260 265 270
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
275 280 285
Cys Ala Gly Glu Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
290 295 300
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
305 310 315 320
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
325 330 335
Thr Tyr Asp Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Tyr Arg Gln
340 345 350
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser Gln Ala
355 360 365
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 39
<211> 395
<212> PRT
<213> Rattus
<220>
<221> MISC_FEATURE
<222> (1)..(395)
<223> Rat APOBEC-3B polypeptide sequence
<400> 39
Met Gln Pro Gln Gly Leu Gly Pro Asn Ala Gly Met Gly Pro Val Cys
1 5 10 15
Leu Gly Cys Ser His Arg Arg Pro Tyr Ser Pro Ile Arg Asn Pro Leu
20 25 30
Lys Lys Leu Tyr Gln Gln Thr Phe Tyr Phe His Phe Lys Asn Val Arg
35 40 45
Tyr Ala Trp Gly Arg Lys Asn Asn Phe Leu Cys Tyr Glu Val Asn Gly
50 55 60
Met Asp Cys Ala Leu Pro Val Pro Leu Arg Gln Gly Val Phe Arg Lys
65 70 75 80
Gln Gly His Ile His Ala Glu Leu Cys Phe Ile Tyr Trp Phe His Asp
85 90 95
Lys Val Leu Arg Val Leu Ser Pro Met Glu Glu Phe Lys Val Thr Trp
100 105 110
Tyr Met Ser Trp Ser Pro Cys Ser Lys Cys Ala Glu Gln Val Ala Arg
115 120 125
Phe Leu Ala Ala His Arg Asn Leu Ser Leu Ala Ile Phe Ser Ser Arg
130 135 140
Leu Tyr Tyr Tyr Leu Arg Asn Pro Asn Tyr Gln Gln Lys Leu Cys Arg
145 150 155 160
Leu Ile Gln Glu Gly Val His Val Ala Ala Met Asp Leu Pro Glu Phe
165 170 175
Lys Lys Cys Trp Asn Lys Phe Val Asp Asn Asp Gly Gln Pro Phe Arg
180 185 190
Pro Trp Met Arg Leu Arg Ile Asn Phe Ser Phe Tyr Asp Cys Lys Leu
195 200 205
Gln Glu Ile Phe Ser Arg Met Asn Leu Leu Arg Glu Asp Val Phe Tyr
210 215 220
Leu Gln Phe Asn Asn Ser His Arg Val Lys Pro Val Gln Asn Arg Tyr
225 230 235 240
Tyr Arg Arg Lys Ser Tyr Leu Cys Tyr Gln Leu Glu Arg Ala Asn Gly
245 250 255
Gln Glu Pro Leu Lys Gly Tyr Leu Leu Tyr Lys Lys Gly Glu Gln His
260 265 270
Val Glu Ile Leu Phe Leu Glu Lys Met Arg Ser Met Glu Leu Ser Gln
275 280 285
Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
290 295 300
Arg Gln Leu Ala Ala Phe Lys Lys Asp His Pro Asp Leu Ile Leu Arg
305 310 315 320
Ile Tyr Thr Ser Arg Leu Tyr Phe Trp Arg Lys Lys Phe Gln Lys Gly
325 330 335
Leu Cys Thr Leu Trp Arg Ser Gly Ile His Val Asp Val Met Asp Leu
340 345 350
Pro Gln Phe Ala Asp Cys Trp Thr Asn Phe Val Asn Pro Gln Arg Pro
355 360 365
Phe Arg Pro Trp Asn Glu Leu Glu Lys Asn Ser Trp Arg Ile Gln Arg
370 375 380
Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu
385 390 395
<210> 40
<211> 226
<212> PRT
<213> Bos Taurus
<220>
<221> MISC_FEATURE
<222> (1)..(226)
<223> Bovine APOBEC-3B polypeptide sequence
<400> 40
Asp Gly Trp Glu Val Ala Phe Arg Ser Gly Thr Val Leu Lys Ala Gly
1 5 10 15
Val Leu Gly Val Ser Met Thr Glu Gly Trp Ala Gly Ser Gly His Pro
20 25 30
Gly Gln Gly Ala Cys Val Trp Thr Pro Gly Thr Arg Asn Thr Met Asn
35 40 45
Leu Leu Arg Glu Val Leu Phe Lys Gln Gln Phe Gly Asn Gln Pro Arg
50 55 60
Val Pro Ala Pro Tyr Tyr Arg Arg Lys Thr Tyr Leu Cys Tyr Gln Leu
65 70 75 80
Lys Gln Arg Asn Asp Leu Thr Leu Asp Arg Gly Cys Phe Arg Asn Lys
85 90 95
Lys Gln Arg His Ala Glu Arg Phe Ile Asp Lys Ile Asn Ser Leu Asp
100 105 110
Leu Asn Pro Ser Gln Ser Tyr Lys Ile Ile Cys Tyr Ile Thr Trp Ser
115 120 125
Pro Cys Pro Asn Cys Ala Asn Glu Leu Val Asn Phe Ile Thr Arg Asn
130 135 140
Asn His Leu Lys Leu Glu Ile Phe Ala Ser Arg Leu Tyr Phe His Trp
145 150 155 160
Ile Lys Ser Phe Lys Met Gly Leu Gln Asp Leu Gln Asn Ala Gly Ile
165 170 175
Ser Val Ala Val Met Thr His Thr Glu Phe Glu Asp Cys Trp Glu Gln
180 185 190
Phe Val Asp Asn Gln Ser Arg Pro Phe Gln Pro Trp Asp Lys Leu Glu
195 200 205
Gln Tyr Ser Ala Ser Ile Arg Arg Arg Leu Gln Arg Ile Leu Thr Ala
210 215 220
Pro Ile
225
<210> 41
<211> 490
<212> PRT
<213> Pan troglodytes
<220>
<221> MISC_FEATURE
<222> (1)..(490)
<223> Chimpanzee APOBEC-3B polypeptide sequence
<400> 41
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Trp Met Tyr Gln Arg Thr
1 5 10 15
Phe Tyr Tyr Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly His Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr Ser Gln Pro Glu
50 55 60
His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Ser Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Lys Phe Leu Ala Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp
165 170 175
Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Ile Arg His Leu
180 185 190
Met Asp Pro Asp Thr Phe Thr Phe Asn Phe Asn Asn Asp Pro Leu Val
195 200 205
Leu Arg Arg His Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp
210 215 220
Asn Gly Thr Trp Val Leu Met Asp Gln His Met Gly Phe Leu Cys Asn
225 230 235 240
Glu Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu
245 250 255
Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile
260 265 270
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
275 280 285
Cys Ala Gly Gln Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
290 295 300
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
305 310 315 320
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
325 330 335
Thr Tyr Asp Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Tyr Arg Gln
340 345 350
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser Gln Ala
355 360 365
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Val Arg Ala Ser Ser Leu
370 375 380
Cys Met Val Pro His Arg Pro Pro Pro Pro Pro Gln Ser Pro Gly Pro
385 390 395 400
Cys Leu Pro Leu Cys Ser Glu Pro Pro Leu Gly Ser Leu Leu Pro Thr
405 410 415
Gly Arg Pro Ala Pro Ser Leu Pro Phe Leu Leu Thr Ala Ser Phe Ser
420 425 430
Phe Pro Pro Pro Ala Ser Leu Pro Pro Leu Pro Ser Leu Ser Leu Ser
435 440 445
Pro Gly His Leu Pro Val Pro Ser Phe His Ser Leu Thr Ser Cys Ser
450 455 460
Ile Gln Pro Pro Cys Ser Ser Arg Ile Arg Glu Thr Glu Gly Trp Ala
465 470 475 480
Ser Val Ser Lys Glu Gly Arg Asp Leu Gly
485 490
<210> 42
<211> 190
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(190)
<223> Human APOBEC-3C polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (65)..(100)
<223> Nucleic acid editing domain
<400> 42
Met Asn Pro Gln Ile Arg Asn Pro Met Lys Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe Gln Phe Lys Asn Leu Trp Glu Ala Asn Asp Arg Asn Glu
20 25 30
Thr Trp Leu Cys Phe Thr Val Glu Gly Ile Lys Arg Arg Ser Val Val
35 40 45
Ser Trp Lys Thr Gly Val Phe Arg Asn Gln Val Asp Ser Glu Thr His
50 55 60
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys Asp Asp Ile Leu
65 70 75 80
Ser Pro Asn Thr Lys Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Asp Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
100 105 110
Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Tyr
115 120 125
Pro Cys Tyr Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Val Ala
130 135 140
Val Glu Ile Met Asp Tyr Glu Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Asp Asn Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Thr
165 170 175
Asn Phe Arg Leu Leu Lys Arg Arg Leu Arg Glu Ser Leu Gln
180 185 190
<210> 43
<211> 190
<212> PRT
<213> Gorilla
<220>
<221> MISC_FEATURE
<222> (1)..(190)
<223> Gorilla APOBEC-3C polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (65)..(100)
<223> Nucleic acid editing domain
<400> 43
Met Asn Pro Gln Ile Arg Asn Pro Met Lys Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe Gln Phe Lys Asn Leu Trp Glu Ala Asn Asp Arg Asn Glu
20 25 30
Thr Trp Leu Cys Phe Thr Val Glu Gly Ile Lys Arg Arg Ser Val Val
35 40 45
Ser Trp Lys Thr Gly Val Phe Arg Asn Gln Val Asp Ser Glu Thr His
50 55 60
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Glu Cys Asp Asp Ile Leu
65 70 75 80
Ser Pro Asn Thr Asn Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
100 105 110
Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Asp
115 120 125
Thr Asp Tyr Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Val Ala
130 135 140
Val Lys Ile Met Asp Tyr Lys Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Asp Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Tyr
165 170 175
Asn Phe Arg Phe Leu Lys Arg Arg Leu Gln Glu Ile Leu Glu
180 185 190
<210> 44
<211> 202
<212> PRT
<213> Rhesus macaque
<220>
<221> MISC_FEATURE
<222> (1)..(202)
<223> Rhesus macaque APOBEC-3A polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (72)..(103)
<223> Nucleic acid editing domain
<400> 44
Met Asp Gly Ser Pro Ala Ser Arg Pro Arg His Leu Met Asp Pro Asn
1 5 10 15
Thr Phe Thr Phe Asn Phe Asn Asn Asp Leu Ser Val Arg Gly Arg His
20 25 30
Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Trp
35 40 45
Val Pro Met Asp Glu Arg Arg Gly Phe Leu Cys Asn Lys Ala Lys Asn
50 55 60
Val Pro Cys Gly Asp Tyr Gly Cys His Val Glu Leu Arg Phe Leu Cys
65 70 75 80
Glu Val Pro Ser Trp Gln Leu Asp Pro Ala Gln Thr Tyr Arg Val Thr
85 90 95
Trp Phe Ile Ser Trp Ser Pro Cys Phe Arg Arg Gly Cys Ala Gly Gln
100 105 110
Val Arg Val Phe Leu Gln Glu Asn Lys His Val Arg Leu Arg Ile Phe
115 120 125
Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Gln Glu Ala Leu Arg
130 135 140
Thr Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Glu Glu
145 150 155 160
Phe Lys His Cys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe
165 170 175
Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg
180 185 190
Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
195 200
<210> 45
<211> 185
<212> PRT
<213> Bos Taurus
<220>
<221> MISC_FEATURE
<222> (1)..(185)
<223> Bovine APOBEC-3A polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (56)..(86)
<223> Nucleic acid editing domain
<400> 45
Met Asp Glu Tyr Thr Phe Thr Glu Asn Phe Asn Asn Gln Gly Trp Pro
1 5 10 15
Ser Lys Thr Tyr Leu Cys Tyr Glu Met Glu Arg Leu Asp Gly Asp Ala
20 25 30
Thr Ile Pro Leu Asp Glu Tyr Lys Gly Phe Val Arg Asn Lys Gly Leu
35 40 45
Asp Gln Pro Glu Lys Pro Cys His Ala Glu Leu Tyr Phe Leu Gly Lys
50 55 60
Ile His Ser Trp Asn Leu Asp Arg Asn Gln His Tyr Arg Leu Thr Cys
65 70 75 80
Phe Ile Ser Trp Ser Pro Cys Tyr Asp Cys Ala Gln Lys Leu Thr Thr
85 90 95
Phe Leu Lys Glu Asn His His Ile Ser Leu His Ile Leu Ala Ser Arg
100 105 110
Ile Tyr Thr His Asn Arg Phe Gly Cys His Gln Ser Gly Leu Cys Glu
115 120 125
Leu Gln Ala Ala Gly Ala Arg Ile Thr Ile Met Thr Phe Glu Asp Phe
130 135 140
Lys His Cys Trp Glu Thr Phe Val Asp His Lys Gly Lys Pro Phe Gln
145 150 155 160
Pro Trp Glu Gly Leu Asn Val Lys Ser Gln Ala Leu Cys Thr Glu Leu
165 170 175
Gln Ala Ile Leu Lys Thr Gln Gln Asn
180 185
<210> 46
<211> 200
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(200)
<223> Human APOBEC-3H polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (54)..(88)
<223> Nucleic acid editing domain
<400> 46
Met Ala Leu Leu Thr Ala Glu Thr Phe Arg Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Leu Arg Arg Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly Tyr Phe Glu
35 40 45
Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Cys Lys Pro Gln Gln Lys Gly Leu Arg Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Phe Pro Lys Phe Ala Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Glu Lys Pro Leu Ser Phe Asn Pro Tyr
145 150 155 160
Lys Met Leu Glu Glu Leu Asp Lys Asn Ser Arg Ala Ile Lys Arg Arg
165 170 175
Leu Glu Arg Ile Lys Ile Pro Gly Val Arg Ala Gln Gly Arg Tyr Met
180 185 190
Asp Ile Leu Cys Asp Ala Glu Val
195 200
<210> 47
<211> 210
<212> PRT
<213> Rhesus macaque
<220>
<221> MISC_FEATURE
<222> (1)..(210)
<223> Rhesus macaque APOBEC-3H polypeptide sequence
<400> 47
Met Ala Leu Leu Thr Ala Lys Thr Phe Ser Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Val Asn Lys Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly His Leu Lys
35 40 45
Asn Lys Lys Lys Asp His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Arg His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Arg Pro Asn Tyr Gln Glu Gly Leu Leu Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Leu Pro Glu Phe Thr Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Lys Glu Pro Pro Ser Phe Asn Pro Ser
145 150 155 160
Glu Lys Leu Glu Glu Leu Asp Lys Asn Ser Gln Ala Ile Lys Arg Arg
165 170 175
Leu Glu Arg Ile Lys Ser Arg Ser Val Asp Val Leu Glu Asn Gly Leu
180 185 190
Arg Ser Leu Gln Leu Gly Pro Val Thr Pro Ser Ser Ser Ile Arg Asn
195 200 205
Ser Arg
210
<210> 48
<211> 386
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(386)
<223> Human APOBEC-3D polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (78)..(109)
<223> Nucleic acid editing domain
<220>
<221> MISC_FEATURE
<222> (262)..(296)
<223> Nucleic acid editing domain
<400> 48
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu Pro Lys Arg Gln
50 55 60
Ser Asn His Arg Gln Glu Val Tyr Phe Arg Phe Glu Asn His Ala Glu
65 70 75 80
Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Arg Leu Pro Ala Asn Arg
85 90 95
Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro Cys Leu Pro Cys
100 105 110
Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro Asn Val Thr Leu
115 120 125
Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Asp Arg Asp Trp Arg
130 135 140
Trp Val Leu Leu Arg Leu His Lys Ala Gly Ala Arg Val Lys Ile Met
145 150 155 160
Asp Tyr Glu Asp Phe Ala Tyr Cys Trp Glu Asn Phe Val Cys Asn Glu
165 170 175
Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn Tyr Ala Ser
180 185 190
Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met Glu Ala Met
195 200 205
Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Leu Lys Ala Cys
210 215 220
Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val Thr Lys His
225 230 235 240
His Ser Ala Val Phe Arg Lys Arg Gly Val Phe Arg Asn Gln Val Asp
245 250 255
Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys
260 265 270
Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr Trp Tyr Thr
275 280 285
Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu
290 295 300
Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Cys
305 310 315 320
Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Cys Ser Leu Ser Gln
325 330 335
Glu Gly Ala Ser Val Lys Ile Met Gly Tyr Lys Asp Phe Val Ser Cys
340 345 350
Trp Lys Asn Phe Val Tyr Ser Asp Asp Glu Pro Phe Lys Pro Trp Lys
355 360 365
Gly Leu Gln Thr Asn Phe Arg Leu Leu Lys Arg Arg Leu Arg Glu Ile
370 375 380
Leu Gln
385
<210> 49
<211> 236
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(236)
<223> Human APOBEC-1 polypeptide sequence
<400> 49
Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg
35 40 45
Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Asp Phe His Pro Ser Met
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Gln Ala Ile Arg Glu Phe Leu Ser Arg His Pro Gly Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Thr Phe Phe Arg Leu
195 200 205
His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu
210 215 220
Ala Thr Gly Leu Ile His Pro Ser Val Ala Trp Arg
225 230 235
<210> 50
<211> 229
<212> PRT
<213> Mus musculus
<220>
<221> MISC_FEATURE
<222> (1)..(229)
<223> Mouse APOBEC-1 polypeptide sequence
<400> 50
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Val Trp Arg His Thr Ser Gln Asn Thr Ser Asn His Val Glu Val
50 55 60
Asn Phe Leu Glu Lys Phe Thr Thr Glu Arg Tyr Phe Arg Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg His Pro Tyr Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Thr Asp Gln Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Tyr Cys Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Ser Asn Glu Ala Tyr Trp Pro Arg Tyr Pro His Leu Trp Val Lys
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Lys Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Thr Leu Gln Thr Cys His Tyr Gln Arg Ile Pro Pro His Leu Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 51
<211> 224
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(224)
<223> Human APOBEC-2 polypeptide sequence
<400> 51
Met Ala Gln Lys Glu Glu Ala Ala Val Ala Thr Glu Ala Ala Ser Gln
1 5 10 15
Asn Gly Glu Asp Leu Glu Asn Leu Asp Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Gly Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Ala
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Ile Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Ile Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Val Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Gln Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 52
<211> 224
<212> PRT
<213> Mus musculus
<220>
<221> MISC_FEATURE
<222> (1)..(224)
<223> Mouse APOBEC-2 polypeptide sequence
<400> 52
Met Ala Gln Lys Glu Glu Ala Ala Glu Ala Ala Ala Pro Ala Ser Gln
1 5 10 15
Asn Gly Asp Asp Leu Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Val Arg Leu Pro
35 40 45
Val Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Val Gln Ser Lys Gly
65 70 75 80
Gly Gln Ala Gln Ala Thr Gln Gly Tyr Leu Glu Asp Glu His Ala Gly
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Lys Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Leu Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Ser Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Val Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Ile Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 53
<211> 224
<212> PRT
<213> Rattus
<220>
<221> MISC_FEATURE
<222> (1)..(224)
<223> Rat APOBEC-2 polypeptide sequence
<400> 53
Met Ala Gln Lys Glu Glu Ala Ala Glu Ala Ala Ala Pro Ala Ser Gln
1 5 10 15
Asn Gly Asp Asp Leu Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Val Arg Leu Pro
35 40 45
Val Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Ser Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Thr Gln Gly Tyr Leu Glu Asp Glu His Ala Gly
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Lys Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Leu Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Ser Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Val Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Leu Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 54
<211> 208
<212> PRT
<213> Petromyzon marinus
<220>
<221> MISC_FEATURE
<222> (1)..(208)
<223> Petromyzon marinus CDA1 (pmCDAl) polypeptide sequence
<400> 54
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Phe Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 55
<211> 381
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(381)
<223> Human APOBEC3G D316R D317R polypeptide sequence
<400> 55
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Phe Asn Tyr Asp Glu Phe Gln His Cys Trp
145 150 155 160
Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn
165 170 175
Leu Pro Lys Tyr Tyr Ile Leu Leu His Phe Met Leu Gly Glu Ile Leu
180 185 190
Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu
195 200 205
Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu
210 215 220
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe
225 230 235 240
Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His
245 250 255
Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu
260 265 270
Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe
275 280 285
Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Lys His Val Ser
290 295 300
Leu Cys Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg Cys Gln
305 310 315 320
Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Phe Thr
325 330 335
Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly
340 345 350
Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu
355 360 365
Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
370 375 380
<210> 56
<211> 182
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(182)
<223> Human APOBEC3G chain A polypeptide sequence
<400> 56
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Trp
1 5 10 15
Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His Asn
20 25 30
Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn Gln
35 40 45
Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu Cys
50 55 60
Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp Tyr
65 70 75 80
Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln
85 90 95
Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys Ile
100 105 110
Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys Gln Glu Gly Leu
115 120 125
Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Phe Thr Tyr Ser Glu
130 135 140
Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe
145 150 155 160
Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser Gly Arg
165 170 175
Leu Arg Ala Ile Leu Gln
180
<210> 57
<211> 184
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(184)
<223> Human APOBEC3G chain A D120R D121R polypeptide sequence
<400> 57
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Phe Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln
180
<210> 58
<211> 367
<212> PRT
<213> Homo sapiens
<220>
<221> MISC_FEATURE
<222> (1)..(367)
<223> hAPOBEC-4 polypeptide sequence
<400> 58
Met Glu Pro Ile Tyr Glu Glu Tyr Leu Ala Asn His Gly Thr Ile Val
1 5 10 15
Lys Pro Tyr Tyr Trp Leu Ser Phe Ser Leu Asp Cys Ser Asn Cys Pro
20 25 30
Tyr His Ile Arg Thr Gly Glu Glu Ala Arg Val Ser Leu Thr Glu Phe
35 40 45
Cys Gln Ile Phe Gly Phe Pro Tyr Gly Thr Thr Phe Pro Gln Thr Lys
50 55 60
His Leu Thr Phe Tyr Glu Leu Lys Thr Ser Ser Gly Ser Leu Val Gln
65 70 75 80
Lys Gly His Ala Ser Ser Cys Thr Gly Asn Tyr Ile His Pro Glu Ser
85 90 95
Met Leu Phe Glu Met Asn Gly Tyr Leu Asp Ser Ala Ile Tyr Asn Asn
100 105 110
Asp Ser Ile Arg His Ile Ile Leu Tyr Ser Asn Asn Ser Pro Cys Asn
115 120 125
Glu Ala Asn His Cys Cys Ile Ser Lys Met Tyr Asn Phe Leu Ile Thr
130 135 140
Tyr Pro Gly Ile Thr Leu Ser Ile Tyr Phe Ser Gln Leu Tyr His Thr
145 150 155 160
Glu Met Asp Phe Pro Ala Ser Ala Trp Asn Arg Glu Ala Leu Arg Ser
165 170 175
Leu Ala Ser Leu Trp Pro Arg Val Val Leu Ser Pro Ile Ser Gly Gly
180 185 190
Ile Trp His Ser Val Leu His Ser Phe Ile Ser Gly Val Ser Gly Ser
195 200 205
His Val Phe Gln Pro Ile Leu Thr Gly Arg Ala Leu Ala Asp Arg His
210 215 220
Asn Ala Tyr Glu Ile Asn Ala Ile Thr Gly Val Lys Pro Tyr Phe Thr
225 230 235 240
Asp Val Leu Leu Gln Thr Lys Arg Asn Pro Asn Thr Lys Ala Gln Glu
245 250 255
Ala Leu Glu Ser Tyr Pro Leu Asn Asn Ala Phe Pro Gly Gln Phe Phe
260 265 270
Gln Met Pro Ser Gly Gln Leu Gln Pro Asn Leu Pro Pro Asp Leu Arg
275 280 285
Ala Pro Val Val Phe Val Leu Val Pro Leu Arg Asp Leu Pro Pro Met
290 295 300
His Met Gly Gln Asn Pro Asn Lys Pro Arg Asn Ile Val Arg His Leu
305 310 315 320
Asn Met Pro Gln Met Ser Phe Gln Glu Thr Lys Asp Leu Gly Arg Leu
325 330 335
Pro Thr Gly Arg Ser Val Glu Ile Val Glu Ile Thr Glu Gln Phe Ala
340 345 350
Ser Ser Lys Glu Ala Asp Glu Lys Lys Lys Lys Lys Gly Lys Lys
355 360 365
<210> 59
<211> 388
<212> PRT
<213> Rattus norvegicus
<220>
<221> MISC_FEATURE
<222> (1)..(388)
<223> rAPOBEC-4 polypeptide sequence
<400> 59
Met Glu Pro Leu Tyr Glu Glu Tyr Leu Thr His Ser Gly Thr Ile Val
1 5 10 15
Lys Pro Tyr Tyr Trp Leu Ser Val Ser Leu Asn Cys Thr Asn Cys Pro
20 25 30
Tyr His Ile Arg Thr Gly Glu Glu Ala Arg Val Pro Tyr Thr Glu Phe
35 40 45
His Gln Thr Phe Gly Phe Pro Trp Ser Thr Tyr Pro Gln Thr Lys His
50 55 60
Leu Thr Phe Tyr Glu Leu Arg Ser Ser Ser Gly Asn Leu Ile Gln Lys
65 70 75 80
Gly Leu Ala Ser Asn Cys Thr Gly Ser His Thr His Pro Glu Ser Met
85 90 95
Leu Phe Glu Arg Asp Gly Tyr Leu Asp Ser Leu Ile Phe His Asp Ser
100 105 110
Asn Ile Arg His Ile Ile Leu Tyr Ser Asn Asn Ser Pro Cys Asp Glu
115 120 125
Ala Asn His Cys Cys Ile Ser Lys Met Tyr Asn Phe Leu Met Asn Tyr
130 135 140
Pro Glu Val Thr Leu Ser Val Phe Phe Ser Gln Leu Tyr His Thr Glu
145 150 155 160
Asn Gln Phe Pro Thr Ser Ala Trp Asn Arg Glu Ala Leu Arg Gly Leu
165 170 175
Ala Ser Leu Trp Pro Gln Val Thr Leu Ser Ala Ile Ser Gly Gly Ile
180 185 190
Trp Gln Ser Ile Leu Glu Thr Phe Val Ser Gly Ile Ser Glu Gly Leu
195 200 205
Thr Ala Val Arg Pro Phe Thr Ala Gly Arg Thr Leu Thr Asp Arg Tyr
210 215 220
Asn Ala Tyr Glu Ile Asn Cys Ile Thr Glu Val Lys Pro Tyr Phe Thr
225 230 235 240
Asp Ala Leu His Ser Trp Gln Lys Glu Asn Gln Asp Gln Lys Val Trp
245 250 255
Ala Ala Ser Glu Asn Gln Pro Leu His Asn Thr Thr Pro Ala Gln Trp
260 265 270
Gln Pro Asp Met Ser Gln Asp Cys Arg Thr Pro Ala Val Phe Met Leu
275 280 285
Val Pro Tyr Arg Asp Leu Pro Pro Ile His Val Asn Pro Ser Pro Gln
290 295 300
Lys Pro Arg Thr Val Val Arg His Leu Asn Thr Leu Gln Leu Ser Ala
305 310 315 320
Ser Lys Val Lys Ala Leu Arg Lys Ser Pro Ser Gly Arg Pro Val Lys
325 330 335
Lys Glu Glu Ala Arg Lys Gly Ser Thr Arg Ser Gln Glu Ala Asn Glu
340 345 350
Thr Asn Lys Ser Lys Trp Lys Lys Gln Thr Leu Phe Ile Lys Ser Asn
355 360 365
Ile Cys His Leu Leu Glu Arg Glu Gln Lys Lys Ile Gly Ile Leu Ser
370 375 380
Ser Trp Ser Val
385
<210> 60
<211> 363
<212> PRT
<213> Macaca fascicularis
<220>
<221> MISC_FEATURE
<222> (1)..(363)
<223> mfAPOBEC-4 polypeptide sequence
<400> 60
Met Glu Pro Thr Tyr Glu Glu Tyr Leu Ala Asn His Gly Thr Ile Val
1 5 10 15
Lys Pro Tyr Tyr Trp Leu Ser Phe Ser Leu Asp Cys Ser Asn Cys Pro
20 25 30
Tyr His Ile Arg Thr Gly Glu Glu Ala Arg Val Ser Leu Thr Glu Phe
35 40 45
Cys Gln Ile Phe Gly Phe Pro Tyr Gly Thr Thr Tyr Pro Gln Thr Lys
50 55 60
His Leu Thr Phe Tyr Glu Leu Lys Thr Ser Ser Gly Ser Leu Val Gln
65 70 75 80
Lys Gly His Ala Ser Ser Cys Thr Gly Asn Tyr Ile His Pro Glu Ser
85 90 95
Met Leu Phe Glu Met Asn Gly Tyr Leu Asp Ser Ala Ile Tyr Asn Asn
100 105 110
Asp Ser Ile Arg His Ile Ile Leu Tyr Cys Asn Asn Ser Pro Cys Asn
115 120 125
Glu Ala Asn His Cys Cys Ile Ser Lys Val Tyr Asn Phe Leu Ile Thr
130 135 140
Tyr Pro Gly Ile Thr Leu Ser Ile Tyr Phe Ser Gln Leu Tyr His Thr
145 150 155 160
Glu Met Asp Phe Pro Ala Ser Ala Trp Asn Arg Glu Ala Leu Arg Ser
165 170 175
Leu Ala Ser Leu Trp Pro Arg Val Val Leu Ser Pro Ile Ser Gly Gly
180 185 190
Ile Trp His Ser Val Leu His Ser Phe Val Ser Gly Val Ser Gly Ser
195 200 205
His Val Phe Gln Pro Ile Leu Thr Gly Arg Ala Leu Thr Asp Arg Tyr
210 215 220
Asn Ala Tyr Glu Ile Asn Ala Ile Thr Gly Val Lys Pro Phe Phe Thr
225 230 235 240
Asp Val Leu Leu His Thr Lys Arg Asn Pro Asn Thr Lys Ala Gln Met
245 250 255
Ala Leu Glu Ser Tyr Pro Leu Asn Asn Ala Phe Pro Gly Gln Ser Phe
260 265 270
Gln Met Thr Ser Gly Ile Pro Pro Asp Leu Arg Ala Pro Val Val Phe
275 280 285
Val Leu Leu Pro Leu Arg Asp Leu Pro Pro Met His Met Gly Gln Asp
290 295 300
Pro Asn Lys Pro Arg Asn Ile Ile Arg His Leu Asn Met Pro Gln Met
305 310 315 320
Ser Phe Gln Glu Thr Lys Asp Leu Glu Arg Leu Pro Thr Arg Arg Ser
325 330 335
Val Glu Thr Val Glu Ile Thr Glu Arg Phe Ala Ser Ser Lys Gln Ala
340 345 350
Glu Glu Lys Thr Lys Lys Lys Lys Gly Lys Lys
355 360
<210> 61
<211> 218
<212> PRT
<213> Rattus norvegicus
<220>
<221> MISC_FEATURE
<222> (1)..(218)
<223> rAPOBEC-1 (delta 177-186) polypeptide sequence
<400> 61
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu
180 185 190
Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro
195 200 205
Pro His Ile Leu Trp Ala Thr Gly Leu Lys
210 215
<210> 62
<211> 218
<212> PRT
<213> Rattus norvegicus
<220>
<221> MISC_FEATURE
<222> (1)..(218)
<223> rAPOBEC-1 (delta 202-213) polypeptide sequence
<400> 62
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln His Tyr Gln Arg Leu Pro
195 200 205
Pro His Ile Leu Trp Ala Thr Gly Leu Lys
210 215
<210> 63
<211> 198
<212> PRT
<213> Mus musculus
<220>
<221> MISC_FEATURE
<222> (1)..(198)
<223> mouse cytidine deaminase polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(30)
<223> Nuclear localization sequence
<220>
<221> MISC_FEATURE
<222> (183)..(198)
<223> Nuclear export signal
<400> 63
Met Asp Ser Leu Leu Met Lys Gln Lys Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Cys Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Glu
85 90 95
Phe Leu Arg Trp Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Gly Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Thr Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Met Leu Gly Phe
195
<210> 64
<211> 224
<212> PRT
<213> Petromyzon marinus
<220>
<221> MISC_FEATURE
<222> (1)..(224)
<223> pmCDA-1 polypeptide sequence
<400> 64
Met Ala Gly Tyr Glu Cys Val Arg Val Ser Glu Lys Leu Asp Phe Asp
1 5 10 15
Thr Phe Glu Phe Gln Phe Glu Asn Leu His Tyr Ala Thr Glu Arg His
20 25 30
Arg Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Ala Gly Gly Arg
35 40 45
Ser Arg Arg Leu Trp Gly Tyr Ile Ile Asn Asn Pro Asn Val Cys His
50 55 60
Ala Glu Leu Ile Leu Met Ser Met Ile Asp Arg His Leu Glu Ser Asn
65 70 75 80
Pro Gly Val Tyr Ala Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Ala
85 90 95
Asn Cys Ser Ser Lys Leu Asn Pro Trp Leu Lys Asn Leu Leu Glu Glu
100 105 110
Gln Gly His Thr Leu Thr Met His Phe Ser Arg Ile Tyr Asp Arg Asp
115 120 125
Arg Glu Gly Asp His Arg Gly Leu Arg Gly Leu Lys His Val Ser Asn
130 135 140
Ser Phe Arg Met Gly Val Val Gly Arg Ala Glu Val Lys Glu Cys Leu
145 150 155 160
Ala Glu Tyr Val Glu Ala Ser Arg Arg Thr Leu Thr Trp Leu Asp Thr
165 170 175
Thr Glu Ser Met Ala Ala Lys Met Arg Arg Lys Leu Phe Cys Ile Leu
180 185 190
Val Arg Cys Ala Gly Met Arg Glu Ser Gly Ile Pro Leu His Leu Phe
195 200 205
Thr Leu Gln Thr Pro Leu Leu Ser Gly Arg Val Val Trp Trp Arg Val
210 215 220
<210> 65
<211> 331
<212> PRT
<213> Petromyzon marinus
<220>
<221> MISC_FEATURE
<222> (1)..(331)
<223> pmCDA-2 polypeptide sequence
<400> 65
Met Glu Leu Arg Glu Val Val Asp Cys Ala Leu Ala Ser Cys Val Arg
1 5 10 15
His Glu Pro Leu Ser Arg Val Ala Phe Leu Arg Cys Phe Ala Ala Pro
20 25 30
Ser Gln Lys Pro Arg Gly Thr Val Ile Leu Phe Tyr Val Glu Gly Ala
35 40 45
Gly Arg Gly Val Thr Gly Gly His Ala Val Asn Tyr Asn Lys Gln Gly
50 55 60
Thr Ser Ile His Ala Glu Val Leu Leu Leu Ser Ala Val Arg Ala Ala
65 70 75 80
Leu Leu Arg Arg Arg Arg Cys Glu Asp Gly Glu Glu Ala Thr Arg Gly
85 90 95
Cys Thr Leu His Cys Tyr Ser Thr Tyr Ser Pro Cys Arg Asp Cys Val
100 105 110
Glu Tyr Ile Gln Glu Phe Gly Ala Ser Thr Gly Val Arg Val Val Ile
115 120 125
His Cys Cys Arg Leu Tyr Glu Leu Asp Val Asn Arg Arg Arg Ser Glu
130 135 140
Ala Glu Gly Val Leu Arg Ser Leu Ser Arg Leu Gly Arg Asp Phe Arg
145 150 155 160
Leu Met Gly Pro Arg Asp Ala Ile Ala Leu Leu Leu Gly Gly Arg Leu
165 170 175
Ala Asn Thr Ala Asp Gly Glu Ser Gly Ala Ser Gly Asn Ala Trp Val
180 185 190
Thr Glu Thr Asn Val Val Glu Pro Leu Val Asp Met Thr Gly Phe Gly
195 200 205
Asp Glu Asp Leu His Ala Gln Val Gln Arg Asn Lys Gln Ile Arg Glu
210 215 220
Ala Tyr Ala Asn Tyr Ala Ser Ala Val Ser Leu Met Leu Gly Glu Leu
225 230 235 240
His Val Asp Pro Asp Lys Phe Pro Phe Leu Ala Glu Phe Leu Ala Gln
245 250 255
Thr Ser Val Glu Pro Ser Gly Thr Pro Arg Glu Thr Arg Gly Arg Pro
260 265 270
Arg Gly Ala Ser Ser Arg Gly Pro Glu Ile Gly Arg Gln Arg Pro Ala
275 280 285
Asp Phe Glu Arg Ala Leu Gly Ala Tyr Gly Leu Phe Leu His Pro Arg
290 295 300
Ile Val Ser Arg Glu Ala Asp Arg Glu Glu Ile Lys Arg Asp Leu Ile
305 310 315 320
Val Val Met Arg Lys His Asn Tyr Gln Gly Pro
325 330
<210> 66
<211> 209
<212> PRT
<213> Petromyzon marinus
<220>
<221> MISC_FEATURE
<222> (1)..(209)
<223> pmCDA-5 polypeptide sequence
<400> 66
Met Ala Gly Asp Glu Asn Val Arg Val Ser Glu Lys Leu Asp Phe Asp
1 5 10 15
Thr Phe Glu Phe Gln Phe Glu Asn Leu His Tyr Ala Thr Glu Arg His
20 25 30
Arg Thr Tyr Val Ile Phe Asp Val Lys Pro Gln Ser Ala Gly Gly Arg
35 40 45
Ser Arg Arg Leu Trp Gly Tyr Ile Ile Asn Asn Pro Asn Val Cys His
50 55 60
Ala Glu Leu Ile Leu Met Ser Met Ile Asp Arg His Leu Glu Ser Asn
65 70 75 80
Pro Gly Val Tyr Ala Met Thr Trp Tyr Met Ser Trp Ser Pro Cys Ala
85 90 95
Asn Cys Ser Ser Lys Leu Asn Pro Trp Leu Lys Asn Leu Leu Glu Glu
100 105 110
Gln Gly His Thr Leu Met Met His Phe Ser Arg Ile Tyr Asp Arg Asp
115 120 125
Arg Glu Gly Asp His Arg Gly Leu Arg Gly Leu Lys His Val Ser Asn
130 135 140
Ser Phe Arg Met Gly Val Val Gly Arg Ala Glu Val Lys Glu Cys Leu
145 150 155 160
Ala Glu Tyr Val Glu Ala Ser Arg Arg Thr Leu Thr Trp Leu Asp Thr
165 170 175
Thr Glu Ser Met Ala Ala Lys Met Arg Arg Lys Leu Phe Cys Ile Leu
180 185 190
Val Arg Cys Ala Gly Met Arg Glu Ser Gly Met Pro Leu His Leu Phe
195 200 205
Thr
<210> 67
<211> 158
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<221> MISC_FEATURE
<222> (1)..(158)
<223> yCD polypeptide sequence
<400> 67
Met Val Thr Gly Gly Met Ala Ser Lys Trp Asp Gln Lys Gly Met Asp
1 5 10 15
Ile Ala Tyr Glu Glu Ala Ala Leu Gly Tyr Lys Glu Gly Gly Val Pro
20 25 30
Ile Gly Gly Cys Leu Ile Asn Asn Lys Asp Gly Ser Val Leu Gly Arg
35 40 45
Gly His Asn Met Arg Phe Gln Lys Gly Ser Ala Thr Leu His Gly Glu
50 55 60
Ile Ser Thr Leu Glu Asn Cys Gly Arg Leu Glu Gly Lys Val Tyr Lys
65 70 75 80
Asp Thr Thr Leu Tyr Thr Thr Leu Ser Pro Cys Asp Met Cys Thr Gly
85 90 95
Ala Ile Ile Met Tyr Gly Ile Pro Arg Cys Val Val Gly Glu Asn Val
100 105 110
Asn Phe Lys Ser Lys Gly Glu Lys Tyr Leu Gln Thr Arg Gly His Glu
115 120 125
Val Val Val Val Asp Asp Glu Arg Cys Lys Lys Ile Met Lys Gln Phe
130 135 140
Ile Asp Glu Arg Pro Gln Asp Trp Phe Glu Asp Ile Gly Glu
145 150 155
<210> 68
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: cytidine deaminase
polypeptide sequence
<400> 68
Met Lys Pro Gln Ile Arg Asp His Arg Pro Asn Pro Met Glu Ala Met
1 5 10 15
Tyr Pro His Ile Phe Tyr Phe His Phe Glu Asn Leu Glu Lys Ala Tyr
20 25 30
Gly Arg Asn Glu Thr Trp Leu Cys Phe Thr Val Glu Ile Ile Lys Gln
35 40 45
Tyr Leu Pro Val Pro Trp Lys Lys Gly Val Phe Arg Asn Gln Val Asp
50 55 60
Pro Glu Thr His Cys His Ala Glu Lys Cys Phe Leu Ser Trp Phe Cys
65 70 75 80
Asn Asn Thr Leu Ser Pro Lys Lys Asn Tyr Gln Val Thr Trp Tyr Thr
85 90 95
Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu
100 105 110
Ala Glu His Ser Asn Val Lys Leu Thr Ile Tyr Thr Ala Arg Leu Tyr
115 120 125
Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Arg Ser Leu Ser Glu
130 135 140
Glu Gly Ala Ser Val Glu Ile Met Asp Tyr Glu Asp Phe Gln Tyr Cys
145 150 155 160
Trp Glu Asn Phe Val Tyr Asp Asp Gly Glu Pro Phe Lys Arg Trp Lys
165 170 175
Gly Leu Lys Tyr Asn Phe Gln Ser Leu Thr Arg Arg Leu Arg Glu Ile
180 185 190
Leu Gln
<210> 69
<211> 192
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: cytidine deaminase
polypeptide sequence
<400> 69
Met Ala Asp Ser Ser Glu Lys Met Arg Gly Gln Tyr Ile Ser Arg Asp
1 5 10 15
Thr Phe Glu Lys Asn Tyr Lys Pro Ile Asp Gly Thr Lys Glu Ala His
20 25 30
Leu Leu Cys Glu Ile Lys Trp Gly Lys Tyr Gly Lys Pro Trp Leu His
35 40 45
Trp Cys Gln Asn Gln Arg Met Asn Ile His Ala Glu Asp Tyr Phe Met
50 55 60
Asn Asn Ile Phe Lys Ala Lys Lys His Pro Val His Cys Tyr Val Thr
65 70 75 80
Trp Tyr Leu Ser Trp Ser Pro Cys Ala Asp Cys Ala Ser Lys Ile Val
85 90 95
Lys Phe Leu Glu Glu Arg Pro Tyr Leu Lys Leu Thr Ile Tyr Val Ala
100 105 110
Gln Leu Tyr Tyr His Thr Glu Glu Glu Asn Arg Lys Gly Leu Arg Leu
115 120 125
Leu Arg Ser Lys Lys Val Ile Ile Arg Val Met Asp Ile Ser Asp Tyr
130 135 140
Asn Tyr Cys Trp Lys Val Phe Val Ser Asn Gln Asn Gly Asn Glu Asp
145 150 155 160
Tyr Trp Pro Leu Gln Phe Asp Pro Trp Val Lys Glu Asn Tyr Ser Arg
165 170 175
Leu Leu Asp Ile Phe Trp Glu Ser Lys Cys Arg Ser Pro Asn Pro Trp
180 185 190
<210> 70
<211> 280
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: cytidine deaminase
polypeptide sequence
<400> 70
Met Asp Pro Gln Arg Leu Arg Gln Trp Pro Gly Pro Gly Pro Ala Ser
1 5 10 15
Arg Gly Gly Tyr Gly Gln Arg Pro Arg Ile Arg Asn Pro Glu Glu Trp
20 25 30
Phe His Glu Leu Ser Pro Arg Thr Phe Ser Phe His Phe Arg Asn Leu
35 40 45
Arg Phe Ala Ser Gly Arg Asn Arg Ser Tyr Ile Cys Cys Gln Val Glu
50 55 60
Gly Lys Asn Cys Phe Phe Gln Gly Ile Phe Gln Asn Gln Val Pro Pro
65 70 75 80
Asp Pro Pro Cys His Ala Glu Leu Cys Phe Leu Ser Trp Phe Gln Ser
85 90 95
Trp Gly Leu Ser Pro Asp Glu His Tyr Tyr Val Thr Trp Phe Ile Ser
100 105 110
Trp Ser Pro Cys Cys Glu Cys Ala Ala Lys Val Ala Gln Phe Leu Glu
115 120 125
Glu Asn Arg Asn Val Ser Leu Ser Leu Ser Ala Ala Arg Leu Tyr Tyr
130 135 140
Phe Trp Lys Ser Glu Ser Arg Glu Gly Leu Arg Arg Leu Ser Asp Leu
145 150 155 160
Gly Ala Gln Val Gly Ile Met Ser Phe Gln Asp Phe Gln His Cys Trp
165 170 175
Asn Asn Phe Val His Asn Leu Gly Met Pro Phe Gln Pro Trp Lys Lys
180 185 190
Leu His Lys Asn Tyr Gln Arg Leu Val Thr Glu Leu Lys Gln Ile Leu
195 200 205
Arg Glu Glu Pro Ala Thr Tyr Gly Ser Pro Gln Ala Gln Gly Lys Val
210 215 220
Arg Ile Gly Ser Thr Ala Ala Gly Leu Arg His Ser His Ser His Thr
225 230 235 240
Arg Ser Glu Ala His Leu Arg Pro Asn His Ser Ser Arg Gln His Arg
245 250 255
Ile Leu Asn Pro Pro Arg Glu Ala Arg Ala Arg Thr Cys Val Leu Val
260 265 270
Asp Ala Ser Trp Ile Cys Tyr Arg
275 280
<210> 71
<211> 555
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.1;
tr|F7B644|F7B644_HORSE polypeptide sequence
<400> 71
Met Pro Arg Gly Arg Ala Arg Glu Arg Gln Arg Arg Asn Pro Met Glu
1 5 10 15
Lys Leu Asp Ala Glu Ala Phe Ser Phe His Phe Leu Asn Met Glu Phe
20 25 30
Val Tyr Asp Arg Asn Cys Ser Tyr Leu Cys Tyr Gln Val Glu Gly Arg
35 40 45
Leu Ser Gly Ser Pro Val Leu Ser Glu Gln Gly Val Phe Pro Asn Glu
50 55 60
Val Cys Gly Lys Thr Arg Arg His Ala Glu Leu Cys Phe Leu Asp Trp
65 70 75 80
Phe Arg Gly Arg Leu Ser Pro Asp Glu Tyr Tyr Cys Val Thr Trp Phe
85 90 95
Ile Ser Trp Ser Pro Cys Ser Asn Cys Ala Arg Glu Val Ala Glu Phe
100 105 110
Leu Lys Arg His Arg Asn Val Glu Leu Ser Ile Phe Ala Ala Arg Leu
115 120 125
Tyr Tyr Cys Arg Asp His Glu Gln Gly Leu Gln Ser Leu Cys Asn Arg
130 135 140
Gly Ala Gln Leu Ala Val Met Leu Arg Lys Asp Phe Thr Tyr Cys Trp
145 150 155 160
Asp Asn Phe Val His Asn Ser Gly Arg Glu Phe Ser Pro Trp Glu Asn
165 170 175
Ile Asp Ala Asn Ser Asp Leu Leu Ala Arg Lys Leu Glu Asp Leu Leu
180 185 190
Lys Asn Pro Met Glu Lys Leu His Arg Lys Thr Phe Ser Phe His Phe
195 200 205
Arg Asn Leu Lys Phe Ala Lys Gly Arg Lys Cys Ser Tyr Leu Cys Tyr
210 215 220
Arg Val Glu Gly Arg Leu Ser Gly Ser Pro Gly Leu Ser Glu Gln Gly
225 230 235 240
Val Phe Leu Asn Glu Val Cys Asp Glu Asn Cys Arg His Ala Glu Leu
245 250 255
Cys Phe Leu His Trp Phe Arg Gly Arg Leu Ser Pro His Ala Asp Tyr
260 265 270
Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Ser Asn Cys Ala Arg
275 280 285
Glu Val Ala Glu Phe Leu Lys Gln His Arg Asn Val Glu Leu His Ile
290 295 300
Ser Ala Ala Arg Leu Tyr Tyr Trp Gln Arg Asn Lys Pro Gly Leu Arg
305 310 315 320
Asn Leu Arg Ser Ser Gly Ala Gln Leu Ala Ile Met Phe Phe Trp Asp
325 330 335
Phe Arg Asp Cys Trp Asp Asn Phe Val His Asn Ser Gly Arg His Phe
340 345 350
Ile Pro Trp Lys Lys Ile Asn Val Asn Ser Arg Leu Leu Ala Thr Lys
355 360 365
Leu Glu Asp Leu Leu Lys Asn Pro Leu Glu Lys Leu His Pro Asn Thr
370 375 380
Phe Ser Phe His Phe Cys Asn Leu Glu Phe Ala Tyr Asp Arg Lys Tyr
385 390 395 400
Ser Tyr Leu Cys Tyr Gln Val Glu Gly Arg Leu Ser Gly Ser Pro Gly
405 410 415
Leu Ser Glu Gln Gly Val Phe Leu Asn Glu Val Cys Gly Lys Thr Arg
420 425 430
Cys His Ala Glu Leu Cys Phe Leu Asp Trp Phe Arg Val Arg Leu Ser
435 440 445
Pro Asp Glu Tyr Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys
450 455 460
Phe Tyr Cys Ala Arg Glu Val Ala Asp Phe Leu Lys Gln Tyr Arg Asn
465 470 475 480
Val Lys Leu Ser Ile Phe Ala Ala Arg Leu Tyr Tyr Cys Arg Asp His
485 490 495
Ala Gln Gly Leu Arg Ser Leu Cys Ser Ser Gly Ala Gln Leu Ala Ile
500 505 510
Met Phe Phe Trp Asp Phe Arg Tyr Cys Trp Asp Asn Phe Val His Asn
515 520 525
Ser Gly Arg Glu Phe Arg Pro Trp Lys Lys Ile Asn Val Asn Ser Arg
530 535 540
Leu Leu Ala Thr Lys Leu Glu Asp Ile Leu Lys
545 550 555
<210> 72
<211> 437
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.2;
tr|D1LZA1|D1LZA1_PANTI polypeptide sequence
<400> 72
Met Glu Pro Trp Arg Pro Ser Pro Arg Asn Pro Met Asp Arg Ile Asp
1 5 10 15
Pro Lys Thr Phe Arg Phe Gln Phe Pro Asn Leu Arg Tyr Ala Ser Gly
20 25 30
Arg Lys Leu Cys Tyr Leu Cys Phe Gln Val Glu Arg Asp Tyr Phe Tyr
35 40 45
Tyr Asn Asp Ser Asp Trp Gly Val Phe Arg Asn Glu Val His Pro Trp
50 55 60
Ala Pro Cys His Ala Glu Gln Cys Phe Leu Ser Trp Phe Arg Asp Gln
65 70 75 80
Tyr Pro Tyr Arg Asp Glu Asp Tyr Asn Val Thr Trp Phe Leu Ser Trp
85 90 95
Ser Pro Cys Pro Thr Cys Ala Glu Glu Val Val Glu Phe Leu Glu Glu
100 105 110
Tyr Arg Asn Leu Thr Leu Ser Ile Phe Thr Ser Arg Leu Tyr Tyr Phe
115 120 125
Trp His Pro Asn Tyr Gln Glu Gly Leu Cys Lys Leu Trp Asp Ala Gly
130 135 140
Val Gln Leu Asp Ile Met Ser Cys Asp Glu Phe Glu Tyr Cys Trp Asp
145 150 155 160
Asn Phe Val Tyr His Lys Gly Met Arg Phe Gln Arg Arg Asn Leu Leu
165 170 175
Lys Asp Tyr Asp Phe Leu Ala Ala Lys Leu Gln Glu Ile Leu Ser Pro
180 185 190
Gly Gln Gln Arg Lys Arg Asp Trp Pro Phe Pro Pro Arg Pro Gly Ala
195 200 205
Gln Val Asp Pro Arg Ser Trp Val Gln Glu Val Thr Glu Pro Gly Ile
210 215 220
Asn Thr Arg Arg His Pro Leu His Leu Leu Val Ser Phe Leu Leu Pro
225 230 235 240
Arg Pro Thr Met Asn Pro Leu Gln Glu Asp Ile Phe Tyr Arg Gln Phe
245 250 255
Gly Asn Gln His Arg Val Pro Lys Pro Tyr Tyr Tyr Arg Arg Lys Thr
260 265 270
Tyr Leu Cys Tyr Gln Leu Lys Leu Pro Glu Gly Thr Leu Ile Asp Lys
275 280 285
Asp Cys Leu Arg Asn Lys Lys Lys Arg His Ala Glu Ile Cys Phe Ile
290 295 300
Asp Lys Ile Lys Ser Leu Thr Arg Asp Thr Ser Gln Arg Phe Glu Ile
305 310 315 320
Ile Cys Tyr Ile Thr Trp Ser Pro Cys Pro Phe Cys Ala Glu Glu Leu
325 330 335
Val Ala Phe Val Lys Asp Asn Pro His Leu Ser Leu Arg Ile Phe Ala
340 345 350
Ser Arg Leu Tyr Val His Trp Arg Trp Lys Tyr Gln Gln Gly Leu Arg
355 360 365
His Leu His Ala Ser Gly Ile Pro Val Ala Val Met Ser Leu Pro Glu
370 375 380
Phe Glu Asp Cys Trp Arg Asn Phe Val Asp His Gln Asp Arg Leu Phe
385 390 395 400
Gln Pro Trp Arg Asn Leu Asp Gln Tyr Ser Glu Ser Ile Lys Arg Arg
405 410 415
Leu Gly Lys Ile Leu Thr Pro Leu Asn Asp Leu Arg Asn Asp Phe Arg
420 425 430
Asn Leu Lys Leu Glu
435
<210> 73
<211> 440
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.3;
tr|A0A3Q0DM17|A0A3Q0DM17_TARSY polypeptide sequence
<400> 73
Met Pro Met Lys Arg Met Tyr Ser Asn Ile Tyr Phe Asp His Phe Asn
1 5 10 15
Asn Gln Arg Leu Leu Ser Gly Gln Asn Ala Pro Trp Leu Cys Phe Lys
20 25 30
Val Glu Arg Val Glu Asn Cys Met Leu Val Pro Leu Glu Thr Gly Val
35 40 45
Phe Gly Asn Gln Val Ser Gly Cys Cys Gly Lys Thr Glu Arg Pro Val
50 55 60
Glu Pro Thr Ser Leu Thr Arg Ser Val Leu Val Ser Pro Asn Pro Gly
65 70 75 80
Thr Glu Leu Arg Ala Gln Gln Pro Ser Arg Lys Gly His Leu Gly Lys
85 90 95
Leu Gly Cys Val Glu Tyr Pro Ser Pro Gly Leu Ala Leu Val Met Leu
100 105 110
Gly Tyr Gly Ala Ser Thr Tyr Cys Pro Asp Ser Ser Met Tyr Cys Pro
115 120 125
Glu Thr Cys His His Pro Glu Met Cys Phe Leu Tyr Trp Phe Glu Lys
130 135 140
Thr Leu Ser His Glu Glu Gln Tyr Gln Ile Thr Trp Tyr Val Ser Trp
145 150 155 160
Ser Pro Cys Val Asn Cys Ala Glu Glu Val Ala Glu Phe Leu Ser Val
165 170 175
His Pro Lys Val Asn Leu Thr Ile Tyr Ala Ala Arg Leu Tyr Cys Tyr
180 185 190
Gln Lys Leu Asn His Arg Gln Gly Leu Arg Arg Leu Cys Lys Glu Gly
195 200 205
Ala Cys Val Lys Ile Met Asn Tyr Glu Glu Phe Asp His Cys Trp Glu
210 215 220
Asn Phe Val Tyr Asn Asn Tyr Lys Ser Phe Lys Pro Trp Val Lys Leu
225 230 235 240
Gln Asp Asn Tyr Glu Leu Leu Ala Thr Glu Leu Asp Lys Ile Leu Arg
245 250 255
Ile Pro Met Glu Arg Met Pro Gln Lys Lys Phe Arg Phe His Phe Gln
260 265 270
Asn Leu Ile Ala Lys Asp Arg Asn Thr Thr Trp Leu Cys Phe Glu Val
275 280 285
Lys Asn Val Arg Lys Lys His Pro Pro Asp Leu Leu Glu Arg Gly Ile
290 295 300
Phe Gln Asn Gln Val Thr Pro Arg Ile Asn Cys His Ala Glu Met Cys
305 310 315 320
Phe Leu Ser Trp Phe Leu Glu Asn Met Leu Leu His Gly Lys Arg Tyr
325 330 335
Gln Val Thr Trp Tyr Ile Ser Trp Ser Pro Cys Ser Ile Cys Ala Glu
340 345 350
Glu Val Ala Glu Phe Leu Ser Ala His Pro Lys Val Ser Leu Thr Ile
355 360 365
Tyr Ala Ala Arg Leu Tyr Tyr Phe Trp Val Pro Gly Tyr Arg Gln Gly
370 375 380
Leu Arg Arg Leu Val Glu Glu Gly Ala Arg Val Glu Ile Met Asn Tyr
385 390 395 400
Glu Glu Phe Asp Tyr Cys Trp Glu Asn Phe Val Ser Ile Asn Asn Glu
405 410 415
Pro Phe Gln Pro Trp Glu Gly Leu His Glu Lys Tyr Gly Tyr Leu Val
420 425 430
Thr Lys Leu Asn Asn Ile Leu Gly
435 440
<210> 74
<211> 453
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.4;
tr|A0A3Q0DNJ5|A0A3Q0DNJ5_TARSY polypeptide sequence
<400> 74
Met Glu Asp Asn Pro Glu Pro Arg Pro Arg Gln Gln Met Asp Gln Asp
1 5 10 15
Thr Phe Ile Phe Asn Phe Asn Asn Asp Pro Ser Val Arg Gly Arg His
20 25 30
Gln Thr Phe Leu Cys Tyr Glu Val Glu His Leu Asp Asp Asp Thr Trp
35 40 45
Val Pro Gln Asp Lys Tyr Leu Gly Phe Leu His Asn Gln Pro Gln Ser
50 55 60
Arg Ser Asn Ala Tyr Cys Ala Tyr His Ala Glu Leu Cys Phe Leu Glu
65 70 75 80
Leu Val Ser Ser Trp Gln Leu Asp Pro Ala Gln Arg Tyr Arg Val Thr
85 90 95
Cys Phe Ile Ser Trp Ser Pro Cys Ser Ser Cys Ala Gln Glu Val Ala
100 105 110
Ala Phe Leu Lys Lys Asn Arg His Val Thr Leu Arg Ile Leu Ala Ala
115 120 125
Arg Ile Tyr Asp Tyr Tyr Gln Gly Tyr Glu Asp Gly Leu Arg Thr Leu
130 135 140
Gln Gly Val Gly Val Asp Ile Thr Val Met Thr Ser Ala Glu Phe Gly
145 150 155 160
His Cys Trp Asn Thr Phe Val Asp His Gln Gly Ser Pro Phe Gln Pro
165 170 175
Trp Glu Gly Leu Asp Gln His Ser Gln Val Ile Trp Gln Arg Met Gln
180 185 190
Asp Ile Leu Gln Val Ile Pro Ala Lys Tyr Leu Met Glu Lys Val Lys
195 200 205
Tyr Thr Val Thr Val Asp Ile Leu Phe Lys Gly Arg Val Pro Gly Pro
210 215 220
Arg Tyr Leu Met Asp Gln Asn Thr Phe Thr Arg Asn Phe Ile Asn Asn
225 230 235 240
Leu Ser Val Ser Gly Arg Arg Gln Thr Leu Leu Cys Tyr Glu Val Glu
245 250 255
Arg Leu Gly Gly Asp Ile Trp Val Pro Leu Asp Gln Leu Arg Gly Phe
260 265 270
Leu Leu Ser Gln Ala Arg Asp Val Leu Asn Tyr Tyr Gln Gly Arg His
275 280 285
Ala Glu Pro Cys Phe Leu Asp Leu Val Ser Ser Trp Gln Leu Asp Pro
290 295 300
Ala Gln His Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Thr
305 310 315 320
Ser Cys Ala Gln Ala Val Ala Ala Phe Leu Arg Glu Asn Arg His Val
325 330 335
Thr Leu Arg Ile Leu Ala Ala Arg Ile Tyr Asp Tyr His Gln Gly Tyr
340 345 350
Glu Glu Gly Leu Arg Thr Leu Gln Arg Thr Gly Ala His Ile Asp Ile
355 360 365
Met Thr Phe Lys Glu Phe Gly His Cys Trp Asn Thr Phe Val Asn His
370 375 380
Lys Gly Ser Pro Phe Lys Ser Trp Thr Gly Leu Asp Gln His Ser Gln
385 390 395 400
Ala Leu Arg Lys Arg Leu Gln Asp Ile Leu His Thr Met Ala Ser Ser
405 410 415
Leu Trp Asp Gln Ser Glu Pro Lys Lys Pro Ile Pro Ser Gln Glu Val
420 425 430
Thr Leu Pro Glu Ser Ile Pro Pro Ser His Gly Asn Arg Phe Arg Leu
435 440 445
Val Lys Arg Pro Ser
450
<210> 75
<211> 424
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.5;
tr|G5AYU5|G5AYU5_HETGA polypeptide sequence
<400> 75
Phe Cys Phe Leu Ser Cys Val His Arg Lys Pro Ile Glu Arg Ile Tyr
1 5 10 15
Lys Lys Ala Phe Arg Phe Tyr Phe Arg Asn Leu Arg Cys Ala Tyr Gly
20 25 30
Arg Asn Lys Thr Phe Leu Cys Tyr Glu Val Lys Arg Glu Arg Asp Asn
35 40 45
Lys Val Leu His Lys Gly Val Val Leu Asn Gln Val Glu Pro Tyr Met
50 55 60
Pro Leu His Ala Glu Leu Arg Phe Leu Ser Trp Phe His Asp Thr Leu
65 70 75 80
Leu Cys Pro Leu Gly Ser Tyr Gln Val Thr Leu Tyr Val Ser Trp Ser
85 90 95
Pro Cys Ser Glu Cys Ala Glu Glu Leu Thr Thr Phe Leu Ala Gly His
100 105 110
Arg Asn Val Thr Met Thr Ile Tyr Val Ala Gln Leu Tyr Tyr Cys Asn
115 120 125
Trp Lys Ser Pro Asn Arg Glu Gly Leu Lys Ile Leu Ile Ala Glu Asp
130 135 140
Ala Arg Leu Arg Val Met Phe Tyr Asp Glu Phe Leu Tyr Cys Trp Arg
145 150 155 160
Asn Phe Val Lys Asn Asp Tyr Asn Asn Phe Asp Pro Trp Ser Leu Leu
165 170 175
Asp Glu Asn Ser Arg Tyr His Asn Arg Ile Leu Gln Asn Ile Leu Lys
180 185 190
Gly Trp Gly Arg Pro His Arg Val Gly Pro Glu Gly Glu Gln Thr Ala
195 200 205
Thr Pro Gly Gly Ser Gly Gly His Cys Ile Ser Val Phe Ser Leu Leu
210 215 220
Arg Arg Arg Glu Met Thr Leu Lys Glu Glu Thr Phe Arg Val Gln Phe
225 230 235 240
Asn Asn Ala Tyr Lys Ala Pro Lys Pro Tyr Arg Arg Arg Val Thr Tyr
245 250 255
Leu Cys Tyr Gln Leu Gln Glu Ala Asn Gly Asp Pro Leu Thr Lys Gly
260 265 270
Cys Leu Arg Thr Lys Lys Gly Tyr His Ala Glu Ser Arg Phe Ile Lys
275 280 285
Arg Ile Cys Ser Met Asp Leu Gly Gln Asp Gln Ser Tyr Gln Val Thr
290 295 300
Cys Phe Leu Thr Trp Ser Pro Cys Pro His Cys Ala Gln Glu Leu Val
305 310 315 320
Ser Phe Lys Arg Ala His Pro His Leu Arg Leu Gln Ile Phe Thr Ala
325 330 335
Arg Leu Phe Phe His Trp Lys Arg Ser Tyr Gln Glu Gly Leu Gln Arg
340 345 350
Leu Cys Arg Ala Gln Val Pro Val Ala Val Met Gly His Pro Glu Phe
355 360 365
Ala Tyr Cys Trp Asp Asn Phe Val Asp His Gln Pro Gly Pro Phe Glu
370 375 380
Pro Pro Trp Ala Lys Leu Glu Tyr Tyr Ser Ser Cys Leu Lys Arg Arg
385 390 395 400
Leu Gln Gln Ile Leu Arg Ser Trp Gly Val Asp Asp Leu Thr Asn Asp
405 410 415
Phe Arg Asn Leu Gln Leu Gly Pro
420
<210> 76
<211> 385
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.6;
tr|A0A2Y9QMV5|A0A2Y9QMV5_TRIMA polypeptide sequence
<400> 76
Met Leu Ser Ser Pro Gln Thr Pro Gly Thr Arg Lys Pro Met Lys Thr
1 5 10 15
Leu Ala Pro Asp Glu Phe Ser Phe Asn Phe Glu Asn Leu Arg Leu Ala
20 25 30
His Gly Arg Asn Thr Thr Phe Leu Cys Phe Gln Val Glu Thr Lys Ala
35 40 45
Pro Pro Ser Leu Asn Ser Pro Asp Ser Gly Ile Phe Gln Asn Gln Asp
50 55 60
His Cys Pro Ser His His His Ala Glu Met Val Phe Leu Thr Trp Phe
65 70 75 80
Gln Lys Arg Leu Ser Pro Ala Gln His Tyr Glu Val Thr Trp Tyr Met
85 90 95
Ser Trp Ser Pro Cys Ser Arg Cys Ala Val Gln Val Ala Lys Phe Leu
100 105 110
Lys Ser Asn Ser Thr Val Asn Leu Ser Ile Phe Val Ala Arg Leu Tyr
115 120 125
Tyr Pro Arg Glu Leu Glu Thr Lys Asp Gly Leu His Ser Leu Trp Gln
130 135 140
Ala Gly Ala Gln Val Gln Ile Met Phe Phe Gln Asp Phe Lys Tyr Cys
145 150 155 160
Trp Glu Asn Phe Val Asn Asn Glu Gly Lys Pro Phe Gln Pro Trp Lys
165 170 175
Asn Leu Asp Glu Asn Ser Lys Asp Trp Asp Thr Glu Leu Lys Asp Ile
180 185 190
His Arg Asn Thr Thr Asp Leu Leu Thr Glu Glu Met Phe Tyr Ser Gln
195 200 205
Phe Tyr Asn Arg Glu Lys Lys Ser Ser Ile Pro Arg Lys Thr Tyr Leu
210 215 220
Cys Tyr Gln Leu Asn Glu Pro Gln Pro Val Lys Arg Cys Leu His Tyr
225 230 235 240
Lys Lys Gly Tyr His Ala Val Thr Arg Phe Ile Asp Gly Ile Val Ser
245 250 255
Met Asn Leu Asp Pro Ala Arg Ser Tyr Asp Ile Thr Cys Tyr Phe Thr
260 265 270
Trp Ser Pro Cys Asn Arg Tyr Ala Arg Lys Leu Val Ser Phe Ile Glu
275 280 285
Asp Tyr Pro Asn Leu Arg Leu Lys Val Tyr Thr Ser Arg Leu Tyr Phe
290 295 300
His Trp Cys Trp Thr Asn Met Gln Gly Leu Gln His Leu Gln Asn Ser
305 310 315 320
Arg Val Thr Val Ala Val Met Thr Phe Arg Asp Phe Glu Tyr Cys Trp
325 330 335
Lys Asn Phe Val Asp Asn Gln Gly Lys Pro Phe Glu Pro Trp Glu Lys
340 345 350
Leu Asp Leu Tyr Ser Gln Ser Thr Glu Arg Arg Leu Arg Arg Ile Leu
355 360 365
Lys Pro Leu Thr Pro Asp Val Leu Asn Glu Asp Phe Gly Asn Leu His
370 375 380
Leu
385
<210> 77
<211> 381
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.7;
tr|H0XHI0|H0XHI0_OTOGA polypeptide sequence
<400> 77
Leu Ser Cys Ala Phe Arg Asp Pro Met Asn Arg Met Tyr Pro Lys Thr
1 5 10 15
Phe Cys Gln Asn Phe Glu Lys Glu Pro Cys Pro Ser Asn Gln Asn Ser
20 25 30
Ser Trp Leu Cys Phe Glu Val Glu Thr Lys Asn Ser Ala Val Phe Phe
35 40 45
His Arg Gly Val Phe Arg Asn Gln Pro Ala Pro Pro Pro Arg Ala Pro
50 55 60
Thr Ser Val Leu Leu Ser Gln Gly Pro Val Lys Thr Pro Cys His Ala
65 70 75 80
Glu Glu Cys Phe Leu Thr Trp Ile Gln Gly Val Leu Pro Pro Asp His
85 90 95
His Tyr His Val Thr Trp Tyr Val Ser Arg Gly Pro Cys Ala Asn Cys
100 105 110
Ala Asn Leu Ile Val His Phe Leu Ala Met His Arg Arg Val Thr Leu
115 120 125
Thr Ile Phe Ala Ala His Leu Asn Phe Phe Trp Glu Ser Asp Phe Gln
130 135 140
Gln Gly Leu Leu Arg Met Asp Gln Glu Gly Val Gln Leu His Ile Met
145 150 155 160
Gly Tyr Glu Glu Phe Glu Tyr Cys Trp Asp Asn Phe Val Tyr Asn Gln
165 170 175
Arg Lys Gln Phe Val Pro Trp Asn Gly Leu Asn Glu Asn Tyr Glu Phe
180 185 190
Met Val Ser Thr Leu Glu Asp Ile Leu Arg Ser Pro Leu Asp Arg Ile
195 200 205
Arg Gln Lys Asp Phe Ser Ile His Phe Arg Asn Ser Leu Trp Leu Asp
210 215 220
Asp Lys Ser Thr Trp Leu Cys Phe Glu Val Lys Arg Thr Lys Ser Pro
225 230 235 240
Val Pro Leu Tyr Arg Gly Val Phe Arg Asn Gln Ser Pro Pro Lys Thr
245 250 255
Pro Cys His Ala Glu Val Arg Phe Phe Thr Trp Leu Gln Asp Leu Pro
260 265 270
Pro Asp Phe Cys Cys Gln Phe Thr Trp Tyr Leu Ser Trp Ser Pro Cys
275 280 285
Ala Asp Cys Ala Asp Leu Val Ala Asn Phe Leu Ala Lys His Arg Asn
290 295 300
Val Ser Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Tyr Arg Asp Pro
305 310 315 320
Glu Met His Arg Gly Leu Arg Arg Met Tyr Gln Glu Gly Ala Asn Val
325 330 335
Asp Ile Met Ser Val Ile Glu Phe Glu Tyr Cys Trp Asp Asn Phe Val
340 345 350
Tyr Asn Gln Gly Lys Gln Phe Val Pro Trp Asn Gly Leu Asn Glu Asn
355 360 365
Tyr Glu Phe Leu Val Pro Arg Leu Gln Glu Ile Leu Glu
370 375 380
<210> 78
<211> 337
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.8;
tr|A0A3M0K4Y7|A0A3M0K4Y7_HIRRU polypeptide sequence
<400> 78
Met Tyr Ile Ser Lys Lys Ala Leu Arg Arg His Phe Asp Pro Arg Val
1 5 10 15
Tyr Pro Arg Glu Thr Tyr Leu Leu Cys Glu Leu Gln Trp Glu Gly Ser
20 25 30
Arg Arg Val Trp Ile His Trp Ile Arg Asn Val Pro Asp His His Ala
35 40 45
Glu Glu Tyr Phe Leu Glu Glu Val Phe Glu Pro Arg Asn Tyr Gly Phe
50 55 60
Cys Asn Ile Thr Leu Tyr Leu Ser Trp Ser Pro Cys Cys Thr Cys Cys
65 70 75 80
Ser Lys Ile Arg Asp Phe Leu Lys Arg Asn Pro Asn Val Lys Ile Asp
85 90 95
Ile Arg Val Ala Arg Leu Ile Tyr Pro Asp Tyr Ala Glu Thr Arg Ser
100 105 110
Ser Leu Arg Glu Leu Asn Gly Leu Gln Arg Val Ser Ile Gln Val Met
115 120 125
Glu Ala Ala Gly Leu Ser Cys Ile Glu Ser Lys Asn His Arg Ile Ser
130 135 140
Gln Val Glu Arg Asp Pro Lys Gly Ser Ser Ser Pro Thr Leu Phe Thr
145 150 155 160
Leu Gln Asp His Leu Lys Leu Ser Asn Met Thr Glu Ser Val Ile Gln
165 170 175
Asp Ser Val Ser Ile Gln Ile Cys Tyr Gln Met Arg Ile Leu Gly Phe
180 185 190
Gln Cys His Ile Arg Trp Lys Leu Gln Pro Glu Asp Phe Gln Arg Asn
195 200 205
Tyr Ser Pro Asn Gln Ile Gly Arg Val Val Tyr Leu Leu Tyr Glu Val
210 215 220
Arg Trp Arg Arg Gly Ser Ile Trp Arg Asn Trp Cys Ser Asn Asn Pro
225 230 235 240
Glu Gln His Ala Glu Val Asn Phe Leu Glu Asn His Phe His His Arg
245 250 255
Pro Gln Thr Pro Cys Ser Ile Thr Trp Phe Leu Ser Thr Ser Pro Cys
260 265 270
Gly Lys Cys Ser Arg Arg Ile Leu Glu Phe Leu Lys Ser Gln Pro Asn
275 280 285
Val Thr Leu Glu Ile Tyr Ala Ala Lys Leu Phe Arg His His Asp Ile
290 295 300
Arg Asn Arg Gln Gly Leu Arg Asn Leu Met Met Asn Gly Val Thr Ile
305 310 315 320
Tyr Ile Met Asn Leu Glu Gly Asn Pro Ala Ser Leu Cys Leu Ser Val
325 330 335
Asp
<210> 79
<211> 237
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.9;
tr|A0A3P4LUZ8|A0A3P4LUZ8_GULGU polypeptide sequence
<400> 79
Met Ser Phe Glu Asp Tyr Glu Tyr Cys Trp Glu Thr Phe Val Asp His
1 5 10 15
Lys Gly Met Tyr Phe Gln Ser Trp Asp Leu Leu Arg Asp Asn Asp Leu
20 25 30
Leu Ala Ala Glu Leu Lys Asn Ile Leu Arg Ser Thr Met Asn Pro Leu
35 40 45
Arg Gln Glu Ile Phe Tyr His Gln Phe Gly Asn Gln Pro Arg Ala Pro
50 55 60
Arg Pro Tyr His Arg Arg Lys Thr Tyr Leu Cys Tyr Gln Leu Gln Pro
65 70 75 80
His Glu Gly Pro Ile Thr Ala Arg Val Cys Leu Gln Asn Lys Lys Lys
85 90 95
Arg His Ala Glu Ile Arg Phe Ile Asp Asn Ile Arg Ala Leu Arg Leu
100 105 110
Asp Arg Ser Gln Thr Phe Glu Ile Thr Cys Tyr Leu Thr Trp Ser Pro
115 120 125
Cys Pro Thr Cys Ala Lys Ala Leu Ala Val Phe Val Gln Asp His Pro
130 135 140
His Ile Ser Leu Arg Leu Phe Ala Ser Arg Leu Phe Ile His Trp Cys
145 150 155 160
Trp Lys Tyr Gln Glu Gly Leu Arg Leu Leu His Arg Ser Arg Ile Pro
165 170 175
Val Ala Val Met Arg Leu Gln Glu Phe Glu Asp Cys Trp Arg Asn Phe
180 185 190
Val Asp Asn Gln Asp Glu Pro Phe Gln Pro Trp Asn Lys Leu Glu Gln
195 200 205
Tyr Ser Glu Ser Ile Thr Arg Arg Leu Arg Arg Ile Leu Gly His Pro
210 215 220
Gln Asn Asn Leu Glu Asn Asp Phe Arg Asn Leu His Ile
225 230 235
<210> 80
<211> 221
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.10;
tr|G5BPM8|G5BPM8_HETGA polypeptide sequence
<400> 80
Arg Arg Arg Ile Glu Pro Trp Gln Phe Glu Ala Ser Phe Asp Pro Arg
1 5 10 15
Gln Leu Arg Arg Glu Thr Cys Leu Leu Ser Glu Val Arg Trp Gly Thr
20 25 30
Ser Pro Arg Ala Trp Arg Gly Cys Ser Leu Asn Thr Ala Arg His Ala
35 40 45
Glu Val Ser Phe Met Asp Arg Leu Thr Ser Glu Gly Arg Leu Arg Gly
50 55 60
Pro Val Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly
65 70 75 80
Ala Cys Ala Gln Ala Ile Gly Glu Phe Leu Arg Gln His Pro Asn Val
85 90 95
Ser Leu Val Ile Tyr Ile Ala Arg Leu Phe Trp His Val Asp Glu Gln
100 105 110
Asn Arg Gln Gly Leu Arg Asp Leu Val Thr Arg Gly Val Arg Met Gln
115 120 125
Val Met Ser Asp Pro Glu Phe Ala His Cys Trp Arg Asn Phe Val Asn
130 135 140
Tyr Ser Pro Gly Gln Glu Ala Arg Trp Pro Gln Val Pro Pro Val Trp
145 150 155 160
Thr Trp Leu Tyr Ser Leu Glu Leu His Cys Ile Leu Leu Asn Leu Pro
165 170 175
Pro Cys Leu Lys Ile Ser Arg Arg His His Asn Gln Leu Thr Phe Phe
180 185 190
Gln Leu Ile Leu Gln Asn Cys His Tyr Gln Ala Ile Pro Ser Pro Val
195 200 205
Leu Leu Ala Ser Gly Leu Ile His Pro Phe Val Thr Trp
210 215 220
<210> 81
<211> 211
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.11;
tr|H2M862|H2M862_ORYLA polypeptide sequence
<400> 81
Met Ile Thr Lys Leu Asp Ser Val Leu Leu Pro Lys Lys Lys Phe Ile
1 5 10 15
Tyr His Tyr Lys Asn Met Arg Trp Ala Arg Gly Arg His Glu Thr Tyr
20 25 30
Leu Cys Phe Val Val Lys Arg Arg Val Gly Pro Glu Ser Leu Ser Phe
35 40 45
Asp Phe Gly His Leu Arg Asn Arg Asn Gly Cys His Val Glu Leu Leu
50 55 60
Phe Leu Arg His Leu Ser Ala Leu Cys Pro Gly Leu Trp Gly Tyr Gly
65 70 75 80
Ala Thr Gly Gln Gly Arg Val Ser Tyr Ser Ile Thr Trp Phe Cys Ser
85 90 95
Trp Ser Pro Cys Ala Asn Cys Ser Phe Arg Leu Ala Gln Phe Leu Ser
100 105 110
Gln Thr Pro Asn Leu Arg Leu Arg Ile Phe Val Ser Arg Leu Tyr Phe
115 120 125
Cys Asp Leu Glu Asp Ser Arg Glu Arg Glu Gly Leu Arg Met Leu Lys
130 135 140
Lys Val Gly Val His Ile Thr Val Met Ser Tyr Lys Asp Tyr Phe Tyr
145 150 155 160
Cys Trp Gln Thr Phe Val Ala Arg Lys Gln Ser Lys Phe Lys Pro Trp
165 170 175
Asp Gly Leu His Gln Asn Ser Val Arg Leu Ser Arg Lys Leu Asn Arg
180 185 190
Ile Leu Gln Pro Cys Glu Thr Glu Asp Phe Arg Asp Ala Phe Lys Leu
195 200 205
Leu Gly Leu
210
<210> 82
<211> 353
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.12;
tr|H0Y0C6|H0Y0C6_OTOGA polypeptide sequence
<400> 82
Met Tyr Leu Lys Thr Phe Tyr Arg His Phe Asn Asn Arg Pro Tyr Leu
1 5 10 15
Ser Arg Arg Asn Asp Thr Trp Leu Cys Phe Glu Val Lys Thr Thr Ser
20 25 30
Ser Asn Ser Pro Gly Ser Phe Tyr Ser Gly Val Phe Arg Asn Gln Gly
35 40 45
Pro Arg Tyr Cys Pro Trp His Thr Glu Leu Cys Phe Leu Thr Trp Val
50 55 60
Arg Pro Ile Val Ser His His His Phe Tyr Gln Ile Thr Trp Tyr Met
65 70 75 80
Ser Trp Ser Pro Cys Ala Asn Cys Ala Trp Gln Val Ala Thr Phe Leu
85 90 95
Ala Thr His Glu Asn Val Ser Leu Thr Asn Tyr Thr Val Arg Ile Tyr
100 105 110
Tyr Phe Trp Arg Gln Asp Tyr Arg Gln Gly Leu Leu Arg Met Ile Glu
115 120 125
Glu Gly Thr Gln Val Tyr Val Met Ser Ser Lys Glu Phe Gln His Cys
130 135 140
Trp Glu Asn Phe Val Asp His Trp Gly Thr Arg Trp Val Thr Cys Trp
145 150 155 160
Asn Arg Leu Lys Lys Asn Tyr Glu Phe Leu Val Thr Arg Leu Ser Glu
165 170 175
Ile Leu Ser Asp Pro Lys Glu Arg Ile Ser Pro Asn Thr Phe Tyr Asn
180 185 190
Gln Phe Asn Asn Thr Pro Val Pro Arg Gly Arg Lys Asp Thr Trp Leu
195 200 205
Cys Phe Glu Val Lys Glu Lys Asn Ser Asn Ser Pro Gly Ser Phe His
210 215 220
Arg Gly Val Phe Gln Asn Gln Val Phe Ser Gly Thr Ser Ser His Ala
225 230 235 240
Arg Arg Cys Pro Pro Asp His His Tyr Glu Val Thr Trp Tyr Thr Ser
245 250 255
Trp Ser Pro Cys Ala His Cys Ala Trp His Val Val Asn Phe Leu Thr
260 265 270
Ser Asn Pro Asn Val Ser Leu Thr Ile Phe Ala Ala Arg Leu Tyr Tyr
275 280 285
Ile Tyr Arg Pro Glu Ile Gln Gln Gly Leu Arg Arg Val Phe Gln Glu
290 295 300
Gly Ala Lys Val His Ile Met Ser Leu Lys Glu Phe Lys Tyr Cys Trp
305 310 315 320
Ala Lys Leu Val Tyr Asn Ser Gly Met Arg Phe Met Pro Trp Tyr Gln
325 330 335
Phe Asn Phe Asn Phe Leu Phe Pro Asn Thr Thr Leu Lys Gly Asp Leu
340 345 350
His
<210> 83
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.13;
tr|A0A3Q2Z5X6|A0A3Q2Z5X6_HIPCM polypeptide sequence
<400> 83
Met Asp Val His Phe Met Asn Phe Ile Tyr His Tyr Lys Asn Met Arg
1 5 10 15
Trp Ala Lys Gly Arg Asn Glu Thr Tyr Leu Cys Phe Val Val Lys Arg
20 25 30
Arg Val Gly Pro Asn Ser Leu Thr Phe Asp Phe Gly His Leu Arg Asn
35 40 45
Arg Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr Leu Gly Arg
50 55 60
Arg Leu Ser Tyr Ser Ile Thr Trp Phe Cys Ser Trp Ser Pro Cys Ala
65 70 75 80
Asn Cys Ser Ala Ala Leu Ser Gln Phe Leu Ser Arg Met Pro Asn Leu
85 90 95
Arg Leu Arg Ile Phe Val Ala Arg Leu Tyr Phe Cys Asp Met Glu Asp
100 105 110
Ser His Glu Arg Glu Gly Leu Arg Leu Leu Gln Lys Ala Gly Val Gln
115 120 125
Val Thr Val Met Ser Tyr Lys Asp Tyr Tyr Tyr Cys Trp Gln Thr Phe
130 135 140
Val Asp Arg Lys Lys Ser His Phe Lys Ala Trp Glu Asp Leu His Gln
145 150 155 160
Asn Ser Val Arg Leu Ser Arg Lys Leu Asn Arg Ile Leu Gln Pro Cys
165 170 175
Glu Met Asp Leu Arg Asp Ala Phe Lys Leu Leu Gly Leu
180 185
<210> 84
<211> 190
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.15;
tr|A0A2K6NY90|A0A2K6NY90_RHIRO polypeptide sequence
<400> 84
Met Asn Pro His Ile Arg Asn Pro Met Glu Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe His Phe Lys Asn Leu Trp Glu Ala Asp Asn Arg Asn Glu
20 25 30
Ser Trp Leu Cys Phe Ala Val Glu Val Ile Lys His His Ser Thr Val
35 40 45
Ser Trp Lys Arg Gly Val Phe Arg Asn Gln Val Asp Pro Glu Thr His
50 55 60
Cys His Ala Glu Lys Cys Phe Leu Ser Trp Phe Cys Asp Asn Thr Leu
65 70 75 80
Ser Pro Lys Lys Asn Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Glu Cys Ala Arg Glu Val Ala Lys Phe Leu Ala Arg His Ser
100 105 110
Asn Val Met Leu Thr Ile Tyr Thr Ala Arg Leu Tyr Tyr Ser Gln Tyr
115 120 125
Pro Asn Tyr Gln Glu Gly Leu Arg Arg Leu Asn Glu Glu Gly Val Pro
130 135 140
Val Glu Ile Met Asp Tyr Glu Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Gly Asp Glu Leu Phe Lys Pro Trp Lys Gly Leu Lys Tyr
165 170 175
Asn Phe Leu Phe Leu Asp Ser Lys Leu Gln Glu Ile Leu Glu
180 185 190
<210> 85
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.16;
tr|Q6ICH2|Q6ICH2_HUMAN polypeptide sequence
<400> 85
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu Pro Lys Arg Gln
50 55 60
Ser Asn His Arg Gln Glu Val Asp Pro Glu Thr His Cys His Ala Glu
65 70 75 80
Arg Cys Phe Leu Ser Trp Phe Cys Asp Asp Ile Leu Ser Pro Asn Thr
85 90 95
Asn Tyr Glu Val Thr Trp Tyr Thr Ser Trp Ser Pro Cys Pro Glu Cys
100 105 110
Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser Asn Val Asn Leu
115 120 125
Thr Ile Phe Thr Ala Arg Leu Cys Tyr Phe Trp Asp Thr Asp Tyr Gln
130 135 140
Glu Gly Leu Cys Ser Leu Ser Gln Glu Gly Ala Ser Val Lys Ile Met
145 150 155 160
Gly Tyr Lys Asp Phe Val Ser Cys Trp Lys Asn Phe Val Tyr Ser Asp
165 170 175
Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Gln Thr Asn Phe Arg Leu
180 185 190
Leu Lys Arg Arg Leu Arg Glu Ile Leu Gln
195 200
<210> 86
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.17;
tr|G8GPV1|G8GPV1_CERNE polypeptide sequence
<400> 86
Met Asp Gly Ser Pro Ala Ser Arg Pro Gly His Val Met Asp Pro Gly
1 5 10 15
Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro Trp Val Ser Gly Gln Arg
20 25 30
Glu Thr Tyr Leu Cys Tyr Lys Val Glu Arg Ser His Asn Asp Thr Trp
35 40 45
Val Leu Leu Asn Gln His Arg Gly Phe Leu Arg Asn Gln Ala Lys Asn
50 55 60
Arg Leu His Gly Asp Tyr Gly Cys His Ala Glu Leu Cys Phe Leu Gly
65 70 75 80
Glu Val Pro Ser Trp Arg Leu Asp Pro Thr Gln Thr Tyr Arg Val Thr
85 90 95
Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Gly Gly Cys Ala Glu Gln
100 105 110
Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe
115 120 125
Ala Ala Arg Ile Tyr Asp Tyr Asp Phe Leu Tyr Gln Glu Ala Leu Arg
130 135 140
Thr Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Glu Glu
145 150 155 160
Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Arg Pro Phe
165 170 175
Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg
180 185 190
Leu Gln Ala Ile Leu Gln Asn Gln Gly Asn
195 200
<210> 87
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.18;
tr|Q1WBT6|Q1WBT6_SYMSY polypeptide sequence
<400> 87
Met Ala Leu Leu Thr Ala Lys Thr Phe Arg Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Val Thr Lys Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly Tyr Phe Lys
35 40 45
Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Pro Ser Cys Ala Trp Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Cys Arg His Gln Gln Glu Gly Leu Arg Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Phe Pro Glu Phe Ala Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Glu Glu Pro Leu Ser Phe Asn Pro Ser
145 150 155 160
Glu Met Leu Glu Glu Leu Asp Lys Asn Ser Arg Ala Ile Lys Arg Arg
165 170 175
Leu Glu Lys Ile Lys
180
<210> 88
<211> 211
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.19;
tr|A0A3B4CS14|A0A3B4CS14_PYGNA polypeptide sequence
<400> 88
Met Asp Asn Thr Asn Arg Arg Lys Phe Ile Tyr His Tyr Lys Asn Val
1 5 10 15
Arg Trp Ala Arg Gly Arg His Glu Thr Tyr Leu Cys Phe Val Val Lys
20 25 30
Lys Arg Asn Ser Pro Asp Ser Leu Ser Phe Asp Phe Gly His Leu Arg
35 40 45
Asn Arg Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr Ile Glu
50 55 60
Val Leu Cys Pro Gly Leu Trp Gly Ser Gly Val Asp Gly Val Arg Val
65 70 75 80
Ser Tyr Ala Val Thr Trp Phe Cys Ser Trp Ser Pro Cys Ser Asn Cys
85 90 95
Ala Gln Arg Leu Thr Asn Phe Leu Ser Gln Thr Pro Asn Leu Arg Leu
100 105 110
Arg Ile Phe Val Ala Arg Leu Tyr Phe Cys Asp Glu Glu Asp Ser Leu
115 120 125
Glu Arg Glu Gly Leu Arg His Leu Gln Arg Ala Gly Val Gln Ile Thr
130 135 140
Val Met Thr Tyr Lys Asp Phe Phe Tyr Cys Trp Gln Thr Phe Val Ala
145 150 155 160
Ser Arg Glu Arg Cys Phe Lys Ala Trp Glu Gly Leu Arg Gln Asn Ser
165 170 175
Val Arg Leu Ser Arg Lys Leu Asn Arg Ile Leu Gln Val Phe Ile Ser
180 185 190
Thr Pro Val Ile Ser Pro Leu Ile Thr Thr His Leu Gly Gln Ser Trp
195 200 205
Ala Gly Gly
210
<210> 89
<211> 315
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.20;
tr|A0A087XZI4|A0A087XZI4_POEFO polypeptide sequence
<400> 89
Arg Lys Val Ser Tyr Ser Val Thr Trp Phe Cys Ser Trp Ser Pro Cys
1 5 10 15
Ala Asn Cys Ser Ile Arg Leu Ala Gln Phe Leu His Gln Thr Pro Asn
20 25 30
Leu Arg Leu Arg Ile Phe Val Ser Arg Leu Tyr Phe Cys Asp Leu Glu
35 40 45
Asp Ser Arg Glu Arg Glu Gly Leu Arg Ile Leu Lys Lys Ala Gly Val
50 55 60
His Ile Thr Val Met Ser Tyr Lys Asp Tyr Phe Tyr Cys Trp Gln Thr
65 70 75 80
Phe Val Ala Lys Ser Gln Ser Lys Phe Lys Pro Trp Asp Gly Leu His
85 90 95
Gln Asn Tyr Ile Arg Leu Ser Arg Lys Leu Asn Arg Ile Leu Gln Pro
100 105 110
Ala Leu Asp Ile Lys Lys Phe Ile Tyr His Tyr Lys Asn Leu Arg Trp
115 120 125
Ala Arg Gly Arg Cys Glu Thr Tyr Leu Cys Phe Val Val Lys Lys Lys
130 135 140
Leu His Leu Phe Met Phe Val Ile Val Gly Arg Asn Arg Leu Phe Asp
145 150 155 160
Leu Asn Val Thr Met Asn Asn Lys Ser Leu Tyr Leu Ile Pro Leu His
165 170 175
Leu Gln Leu Leu Phe Leu Arg His Leu Gly Ala Leu Cys Pro Gly Leu
180 185 190
Trp Gly Tyr Gly Val Thr Gly Glu Arg Lys Val Ser Tyr Ser Val Thr
195 200 205
Trp Phe Cys Ser Trp Ser Pro Cys Ala Asn Cys Ser Ile Arg Leu Ala
210 215 220
Gln Phe Leu His Gln Thr Pro Asn Leu Arg Leu Arg Ile Phe Val Ser
225 230 235 240
Arg Leu Tyr Phe Cys Asp Leu Glu Asp Ser Arg Glu Arg Glu Gly Leu
245 250 255
Arg Ile Leu Lys Lys Ala Gly Val His Ile Thr Val Met Ser Tyr Lys
260 265 270
Asp Tyr Phe Tyr Cys Trp Gln Thr Phe Val Ala Lys Ser Gln Ser Lys
275 280 285
Phe Lys Pro Trp Asp Gly Leu His Gln Asn Tyr Ile Arg Leu Ser Arg
290 295 300
Lys Leu Asn Arg Ile Leu Gln Val Gln Phe Phe
305 310 315
<210> 90
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.21;
tr|A0A341AEK4|A0A341AEK4_9CETA polypeptide sequence
<400> 90
Met Ala Ser Asp Arg Gly Pro Ser Ala Gly Asp Ala Thr Ser Arg Arg
1 5 10 15
Arg Ile Glu Pro Trp Glu Phe Glu Val Ser Phe Asp Pro Arg Glu Leu
20 25 30
Cys Lys Glu Thr Arg Leu Leu Tyr Glu Ile Lys Trp Gly Arg Ser Gln
35 40 45
His Val Trp Arg His Ser Gly Lys Asn Thr Thr Asn His Val Glu Cys
50 55 60
Asn Phe Ile Glu Lys Phe Thr Ser Glu Arg Pro Phe His Arg Ser Val
65 70 75 80
Ser Cys Cys Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Lys Ala Ile Arg Glu Phe Leu Asn Gln His Pro Arg Val Thr Leu
100 105 110
Phe Ile Tyr Val Ala Arg Leu Phe Gln His Met Asp Pro Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile His Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Gly Pro Thr Glu Tyr Asp Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Lys Glu Ala His Trp Pro Arg Tyr Pro Pro Pro Leu Met Lys
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Val Pro
180 185
<210> 91
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.22;
tr|E2D879|E2D879_MUSMI polypeptide sequence
<400> 91
Arg Asn Leu Ile Ser Arg Glu Thr Phe Asn Phe Asn Phe Glu Asn Leu
1 5 10 15
Cys Tyr Ala Lys Gly Arg Lys Asn Thr Phe Leu Cys Tyr Glu Val Thr
20 25 30
Arg Lys Asp Cys Asp Ser Pro Val Ser Leu Cys His Gly Val Phe Lys
35 40 45
Asn Lys Gly Ser Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe His
50 55 60
Asp Lys Val Leu Lys Val Leu Thr Pro Arg Glu Glu Phe Lys Val Thr
65 70 75 80
Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Val Val
85 90 95
Arg Phe Leu Ala Thr His His Asn Leu Asn Leu Thr Ile Phe Ser Ser
100 105 110
Arg Leu Tyr Asn Val Ser Asp Pro Asp Thr Gln Gln Lys Leu Cys Arg
115 120 125
Leu Val Gln Glu Gly Ala Gln Val Ala Val Met Asp Leu Ser Glu Phe
130 135 140
Lys Lys Cys Trp Glu Lys Phe Val Asp Asn Asp Gly Gln Gln Phe Arg
145 150 155 160
Pro Trp Lys Arg Leu Arg Thr Asn Phe Arg Tyr Gln Asn Ser Lys Leu
165 170 175
Gln Glu Ile Leu
180
<210> 92
<211> 221
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.23;
tr|A0A2K5RDN6|A0A2K5RDN6_CEBCA polypeptide sequence
<400> 92
Met Trp Glu Ala Gln Ser Pro Gly Leu Ser Arg Glu Trp Gly Ser Val
1 5 10 15
Ala Ile Ser Pro Glu Asp Pro Gly Pro Leu His Ile Gly Arg Phe Leu
20 25 30
Ser Cys Ala Phe Arg His Pro Met Asn Ala Met Tyr Pro Gly Ile Phe
35 40 45
Asn Phe His Phe Arg Asn Leu Arg Lys Ala Tyr Gly Arg Asn Glu Thr
50 55 60
Trp Leu Cys Phe Thr Val Glu Gly Ile Met Asn Arg Ser Thr Val Ser
65 70 75 80
Trp Lys Ser Gly Val Phe Arg Asn Gln Val Gly Ser Asp Pro Phe Cys
85 90 95
His Ala Glu Met Cys Phe Leu Ser Trp Phe Arg His Asn Met Leu Ser
100 105 110
Pro Lys Lys Asp Tyr Glu Val Thr Trp Tyr Ala Ser Trp Ser Pro Cys
115 120 125
Pro Glu Cys Ala Gly Gln Val Ala Glu Phe Leu Ala Arg His Gly Asn
130 135 140
Val Arg Leu Thr Ile Phe Thr Ala His Leu Tyr Tyr Phe Trp Asn Pro
145 150 155 160
Ser Phe Arg Gln Gly Leu Arg Arg Leu Ser Gln Glu Gly Ala Ser Val
165 170 175
Leu Ile Met Gly Tyr Glu Asp Phe Glu Tyr Cys Trp Asp Asn Phe Val
180 185 190
Tyr Asn Asp Gly Gln Pro Phe Lys Pro Trp Lys Arg Leu Gln Asp Asn
195 200 205
Ser Leu Ser Leu Tyr Ile Thr Leu Gln Glu Ile Leu Gln
210 215 220
<210> 93
<211> 206
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.24;
tr|A0A2K5RDN7|A0A2K5RDN7_CEBCA polypeptide sequence
<400> 93
Met Glu Ala Ser Pro Ala Ser Arg Pro Arg Pro Leu Met Gly Pro Arg
1 5 10 15
Thr Phe Thr Glu Asn Phe Thr Asn Asn Pro Glu Val Phe Gly Arg His
20 25 30
Gln Thr Tyr Leu Cys Tyr Glu Val Lys Cys Gln Gly Pro Asp Gly Thr
35 40 45
Arg Asp Leu Met Thr Glu Gln Arg Asp Phe Leu Cys Asn Gln Ala Arg
50 55 60
Asn Leu Leu Ser Gly Phe Asp Gly Arg His Ala Glu Arg Cys Phe Leu
65 70 75 80
Asp Arg Val Pro Ser Trp Arg Leu Asp Pro Ala Gln Thr Tyr Arg Val
85 90 95
Thr Cys Phe Ile Ser Trp Ser Pro Cys Phe Ser Cys Ala Arg Glu Val
100 105 110
Ala Glu Phe Leu Gln Glu Asn Pro His Val Asn Leu Arg Ile Phe Ala
115 120 125
Ala Arg Ile Tyr Asp Cys Arg Pro Arg Tyr Glu Glu Gly Leu Gln Met
130 135 140
Leu Gln Asn Ala Gly Ala Gln Val Ser Ile Met Thr Ser Glu Glu Phe
145 150 155 160
Arg His Cys Trp Asp Thr Phe Val Asp His Gln Gly His Pro Phe Gln
165 170 175
Pro Trp Glu Gly Leu Asp Glu His Ser Gln Ala Leu Ser Arg Arg Leu
180 185 190
Gln Ala Ile Leu Gln Gly Asn Arg Trp Met Ile Leu Ser Leu
195 200 205
<210> 94
<211> 184
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.25;
tr|A0A1C9CJ69|A0A1C9CJ69_CERAL polypeptide sequence
<400> 94
Asn Pro Met Lys Ala Met Asp Pro His Ile Phe Tyr Phe His Phe Lys
1 5 10 15
Asn Leu Arg Lys Ala Tyr Gly Arg Asn Glu Thr Trp Leu Cys Phe Ala
20 25 30
Val Glu Ile Ile Lys Gln Arg Ser Thr Val Pro Trp Arg Thr Gly Val
35 40 45
Phe Arg Asn Gln Val Asp Pro Glu Ser His Cys His Ala Glu Arg Cys
50 55 60
Phe Leu Ser Trp Phe Cys Glu Asp Ile Leu Ser Pro Asn Thr Asp Tyr
65 70 75 80
Arg Val Thr Trp Tyr Thr Ser Trp Ser Pro Cys Leu Asp Cys Ala Gly
85 90 95
Glu Val Ala Glu Phe Leu Ala Arg His Ser Asn Val Glu Leu Ala Ile
100 105 110
Phe Ala Ala Arg Leu Tyr Tyr Phe Trp Asp Thr His Tyr Gln Gln Gly
115 120 125
Leu Arg Ser Leu Ser Glu Lys Gly Ala Ser Val Glu Ile Met Gly Tyr
130 135 140
Glu Asp Phe Lys Tyr Cys Arg Glu Asn Phe Val Cys Asp Asp Gly Lys
145 150 155 160
Pro Phe Lys Pro Trp Lys Gly Leu Lys Thr Asn Phe Arg Phe Leu Lys
165 170 175
Arg Arg Leu Gln Glu Ile Leu Glu
180
<210> 95
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.26;
tr|A0A2R2Z4D2|A0A2R2Z4D2_PTEAL polypeptide sequence
<400> 95
Met His Leu Gln Val Trp Arg Lys Val Thr Glu Ala Trp Arg Glu Gly
1 5 10 15
Tyr Thr Leu Lys Pro Trp Ser Arg Asn Pro Met Glu Arg Leu Tyr His
20 25 30
Asp Tyr Phe Tyr Phe His Phe Tyr Asn Leu Pro Thr Pro Lys His Arg
35 40 45
Asn Gly Cys Tyr Ile Cys Tyr Gln Val Glu Gly Thr Lys Lys His Ser
50 55 60
Arg Met Pro Leu Leu Arg Gly Val Phe Glu Asn Gln Glu Ser Leu Asp
65 70 75 80
Met Met Leu Ser Pro Gly Glu Lys Tyr Arg Val Thr Trp Tyr Ile Ser
85 90 95
Trp Ser Pro Cys Phe Ala Cys Val Asp Glu Val Ile Lys Phe Leu Arg
100 105 110
Glu His Thr Asn Val Glu Leu Ile Ile Phe Ala Ala Arg Leu Tyr His
115 120 125
Ser Asp Ile Leu Gln Tyr Arg Gln Gly Leu Arg Lys Leu His Asp Ala
130 135 140
Gly Val His Val Ala Ile Met Ser Tyr Tyr Glu Phe Lys His Cys Leu
145 150 155 160
Asn Asp Phe Val Phe His Gln Gly Arg Ser Phe Cys Pro Trp Asn Asp
165 170 175
Leu Asn Lys Asn Ser Lys Asn Leu Ser Asn Thr Leu Glu Asp Ile Leu
180 185 190
Arg Asn Gln Glu Asp
195
<210> 96
<211> 206
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.27;
tr|B7T161|B7T161_SHEEP polypeptide sequence
<400> 96
Met Thr Glu Gly Trp Ala Gly Ser Gly Leu Pro Gly Arg Gly Asp Cys
1 5 10 15
Val Trp Thr Pro Gln Thr Arg Asn Thr Met Asn Leu Leu Arg Glu Thr
20 25 30
Leu Phe Lys Gln Gln Phe Gly Asn Gln Pro Arg Val Pro Pro Pro Tyr
35 40 45
Tyr Arg Arg Lys Thr Tyr Leu Cys Tyr Gln Leu Lys Glu Leu Asp Asp
50 55 60
Leu Met Leu Asp Lys Gly Cys Phe Arg Asn Lys Lys Gln Arg His Ala
65 70 75 80
Glu Ile Arg Phe Ile Asp Lys Ile Asn Ser Leu Asn Leu Asn Pro Ser
85 90 95
Gln Ser Tyr Lys Ile Ile Cys Tyr Ile Thr Trp Ser Pro Cys Pro Asn
100 105 110
Cys Ala Ser Glu Leu Val Asp Phe Ile Thr Arg Asn Asp His Leu Asn
115 120 125
Leu Gln Ile Phe Ala Ser Arg Leu Tyr Phe His Trp Ile Lys Pro Phe
130 135 140
Cys Arg Gly Leu His Gln Leu Gln Lys Ala Gly Ile Ser Val Ala Val
145 150 155 160
Met Thr His Thr Glu Phe Glu Asp Cys Trp Glu Gln Phe Val Asp Asn
165 170 175
Gln Leu Arg Pro Phe Gln Pro Trp Asp Lys Leu Glu Gln Tyr Ser Ala
180 185 190
Ser Ile Arg Arg Arg Leu Gln Arg Ile Leu Thr Ala Pro Thr
195 200 205
<210> 97
<211> 205
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.28;
tr|A0A2R2X2G4|A0A2R2X2G4_PTEAL polypeptide sequence
<400> 97
Met Ala Gly Leu Gly Gln Ala Cys Glu Gly Cys Cys Gly Gln Met Pro
1 5 10 15
Glu Ile Ser Tyr Pro Met Gly Arg Leu Asp Pro Lys Thr Phe Ser Phe
20 25 30
Glu Phe Lys Asn Leu Pro Tyr Ala Tyr Gly Arg Lys Ser Ser Tyr Leu
35 40 45
Cys Phe Gln Val Glu Arg Glu Gln His Ser Ser Pro Val Pro Ser Asp
50 55 60
Trp Gly Val Phe Lys Asn Gln Phe Cys Gly Thr Glu Pro Tyr His Ala
65 70 75 80
Glu Leu Cys Phe Leu Asn Trp Phe Arg Ala Glu Lys Leu Ser Pro Tyr
85 90 95
Glu His Tyr Asp Val Thr Trp Phe Leu Ser Trp Ser Pro Cys Ser Thr
100 105 110
Cys Ala Glu Glu Ile Ala Ile Phe Leu Ser Asn His Lys Asn Val Arg
115 120 125
Leu Asn Ile Phe Val Ser Arg Ile Tyr Tyr Phe Trp Lys Pro Ala Phe
130 135 140
Arg Gln Gly Leu Gln Glu Leu Asp His Leu Gly Val Gln Leu Asp Ala
145 150 155 160
Met Ser Phe Asp Glu Phe Lys Tyr Cys Trp Glu Asn Phe Val Asp Asn
165 170 175
Gln Gly Met Pro Phe Arg Cys Trp Lys Lys Val His Gln Asn Tyr Lys
180 185 190
Ser Val Leu Arg Lys Leu Asn Glu Ile Leu Arg Arg Arg
195 200 205
<210> 98
<211> 309
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.29;
tr|G1Q1M4|G1Q1M4_MYOLU polypeptide sequence
<400> 98
Tyr Ala Glu Leu Ser Phe Leu Asp Leu Phe Gln Ser Trp Asn Leu Asp
1 5 10 15
Arg Gly Arg Gln Tyr Arg Leu Thr Trp Tyr Met Ser Trp Ser Pro Tyr
20 25 30
Pro Asp Cys Ala Gln Lys Leu Val Glu Phe Leu Gly Glu Asn Ser His
35 40 45
Val Thr Leu Arg Ile Phe Ala Ala Asp Ile His Ser Leu Cys Ser Gly
50 55 60
Tyr Glu Asp Gly Leu Arg Lys Leu Arg Asp Ala Arg Ala Gln Leu Ala
65 70 75 80
Ile Met Thr Arg Asp Glu Leu Gln Tyr Cys Trp Val Thr Phe Val Asp
85 90 95
Asn Gln Gly Gln Pro Phe Arg Pro Trp Pro Asn Leu Val Glu His Ile
100 105 110
Lys Thr Lys Lys Gln Glu Leu Lys Asp Ile Leu Gly Asn Pro Met Arg
115 120 125
Arg Met Tyr Pro Lys Thr Phe Asn Phe Asn Phe Gln Asn Leu Asn Ser
130 135 140
Tyr Gly Arg Lys Ser Thr Phe Leu Cys Phe Glu Val Glu Thr Trp Glu
145 150 155 160
Asp Gly Ser Val Leu Asp Tyr Gln Asn Gly Val Phe Gln Asn Gln Leu
165 170 175
Asp Pro Gly His Ala Glu Leu Cys Phe Ile Glu Trp Phe His Glu Lys
180 185 190
Val Leu Phe Pro Asp Glu Val Arg Cys Pro Asp Ala Gln Tyr His Val
195 200 205
Thr Trp Tyr Ile Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Val
210 215 220
Ala Gly Phe Leu Asn Glu His Glu Asn Val Asp Leu Ser Ile Ser Ala
225 230 235 240
Ala Arg Leu Tyr Leu Cys Glu Asp Glu Asp Glu Gln Gly Leu Gln Asp
245 250 255
Leu Val Ala Ala Gly Ala Lys Val Ala Met Met Ala Pro Glu Asp Phe
260 265 270
Glu Tyr Cys Trp Asp Asn Phe Val Tyr Asn Arg Gly Trp Pro Phe Thr
275 280 285
Tyr Trp Lys His Val Arg Arg Asn Tyr Gly Arg Leu Gln Glu Lys Leu
290 295 300
Asp Glu Ile Leu Trp
305
<210> 99
<211> 216
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.30;
tr|A0A1S3AN78|A0A1S3AN78_ERIEU polypeptide sequence
<400> 99
Arg Arg Ile Glu Pro Trp Glu Phe Glu Asp Phe Phe Asp Pro Arg Gln
1 5 10 15
Phe Arg Pro Glu Thr Cys Leu Leu Tyr Glu Val Arg Trp Gly Ser Ser
20 25 30
Arg Asn Ala Trp Arg Ser Thr Ala Arg Asn Thr Thr Arg His Ala Glu
35 40 45
Val Asn Phe Leu Glu Arg Phe Ala Ala Glu Arg His Phe Asp Lys Pro
50 55 60
Val Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu
65 70 75 80
Cys Ser Gln Ala Ile Gly Ala Phe Leu Ser Gln His Pro Gln Val Thr
85 90 95
Leu Ala Ile His Val Thr Arg Leu Phe His His Glu Asp Glu Gln Asn
100 105 110
Arg Gln Gly Leu Arg Asp Leu Leu Ala Arg Gly Val Thr Leu Gln Val
115 120 125
Met Gly Asp Ser Glu Tyr Ala His Cys Trp Arg Thr Phe Val Asn Ser
130 135 140
Pro Pro Gly Ala Glu Gly His Tyr Pro Arg Tyr Pro Ser Asp Phe Thr
145 150 155 160
Arg Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Gly Leu Pro Pro
165 170 175
Cys Leu Glu Ile Leu Arg Arg Tyr Gln Asn Gln Phe Thr Leu Phe Arg
180 185 190
Leu Val Pro Gln Asn Cys His Tyr Gln Met Ile Pro His Leu Asn Phe
195 200 205
Phe Val Val Arg His Tyr Phe Phe
210 215
<210> 100
<211> 201
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.32;
tr|Q4VUI3|Q4VUI3_XENLA polypeptide sequence
<400> 100
Met Thr Met Asp Ser Met Leu Leu Lys Arg Asn Lys Phe Ile Tyr His
1 5 10 15
Tyr Lys Asn Leu Arg Trp Ala Arg Gly Arg His Glu Thr Tyr Leu Cys
20 25 30
Tyr Ile Val Lys Arg Arg Tyr Ser Ser Val Ser Cys Ala Leu Asp Phe
35 40 45
Gly Tyr Leu Arg Asn Arg Asn Gly Cys His Ala Glu Met Leu Phe Leu
50 55 60
Arg Tyr Leu Ser Ile Trp Val Gly His Asp Pro His Arg Asn Tyr Arg
65 70 75 80
Val Thr Trp Phe Ser Ser Trp Ser Pro Cys Tyr Asp Cys Ala Lys Arg
85 90 95
Thr Leu Glu Phe Leu Lys Gly His Pro Asn Phe Ser Leu Arg Ile Phe
100 105 110
Ser Ala Arg Leu Tyr Phe Cys Glu Glu Arg Asn Ala Glu Pro Glu Gly
115 120 125
Leu Arg Lys Leu Gln Lys Ala Gly Val Arg Leu Ser Val Met Ser Tyr
130 135 140
Lys Asp Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Thr Arg Glu Ser
145 150 155 160
Gly Phe Glu Ala Trp Asp Gly Leu His Glu Asn Ser Val Arg Leu Ala
165 170 175
Arg Lys Leu Arg Arg Ile Leu Gln Pro Pro Tyr Asp Met Glu Asp Leu
180 185 190
Arg Glu Val Phe Val Leu Leu Gly Leu
195 200
<210> 101
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.33;
tr|E2RL86|E2RL86_CANLF polypeptide sequence
<400> 101
Met Asn Pro Leu Gln Glu Glu Thr Phe Tyr Gln Gln Phe Ser Asn Gln
1 5 10 15
Arg Val Pro Lys Pro Thr Tyr Gln Arg Arg Thr Tyr Leu Cys Tyr Gln
20 25 30
Leu Lys Pro His Glu Gly Ser Val Ile Ala Lys Val Cys Leu Gln Asn
35 40 45
Gln Glu Lys Arg His Ala Glu Ile Cys Phe Ile Asp Asp Ile Lys Ser
50 55 60
Arg Gln Leu Asp Pro Ser Gln Lys Phe Glu Ile Thr Cys Tyr Val Thr
65 70 75 80
Trp Ser Pro Cys Pro Thr Cys Ala Lys Lys Leu Ile Ala Phe Val Asn
85 90 95
Asp His Pro His Ile Ser Leu Arg Leu Phe Ala Ser Arg Leu Tyr Phe
100 105 110
His Trp Arg Gln Lys Tyr Lys Arg Glu Leu Arg His Leu Gln Lys Ser
115 120 125
Gly Ile Pro Leu Ala Val Met Ser Tyr Leu Glu Phe Lys Asp Cys Trp
130 135 140
Glu Lys Phe Val Asp His Lys Gly Arg Pro Phe Gln Pro Trp Asn Lys
145 150 155 160
Leu Lys Gln Tyr Ser Glu Ser Ile Gly Arg Arg Leu Gln Arg Ile Leu
165 170 175
Gln Pro Leu Asn Asn Leu Glu Asn Asp Phe Arg Asn Leu Arg Leu
180 185 190
<210> 102
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.34;
tr|G1LWB0|G1LWB0_AILME polypeptide sequence
<400> 102
Ser Ser Ala Ala Pro Ala Ser Ile His Leu Leu Asp Glu Asp Thr Phe
1 5 10 15
Thr Glu Asn Phe Arg Asn Asp Asp Trp Pro Ser Arg Thr Tyr Leu Cys
20 25 30
Tyr Lys Val Glu Gly Pro Asp Gln Gly Ser Gly Val Pro Leu Gly Gln
35 40 45
Asp Lys Gly Ile Leu His Asn Lys Pro Ala Gln Gly Pro Glu Pro Ser
50 55 60
Arg His Ala Glu Cys Tyr Leu Leu Glu Gln Ile Gln Ser Trp Asn Leu
65 70 75 80
Asp Pro Lys Leu His Tyr Gly Val Thr Cys Phe Leu Ser Trp Ser Pro
85 90 95
Cys Ala Lys Cys Ala Gln Lys Met Ala Arg Phe Leu Gln Glu Asn Ser
100 105 110
His Val Ser Leu Lys Leu Phe Ala Ser Arg Leu Tyr Thr Arg Glu Arg
115 120 125
Trp Asp Glu Asp Tyr Lys Glu Gly Leu Arg Thr Leu Lys Arg Ala Gly
130 135 140
Ala Ser Ile Ala Ile Met Thr Tyr Arg Glu Phe Glu His Cys Trp Lys
145 150 155 160
Thr Phe Val Leu His Asp Gln Glu Gly Ser Cys Phe Gln Pro Trp Pro
165 170 175
Phe Leu His Lys Glu Ser Gln Lys Phe Ser Glu Lys Leu Gln Ala Ile
180 185 190
Leu Gln Val Gly Val Leu Leu Leu Ser Leu Pro Pro Pro Leu Pro Ser
195 200 205
Ser Pro Leu Ser Ser Pro Trp Pro Phe Pro Ala Pro Leu Arg Ala Ser
210 215 220
Thr Gly
225
<210> 103
<211> 238
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.35;
tr|A0A1U7S7K7|A0A1U7S7K7_ALLSI polypeptide sequence
<400> 103
Met Gly Glu His Trp Gln Tyr Ala Gly Ser Gly Glu Tyr Ile Pro Gln
1 5 10 15
Asp Gln Phe Glu Glu Asn Phe Asp Pro Ser Val Leu Leu Ala Glu Thr
20 25 30
His Leu Leu Ser Glu Leu Thr Trp Gly Gly Arg Pro Tyr Lys His Trp
35 40 45
Tyr Glu Asn Thr Glu His Cys His Ala Glu Ile His Phe Leu Glu Asn
50 55 60
Phe Ser Ser Lys Asn Arg Ser Cys Thr Ile Thr Trp Tyr Leu Ser Trp
65 70 75 80
Ser Pro Cys Ala Glu Cys Ser Ala Arg Ile Ala Asp Phe Met Gln Glu
85 90 95
Asn Thr Asn Val Lys Leu Asn Ile His Val Ala Arg Leu Tyr Leu His
100 105 110
Asp Asp Glu His Thr Arg Gln Gly Leu Arg Tyr Leu Met Lys Met Lys
115 120 125
Arg Val Thr Ile Gln Val Met Thr Ile Pro Asp Tyr Thr Tyr Cys Trp
130 135 140
Asn Thr Phe Leu Glu Asp Asp Gly Glu Asp Glu Ser Asp Asp Tyr Gly
145 150 155 160
Gly Tyr Ala Gly Val His Glu Asp Glu Asp Glu Ser Asp Asp Asp Asp
165 170 175
Tyr Leu Pro Thr His Phe Ala Pro Trp Ile Met Leu Tyr Ser Leu Glu
180 185 190
Leu Ser Cys Ile Leu Gln Gly Phe Ala Pro Cys Leu Lys Ile Ile Gln
195 200 205
Gly Asn His Met Ser Pro Thr Phe Gln Leu His Val Gln Asp Gln Glu
210 215 220
Gln Lys Arg Leu Leu Glu Pro Ala Asn Pro Trp Gly Ala Asp
225 230 235
<210> 104
<211> 220
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.36;
tr|A0A2R2X2J8|A0A2R2X2J8_PTEVA polypeptide sequence
<400> 104
Met Pro Arg Ile Gly Asn Met Asn Leu Leu Ser Glu Lys Thr Phe Asn
1 5 10 15
Tyr His Phe Gly Asn Gln Leu Arg Val Lys Lys Pro Gln Gly Arg Arg
20 25 30
Arg Thr Tyr Leu Cys Tyr Lys Leu Lys Leu Pro Asn Glu Thr Leu Val
35 40 45
Lys Gly Tyr Phe Ile Asn Lys Lys Lys Asn His Ala Glu Ile Arg Phe
50 55 60
Ile Asn Lys Ile Arg Ser Leu Asn Leu Asp Gln Thr Gln Ser Tyr Lys
65 70 75 80
Ile Thr Cys Tyr Ile Thr Trp Ser Pro Cys Ser Tyr Cys Ala Gly Lys
85 90 95
Leu Val Ala Leu Val Lys Ser Cys Pro His Leu Ser Leu Gln Ile Phe
100 105 110
Thr Ser Arg Leu Tyr Tyr His Trp Leu Trp Lys Asn Gln Ala Gly Leu
115 120 125
Arg Tyr Leu Trp Lys Ile Asn Ile Ser Val Leu Val Met Lys Glu Pro
130 135 140
Glu Phe Ala Asp Cys Trp Asp Asn Phe Val Asn His Gln Ser Arg Arg
145 150 155 160
Phe Lys Pro Trp Glu Lys Leu Thr Gln Tyr Ser Asn Ser Thr Glu Arg
165 170 175
Arg Leu Leu Arg Ile Leu Arg Ile Asn Arg Thr Asp Leu Phe Leu Ala
180 185 190
Gln Ser Ser Glu Gln Asp Pro Gly Leu Asn Asp Leu Val Asp Ala Ile
195 200 205
Lys Arg Leu Phe Leu Asp Ala His Arg Pro Arg Asp
210 215 220
<210> 105
<211> 198
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.37;
tr|A0A151P6M4|A0A151P6M4_ALLMI polypeptide sequence
<400> 105
Met Ala Val Glu Glu Glu Lys Gly Leu Leu Gly Thr Ser Gln Gly Trp
1 5 10 15
Lys Ile Glu Leu Lys Asp Phe Gln Glu Asn Tyr Met Pro Ser Thr Trp
20 25 30
Pro Lys Val Thr His Leu Leu Tyr Glu Ile Arg Trp Gly Lys Gly Ser
35 40 45
Lys Val Trp Arg Asn Trp Cys Ser Asn Thr Leu Thr Gln His Ala Glu
50 55 60
Val Asn Cys Leu Glu Asn Ala Phe Gly Lys Leu Gln Phe Asn Pro Pro
65 70 75 80
Val Pro Cys His Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Cys Gln
85 90 95
Cys Cys Arg Arg Ile Leu Gln Phe Leu Arg Ala His Ser His Ile Thr
100 105 110
Leu Val Ile Lys Ala Ala Gln Leu Phe Lys His Met Asp Glu Arg Asn
115 120 125
Arg Gln Gly Leu Arg Asp Leu Val Gln Ser Gly Val His Val Gln Val
130 135 140
Met Asp Leu Pro Asp Tyr Arg Tyr Cys Trp Arg Thr Phe Val Ser His
145 150 155 160
Pro His Glu Gly Glu Gly Asp Phe Trp Pro Trp Phe Phe Pro Leu Trp
165 170 175
Ile Thr Phe Tyr Thr Leu Glu Leu Gln His Ile Leu Leu Gln Gln His
180 185 190
Ala Leu Ser Tyr Asn Leu
195
<210> 106
<211> 158
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.38;
tr|A0A2K6MNR2|A0A2K6MNR2_RHIBE polypeptide sequence
<400> 106
Ile Trp Leu Cys Phe Thr Met Glu Ile Ile Lys Gln Cys Ser Thr Val
1 5 10 15
Ser Trp Lys Arg Gly Val Phe Arg Asn Gln Val Asp Pro Glu Thr His
20 25 30
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Trp Glu Asp Thr Leu
35 40 45
Ser Pro Asn Thr Asn Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
50 55 60
Cys Leu Asp Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
65 70 75 80
Asn Val Lys Leu Ala Ile Phe Ala Ala Arg Leu Tyr Tyr Phe Trp Asp
85 90 95
Thr Asp Tyr Gln Gln Gly Leu Arg Ser Leu Ser Glu Glu Gly Thr Ser
100 105 110
Val Glu Ile Met Gly Tyr Glu Asp Phe Lys Tyr Cys Trp Glu Asn Phe
115 120 125
Val Tyr Asn Gly Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Tyr
130 135 140
Asn Phe Leu Phe Leu Asp Ser Lys Leu Gln Glu Ile Leu Glu
145 150 155
<210> 107
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.40;
tr|F1CGT0|F1CGT0_ANOCA polypeptide sequence
<400> 107
Lys Ala Ala Ile Leu Leu Ser Asn Leu Phe Phe Arg Trp Gln Met Glu
1 5 10 15
Pro Glu Ala Phe Gln Arg Asn Phe Asp Pro Arg Glu Phe Pro Glu Cys
20 25 30
Thr Leu Leu Leu Tyr Glu Ile His Trp Asp Asn Asn Thr Ser Arg Asn
35 40 45
Trp Cys Thr Asn Lys Pro Gly Leu His Ala Glu Glu Asn Phe Leu Gln
50 55 60
Ile Phe Asn Glu Lys Ile Asp Ile Lys Gln Asp Thr Pro Cys Ser Ile
65 70 75 80
Thr Trp Phe Leu Ser Trp Ser Pro Cys Tyr Pro Cys Ser Gln Ala Ile
85 90 95
Ile Lys Phe Leu Glu Ala His Pro Asn Val Ser Leu Glu Ile Lys Ala
100 105 110
Ala Arg Leu Tyr Met His Gln Ile Asp Cys Asn Lys Glu Gly Leu Arg
115 120 125
Asn Leu Gly Arg Asn Arg Val Ser Ile Met Asn Leu Pro Asp Tyr Arg
130 135 140
His Cys Trp Thr Thr Phe Val Val Pro Arg Gly Ala Asn Glu Asp Tyr
145 150 155 160
Trp Pro Gln Asp Phe Leu Pro Ala Ile Thr Asn Tyr Ser Arg Glu Leu
165 170 175
Asp Ser Ile Leu Gln Asp
180
<210> 108
<211> 230
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.41;
tr|C7AGG3|C7AGG3_HORSE polypeptide sequence
<400> 108
Met Asp Pro Gln Ala Pro Thr Gln Arg Gly Gly Leu Gly Gln Ala Tyr
1 5 10 15
Gln Gly Gly Asp Tyr Val Gln Ala Pro Gly Asn Gly Asn Thr Gln His
20 25 30
Leu Leu Ser Glu Asp Val Phe Lys Lys Gln Phe Gly Asn Gln Arg Arg
35 40 45
Val Thr Lys Pro Tyr Tyr Arg Arg Lys Thr Tyr Val Cys Tyr Gln Leu
50 55 60
Lys Leu Leu Arg Gly Pro Thr Ile Ala Lys Gly Tyr Phe Arg Asn Lys
65 70 75 80
Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn Ser Leu
85 90 95
Gly Leu Asp Gln Asp Gln Ser Tyr Glu Ile Thr Cys Tyr Val Thr Trp
100 105 110
Ser Pro Cys Ala Thr Cys Ala Cys Lys Leu Ile Lys Phe Thr Arg Lys
115 120 125
Phe Pro Asn Leu Ser Leu Arg Ile Phe Val Ser Arg Leu Tyr Tyr His
130 135 140
Trp Phe Arg Gln Asn Gln Gln Gly Leu Arg Gln Leu Trp Ala Ser Ser
145 150 155 160
Ile Pro Val Val Val Met Gly Tyr Gln Glu Phe Ala Asp Cys Trp Glu
165 170 175
Asn Phe Ala Asp Asn Arg Gly Asn Pro Phe Gln Ser Trp Glu Lys Leu
180 185 190
Thr Glu Tyr Ser Lys Gly Ile Lys Arg Arg Leu Gln Lys Ile Leu Glu
195 200 205
Pro Leu Asn Leu Asn Gly Leu Glu Asp Ala Met Gly Asn Leu Lys Leu
210 215 220
Gly Ser Val Asp Leu Gly
225 230
<210> 109
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.42;
tr|A0A250YMK7|A0A250YMK7_CASCN polypeptide sequence
<400> 109
Met Ser Leu Leu Lys Glu Asp Ile Phe Leu Tyr Gln Phe Asn Asn Gln
1 5 10 15
Gln Gln Val Gln Lys Pro Tyr Phe Arg Arg Arg Thr Tyr Leu Cys Tyr
20 25 30
Gln Leu Glu Gln Pro Asn Gly Ser Arg Pro Gln Trp Pro Ala Lys Gly
35 40 45
Cys Leu Gln Asn Lys Lys Gly His His Ala Glu Ile Arg Phe Ile Lys
50 55 60
Arg Ile His Ser Met Gly Leu Glu Gln Asp Gln Asp Tyr Gln Ile Thr
65 70 75 80
Cys Tyr Ile Thr Trp Ser Pro Cys Leu Ala Cys Ala Cys Ala Leu Ala
85 90 95
Glu Leu Lys Asn His Phe Pro Arg Leu Thr Leu Arg Ile Phe Ala Ser
100 105 110
Arg Leu Tyr Phe His Trp Ile Arg Lys Phe Gln Met Gly Leu Gln His
115 120 125
Leu Tyr Lys Ser Gly Val Leu Val Ala Val Met Ser Leu Pro Glu Phe
130 135 140
Thr Asp Cys Trp Glu Lys Phe Val Asn His Arg Gln Val Phe Phe Thr
145 150 155 160
Pro Trp Asp Lys Leu Glu Glu His Ser Arg Ser Ile Gln Arg Arg Leu
165 170 175
Arg Arg Ile Leu Gln Ser Trp Asp Val Asp Asp Leu Thr Asp Asp Phe
180 185 190
Arg Asn Leu Arg Leu
195
<210> 110
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM3.43;
tr|B7T160|B7T160_SHEEP polypeptide sequence
<400> 110
Met Pro Trp Ile Ser Asp His Val Ala Arg Leu Asp Pro Glu Thr Phe
1 5 10 15
Tyr Phe Gln Phe His Asn Leu Leu Tyr Ala Tyr Gly Arg Asn Cys Ser
20 25 30
Tyr Ile Cys Tyr Arg Val Lys Thr Trp Lys His Arg Ser Pro Val Ser
35 40 45
Phe Asp Trp Gly Val Phe His Asn Gln Val Tyr Ala Gly Thr His Cys
50 55 60
His Ser Glu Arg Arg Phe Leu Ser Trp Phe Cys Ala Lys Lys Leu Arg
65 70 75 80
Pro Asp Glu Cys Tyr His Ile Thr Trp Phe Met Ser Trp Ser Pro Cys
85 90 95
Met Lys Cys Ala Glu Leu Val Ala Gly Phe Leu Gly Met Tyr Gln Asn
100 105 110
Val Thr Leu Ser Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Lys Pro
115 120 125
Gln Tyr Arg Lys Gly Leu Leu Arg Leu Ser Asp Gln Gly Ala Cys Val
130 135 140
Asp Ile Met Ser Tyr Gln Glu Phe Lys Tyr Cys Trp Lys Lys Phe Val
145 150 155 160
Tyr Ser Gln Arg Arg Pro Phe Arg Pro Trp Lys Lys Leu Lys Arg Asn
165 170 175
Tyr Gln Leu Leu Ala Ala Glu Leu Glu Asp Ile Leu Gly
180 185
<210> 111
<211> 541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.1;
tr|A0A182D0J1|A0A182D0J1_BLAVI polypeptide sequence
<400> 111
Met Thr Asn Pro Glu Ser Pro Pro Gln Ala Pro Cys Asp Phe Asn Glu
1 5 10 15
Asp Ala Leu Leu Asn Arg Glu Pro Leu Arg Gly Ser Pro Ile Lys Phe
20 25 30
Val Ser Pro Val Asp Tyr Pro Asp Leu Val Phe Ala Leu Ala Gly Pro
35 40 45
Val Gly Val Asp Ile Asp Tyr Ile Gln Gln Ser Ile Ser Asp Cys Leu
50 55 60
Lys Ser Phe Asp Tyr Ser Thr Glu Phe Ile Arg Ile Thr Glu Ile Met
65 70 75 80
Gln Asp Ile Lys Cys Ser Lys Thr Ile Asp Cys Thr Asp Met Leu Lys
85 90 95
Glu Tyr Gln Ser Lys Ile Glu Tyr Ala Asn Glu Leu Arg Arg Ala Tyr
100 105 110
Arg Ala Lys Asp Leu Leu Ala Ala Leu Thr Ile Ser Ala Ile Ser Lys
115 120 125
Leu Arg Glu Gln Ile Lys Glu Arg Asp Glu Ala Thr Asn Lys Ser Asn
130 135 140
Ile Gln Pro Ser Arg Arg Lys Leu Ala Trp Val Val Arg Gln Leu Lys
145 150 155 160
Thr Pro Glu Glu Val Arg Leu Leu Arg Ala Val Tyr Gly Lys Gln Phe
165 170 175
Val Leu Val Ser Ile Tyr Ser Ser Pro Gln Arg Arg Glu Asp Phe Leu
180 185 190
Ile Ser Lys Ile Lys Ile Lys Ser Arg Gly Thr Ile Asp Asn Asn Thr
195 200 205
Ser Ser Glu Gly Ala Gln Arg Leu Ile Glu Arg Asp Ser Lys Glu Asp
210 215 220
Asn Glu Tyr Gly Gln Asn Leu Ser Gly Thr Phe Cys Leu Gly Asp Ile
225 230 235 240
Phe Val Asp Ser Asn Asn Lys Glu Ser Ala Ile Val Ser Ile Asp Arg
245 250 255
Phe Leu Asn Ala Phe Phe Gly Ser Asn Glu Ile Ser Pro Thr Arg Asp
260 265 270
Glu Tyr Gly Met Tyr Leu Ala Lys Thr Ala Ser Leu Arg Ser Cys Asp
275 280 285
Leu Ser Arg Gln Val Gly Ala Ala Ile Phe Ser Lys Thr Gly Glu Ile
290 295 300
Ile Ser Leu Gly Ser Asn Glu Val Pro Lys Ala Gly Gly Gly Thr Tyr
305 310 315 320
Trp Thr Gly Asp Asn Ala Asp Ser Arg Asp Ile Arg Leu Gly His Asp
325 330 335
Pro Asn Glu Ile Asn Lys Val Glu Ile Phe Ala Glu Ile Ile Ser Arg
340 345 350
Leu Leu Glu Asp Lys Leu Leu Ser Asn Asp Leu Leu Asn Lys Asp Ala
355 360 365
Ala Ser Ile Val Thr Ile Leu Leu Ser Lys Asn Glu Gly Lys Arg Tyr
370 375 380
Lys Asp Leu Arg Val Met Asp Ile Ile Glu Phe Gly Arg Ile Ile His
385 390 395 400
Ala Glu Met Ser Ala Ile Cys Asp Ala Ala Arg Asn Gly Arg Ala Ile
405 410 415
Ile Gly Ala Thr Leu Phe Cys Thr Thr Phe Pro Cys His Leu Cys Ala
420 425 430
Lys His Ile Val Ala Ser Gly Ile Gly Arg Ile Val Tyr Leu Glu Pro
435 440 445
Tyr Pro Lys Ser Tyr Ala Lys Lys Leu His Ser Asp Ser Ile Gln Val
450 455 460
Glu Asp His Ser Asp Ser Glu Lys Val Ser Phe Glu Pro Phe Ile Gly
465 470 475 480
Ile Ser Pro Ser Arg Tyr Arg Glu Leu Phe Glu Gly Gly Arg Arg Lys
485 490 495
Asp Pro Phe Gly Glu Ala Leu Lys Trp Lys Asn Asp Pro Arg Lys Pro
500 505 510
Val Ile Asp Val Val Val Pro Pro His Phe Glu Ala Glu Lys Leu Val
515 520 525
Ile Ala Gln Leu Gly Lys Leu Ile Val Ser Gly Thr Gly
530 535 540
<210> 112
<211> 330
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.2;
tr|A0A2D6EXD2|A0A2D6EXD2_9ARCH polypeptide sequence
<400> 112
Met Ile Ile Gly Leu Val Gly Thr Ile Gly Ala Gly Lys Gln Thr Ile
1 5 10 15
Ile Asp Tyr Leu Gln Glu Lys Tyr Gly Tyr Asn Ala Leu Ser Cys Ser
20 25 30
Asp Val Leu Arg Glu Ile Leu Lys Lys Gln Gly Lys Pro Val Thr Arg
35 40 45
Asp Asn Leu Arg Glu Ile Gly Asn Lys Thr Arg Glu Glu Gly Gly Asn
50 55 60
Gly Ala Ile Ala Lys Ile Leu Leu Glu Lys Leu Arg Asn Asn Trp Lys
65 70 75 80
Ala Asn Tyr Ile Val Asp Ser Leu Arg His Pro Asp Glu Val Ser Val
85 90 95
Leu Arg Thr Ser Pro Leu Phe His Leu Val Ala Val Asp Ala Asp Leu
100 105 110
Arg Ile Arg Phe Glu Arg Val Lys Ala Arg Lys Arg Glu Glu Glu Pro
115 120 125
Thr Thr Leu Pro Ala Phe Val Glu Arg Asp Gln Lys Glu Met Phe Gly
130 135 140
Thr Gly Asn Glu Gln Arg Ile Arg Glu Thr Met Glu Leu Ala Asp Glu
145 150 155 160
Leu Val Leu Asn Asn Gly Thr Val Glu Glu Leu Lys Gln Arg Ile Asp
165 170 175
Asp Leu Asn Leu Val Ser Asp Glu Arg Leu Arg Pro Ser Trp Asp Asp
180 185 190
Tyr Phe Met Arg Leu Ala Arg Leu Ala Ala Gln Arg Ser Asn Cys Met
195 200 205
Ser Arg Lys Val Gly Ala Ile Ile Thr Lys Asp Arg Arg Val Ile Ala
210 215 220
Thr Gly Tyr Asn Gly Thr Pro Arg Gly Val Lys Asn Cys Asn Glu Gly
225 230 235 240
Gly Cys Glu Arg Cys Asn Ser Ala Val Ala Lys Gly Thr Ala Ile Ser
245 250 255
Glu Cys Leu Cys Leu His Gly Glu Glu Asn Ala Ile Ile Glu Ala Gly
260 265 270
Arg Val Arg Ser Glu Gly Ala Thr Ile Tyr Thr Ser Phe Leu Pro Cys
275 280 285
Leu Trp Cys Thr Lys Met Ile Ile Gln Ala Gly Leu Lys Glu Val Val
290 295 300
Phe Ser Glu Val Tyr Asp Leu His Glu Ala Ser Ile Lys Leu Phe Glu
305 310 315 320
Thr Ser Gly Val Leu Ile Arg Arg Leu Lys
325 330
<210> 113
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.3;
tr|F7YVM7|F7YVM7_9THEM polypeptide sequence
<400> 113
Met Asn Glu Phe Lys Tyr Met Ser Leu Ala Leu Lys Leu Ala Lys Lys
1 5 10 15
Gly Lys Tyr Thr Thr Ser Pro Asn Pro Met Val Gly Ala Val Ile Val
20 25 30
Lys Asp Gly Lys Ile Leu Ala Thr Gly Tyr His Lys Lys Ala Gly Gln
35 40 45
Pro His Ala Glu Ile Asn Ala Leu Ser Lys Leu Asn Phe Gln Ala Gln
50 55 60
Asn Cys Glu Met Tyr Val Thr Leu Glu Pro Cys Ser His Tyr Gly Arg
65 70 75 80
Thr Pro Pro Cys Ala Asp Ala Ile Ile Arg Ser Gly Ile Arg Lys Val
85 90 95
Val Ile Ala Thr Leu Asp Pro Asn Pro Leu Val Asn Gly Lys Gly Val
100 105 110
Glu Lys Leu Lys Asn Ala Gly Ile Glu Val Val Cys Gly Val Leu Glu
115 120 125
Glu Lys Ala Lys Lys Leu Asn Glu Lys Phe Phe Lys Tyr Ile Thr Thr
130 135 140
Lys Ile Pro Phe Val Ala Leu Lys Ile Ala Gln Thr Leu Asp Gly Lys
145 150 155 160
Ile Ala Leu Lys Asn Gly Glu Ser Lys Trp Ile Thr Ser Glu Lys Ser
165 170 175
Arg Glu Tyr Val His Lys Leu Arg Met Glu Tyr Asp Ala Val Leu Thr
180 185 190
Gly Ile Gly Thr Ile Leu Lys Asp Asp Pro Gln Leu Asn Val Arg Leu
195 200 205
Lys Lys Val Tyr Lys Gln Pro Leu Arg Ile Ile Leu Asp Ser Lys Leu
210 215 220
Lys Ile Pro Leu Ser Ala Lys Val Leu Glu Asp Pro Ser Lys Val Ile
225 230 235 240
Ile Leu Thr Thr Ala Leu Ala Asp Lys Glu Lys Leu Glu Glu Leu Arg
245 250 255
Ser Lys Gly Val Glu Val Ile Ile Thr Asn Glu Lys Asn Gly Ile Val
260 265 270
Asp Leu Glu Ser Ala Leu Lys Ile Leu Gly Glu Lys Lys Ile Thr Ser
275 280 285
Val Met Val Glu Ala Gly Pro Thr Leu Leu Thr Ser Phe Leu Lys Glu
290 295 300
Ser Leu Phe Asp Lys Ile Tyr Leu Phe Ile Ala Pro Lys Ile Phe Gly
305 310 315 320
Ala Asp Ser Lys Ser Val Phe Ser Glu Leu Gly Leu Glu Asp Ile Ser
325 330 335
Lys Ser Gln Lys Phe Ser Leu Glu Ser Val Lys Lys Ile Gly Glu Asp
340 345 350
Leu Leu Leu Glu Leu Tyr Pro Lys Gln Leu Lys Lys Leu Glu Glu
355 360 365
<210> 114
<211> 449
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.4;
tr|A0A3M6UNF1|A0A3M6UNF1_9CNID polypeptide sequence
<400> 114
Met Glu Glu Lys Ser Glu Leu Glu Asn Glu Leu Met Arg Ser Thr Ser
1 5 10 15
Pro Lys Pro Ser Val Pro Asn Gly Ser Lys Gly Asn Glu Cys Glu Gln
20 25 30
Arg Glu Thr Arg Ile Thr Lys Glu Asn Leu Tyr Met Val Leu Ala Leu
35 40 45
Trp Met Glu Glu Phe Pro Val Val Glu Gln Thr Ser Ser Ala Lys Arg
50 55 60
Leu Asn Lys Val Gly Val Val Phe Val Leu Pro Thr Asp Arg Val Leu
65 70 75 80
Ala Ala Asp Cys Ser Arg Asp Gly Val His Gly Val Ala Arg Val Met
85 90 95
Val Asn His Cys Gly Lys Leu Glu Gly Cys Lys Val Phe Val Ser Arg
100 105 110
Lys Pro Cys Ser Leu Cys Ala Lys Leu Leu Val Gln Ser Lys Val Ser
115 120 125
Arg Val Phe Tyr Leu Pro Ile Glu Pro Glu Ser Glu Asn Lys Gly Glu
130 135 140
Ile Ala Arg Ala Asp Asn Leu Phe Lys Asn Ser Ser Val Gly Gln Ser
145 150 155 160
Val Phe Val Pro Cys Val Glu Gln Lys Val Leu Asp Lys Leu Glu Asp
165 170 175
Lys Leu Pro Lys Glu Ile Ile Thr Pro Asp Asp Ile Ser Glu Cys Arg
180 185 190
Asp Asn Leu Leu Lys Lys Cys Gly Trp Ser Ala Glu Trp Phe Ala Arg
195 200 205
Ala Gln Ala Ser Leu Pro Trp Pro Cys Phe Glu Gly Lys Met Lys Ser
210 215 220
Gln Val Asp Asn Asp Phe Lys Ser Leu Ile Lys Trp Ile Ala Val Val
225 230 235 240
Lys Ala Pro Met Asp Lys Gly Val Ala Phe Pro Lys Val Lys Leu Thr
245 250 255
Ser Asp Ser Arg Val Val Pro Asp Cys Asp Ala Asp Asn Phe Pro Asp
260 265 270
Ser Lys Thr Ala Tyr His Met Met Ile Phe Ala Lys Met Leu Ala Arg
275 280 285
Gln Thr Asp Asp Pro Lys Thr Gly Val Gly Ala Val Ile Val Arg Gly
290 295 300
Lys Val Pro Asp Ile Val Ser Leu Gly Trp Asn Gly Phe Pro Ser Lys
305 310 315 320
Ala Leu Tyr Gly Glu Phe Pro Arg Ala Ser Asp Asp Asp Arg Ala Leu
325 330 335
Gln Lys Lys Phe Pro Tyr Val Ile His Ala Glu Gln Asn Ala Leu Met
340 345 350
Val Arg Asn Val Lys Asp Leu Thr Asp Gly Ile Leu Phe Val Thr Lys
355 360 365
Pro Pro Cys Asp Glu Cys Ala Pro Met Ile Lys Leu Ser Gly Val Lys
370 375 380
Thr Ile Val Ile Gly Glu Lys Ile Glu Lys Ser Arg Gly Gly Glu Leu
385 390 395 400
Ser Tyr Asn Leu Ile Lys Glu Tyr Ile Lys Glu Gly Ile Met Thr Cys
405 410 415
Tyr Gln Met Glu Ala Thr Lys Thr Lys Ala Lys Arg Leu Ala Ser Asp
420 425 430
Pro Glu Thr Arg Lys Arg Leu Lys Ser Ser Cys Ser Asn Ser Asn Asp
435 440 445
Val
<210> 115
<211> 414
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.5;
tr|A0A2G3K826|A0A2G3K826_9BURK polypeptide sequence
<400> 115
Met Thr Lys Ile Ile Asp Asp Val Asn Thr Ala Ala Ala Ala Val Leu
1 5 10 15
Asp Gln Ala Thr Ala Ala Ala Asn Gln Thr Thr Phe Ala Val Gly Gly
20 25 30
Val Met Val Asn Asn Gln Thr Gly Glu Val Ile Ser Ala Ile His Asn
35 40 45
Asn Val Ile Ile Pro Leu Ser Asn Asn Val Ser Phe Thr Phe Asp Pro
50 55 60
Thr Ala His Gly Glu Arg Gln Leu Val Tyr Trp Tyr Tyr Ala Asn Lys
65 70 75 80
Glu Ala Leu Lys Leu Pro Glu Pro Asn Gln Ile Thr Val Ile Thr Ser
85 90 95
Leu Asp Pro Cys Ala Met Cys Thr Gly Ala Leu Leu Thr Ala Gly Phe
100 105 110
Asn Val Gly Val Val Ala Ile Asp Thr Tyr Ala Gly Ile Asn Cys Ala
115 120 125
Gln Asn Phe Gln Phe Ala Thr Leu Pro Ala Asn Leu Arg Thr Lys Ala
130 135 140
Gln Lys Asn Phe Gly Tyr Tyr Ala Ser Gly Ala Ala Asn Phe Lys Pro
145 150 155 160
Leu Thr Arg Ser Tyr Val Gly Gly Pro Ser Val Ala Phe Lys Asn Gly
165 170 175
Val Val Thr Pro Ala Asn Leu Arg Asp Cys Gly Thr Val Phe Thr Gln
180 185 190
Ser Val Asp Thr Val Arg Asn Thr Ser Asn Ser Thr Gly Leu Ala Pro
195 200 205
Ser Gln Met Ser Asn Pro Ala Glu Leu Pro Ser Asn Ser Ala Ile Leu
210 215 220
Gln Ala Tyr Arg Ala Ile Tyr Lys Lys Ala Phe Thr Ile Lys Ile Asp
225 230 235 240
Asn Pro Arg Leu Pro Asp Ala Gln Ile Leu Thr Glu Leu Lys Ala Val
245 250 255
Leu Ala Asp Ala Pro Asn Ala Arg Asn Ala Val Ala Phe Ile Asp Pro
260 265 270
Phe Gly Asn Leu Val Leu Cys Met Ala Asp Ala Phe Asn Thr Ser Pro
275 280 285
Val His Ala Ala Phe Met Asn Val Thr Gln Glu Tyr Ala Lys Thr Arg
290 295 300
Trp Asp Leu Met Asn Lys Tyr Ala Gln Ala Ser Thr Thr Asp Asn Pro
305 310 315 320
Ala Leu Tyr Leu Thr His Pro Lys Tyr Gly Thr Phe Val Tyr Leu Tyr
325 330 335
Ala Pro Asp Pro Asp Asp Ser Ile Thr Ile Met Ser Leu Gly Ala Tyr
340 345 350
Gly Ser Thr Met Glu Gly Pro Ile Pro Asn Met Phe Pro Ser Asn Leu
355 360 365
Gln Phe Tyr Tyr Pro Pro Arg Asn Gly Ala Gln Phe Ser Glu Leu Val
370 375 380
Pro Val Val Asn Glu Leu Pro Pro Phe Tyr Thr Gln Asn Val Asn Ile
385 390 395 400
Ser Leu Met Gln Val Pro Gly Val Thr Gln Ala Pro Thr Lys
405 410
<210> 116
<211> 308
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.6;
tr|K1ZCJ4|K1ZCJ4_9BACT polypeptide sequence
<400> 116
Met Ser Ser Arg Ala Lys Lys Asn Arg Ser Thr Asn Leu Lys Lys Ser
1 5 10 15
Ile Gly Gln Lys Ser Ile Glu Asn Lys Pro Thr Asp Gln Lys Lys Asp
20 25 30
Gln Val Leu Val Ala Tyr Val Pro Val Ile His Glu Gly Tyr Arg Arg
35 40 45
Phe Phe Arg His Phe Pro Ala Val Lys Glu Leu Trp Leu Ile Ser Gln
50 55 60
Glu Leu Ser His Glu Leu Arg Ser Leu Gln Lys Asp Ile Arg Ala Leu
65 70 75 80
Lys Ala Ser Glu Thr Lys Lys Leu Leu Gln Thr Trp Gly Gln Phe Gln
85 90 95
Lys Ile Lys Leu Leu Thr Pro Ser Ser Leu Ala Ile Leu Gln Lys Thr
100 105 110
Thr Thr Gln Leu Val Phe Pro Asp Glu Glu Ile Ser His His Leu Val
115 120 125
Glu Lys Tyr Phe Ala Gln Asn Arg Val Leu Phe Ala Ser Phe Phe Leu
130 135 140
Arg Trp Asp Lys Lys Ser Ser Leu Lys Lys His Asp Leu Gln Glu Tyr
145 150 155 160
Ser Glu Ile Ser Asn Lys Glu Phe Asp Gln Met Met Ile Ala Ile Ala
165 170 175
Gln Gln Glu Ala Asp Lys Ser Asp Asp Trp Trp Arg Gln Val Gly Gly
180 185 190
Leu Ile Phe Lys Asp Glu Thr Ile Leu Leu Leu Ala His Asn Gln His
195 200 205
Thr Pro Thr Glu Ala Glu Ala Tyr Phe Ala Gly Asp Pro Arg Ala Asp
210 215 220
Phe His Gln Gly Glu Tyr Leu Lys Ile Ser Thr Ala Ile His Ala Glu
225 230 235 240
Ala Tyr Leu Ile Ala Gln Ala Ala Lys Gln Gly Ile Ser Leu Glu Gly
245 250 255
Ala Asp Leu Tyr Val Thr Thr Phe Pro Cys Pro Val Cys Ala Lys Gln
260 265 270
Val Ala Tyr Ser Gly Ile Lys Arg Val Phe Phe Arg Glu Gly Tyr Ser
275 280 285
Leu Leu Asp Gly Glu Thr Ile Leu Lys Ala Asn Gly Val Lys Leu Ile
290 295 300
Arg Val Thr Val
305
<210> 117
<211> 615
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.7;
tr|A0A1G3PNQ8|A0A1G3PNQ8_9SPIR polypeptide sequence
<400> 117
Met Arg Asp Leu Pro Leu Leu Val Leu Gly Leu Thr Gly Pro Met Gly
1 5 10 15
Ala Gly Cys Thr Arg Phe Ala Arg Asp Ile Ser Lys Met Glu Pro Gly
20 25 30
Lys Val Ile Lys Lys Gln Gly Leu Leu Asp Gln Val Ala His Glu Ile
35 40 45
Ser Glu Leu Ser Lys Lys Ala Ser Glu Ile Arg Leu Gln Cys Ile Ser
50 55 60
Asn Gly Lys Asn Ser Glu Leu Ala Glu Leu Lys Arg Leu Asn Arg Arg
65 70 75 80
Leu Asn Ala Lys Leu Ala Glu Arg Ala Cys Leu His Val Ile Ala Lys
85 90 95
Ser Ser Leu Pro Glu Pro Leu Phe Ile Ser Leu Asn Thr Ile Val Ile
100 105 110
Lys Ile Ala Val Asp Ser Ile Thr Ala Pro Glu Phe Ala Glu Trp Ala
115 120 125
Lys Asn His Ala Lys Val Ala Asp Leu Leu Lys Trp Leu Arg Thr Gln
130 135 140
Trp Glu Ser Glu Leu Thr Leu Tyr Glu Thr Trp Gly Gln Asp Ala Gly
145 150 155 160
Arg Phe Ser Gln Asp Glu Leu Glu Lys Met Asp Ala Met Phe Ala Glu
165 170 175
Phe Glu Arg Ile Gly Asp Glu Ile Leu Lys Glu Asp Phe Glu Thr Tyr
180 185 190
Phe Gly Lys Arg Asn Asn Asp Phe Ser Ile Arg Met Phe Ser Glu Asn
195 200 205
Ile Arg Leu Ser Gly Asn Pro Phe Arg Pro Ala Glu Asn Gly Gly Gly
210 215 220
Gly Gly Lys Tyr Asp Glu Pro Ser Met Val Met Ile Ala Arg Glu Thr
225 230 235 240
Asp Arg Tyr Ile Arg Phe Tyr Arg Thr Arg Ser Asp Gln Lys Arg Ser
245 250 255
His Phe Phe Ile Ile Asp Glu Ile Lys Asn Pro Arg Glu Ala Glu Tyr
260 265 270
Phe Arg Ala Arg His Gln Asn Phe Phe Leu Val Ser Ile Phe Ser Ser
275 280 285
Ser Glu Ile Arg Ala Ser Arg Met Arg Arg Gly Leu Gly His Asp Ala
290 295 300
Gly Val Ser Asp Ala Asp Phe Gln His Leu Phe Arg Glu Leu Asp Ser
305 310 315 320
Arg Asp Trp Gly Ala Asp Asp Phe Asp Ala His Gly Leu His Arg Gln
325 330 335
Asn Ile Tyr Arg Cys Phe Asn Leu Ala Asp Ile Ala Ile Asn Asn Asp
340 345 350
Val Glu Asp Glu Arg Phe Ser Glu Val Leu Phe Asn Lys Phe Ile Arg
355 360 365
Tyr Tyr Ala Leu Met Leu Ser Pro Gly Cys Val Gln Pro Thr Pro Gln
370 375 380
Glu Thr Tyr Met His Leu Ala Tyr Ser Leu Ser Leu Arg Ser Thr Cys
385 390 395 400
Ile Ser Arg Gln Val Gly Ala Val Ile Thr Asp Leu Glu Asp Arg Ile
405 410 415
Leu Ser Leu Gly Trp Asn Glu Val Pro Glu Gly Gln Ile Gly Cys Gly
420 425 430
Leu Lys Val Lys Lys Asp Tyr Thr Asp Lys Glu Asn Pro Leu Phe Glu
435 440 445
Met Glu Ile Trp Asp Asn Val Ile Thr Ala Glu Asp Leu Ala Val Trp
450 455 460
Asp Asp Glu Asp Ser Ile Cys Val Lys Asp Ile Leu Ser Arg Ile Glu
465 470 475 480
Ile Lys Thr Lys Leu Lys Ser Val Ser Leu Thr Pro Glu Glu Arg Ala
485 490 495
Asp Val Leu Lys Ala Leu Arg Ile Lys Arg Leu Glu Tyr Ser Arg Ser
500 505 510
Leu His Ala Glu Glu Asn Ala Ile Leu Gln Val Ala Ser Arg Gly Gly
515 520 525
Val Gly Leu Lys Asp Gly Thr Ile Tyr Val Thr Thr Phe Pro Cys Glu
530 535 540
Leu Cys Ser Lys Lys Ile Tyr Gln Val Gly Ile Ser Lys Ile Tyr Tyr
545 550 555 560
Thr Glu Pro Tyr Pro Asn Ser Ile Ser Glu Lys Val Ile Leu Lys Asp
565 570 575
Gly Ile Arg Asn Ile Lys Ile Leu Gln Phe Glu Gly Val Lys Ser Tyr
580 585 590
Ser Tyr Phe Lys Leu Phe Lys Pro Gly Phe Asp Lys Lys Asp Ala Gln
595 600 605
Met Leu Glu Gly Arg Gly Ile
610 615
<210> 118
<211> 291
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.8;
tr|A0A1G0PGF4|A0A1G0PGF4_9BACT polypeptide sequence
<400> 118
Met Lys His Asn Asn Gln Leu Arg Lys Glu Ile Glu Lys Leu Leu Gly
1 5 10 15
Gln Asn Ser Ile Ile Lys Asn Asp Glu Leu Lys Lys Leu Gln Lys Glu
20 25 30
Tyr Lys Ile Glu Thr Asp Glu Leu Leu Ile Ser Phe Leu Pro Tyr Ala
35 40 45
Ala Glu Phe Ala Lys Val Pro Ile Ser Lys Tyr Lys Val Gly Ala Val
50 55 60
Val Leu Gly Lys Ser Gly Asn Ile Tyr Phe Gly Ser Asn Met Glu Phe
65 70 75 80
Glu Ala Gly Ala Leu Ser Ala Thr Val His Ala Glu Gln Ser Ala Val
85 90 95
Asn Asn Ala Trp Leu Asn Gly Glu Thr Gly Ile Asn Lys Ile Ala Val
100 105 110
Thr Ala Ala Pro Cys Gly Tyr Cys Arg Gln Phe Leu Asn Glu Leu Thr
115 120 125
Thr Ala Lys Gln Leu His Val Leu Leu Lys Asp Lys Asn Leu Glu Ala
130 135 140
Ala Lys Val Phe Lys Leu Thr Glu Leu Leu Pro Glu Ala Phe Gly Pro
145 150 155 160
Arg Asp Leu Glu Ile Glu Gly Gly Leu Met Lys Val Glu Asn His Lys
165 170 175
Leu Lys Ile Glu Asn Ile Asn Asp Glu Leu Ile Asn Ala Ala Leu Glu
180 185 190
Ala Ala Asn Lys Ser Tyr Ala Pro Tyr Ser Lys Asn Tyr Ser Gly Val
195 200 205
Ser Ile Gln Leu Ser Asp Gly Thr Ile Phe Ser Gly Arg Tyr Ser Glu
210 215 220
Asn Ala Ala Tyr Asn Pro Ser Leu Leu Pro Phe Gln Ser Ala Leu Ala
225 230 235 240
Phe Met Asn Met Asn Thr Lys Lys Gly Ser Asn Asn Lys Ile Val Asp
245 250 255
Ala Val Leu Val Glu Ala Val Ser Asn Ile Ser Gln Lys Asp Ala Ala
260 265 270
Gly Thr Leu Leu Asn Ser Ile Ser Lys Thr Lys Leu Arg Tyr Tyr Lys
275 280 285
Ile Lys Asn
290
<210> 119
<211> 398
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.9;
tr|A0A0P4WGY5|A0A0P4WGY5_9EUCA polypeptide sequence
<400> 119
Met Glu Glu Asn Ser Ser Ala Thr Ser Gln Pro Lys Cys Ala Ser Arg
1 5 10 15
Thr Lys Gln Gly Gly Asn Asp Leu Ser Thr Asp Met Ser Asn Leu Ser
20 25 30
Val Gly Glu Thr Lys Arg Thr Asp Phe Leu Pro Trp Asp Asp Tyr Phe
35 40 45
Met Ala Val Ala Phe Leu Ser Ala Met Arg Ser Lys Asp Pro Ser Ser
50 55 60
Gln Val Gly Ala Cys Ile Val Asn Ala Asp Lys Lys Ile Val Gly Ile
65 70 75 80
Gly Tyr Asn Gly Met Pro Ile Gly Cys Ser Asp Asp Glu Leu Pro Trp
85 90 95
Asn Lys Glu Ser Leu Asp Pro Leu Gln Thr Lys Tyr Met Tyr Val Cys
100 105 110
His Ala Glu Met Asn Ala Ile Met Asn Lys Asn Ser Ser Asp Leu Ala
115 120 125
Gly Cys Cys Val Tyr Val Ala Leu Phe Pro Cys Asn Glu Cys Ala Lys
130 135 140
Leu Val Ile Gln Ala Gly Ile Arg Glu Val Val Phe Phe Ser Asp Lys
145 150 155 160
His Gln Gln Lys Pro Glu Thr Val Ala Ser Lys Lys Met Leu Asn Met
165 170 175
Ala Gly Val Ala Tyr Arg Gln Tyr Thr Pro Ser Gln Ser Lys Ile Glu
180 185 190
Leu Asn Leu Ser Leu Lys Glu Gln Glu Lys Ser Glu Pro Thr Ala Asp
195 200 205
Ile Thr Gln Ser Ser Glu Arg Asp Gln Asn Ser Lys Arg Lys Asp Tyr
210 215 220
Leu Ser Trp Glu Glu Tyr Phe Met Ala Met Ala His Leu Ser Ala Leu
225 230 235 240
Arg Ser Lys Asp Pro Ile Thr Gln Val Gly Ala Cys Ile Val Asn Ser
245 250 255
Lys Lys Lys Ile Val Gly Ile Gly Tyr Asn Gly Met Pro Leu Gly Cys
260 265 270
Asn Asp Asp Leu Met Pro Trp Gly Asn Ser Ser Ser Asn Lys Leu Glu
275 280 285
Thr Lys Tyr Met Tyr Val Cys His Ala Gly Val Asn Ala Ile Met Asn
290 295 300
Lys Asn Ser Cys Asp Val Ser Gly Cys Thr Leu Tyr Val Ala Leu Phe
305 310 315 320
Pro Cys Asn Glu Cys Ala Lys Val Ile Ile Gln Ala Gly Ile Lys Thr
325 330 335
Ile Ile Tyr Ala Ser Asp Thr Asn Lys Asp Gln Ala Ser Ile Leu Ala
340 345 350
Ser Lys Lys Met Leu Asp Met Ala Gly Ile Lys Tyr Arg Ala Asp Asn
355 360 365
Leu Ser Gln Arg Lys Ile Val Ile Asp Phe Lys Thr Ile Asp Trp Asn
370 375 380
Ser Arg Phe Met Asn Asp His Gln Asn Asp Pro Thr Cys Leu
385 390 395
<210> 120
<211> 259
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.10;
tr|A0A3D8IG27|A0A3D8IG27_9HELI polypeptide sequence
<400> 120
Met Arg Lys Asn Ile Leu Tyr Phe Ile Leu Thr Leu Phe Phe Leu Ser
1 5 10 15
Gly Leu Tyr Ala Thr Ser Leu Pro Glu Asp Asn Val Val Ser Gly Val
20 25 30
Ile Tyr Glu Lys Ile Asp Thr Val Ser Ala Glu Val Asp His Ile Tyr
35 40 45
Pro Met Leu Ala Leu Ala Ile Val Tyr Lys Asp Trp Gln Glu Lys Asn
50 55 60
Met Leu Asn Lys Gln Gly His Asn Ile Gly Leu Val Ile Val Asp Glu
65 70 75 80
Asn Asn Met Pro Val Phe Trp Val Arg Asn Ser Val His Ala Thr His
85 90 95
Asn Gly Thr Gln His Gly Glu Val Arg Leu Val Ser Asn Leu Leu Asn
100 105 110
Cys Glu Gly Phe Asn Lys Tyr Leu Asp Lys Tyr Thr Leu Tyr Thr Thr
115 120 125
Leu Glu Pro Cys Ile Met Cys Ala Gly Met Leu Ser Met Val Gln Ile
130 135 140
Pro Lys Val Val Tyr Ala Gln Lys Asp Leu Ser Cys Gly Asn Thr Gln
145 150 155 160
Glu Ile Ile Ser Thr Ala Lys Tyr Pro Arg Tyr Tyr Lys Ala Phe Thr
165 170 175
Val Glu Asn Gly Tyr Lys Lys Asp Leu Glu Glu Cys Phe Glu Gln Tyr
180 185 190
Lys Ile Cys Lys Asn Asp Ser Ile Thr Asp Phe Leu Val Asn Asp Ser
195 200 205
Ala Lys Glu Ile Phe Arg Lys Ala Ser Asn Asp Leu Gln Asp Tyr Lys
210 215 220
Val Lys Phe Lys Glu Asn Arg Arg Val Ile Lys Val Ala Gln Glu Phe
225 230 235 240
Leu Gln Asn Ile Gln Thr Lys Asp Asn Leu Asp Val Leu Gln Cys Pro
245 250 255
Lys Asn Met
<210> 121
<211> 256
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.11;
tr|A0A351C8C4|A0A351C8C4_9BACT polypeptide sequence
<400> 121
Met Asn Glu Leu Thr Lys Gln Ser Glu His Leu Arg Asn Glu Ala Leu
1 5 10 15
Arg Ile Ala Thr Arg Ser Tyr Val Pro Tyr Thr Gly Gln Gln Glu Gly
20 25 30
Val Ile Ile Leu Leu Glu Asn Gly Asp Leu Ile Pro Gly Val Arg Val
35 40 45
Glu Asn Ala Ser Phe Gln Leu Thr Ile Pro Ala Leu Gln Asn Ala Leu
50 55 60
Ser Thr Met Tyr Ala Leu Gln Arg Thr Asp Ile Ser Met Ile Val Ser
65 70 75 80
Ser Ile Pro Phe Thr Asp Ser Asp Leu Ala Tyr Thr Gly Gly Met Ala
85 90 95
Glu Ile Ala Trp Glu Met Val Gly Ala Ser Leu Leu Leu Val Ala Gly
100 105 110
Ala His Ile Pro Glu Ala Gly Thr Phe Ile Asp Pro Ala Arg Gly Glu
115 120 125
Asn Leu Leu Asp Val Ser Arg Glu Ala Ala Leu Asn Ala Phe Ile Pro
130 135 140
Glu Ser Asp Phe Pro Val Gly Ser Ala Ile Gln Thr Ser Asp Asp Val
145 150 155 160
Val Ile Asp Gly Cys Asn Val Glu His Ser Asp Trp Ser Lys Ile Ile
165 170 175
Cys Ala Glu Arg Asn Val Leu Ser Thr Ala Arg Ser Tyr Gly Leu Gly
180 185 190
Gln Ile Thr Thr Ile Tyr Val Ser Cys Pro Lys Glu Pro Gly Gly Thr
195 200 205
Pro Cys Gly Ala Cys Arg Gln Val Ile Val Glu Leu Ala Pro Asp Ala
210 215 220
Thr Val Trp Met Asp Arg Gly Asn Gln Glu Pro Ile Ala Met Lys Ala
225 230 235 240
Thr Lys Leu Leu Pro Gly His Phe Thr Gly Asn Val Leu Lys Lys Gln
245 250 255
<210> 122
<211> 301
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.12;
tr|A0A1G6V2K7|A0A1G6V2K7_PEPNI polypeptide sequence
<400> 122
Met Pro Ile Val Arg Val Asn Glu Ile Gly Ala Arg Leu Pro Glu Asp
1 5 10 15
Trp Glu Ala Leu Glu Thr Ala Ile Trp Gln Ala Tyr Val Ser Arg Glu
20 25 30
Asp Leu Pro Asp Ala Gly Glu Leu Asp Leu Thr Leu Val Asp Asp Ala
35 40 45
Thr Ile Gln Glu Leu Asn Lys Thr His Arg Gln Leu Asp Lys Ser Thr
50 55 60
Asp Val Leu Ser Phe Pro Met Tyr Asp Asp Arg Asp Asp Leu Ala Ala
65 70 75 80
Asp Val Gln Ala Gly Leu Pro Val Ile Leu Gly Asp Ile Met Ile Ser
85 90 95
Val Pro Thr Ala Glu Arg Gln Ala Gln Ala Tyr Gly His Ser Phe Lys
100 105 110
Arg Glu Met Ala Tyr Leu Leu Val His Gly Leu Leu His Ile Ala Gly
115 120 125
Tyr Asp His Met Ser Ala Glu Glu Lys Ser Ala Met Arg Arg Ala Glu
130 135 140
Glu Ala Ile Leu Ala Asp Val Asp Val Pro Arg Asp Thr Ala Pro Ser
145 150 155 160
Lys Thr Ala Ala Val Leu Asp Glu Ala Asp Val Gln Ala Leu Ile Asp
165 170 175
Ala Ala Arg Ala Ala Arg Leu Gln Ala Tyr Ala Pro Tyr Ser Gly Tyr
180 185 190
Ala Val Gly Ala Ala Leu Leu Ala Ala Asp Gly Arg Arg Phe Cys Gly
195 200 205
Val Asn Val Glu Asn Ala Ser Tyr Gly Ala Thr Cys Cys Ala Glu Arg
210 215 220
Thr Ala Leu Phe Ala Ala Val Thr Ala Gly Ala Arg Asp Phe Ile Ala
225 230 235 240
Leu Ala Leu Val Thr Glu Gly Asp Glu Pro Ala Pro Pro Cys Gly Leu
245 250 255
Cys Arg Gln Ala Leu Ala Glu Phe Ser Pro Asp Leu Ala Ile Tyr Leu
260 265 270
Ala Gly Pro Thr Gly Glu Thr Tyr Arg Arg Thr Ser Leu Ala Ala Leu
275 280 285
Phe Pro Glu Ala Phe Ser Leu Ser Thr Lys Glu Ser Val
290 295 300
<210> 123
<211> 528
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.13;
tr|F2NP91|F2NP91_MARHT polypeptide sequence
<400> 123
Met Pro Val Met Glu Thr His Ala Leu Glu Ala Arg Phe Lys Glu Ala
1 5 10 15
Leu Ala Arg Leu Cys Pro Glu Gly Arg Leu Leu Ala Ala Val Ser Gly
20 25 30
Gly Gly Asp Ser Val Ala Leu Leu Tyr Leu Leu Lys Ala Ala Gly Arg
35 40 45
Asp Thr Ile Val Ala His Leu Asp His Ala Leu Arg Pro Asp Ser Ala
50 55 60
Ala Asp Ala Ala Phe Val Glu Lys Leu Ala Gln Arg Leu Gly Phe Pro
65 70 75 80
Leu Glu Thr Glu His Val Asp Val Arg Ala Leu Ala His Arg Lys Arg
85 90 95
Ile Asn Leu Glu Ala Ala Ala Arg Glu Val Arg Tyr Ala Phe Leu Ala
100 105 110
Arg Val Ala Arg Arg Trp Lys Ala Arg Cys Ile Leu Thr Ala His Thr
115 120 125
Leu Asp Asp Asn Ala Glu Thr Val Leu Leu Gln Ile Leu Arg Gly Ala
130 135 140
Gly Arg Gly Leu Gly Ile Arg Pro Leu Gln Arg Arg Val Ala Arg Pro
145 150 155 160
Leu Leu Glu Phe Ser Arg Ala Glu Leu Arg Ala Tyr Leu Glu Ala Arg
165 170 175
Gly Ala Arg Trp Leu Glu Asp Pro Thr Asn Arg Ser Leu Glu Leu Asp
180 185 190
Arg Asn Tyr Leu Arg His Ala Val Leu Pro Arg Ile Thr Ala Arg Phe
195 200 205
Pro His Ala Leu Glu Ala Leu Ala Arg Phe Ser Gln Ala Gln Gln Ala
210 215 220
Asp Asp Trp Ala Leu Glu Ala Leu Ser Ala Arg His Leu Ile Pro Asp
225 230 235 240
Arg Arg Trp Pro Val Pro Ala Tyr Arg Ala Leu Pro Leu Glu Arg Ala
245 250 255
Pro Glu Ala Leu Arg Arg Arg Ala Ile Arg Gly Val Leu Glu Ala Leu
260 265 270
Gly Val Arg Pro Glu Ala Arg Leu Val Ala Asp Val Glu Ala Ala Leu
275 280 285
Gly Gly Arg Ala Gln Thr Leu Pro Gly Gly Val Val Val Arg Arg Gln
290 295 300
Arg Gly Thr Leu Phe Phe Ile Pro Pro Thr Val Arg Phe Pro Lys Val
305 310 315 320
Gln Pro Pro Ala Gly Leu Glu Ala Arg Pro Pro Arg Pro Gly Asp Tyr
325 330 335
Leu Val Phe Pro Tyr Gly Arg Lys Arg Leu Val Asp Phe Leu Asn Glu
340 345 350
Arg Gly Val Pro Arg Glu Leu Lys Arg Arg Trp Pro Val Gly Ala Val
355 360 365
Gly Ala Glu Val Arg Trp Val Tyr Gly Leu Trp Pro Glu Pro Asp Glu
370 375 380
Asp Arg Tyr Met Arg Arg Ala Leu Val Leu Ala Arg Ala Ala Ala Arg
385 390 395 400
Gln Gly Glu Val Pro Ile Gly Ala Val Leu Val Arg Asp Gly Ala Val
405 410 415
Leu Ala Glu Ala Ala Asn Ala Val Glu Ala Ser Arg Asp Ala Thr Ala
420 425 430
His Ala Glu Leu Leu Ala Leu Arg Thr Ala Leu Arg Arg Val Gly Glu
435 440 445
Lys Val Leu Pro Gly Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Pro
450 455 460
Met Cys Tyr Gly Ala Ile Leu Glu Ala Arg Val Ala Arg Val Val Tyr
465 470 475 480
Gly Val Glu Asn Leu Lys Ala Gly Ala Phe Thr Val His Gly Leu Glu
485 490 495
Pro Arg Val Ala Leu Glu Ala Gly Arg Val Glu Gly Glu Cys Ala Lys
500 505 510
Val Leu Lys Asp Phe Phe Ala Arg Leu Arg Pro Gly Arg Asp Gly Ala
515 520 525
<210> 124
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.14;
tr|A0A316TX77|A0A316TX77_9BACT polypeptide sequence
<400> 124
Met Ile Asn Gly Tyr Thr Pro Tyr Ser Gly Asn Gln Asn Thr Cys Tyr
1 5 10 15
Val Lys Gly Glu Ser Gly Thr Phe Tyr Pro Gly Val Arg Ile Glu Asn
20 25 30
Val Ser Tyr Pro Leu Thr Ile Ser Ser Val Gln Ala Ala Val Cys Ser
35 40 45
Cys Leu Ala Asn Ser Asp Asn Pro Val Glu Tyr Tyr Thr Gly Asp His
50 55 60
Gln Pro Glu Leu Leu Gln Val Trp Ala Asp Glu Tyr Asp Met Lys Pro
65 70 75 80
Gly Gly Lys Leu Pro Asp Ser Pro Leu Lys Leu Phe Asp Pro Leu Val
85 90 95
Pro Ser Ile Pro Asp Ile Lys Lys Glu Leu Asp Val Leu Thr Glu Lys
100 105 110
Ser Val Thr Pro Asn Ser Gly Phe Pro Val Ser Ala Leu Leu Gln Thr
115 120 125
Glu Lys Gly Tyr Ile Arg Gly Val Asn Ile Glu Leu Ser Ser Trp Ala
130 135 140
Leu Gly Leu Cys Ala Glu Arg Val Ala Ile Ser Arg Ala Leu Thr Ala
145 150 155 160
Gly Tyr Thr Gln Phe Lys Ser Ile His Ile Tyr Ala Pro Glu Ala Asp
165 170 175
Phe Val Ser Pro Cys Gly Ala Cys Arg Gln Val Leu Leu Glu Val Met
180 185 190
Pro Asp Ala Asp Thr Glu Leu Tyr His Gly Asp Gly Thr Leu Ser Lys
195 200 205
His Ile Val Ser Asp Leu Leu Pro Phe Gly Phe Thr Ser His Lys Leu
210 215 220
Lys Lys
225
<210> 125
<211> 321
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.15;
tr|R6VYG3|R6VYG3_9FIRM polypeptide sequence
<400> 125
Met Ile His Lys Gly Thr Gln Thr Ile Glu Thr Lys Arg Leu Ile Leu
1 5 10 15
Arg Ala Phe Thr Pro Asp Asp Ala Glu Ala Ala Phe Glu Asn Trp Met
20 25 30
Ser Asp Pro Lys Val Thr Glu Phe Leu Arg Trp Lys Thr His Ala Asp
35 40 45
Ile Ser Asp Ser Arg Lys Ile Val Asn Glu Trp Ala Asn Gly Ser Ala
50 55 60
Asp Pro Glu Phe Tyr Gln Trp Ala Ile Val Pro Lys Asp Val Asn Glu
65 70 75 80
Pro Ile Gly Thr Ile Ser Val Val Asp Arg Asn Asp Ala Leu Gly Ile
85 90 95
Phe His Ile Gly Tyr Cys Ile Gly Ser Lys Trp Trp His Lys Gly Ile
100 105 110
Thr Ser Glu Ala Phe Ser Ala Val Ile His Phe Leu Phe Glu Glu Val
115 120 125
Gly Ala Asn Arg Ile Glu Ser Gln His Asp Pro Glu Asn Ile His Ser
130 135 140
Gly Asp Val Met Lys Lys Cys Gly Leu Thr Phe Glu Gly Thr Leu Arg
145 150 155 160
Gln Ala Asp Phe Asn Asn Arg Gly Ile Val Asp Ala Cys Val Tyr Ser
165 170 175
Ile Leu Gln Ser Glu Trp Gln Asn Asn Thr Ser Val Trp Gln Arg Leu
180 185 190
Tyr Asn Ala Ala Leu Thr Val Gln Asn Asp Arg Val Val Ser Pro Phe
195 200 205
Ile Asp Ala Gly Gly Val Ala Ala Ala Leu Met Thr Lys Lys Gly Asn
210 215 220
Ile Tyr Thr Gly Ile Cys Ile Asp Thr Ala Ser Thr Leu Gly Met Cys
225 230 235 240
Ala Glu Arg Asn Ala Val Ala Asn Met Leu Thr Asn Gly Glu Ser Arg
245 250 255
Ile Asp Lys Ile Val Ala Val Met Pro Asp Gly Lys Val Gly Ala Pro
260 265 270
Cys Gly Ala Cys Arg Glu Tyr Met Met Gln Leu Asp Arg Asp Ser Gly
275 280 285
Asp Ile Glu Ile Leu Leu Asp Leu Glu Thr Glu Lys Thr Val Arg Leu
290 295 300
Lys Asp Leu Ile Pro Asp Trp Trp Gly Ala Glu Arg Phe Gly Asp Thr
305 310 315 320
Glu
<210> 126
<211> 229
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.16;
tr|A0A3C1HZ18|A0A3C1HZ18_9BACI polypeptide sequence
<400> 126
Met Gly Asp Ile Met Glu Asn Trp Asn Glu Leu Ser Glu Pro Trp Lys
1 5 10 15
Arg Cys Phe Leu Gln Ala Trp Lys Ala Tyr Cys His Gly Ser Ile Pro
20 25 30
Ile Gly Ala Val Leu Val Asp Ser Glu Gly Glu Ile Phe Leu Glu Gly
35 40 45
Arg Asn Arg Val His Glu Leu Thr Ala Pro Glu Gly Gln Leu Cys Asp
50 55 60
Cys Arg Ile Ala His Ala Glu Met Asn Val Leu Val Gln Val Lys Thr
65 70 75 80
Ser Asp Tyr Glu Lys Leu Ser Gly Ala Thr Ile Tyr Ser Thr Met Glu
85 90 95
Pro Cys Ile Gln Cys Phe Gly Ala Ile Ile Leu Ser Arg Ile Lys Asn
100 105 110
Ile Ser Phe Ala Ala Ile Asp Asp Lys Leu Ala Gly Ala Thr Thr Leu
115 120 125
Glu Asp Arg His Gly Phe Ile Lys Ser Arg Asn Leu Asn Ile Ala Gly
130 135 140
Pro Phe Ser His Leu Gly Glu Ile Gln Ile Ile Leu Arg Thr Asp Phe
145 150 155 160
Leu Leu Arg Ile Phe Asp Ser Glu Tyr Ala Asp Pro Leu Ile Ala Ala
165 170 175
His Glu Lys Asp Tyr Pro Ile Gly Val Ala Leu Gly Arg His Tyr His
180 185 190
Arg Asn Asn Arg Leu Gln Val Ala Lys Lys Glu Thr Ile Pro Phe Gly
195 200 205
Glu Leu Phe Asn Glu Phe Ser Phe Asp Ile Lys Arg Ala Arg Glu Gly
210 215 220
Tyr Thr Leu Gly Lys
225
<210> 127
<211> 205
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.17;
tr|A0A1M6KV24|A0A1M6KV24_9BACT polypeptide sequence
<400> 127
Met Glu Ala Ser Gln Gln Asn Ile Leu Leu Lys Ile Glu Gly Lys Gly
1 5 10 15
Pro Val Ala Glu Ile Asn Phe Thr Val Thr Leu Pro Glu Trp Leu Val
20 25 30
Glu Gln Val Gln Ser Gly Ser Thr Val Phe Leu Thr Gln Lys Glu Lys
35 40 45
Met Arg Phe Val Leu Glu Leu Ala Arg Lys Asn Val Ala Gln Glu Thr
50 55 60
Gly Gly Pro Phe Ala Ala Ala Val Phe Ser Leu Glu Ser Gly Glu Leu
65 70 75 80
Val Ser Ala Gly Val Asn Val Val Val Glu Ser Arg Cys Ser Ser Ala
85 90 95
His Ala Glu Val Val Ala Leu Ser Leu Ala Gln Lys Ala Val Asp Ser
100 105 110
His Asp Leu Gly Ala Ala Gly Leu Pro Arg Met Val Leu Val Ser Ser
115 120 125
Ala Glu Pro Cys Ala Met Cys Met Gly Ala Ile Pro Trp Ser Gly Val
130 135 140
Lys Gln Val Ile Cys Gly Ala Arg Asp Glu Asp Val Arg Ser Val Gly
145 150 155 160
Phe Asp Glu Gly Ala Lys Pro Leu Glu Trp Val Glu Asp Phe Ala Glu
165 170 175
Arg Gly Ile Glu Val Ile Arg Asp Val Leu Arg Glu Glu Ala Thr Glu
180 185 190
Val Leu Trp Asp Tyr Arg Glu Arg Gly Gly Glu Ile Tyr
195 200 205
<210> 128
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.18;
tr|A0A2U0T9B4|A0A2U0T9B4_9RHIZ polypeptide sequence
<400> 128
Met Glu Thr Ala Glu Leu Ile Ser Arg Leu Leu Asp Val Ile Glu Lys
1 5 10 15
Asp Ile Ala Pro Val Thr Ala Lys Gly Val Ala Arg Gly Asn Lys Leu
20 25 30
Phe Gly Ala Ala Ile Leu Lys Lys Ser Asp Leu Ala Val Ile Val Ala
35 40 45
Glu Thr Asn Asn Glu Ile Glu Asn Pro Leu Trp His Gly Glu Met Gln
50 55 60
Ala Ile Lys Arg Phe Phe Glu Leu Pro Ala Asp Gln Arg Pro Ala Thr
65 70 75 80
Arg Asp Cys Leu Phe Leu Ala Thr His Glu Pro Cys Ser Leu Cys Leu
85 90 95
Ser Gly Ile Thr Trp Ser Gly Phe Asp Asn Phe Tyr Tyr Leu Phe Ser
100 105 110
His Gln Asp Ser Arg Asp Gly Phe Ala Ile Pro Tyr Asp Ile Gln Ile
115 120 125
Leu Lys Ser Val Tyr Ala Val Pro Glu Pro Glu Thr Gly Thr Val Ser
130 135 140
Pro Ala Arg Asp Leu Tyr Asn Arg Ser Asn Asp Phe Trp Thr Ser His
145 150 155 160
Gly Leu Gln Asp Met Ile Ala Gly Leu Ala Arg Ser Asn Arg Glu Ala
165 170 175
Leu Leu Ala Arg Ile Asp Asp Leu Asn Ala Leu Tyr Ala Glu Leu Ser
180 185 190
Glu Arg Tyr Gln Arg Asp Lys Gly Gly Lys Gly Ile Pro Leu Pro
195 200 205
<210> 129
<211> 231
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.19;
tr|A0A2K9PN08|A0A2K9PN08_9FLAO polypeptide sequence
<400> 129
Met Ser Asp Lys Lys Glu Ser Lys Ile Lys Ile Ser Lys Thr Ser Glu
1 5 10 15
Ser Ile Glu Leu Asp Glu Ile His Ser Leu Leu Ser Tyr Ser Ile Val
20 25 30
Gln Lys Phe Trp Glu Asn Asp Asp Arg Asn Gly Arg Gly Tyr Asn Val
35 40 45
Gly Val Ile Leu Val Asp Glu Asn Lys Asn Ile Val Asp Trp Asp Ile
50 55 60
Asn Ser Val Asn Lys Thr Glu Asn Ser Thr Gln His Gly Glu Met Arg
65 70 75 80
Leu Ile Ser Arg Tyr Leu Asp Lys Asp Glu Leu Tyr Ser Leu Lys Gly
85 90 95
Tyr Thr Met Tyr Pro Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Met
100 105 110
Met Thr Met Thr Asn Val Tyr Arg Thr Val Asn Gly Gln Met Asp Tyr
115 120 125
Phe Tyr Ser Lys Ala Leu Glu Arg Leu Ser Ile Asp Thr Arg Glu Cys
130 135 140
Gly Gly Tyr Pro Pro Tyr Pro Arg Thr Val Ile Ser Glu Ile Ser Pro
145 150 155 160
Ser Ser Ile Ser Thr Arg Leu Asp Ala Glu Tyr Lys Gln Tyr Thr Asn
165 170 175
Ala Gly Asn Lys Pro Ile Ile Thr Lys Phe Leu Ser Thr Tyr Lys Ala
180 185 190
Lys Thr Ile Tyr Asp Asp Ala Phe Asn Gln Phe Ile Asn Phe Lys Cys
195 200 205
Lys Phe Pro Glu Asn Lys Thr Lys Tyr Glu Asn Ala Ile Lys Phe Tyr
210 215 220
Asn Ser Leu Pro Glu Ser Ile
225 230
<210> 130
<211> 330
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.20;
tr|F4PWM7|F4PWM7_CAVFA polypeptide sequence
<400> 130
Met Arg Phe Ser Leu Ser Leu Leu Phe Val Ile Leu Ser Val Leu Leu
1 5 10 15
Ala Gly Val Leu Ala Cys Lys Asp Pro Tyr Asn Pro Glu Thr Val Asp
20 25 30
Tyr Gly Gln Cys Ala Ser Ala Thr Lys Ala Asn Tyr Glu Val Arg Ser
35 40 45
Asp Ser Lys Val Leu Thr Pro Ala Asp Leu Pro Ala Asp Glu Leu Ala
50 55 60
Val His Glu Ser Arg Met Arg His Ile Ile Asp Ile Ala Arg Val Asn
65 70 75 80
Asn Lys Lys Phe Val Ser Ser Ile Tyr Phe Pro Asn Gly Thr Leu Ala
85 90 95
Cys Ile Gly Ile Asn Thr Gly Lys Pro Asn Met Ile Ala His Gly Glu
100 105 110
Ile Val Ala Ile Gln Asn Cys Thr Glu Ile His Gly Ile Ser Met Tyr
115 120 125
Thr Asn Tyr Ser Ile Tyr Thr Thr Gly Glu Pro Cys Ser Met Cys Ala
130 135 140
Ser Ala Ile Leu Trp Ser Arg Phe Lys Thr Val Val Trp Ser Thr Tyr
145 150 155 160
Asn Ser Asp Leu Tyr Cys Lys Ile Cys Met Ser Asn Ile Pro Ile Asp
165 170 175
Ser Ser Tyr Ile Phe Ser Arg Ala Tyr Gly Leu Gly Ile Glu Ala Pro
180 185 190
Val Ala Ile Gly Gly Val Val Lys Ala Glu Gly Asp Ala Trp Phe Gly
195 200 205
Thr Tyr Cys Asn Arg Pro Thr Ser Ile Tyr Tyr Ile Ala Pro Lys Cys
210 215 220
Ala Cys Gln Asp Pro Ala Lys Val Ser Pro Leu Lys Phe Thr Gln Thr
225 230 235 240
Arg Thr Thr Val Trp Val Glu Gly Gly Asp Lys Val Val Thr Gln Trp
245 250 255
Asn Ala Ile Ile Ser Asn Pro Ser Asn Ser Thr Ile Val Asp Pro Pro
260 265 270
Ile Val Ile Ser Pro Ser Val Val Phe Lys Gly Ala Pro Trp Gly Ile
275 280 285
Ser Ala Ala Ser Glu Pro Asn Thr Tyr Lys Leu Ser Tyr Asn Lys Val
290 295 300
Leu Phe Pro Gly Gln Thr Phe Ser Phe Gly Tyr Ser Val Tyr Gly Leu
305 310 315 320
Glu Glu Val Ala Phe Thr Ala Leu Glu Ala
325 330
<210> 131
<211> 193
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.21;
tr|U7QZM1|U7QZM1_PHOTE polypeptide sequence
<400> 131
Met Asn Lys Thr Arg Arg Lys Leu Leu Ala Thr Leu Gly Ile Met Ser
1 5 10 15
Ile Ser Met Ser Phe Ile Ala Gln Ala Gly Glu Lys Lys Thr Gln Val
20 25 30
Ile Asn Asn Ile Leu Ser Lys Gln Glu Ile Thr Glu His Glu Lys Tyr
35 40 45
Met Arg Glu Ala Ile Lys Glu Ala Ile Lys Asn Pro Lys His Pro Phe
50 55 60
Gly Ala Val Ile Val Asn Arg Asn Asn Gly Glu Ile Leu Ser Arg Gly
65 70 75 80
Val Asn Thr Gly Arg Asn Asn Pro Ile Leu His Gly Glu Ile Gln Ala
85 90 95
Ile Asn His Tyr Ile Thr Gln Tyr Gly Asn Gln Gly Trp Glu Asn Val
100 105 110
Ala Leu Tyr Thr Thr Gly Glu Pro Cys Ser Met Cys Met Ser Ala Leu
115 120 125
Val Trp Ile Gly Ile Arg Glu Val Ile Trp Ala Thr Ser Ile Ser Val
130 135 140
Ile Arg Asn Ser Gly Ile Arg Gln Ile Asp Ile Ser Ala His Glu Ile
145 150 155 160
Ala Glu Arg Ala Ser Ser Phe Tyr Asn Pro Ile Thr Leu Val Gly Gly
165 170 175
Ile Leu Ala Asn Glu Thr Asp Lys Leu Phe Leu Glu Arg Lys Arg Gly
180 185 190
Asn
<210> 132
<211> 319
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.22;
tr|A0A081CH48|A0A081CH48_PSEA2 polypeptide sequence
<400> 132
Met Ala Ser Arg Arg His Leu Leu Ala Thr Gln Val Thr Gly Asn His
1 5 10 15
Arg Lys Leu Ser Leu Trp His Leu Arg Gly Trp Leu Ser Pro Tyr Thr
20 25 30
Lys Leu Val Asp Ala Val Tyr Phe Leu Thr Thr Asn Ser Phe Tyr His
35 40 45
Ser Leu Gln Thr Pro Pro Val Gln Ser Ile Thr Met Leu Leu Ser Ser
50 55 60
Ile Ile Thr Ser Leu Ala Leu Ala Ala Gln Ala Ser Ala Tyr Arg Glu
65 70 75 80
Gly Leu His Pro Glu Phe Gln Ser Gly Leu Ser Ile Asn Ser Val Pro
85 90 95
Ala Thr Asp Arg Asp His Trp Met Arg Leu Ala Asn Ser Ala Ile Tyr
100 105 110
Tyr Pro Pro Val Ser His Pro Cys Pro Gln Ala Pro Phe Gly Thr Ala
115 120 125
Ile Val Asn Thr Thr Ser Asn Glu Leu Ile Cys Ala Ile Ala Asn Arg
130 135 140
Val Gly Ser Thr Gly Asp Pro Thr Gln His Gly Glu Ile Thr Ala Ile
145 150 155 160
Gln His Cys Thr Asn Val Met Arg Lys Lys Gly Leu Ser Pro Gln Glu
165 170 175
Ile Ile Ala Ala Trp Lys Gln Leu Ser Leu Tyr Thr Asn Ala Glu Pro
180 185 190
Cys Thr Met Cys Leu Ser Ala Ile Arg Trp Ala Gly Phe Lys Glu Val
195 200 205
Ile Tyr Gly Thr Ser Val Gly Thr Ile Ser Glu Asn Gly Arg Asn Gln
210 215 220
Ile Tyr Ile Pro Ser Asn Leu Val Leu Glu Lys Ser Tyr Ser Phe Gly
225 230 235 240
His Ala Thr Leu Met Leu Gly Asn Ile Leu Thr His Glu Thr Asp Pro
245 250 255
Phe Phe Gln His Gln Phe Asn Glu Ser Ala Pro Cys Pro Val Gly Cys
260 265 270
Glu Arg Thr Gln Val Gly Glu Ala Arg Val Lys Thr Cys Glu Pro Val
275 280 285
Pro Asn Trp Gln Lys Leu Val Arg Leu Glu Tyr Ser Glu Asp Ser Arg
290 295 300
Val Gly Ser Glu Pro Val Ala His Thr Pro Leu His Leu Glu Leu
305 310 315
<210> 133
<211> 203
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.23;
tr|A0A3D3HMU1|A0A3D3HMU1_9GAMM polypeptide sequence
<400> 133
Met Asp Tyr Ser Asp Ala Ile Leu Gly Ala Ile Thr Ser Ile Arg Arg
1 5 10 15
Asn Ser Lys Gln Pro Gly Val Asn Val Thr Asp Asn Val Thr Asp Ser
20 25 30
Ser Thr Gln Tyr Asn Asn Asp Glu Tyr Trp Met Arg Arg Ala Leu Ala
35 40 45
Leu Ala Arg Glu Ala Gly Glu Ala Gly Glu Ile Pro Val Gly Ala Val
50 55 60
Leu Val Lys Asp Asn Gln Gln Val Ala Gly Gly Phe Asn Gln Pro Ile
65 70 75 80
Arg Ser His Asp Pro Ala Ala His Ala Glu Ile Leu Thr Leu Arg Glu
85 90 95
Ala Gly Ala Val Leu Gly Asn Tyr Arg Leu Ile Asp Thr Thr Leu Tyr
100 105 110
Val Thr Leu Glu Pro Cys Met Met Cys Ala Gly Ala Leu Val His Ser
115 120 125
Arg Ile Lys Arg Leu Val Phe Gly Ala Ala Glu Pro Lys Thr Gly Ala
130 135 140
Ala Gly Ser Phe Ile Asp Leu Leu Thr Leu Pro Arg Leu Asn His Tyr
145 150 155 160
Met Glu Val Thr Gly Gly Val Leu Gly Glu Glu Cys Ser Val Leu Leu
165 170 175
Ser Asp Phe Phe Arg Arg Arg Arg Ala Glu Lys Lys Ala Leu Lys Arg
180 185 190
Gln Asn Ser Glu Ser Gly Ser Asp Ser Ala Ser
195 200
<210> 134
<211> 270
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.24;
tr|A0A1N5WT13|A0A1N5WT13_9ACTN polypeptide sequence
<400> 134
Met Leu Glu Lys Ile Glu Arg Arg Leu Val Ala Ala Ala Glu Ala Val
1 5 10 15
Val Arg Ser Pro Ser Thr Gly Asp Ala His Thr Val Ala Ala Ala Ala
20 25 30
Met Asp Ala Asn Gly Asp Ile Tyr Ser Gly Val Asn Val Phe His Phe
35 40 45
Thr Gly Gly Pro Cys Ala Glu Leu Val Val Ile Gly Ser Ala Ala Ala
50 55 60
Ala Asn Ala Pro Pro Leu Ile Thr Ile Val Ala Val Gly Asp Gly Asp
65 70 75 80
Arg Gly Val Ile Ala Pro Cys Gly Arg Cys Arg Gln Val Met Leu Asp
85 90 95
Leu His Pro Asp Val Phe Val Ile Val Pro Thr Gly Asp Gly Gln Leu
100 105 110
Ala Ala Lys Pro Val Arg Glu Leu Leu Pro Phe Gly Tyr Val Ala Arg
115 120 125
Thr Gly Ser Thr Ala Pro Arg Val Val Tyr Phe His Pro Arg His Tyr
130 135 140
Asp Thr Ile Ser Ser Gly Leu Lys Thr Ala Thr Val Arg Phe Gln Asp
145 150 155 160
Ser Val Gln Thr Gly Pro Ala Val Phe Val Phe Asp Asp Gly Glu Ser
165 170 175
Ile Arg Arg Leu Asp Ala Val Val Glu Lys Val Glu Ser Arg Arg Leu
180 185 190
Asp His Leu Thr Glu Glu Asp Ala His His Glu Ala Leu Pro Asp Ser
195 200 205
Asp Ala Leu Arg Asp Ala Ile Lys Thr Gln Tyr Pro Met Leu Gly Asp
210 215 220
Gly Asp Val Val Asp Val Ala Thr Phe Arg Leu Thr Ala Ile Ser Ala
225 230 235 240
Pro Asp Pro Asp Pro Arg Ser Ser Tyr Pro Pro Ala Val Ser Arg Cys
245 250 255
Asn Pro Ala Gly Pro Arg Ala Asp Leu Leu Val Gly Gln Ser
260 265 270
<210> 135
<211> 257
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.25;
tr|X0SAC5|X0SAC5_9ZZZZ polypeptide sequence
<400> 135
Met Thr Lys Asp Gly Arg Val Ile Ala Ser Ala His Asp Thr Glu Val
1 5 10 15
Thr Asp Gln Asp Ser Thr Ala His Ala Glu Ile Asn Ala Ile Arg Lys
20 25 30
Ala Ser Lys Ile Tyr Arg Lys Asp Leu Thr Gly Cys Leu Ile Ile Ser
35 40 45
Thr His Glu Pro Cys Pro Met Cys Thr Gly Ser Ile Ile Trp Ser Asn
50 55 60
Ile Ser Lys Val Val Tyr Gly Val Ser Ile Arg Asp Ser Ile Lys Ala
65 70 75 80
Gly Arg Asp Met Ile Asn Leu Ser Cys Lys Glu Ile Ile Lys Lys Pro
85 90 95
Asn Ala Glu Ile Asn Ile Tyr Asp Gly Ile Leu Lys Lys Glu Cys Leu
100 105 110
Lys Leu Tyr Asn Asn Asp Thr Arg Lys Leu Val Lys Lys Phe Arg Lys
115 120 125
Tyr Glu Trp Ile Asn Ile Glu Glu Asn Leu Leu Asn Lys Arg Met Gln
130 135 140
Trp Phe Glu Asn Asn Lys Thr Met Ile Arg Lys Leu Lys Gly Asn Asp
145 150 155 160
Leu Glu Lys Ala Tyr His Leu Ile Leu Met Lys Ile Gly Ile Lys Arg
165 170 175
Ser Glu Ala Pro Ile Val Lys Lys Ser Glu Ser Lys Ile Ile Phe His
180 185 190
Ser Lys Asn Tyr Cys Pro Ser Leu Glu Ala Cys Ile Ile Leu Asp Leu
195 200 205
Asp Thr Arg Glu Val Cys Lys Glu Ile Tyr Glu Arg Pro Thr Glu Glu
210 215 220
Leu Ile Arg Arg Leu Asn Ser Lys Leu Arg Phe Thr Arg Asn Tyr Asp
225 230 235 240
Cys Ile Arg Pro Tyr Ser Asp Tyr Cys Glu Glu Ile Ile Ile Leu Glu
245 250 255
Lys
<210> 136
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.26;
tr|A0A3B8IC10|A0A3B8IC10_9BACT polypeptide sequence
<400> 136
Met Pro Ser His Glu Asp Phe Ile His Gln Cys Leu Glu Leu Gly Lys
1 5 10 15
Glu Ala Leu Leu Gln Gly Asn Pro Pro Val Gly Ser Val Ile Val Trp
20 25 30
Gln Asp Gln Val Ile Gly Arg Gly Ile Glu Asn Gly Arg Ser Ser Gly
35 40 45
Asp Ile Thr Gln His Ala Glu Leu Leu Ala Leu Gln Glu Ala Val Ala
50 55 60
Thr Gly Gln Arg Asp Lys Leu Lys Glu Ala Ile Ile Tyr Ser Thr His
65 70 75 80
Glu Pro Cys Val Met Cys Ala Tyr Pro Ile Arg Gln Tyr Lys Ile Pro
85 90 95
Thr Val Val Tyr Ser Val Ala Val Pro Glu Leu Gly Gly His Thr Ser
100 105 110
Ser Trp His Leu Leu Thr Thr Glu Asp Val Pro Lys Trp Gly Lys Ala
115 120 125
Pro Lys Ile Ile Thr Gly Ile Ser Ala Glu Glu Val Glu Ala Leu Asn
130 135 140
Ala Ala Phe Gln Asp Ser Leu Lys Lys Gly
145 150
<210> 137
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.27;
tr|A0A2N9P8B9|A0A2N9P8B9_9FLAO polypeptide sequence
<400> 137
Met Phe Ile Phe Lys Leu Ile Ser Pro Pro Val Ser Ile Glu Val Tyr
1 5 10 15
Gln Asp Lys Ile Ile Gln Lys Leu Tyr Ile Cys Phe Met Glu Asn Ile
20 25 30
Phe Thr Asp Glu Tyr Phe Met Lys Lys Ala Leu Gln Glu Ala Glu Thr
35 40 45
Ala Phe Gln Gln Gly Glu Ile Pro Val Gly Ala Val Ile Val Ile Asp
50 55 60
Asn Arg Ile Ile Ala Arg Ser His Asn Leu Thr Glu Met Leu Asn Asp
65 70 75 80
Val Thr Ala His Ala Glu Met Gln Ala Ile Thr Ala Ser Ala Asn Phe
85 90 95
Leu Gly Gly Lys Tyr Leu Lys Asp Cys Thr Leu Tyr Val Thr Leu Glu
100 105 110
Pro Cys Gln Met Cys Ala Gly Ala Leu Tyr Trp Ser Gln Ile Ser Lys
115 120 125
Ile Val Tyr Gly Ala Thr Asp Glu Gln Arg Gly Tyr Arg Ala Met Gly
130 135 140
Ala Gln Leu His Pro Lys Thr Lys Val Ile Ser Gly Ile Met Gln Asn
145 150 155 160
Glu Cys Thr His Leu Met Lys Asp Phe Phe Lys Gln Arg Arg Ser Lys
165 170 175
Ser Thr Lys Asp
180
<210> 138
<211> 178
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.28;
tr|K1KX30|K1KX30_9BACT polypeptide sequence
<400> 138
Met Val Lys Asn Pro Val Asn Asn Asn Glu Leu Tyr Phe Gly Lys His
1 5 10 15
Ser Glu Ile Pro Met Asn Glu Glu Gln Lys Ala Tyr Met Lys Met Ala
20 25 30
Val Asp Leu Ser Arg Ser Gly Met Glu Ser Gly Lys Gly Gly Pro Phe
35 40 45
Gly Cys Val Ile Val Lys Asp Gly Lys Val Ile Gly Ile Gly Ser Asn
50 55 60
Ser Val Leu Glu Thr Asn Asp Pro Thr Ala His Ala Glu Ile Val Ala
65 70 75 80
Ile Arg Asp Ala Cys Arg Asn Leu Gly His Phe Gln Leu Asp Gly Cys
85 90 95
Glu Val Tyr Thr Ser Cys Glu Pro Cys Pro Met Cys Leu Gly Ala Ile
100 105 110
Tyr Trp Ala Arg Pro Ser Lys Val Phe Phe Ala Asn Asp Lys Arg Asp
115 120 125
Ala Ala Glu Ala Gly Phe Asp Asp Asp Phe Ile Tyr Gln Glu Leu Glu
130 135 140
Leu Pro Tyr Glu Lys Arg Lys Ile Pro Phe Glu Gln Gly Met Gln Asp
145 150 155 160
Thr Ala Lys Glu Val Phe Gln Glu Trp Ile Leu Lys Glu Asp Lys Thr
165 170 175
Leu Tyr
<210> 139
<211> 196
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.29;
tr|R4XI84|R4XI84_TAPDE polypeptide sequence
<400> 139
Met Ser Ser Glu Ile Glu Pro Pro Ser Thr Asp Val His Lys His Ala
1 5 10 15
Val Ala Glu Ala Ala Asp Glu Ser Gly Ala Ala Asp Ala Phe Met Gln
20 25 30
Ile Ala Leu Gln Gln Ala Glu Thr Ala Leu Leu Asn Lys Glu Val Pro
35 40 45
Val Gly Cys Val Phe Val His Gln Pro Thr Gly Thr Val Leu Ala Thr
50 55 60
Gly Ala Asn Gln Thr Asn Ala Ser Leu Asn Gly Thr Leu His Ala Glu
65 70 75 80
Phe Val Ala Ile Glu Ser Ile Leu Arg Asp His Pro Pro Ser Ile Phe
85 90 95
Arg Glu Ser Asp Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala
100 105 110
Ser Ala Leu Arg Gln Leu Gln Val Arg Lys Val Tyr Phe Gly Cys Gly
115 120 125
Asn Asp Arg Phe Gly Gly Cys Gly Ser Val Phe Ser Ile His Ser Asp
130 135 140
Ala Ser Lys Thr Gly Asp Ala Ala Tyr Met Val Glu Ser Gly Ile Phe
145 150 155 160
Arg Lys Glu Ala Ile Met Leu Leu Arg Arg Phe Tyr Leu Leu Gln Asn
165 170 175
Glu Ser Ala Pro Lys Pro Ala Leu Lys Ser Thr Arg Val Leu Lys Glu
180 185 190
His Phe Asp Glu
195
<210> 140
<211> 212
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.30;
tr|A0A239CVF7|A0A239CVF7_9DELT polypeptide sequence
<400> 140
Met Ser Pro Ala Ser Lys Lys His Phe Pro Ser Leu Phe Ser Phe Leu
1 5 10 15
Leu Leu Thr Ile Gly Leu Ile Cys Gly Thr Ala His Ala Gln Pro Gln
20 25 30
Gly His Thr Ala Asp Asp Thr Ala Ala Thr Leu Ala Asn Ala Ser Leu
35 40 45
Lys Glu His Glu Pro Phe Ile Arg Arg Cys Tyr Gln Leu Ala Ile Asp
50 55 60
Ala Gly Lys Lys Gly Asn His Pro Phe Gly Ala Leu Leu Val His Lys
65 70 75 80
Gly Lys Ile Val Leu Glu Ala Glu Asn Thr Val Leu Thr Asp Asn Asp
85 90 95
Phe Thr Asn His Ala Glu Met Asn Leu Ile Ala Glu Ala Ala Arg Thr
100 105 110
Leu Ser Arg Gln Ile Ile Pro Glu Ala Thr Val Tyr Thr Ser Cys Ala
115 120 125
Pro Cys Ala Met Cys Thr Ala Thr Leu Ala Met Ala Gly Phe Thr Arg
130 135 140
Ile Val Tyr Gly Val Ser His Asp Ala Leu Asn Lys Arg Phe Gly Leu
145 150 155 160
Lys Gly Lys Ser Val Ser Cys Pro Ala Leu Phe Lys Thr Met Gly Met
165 170 175
Glu Leu Glu Phe Val Gly Pro Val Leu Glu Lys Glu Gly Leu Arg Val
180 185 190
Phe Asp Phe Trp Pro Glu Lys Asp Pro His Ala Gln Met Leu Lys Lys
195 200 205
Gln Ala Arg Lys
210
<210> 141
<211> 320
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.31;
tr|A0A1Q3NME1|A0A1Q3NME1_9BACT polypeptide sequence
<400> 141
Met Thr Glu Phe Asn Tyr Asp Trp Ala Lys Leu Ala Phe Ser Ser Lys
1 5 10 15
Arg Pro Leu Thr Asn Leu Lys Ala Thr Phe Ile Ile Ala Pro Arg Glu
20 25 30
Ile Ser Glu Lys Arg Phe Thr Gln Leu Leu Lys Glu Tyr Leu Pro Lys
35 40 45
Gly Asp Ile Leu Leu Gly Ile Ser Lys Glu Asp Tyr Val Glu Gly Leu
50 55 60
Glu Gly Gln Pro Gln Phe Ala Met Leu Gln Gln Lys Thr Leu Gln Lys
65 70 75 80
Leu Ile Asp Lys Val Asn Asp Ala Ser Ala His Lys Val Tyr Thr Leu
85 90 95
Arg Tyr Phe Gln Arg Glu Leu Pro Ala Ile Ile Glu Lys Leu Thr Pro
100 105 110
Pro Arg Val Val Gly Ile His Gly Ser Trp His His Ser Phe His Thr
115 120 125
Leu Pro Ile Tyr Tyr Leu Leu Ser Glu Lys Arg Ile Pro Tyr Gln Leu
130 135 140
Val Ala Ala Phe Ser Asp Glu Asp Glu Ala Arg Ala Tyr Glu Val Ala
145 150 155 160
Thr Asp Lys Lys Ile Val Arg Pro Thr Leu Glu Gly Ser Phe Asp Asp
165 170 175
Thr Thr Val Leu Gln Leu Thr Asp Glu Val Ala Lys Ser Ser Tyr Asp
180 185 190
Tyr Gly Phe Gln Thr Gly Ala Ile Leu Ala Glu Lys Val Asn Gly Val
195 200 205
Tyr Gln Pro Val Ala Ala Gly Phe Asn Lys Val Val Pro Tyr Gln Thr
210 215 220
Tyr Ala Leu Leu Asn Gly Ala Ser Arg Glu Thr Asn Phe Ser Pro Ala
225 230 235 240
Asn Asp Met Asn His Tyr Asp Thr Ile His Ala Glu Met Gln Ile Leu
245 250 255
Val Glu Ala Ala Lys Gln Gly Ile Ser Leu Lys Asp Lys Thr Leu Phe
260 265 270
Val Asn Leu Met Pro Cys Pro Ser Cys Ala Arg Thr Leu Ser Gln Thr
275 280 285
Glu Leu Ser Glu Ile Val Tyr Arg Ile Asp His Ser Gly Gly Tyr Ala
290 295 300
Val Asp Leu Leu Thr Lys Val Gly Lys Asp Ile Arg Arg Ile Val Tyr
305 310 315 320
<210> 142
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.32;
tr|A0A2G6N4N7|A0A2G6N4N7_9DELT polypeptide sequence
<400> 142
Met Lys Glu Arg Thr Val Ser Tyr Ser Asp Arg His Phe Met Ala Glu
1 5 10 15
Ala Leu Glu Met Ala Glu Ser Ala Leu Thr Gln Gly Glu Phe Pro Val
20 25 30
Gly Cys Val Ile Ala Asp Gly Thr Ala Val Val Ala Arg Gly His Arg
35 40 45
Thr Gly Thr Thr Ala Gly Ala Val Asn Glu Ile Asp His Ala Glu Ile
50 55 60
Asn Ala Leu Arg His Leu Gly Leu Ala Gly Glu His Leu Asp Arg Thr
65 70 75 80
Asp Leu Thr Ile Tyr Ser Thr Met Glu Pro Cys Leu Met Cys Phe Ala
85 90 95
Ala Ile Val Leu Ser Gly Ile Asn Arg Ile Val Tyr Ala Tyr Glu Asp
100 105 110
Val Met Gly Gly Gly Thr Gly Cys Asp Leu Thr Gly Leu Pro Pro Leu
115 120 125
Tyr Arg Asp Ala Pro Leu Thr Leu Val Ala Gly Val Arg Arg Arg Ala
130 135 140
Ser Leu Asn Leu Phe Arg Arg Phe Phe Thr Asp Pro Glu Asn Gly Tyr
145 150 155 160
Trp Ala Gly Ser Leu Leu Ser Arg Tyr Thr Leu Asn Gln Thr Lys Asp
165 170 175
Ser His Arg Leu
180
<210> 143
<211> 156
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.33;
tr|A0A0G0RBB8|A0A0G0RBB8_9BACT polypeptide sequence
<400> 143
Met Gln Ser Val Gln Tyr Asn Lys Leu Thr His Leu Gln Arg Arg Ala
1 5 10 15
Leu Asp Glu Ala Glu Gln Val Leu Glu Asn Ser Tyr Asn Pro Tyr Ser
20 25 30
His Phe Tyr Val Gly Ala Cys Leu Ile Ser Glu Asp Glu Gln Leu Ile
35 40 45
Ala Gly Thr Asn Phe Glu Asn Ala Ala Tyr Gly Ser Ala Ile Cys Ala
50 55 60
Glu Arg Ala Ala Val Leu Arg Ala Asn Ala Met Ser Ile Arg Arg Phe
65 70 75 80
Arg Gly Ile Ala Ile Ile Ala Arg Gly Glu Asp Phe Asn Thr Thr Glu
85 90 95
Val Thr Gly Pro Cys Gly Ser Cys Arg Gln Val Leu Tyr Glu Ile Ser
100 105 110
Gln Val Ser Gly Cys Asp Leu Gln Val Ile Leu Ala Thr Ser Lys Lys
115 120 125
Asp Lys Ile Val Ile Thr Thr Ile Arg Glu Leu Leu Pro Leu Ala Phe
130 135 140
Gly Pro Leu Asp Leu Gly Val Asp Ile Gly Lys Tyr
145 150 155
<210> 144
<211> 217
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.34;
tr|A0A327L2Q5|A0A327L2Q5_9RHIZ polypeptide sequence
<400> 144
Met Val Thr Ser Arg Asp Gly Glu Asp Glu Ala Met Met Ala Arg Cys
1 5 10 15
Val Ala Leu Ser Arg Ile Ala Val Gly Lys Gly Glu Tyr Pro Phe Gly
20 25 30
Ala Val Val Ala Arg Glu Gly Arg Ile Val Ala Glu Ala Ile Asn Arg
35 40 45
Thr Ile Arg Asp Gly Asp Val Ser Arg His Ala Glu Val Ile Ala Leu
50 55 60
Ala Arg Ala Gln Lys Ala Ile Gly Arg Arg Glu Leu Arg Glu Cys Ser
65 70 75 80
Leu Tyr Ser Asn Val Glu Pro Cys Ala Met Cys Ser Tyr Cys Ile Arg
85 90 95
Glu Ala Trp Val Gly Arg Val Val Tyr Ala Leu Gly Ser Pro Val Met
100 105 110
Gly Gly Val Ser Lys Trp Asn Ile Leu Arg Asp Asp Gly Leu Ser Gly
115 120 125
Arg Met Pro Gln Val Phe Asp Ala Ala Pro Glu Val Val Ser Gly Val
130 135 140
Leu Val Glu Gln Ala Gln Ala Ala Trp Arg Asp Trp Ser Pro Leu Ala
145 150 155 160
Trp Glu Met Ile Thr Leu Arg Gly Leu Met Thr Asp Pro Ser Ala Arg
165 170 175
Pro Glu Cys Arg Thr Arg Ala Ala Arg Pro Arg Ser Leu Trp His His
180 185 190
Leu Val Ala Leu Ile Glu Arg Pro Pro Arg Pro Tyr Val Asp Pro Thr
195 200 205
Ser Ala Ala Glu Gly His Ala Asp Leu
210 215
<210> 145
<211> 162
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.35;
tr|S2DR30|S2DR30_9BACT polypeptide sequence
<400> 145
Met Lys Met Lys Lys Lys Ile Glu Ile Thr Val Ser Leu Glu Val Ile
1 5 10 15
Gln Lys Ser Glu Trp Ser Lys Glu Asp Arg Ser Leu Ile Glu Arg Ala
20 25 30
Ile His Ala Val Glu His Ala His Ala Pro Tyr Ser Asn Phe Met Val
35 40 45
Gly Thr Ala Leu Leu Leu Asp Asn Gly Gln Ile Phe Ser Ala Asn Asn
50 55 60
Gln Glu Asn Val Ser Phe Pro Val Gly Ile Cys Ala Glu Arg Ala Val
65 70 75 80
Leu Ser Tyr Ala Met Gly Asn Phe Pro Asn Asn Arg Pro Val Lys Leu
85 90 95
Ala Val Val Ala Lys Arg Arg Ser Asp Ser Thr Trp Ala Thr Val Thr
100 105 110
Pro Cys Gly Leu Cys Arg Gln Thr Ile Asn Glu Tyr Glu Val Lys Phe
115 120 125
Gly His Pro Ile Glu Ile Leu Met Leu Asn Pro Gly Glu Glu Ile Leu
130 135 140
Lys Ala Ser Gly Ile Asp Gln Leu Leu Pro Phe Arg Phe Asn Asp Leu
145 150 155 160
Asn Ser
<210> 146
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.36;
tr|A0A369QGF1|A0A369QGF1_9BACT polypeptide sequence
<400> 146
Met Glu Glu His Glu Lys Trp Met His Trp Cys Leu Asn Leu Ala Gln
1 5 10 15
Gln Ala Leu Gln Gln Gly Asp Phe Pro Val Gly Ala Val Val Val Gln
20 25 30
Lys Gly Lys Leu Ile Gly Gln Gly Val Glu Ala Gly Gln Leu Lys Lys
35 40 45
Asp Ile Thr Cys His Ala Glu Met Glu Ala Ile Arg Asp Ala Arg Gln
50 55 60
Thr Ile Asn Thr Ala Asp Leu Gln Asn Cys Ile Leu Tyr Ser Thr His
65 70 75 80
Glu Pro Cys Ile Met Cys Ser Tyr Val Ile Arg His His Lys Ile Ser
85 90 95
Arg Val Val Val Gly Thr Thr Val Pro Glu Val Gly Gly Ser Ser Ser
100 105 110
Ala Tyr Pro Leu Leu Ser Ala Pro Asp Ile Ser Ile Trp Val Ala Pro
115 120 125
Pro His Leu Val Thr Gly Val Leu Ala Glu Ala Cys Gln Ala Leu Ser
130 135 140
Gln Ala Tyr Lys Gln Lys Phe Lys Lys
145 150
<210> 147
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.37;
tr|A0A1W6X4U4|A0A1W6X4U4_9RHIZ polypeptide sequence
<400> 147
Met Thr Asn Pro Ser Arg Gln Glu Arg Trp Asp Arg Arg Phe Leu Glu
1 5 10 15
Leu Ala Lys Val Phe Gly Thr Trp Ser Lys Asp Arg Ser Ala Gly Thr
20 25 30
Gly Cys Val Ile Val Gly Pro Asp Arg Leu Leu Arg Ala Ser Gly Tyr
35 40 45
Asn Gly Phe Ala Arg Gly Ile Asp Asp Glu Val Pro Glu Arg His Glu
50 55 60
Arg Pro Ala Lys Tyr Ser Trp Thr Glu His Ala Glu Arg Asn Ala Ile
65 70 75 80
Tyr Asn Ala Ala Lys Leu Gly Ile Ser Leu Asp Gly Cys Thr Ala Tyr
85 90 95
Val Asn Trp Phe Pro Cys Ile Asp Cys Ala Arg Ala Ile Val Gln Ala
100 105 110
Gly Ile Val Arg Leu Val Gly Leu His Pro Asp His Ala Asp Gln Arg
115 120 125
Trp Gly Ser Glu Phe Lys Phe Ala Thr Glu Met Leu Arg Glu Ser Gly
130 135 140
Ile Glu Ile Ile Leu Tyr Asp Ile Pro Glu Leu Ala Ala Arg Lys
145 150 155
<210> 148
<211> 490
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.38;
tr|A0A238BW09|A0A238BW09_9BILA polypeptide sequence
<400> 148
Met Glu Glu Met Ala Arg Lys Ile Arg Thr Lys Ala Lys Lys Ala Asn
1 5 10 15
Ser Tyr Cys Asn Thr Met Thr Phe Leu Ile Ser Lys Ala Ser Ile Val
20 25 30
Leu Leu Lys Ala Glu Cys Lys Arg Ile Glu Leu Thr Val Val Ile Phe
35 40 45
Arg Phe Leu Ile Lys Met Asn Ala Ser Glu Pro Asn Asn Glu Leu Cys
50 55 60
Asp Met Thr Val Ile Lys Ser Met Leu Lys Ile Thr His Val Ile Phe
65 70 75 80
Asp Leu Asp Gly Leu Leu Ile Asp Thr Glu Val Val Phe Ser Lys Val
85 90 95
Asn Gln Cys Leu Leu Ser Lys Tyr Asn Lys Lys Phe Thr Pro His Leu
100 105 110
Arg Gly Leu Val Thr Gly Met Pro Lys Lys Ala Ala Val Thr Tyr Ile
115 120 125
Leu Glu His Glu Lys Leu Ser Ala Lys Val Asp Val Asp Glu Tyr Cys
130 135 140
Lys Lys Tyr Asp Glu Met Ala Glu Glu Met Leu Pro Lys Cys Ser Leu
145 150 155 160
Met Pro Gly Val Met Lys Leu Val Arg His Leu Lys Thr His Ser Ile
165 170 175
Pro Met Ala Ile Cys Thr Gly Ala Thr Lys Lys Glu Phe Glu Ile Lys
180 185 190
Thr Arg Tyr His Lys Glu Leu Leu Asp Leu Ile Ser Leu Arg Val Leu
195 200 205
Ser Gly Asp Asp Pro Ala Val Lys Arg Gly Lys Pro Ala Pro Asp Pro
210 215 220
Phe Leu Val Thr Met Asp Arg Phe Lys Gln Lys Pro Glu Lys Ala Glu
225 230 235 240
Asn Val Leu Val Phe Glu Asp Ala Ala Asn Gly Val Cys Ala Ala Ile
245 250 255
Ala Ala Gly Met Asn Val Ile Met Val Pro Asp Leu Thr Tyr Met Lys
260 265 270
Ile Pro Glu Gly Leu Gln Asn Lys Ile Asn Ser Phe Ser Asp Asn Leu
275 280 285
Ile Ile Ser Asn Asp Leu Asn Val Ala Leu Met Ser Leu Lys Lys Glu
290 295 300
Leu Ser Glu Glu Glu Val His Phe Leu Asn Arg Ala Phe Glu Ile Ala
305 310 315 320
Val Asp Ala Val Leu Asn Asn Glu Val Pro Val Gly Cys Val Phe Val
325 330 335
Phe Glu Gly Gln Glu Val Ala Phe Gly Arg Asn Asp Val Asn Arg Thr
340 345 350
Lys Asn Pro Thr Tyr His Ala Glu Met Val Ala Leu Lys Met Met Lys
355 360 365
Gln Trp Cys Met Asp Asn Gly Arg Asp Leu Glu Glu Ile Met Arg Arg
370 375 380
Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Ile Met Cys Ala Ser Ala
385 390 395 400
Leu Tyr His Leu Arg Leu Lys Lys Ile Leu Tyr Gly Ala Ala Asn Glu
405 410 415
Arg Phe Gly Gly Leu Val Ser Val Gly Thr Arg Glu Lys Tyr Gly Ala
420 425 430
Lys His Phe Ile Glu Ile Met Pro Asn Leu Ser Val Asp Arg Ala Val
435 440 445
Lys Leu Leu Lys Glu Phe Tyr Glu Lys Gln Asn Pro Phe Cys Pro Glu
450 455 460
Glu Lys Arg Lys Val Lys Lys Pro Lys Lys Ser Gly Asn Asn Asn Asp
465 470 475 480
Asn Ser Asp Asp Ala Val Ala Leu Asn Val
485 490
<210> 149
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.39;
tr|A0A1J5H6Z0|A0A1J5H6Z0_9BACT polypeptide sequence
<400> 149
Met Ala Tyr Gln Pro Ser Glu Lys Phe Met Gln Met Ala Ile Asp Lys
1 5 10 15
Thr Arg Glu Gly Val Leu Ser Gly Gln Thr Pro Phe Gly Ala Cys Ile
20 25 30
Val Lys Asp Gly Lys Val Val Ala Cys Glu His Asn Thr Val Trp Gln
35 40 45
Asp Thr Asp Ile Thr Ser His Gly Glu Val His Thr Ile Arg Ala Ala
50 55 60
Cys Lys Ala Ile Gly Ser Ile Asp Leu Ser Gly Cys Ile Leu Tyr Ser
65 70 75 80
Thr Cys Glu Pro Cys Pro Met Cys Phe Ser Ala Ile His Trp Ala Arg
85 90 95
Ile Asp Thr Val Val Tyr Gly Ala Phe Ile Ala Asp Ala Gln Asp Ala
100 105 110
Gly Phe Asn Glu Leu Thr Ile Ser Asn Glu Lys Met Lys Glu Phe Gly
115 120 125
Gly Ser Pro Val Asn Phe Ile Ser Gly Phe Met Arg Asp Glu Asn Val
130 135 140
Ala Leu Phe Lys Leu Trp Lys Glu Gln Gly Ala Asn Asn Val Tyr
145 150 155
<210> 150
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.40;
tr|A0A3C2D945|A0A3C2D945_9BACT polypeptide sequence
<400> 150
Met Lys Thr Thr Glu Ile Arg Ile Ile Val His Glu Tyr Gln Asn Ile
1 5 10 15
Asp Glu Leu Thr Glu Asn Asp Gln Tyr Leu Leu His Glu Ala Arg Arg
20 25 30
Ile Thr Glu Phe Ala Tyr Ala Pro Tyr Ser Gly Phe His Val Gly Ala
35 40 45
Ala Ile Leu Leu Gly Asn Gly Met Ile Val Lys Gly Asn Asn Gln Glu
50 55 60
Asn Ser Ala Tyr Pro Ser Gly Leu Cys Ala Glu Arg Val Ala Leu Phe
65 70 75 80
Tyr Ala Asn Ala Asn Tyr Pro Asp Ser Glu Val Lys Thr Ile Ala Ile
85 90 95
Ser Ala Ala Lys Asn Gly Ile Leu Val Asn Asp Pro Ile Lys Pro Cys
100 105 110
Gly Gly Cys Arg Gln Thr Leu Ser Glu Ala Glu Val Arg Phe Gly Ser
115 120 125
Pro Ile Arg Ile Ile Leu Asp Gly Gln Asp Ser Ile Leu Val Leu His
130 135 140
Gly Val Glu Ser Leu Leu Pro Leu Ser Phe Ser Lys Lys Asp Leu Ala
145 150 155 160
Ser Pro Leu Ala Ala Thr Gly Arg
165
<210> 151
<211> 214
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.41;
tr|A0A1I7EYS3|A0A1I7EYS3_9BURK polypeptide sequence
<400> 151
Met Lys Phe Lys Leu Asp Pro Ser Arg Pro Pro Asp Glu Asp Asp Tyr
1 5 10 15
Tyr Leu Gly Val Ala Leu Ala Val Arg Arg Lys Ala Asn Cys Thr Gly
20 25 30
Asn Arg Val Ala Ala Val Ile Val Lys Asn Lys Arg Val Ile Ala Thr
35 40 45
Gly Tyr Asn Gly Val Pro Glu Asp Met Pro Asn Cys Leu Asp Gly Gly
50 55 60
Cys Leu Arg Cys Ser Asn Pro Gly Gly Gln Phe Lys Ser Gly Thr Arg
65 70 75 80
Tyr Asp Leu Cys Ile Cys Val His Ala Glu Gln Asn Ala Leu Leu Thr
85 90 95
Ala Ala Arg Phe Gly Ile Ser Val Glu Gly Ala His Leu Tyr Thr Thr
100 105 110
Met Gln Pro Cys Phe Gly Cys Ala Lys Glu Ile Leu Gln Ala Lys Ile
115 120 125
Glu Lys Val Phe Tyr Leu His Pro Trp Val Pro Thr Asp Val Asp Pro
130 135 140
Val Met Asp Ala Ala Met Lys Ala Glu Tyr Ala Lys Ile Ile Gly Lys
145 150 155 160
Leu Lys Val Lys Lys Leu Asp Phe Asp Asp Pro Val Ala Thr Trp Ala
165 170 175
Val Thr Thr Met Arg Gln Ala Ala Leu Ala Ser Asp Lys Asn Pro Asp
180 185 190
Lys Lys Thr Pro Pro Lys Thr Ala Lys Lys Lys Val Ala Lys Lys Lys
195 200 205
Ser Arg Thr Ser Pro Arg
210
<210> 152
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.42;
tr|H8GQX8|H8GQX8_METAL polypeptide sequence
<400> 152
Met Asn His Glu His Phe Met Arg Arg Ala Ile Glu Leu Ala Arg Gln
1 5 10 15
Ala Pro Gln Tyr Pro Phe Gly Ala Val Ile Val Arg Arg Asp Asp Gly
20 25 30
Gln Cys Val Gly Gln Gly Phe Asn Arg Ser Asp Leu Asn Pro Thr Tyr
35 40 45
His Gly Glu Met Val Ala Ile Asn Asp Cys Ala Val Arg His Cys Ala
50 55 60
Glu Asp Trp Arg Gly Phe Asp Leu Tyr Thr Thr Ala Glu Pro Cys Ala
65 70 75 80
Met Cys Gln Gly Ala Ile Glu Trp Ala Gly Ile Gly Arg Val Phe Tyr
85 90 95
Gly Thr Ser Ile Pro Tyr Leu Gln Lys Leu Gly Trp Trp Gln Ile Asp
100 105 110
Leu Arg Ala Ala Glu Val Ser Ala Arg Ala Val Phe Arg Asp Thr Leu
115 120 125
Ile Val Gly Gly Ile Leu Glu Thr Glu Cys Asn Ala Leu Phe Ala Ala
130 135 140
Ala Arg Arg Gly Cys Phe Gly Thr Gly Ser Glu
145 150 155
<210> 153
<211> 156
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.43;
tr|A0A0S8HZN3|A0A0S8HZN3_9CHLR polypeptide sequence
<400> 153
Met Asp Glu His Asp Ile Arg Phe Leu Arg Ala Ser Phe Asp Val Ala
1 5 10 15
Arg Asn Ala Arg Lys Asn Gly Asn His Pro Phe Gly Ala Leu Leu Val
20 25 30
Asp Glu His Gly Arg Ile Val Met Glu Ala Glu Asn Thr Val Ile Thr
35 40 45
Ala Lys Asp Cys Thr Gly His Ala Glu Thr Asn Leu Met Arg Glu Ala
50 55 60
Ser Ser Lys Tyr Asp Ser Asp Phe Leu Ala Asn Cys Thr Ile Tyr Thr
65 70 75 80
Ser Thr Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Phe Trp Ser Asn
85 90 95
Val Arg Arg Val Val Tyr Gly Leu Ser Glu Glu Ser Leu Tyr Glu Ile
100 105 110
Ala Gly Arg Gly Ser Glu Glu Val Leu Phe Leu Ser Cys Arg Glu Ile
115 120 125
Phe Glu Arg Gly Lys Lys Leu Ile Glu Val Ile Gly Pro Leu Leu Glu
130 135 140
Asp Glu Ala Arg Glu Val His Met Gly Phe Trp Arg
145 150 155
<210> 154
<211> 193
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.44;
tr|E3SF31|E3SF31_9CAUD polypeptide sequence
<400> 154
Met Lys Pro Thr Thr Val Leu Gln Ile Ala Tyr Leu Val Ser Gln Glu
1 5 10 15
Ser Lys Cys Cys Ser Trp Lys Val Gly Ala Val Ile Glu Lys Asn Gly
20 25 30
Arg Ile Ile Ser Thr Gly Tyr Asn Gly Ser Pro Ala Gly Gly Val Asn
35 40 45
Cys Cys Glu His Ala Glu Glu Gln Gly Trp Leu Leu Asn Lys Pro Lys
50 55 60
Pro Val Leu Ile Pro Gly His Lys Ser Glu Cys Val Arg Phe Ser Gln
65 70 75 80
Val Asp Arg Phe Val Leu Ala Lys Ala His Arg Glu Ala His Ser Ala
85 90 95
Trp Ser Lys Asn Asn Glu Ile His Ala Glu Leu Asn Ala Ile Leu Phe
100 105 110
Ala Ala Arg Met Gly Ser Ser Ile Glu Gly Ala Thr Met Tyr Val Thr
115 120 125
Leu Ser Pro Cys Pro Asp Cys Ala Lys Ala Ile Ser Gln Ser Gly Ile
130 135 140
Lys Lys Leu Val Tyr Cys Glu Thr Tyr Asp Lys Asn Ile Pro Gly Trp
145 150 155 160
Asp Asp Ile Leu Lys Asn Ala Gly Ile Glu Val Phe Asn Val Pro Lys
165 170 175
Arg Ser Leu Asp Lys Leu Asn Trp Glu Asn Ile Asn Glu Phe Cys Gly
180 185 190
Glu
<210> 155
<211> 330
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.45;
tr|F8AAC6|F8AAC6_THEID polypeptide sequence
<400> 155
Met Ile Arg Ala Pro Trp His Glu Tyr Phe Met Leu Leu Ala Lys Ile
1 5 10 15
Val Ala Leu Arg Ser Gly Cys Asn Ser Arg Pro Ser Gly Ala Val Ile
20 25 30
Val Lys Asn Lys Arg Ile Leu Ala Thr Gly Tyr Asn Gly Pro Met Pro
35 40 45
Gly Ala Trp His Cys Thr Asp Arg Gly Pro Gly Tyr Cys Phe Arg Arg
50 55 60
Glu Lys Gly Ile Pro Asp Ile Asp Lys Tyr Asn Phe Cys Arg Ala Thr
65 70 75 80
His Ala Glu Ala Asn Ala Ile Ala Gln Ala Ala Arg Phe Gly Ile Ser
85 90 95
Val Glu Gly Ala Ser Leu Tyr Cys Thr Leu Ala Pro Cys Tyr Val Cys
100 105 110
Leu Lys Leu Ile Ala Ser Ala Gly Ile Lys Lys Val Tyr Tyr Glu His
115 120 125
Asp Tyr Gly Ser Arg Asp Phe Glu Arg Asp Gln Phe Trp Lys Glu Ala
130 135 140
Ile Lys Glu Ala Gly Leu Glu Lys Phe Glu Gln Ile Thr Val Ser Gln
145 150 155 160
Glu Val Met Glu Gln Leu Gln Glu Ile Leu Pro Tyr Pro Thr Ser Lys
165 170 175
Arg Arg Leu Ala Pro Thr Glu Phe Leu Asp Glu Phe Glu Asp Gly Lys
180 185 190
Lys Tyr Gly Val Pro Ser Ile Glu Val Leu Phe Asn Lys Leu Asn Tyr
195 200 205
Leu Thr Arg Gln Ala Leu Lys Asp Ile Thr Phe Val Ile Glu Lys Thr
210 215 220
Thr Val Thr Glu Glu Pro Glu Gly Ile Ser Phe Tyr Leu Ser Gly Lys
225 230 235 240
Met Val Glu Leu Ser Glu Leu Ile Asn Thr Val Lys Lys Gln Ile Asn
245 250 255
Ala Asp Gln Asn Phe Tyr Phe Leu Ala Lys His Asn Ala Ile Glu Ala
260 265 270
Lys Ile Glu Ile Leu Arg Glu Ala Glu Asn Ile Arg Leu Lys Ala Phe
275 280 285
Leu Asn Glu Cys Pro Leu Glu Ser Phe Lys Arg Ile Ala Glu Ser Leu
290 295 300
Asp Tyr Ile Leu Tyr Gln Val Ser Asn Ser Leu Ser Leu Pro Thr Arg
305 310 315 320
Leu Glu Leu Ser Val Asn Leu Leu Arg Ile
325 330
<210> 156
<211> 158
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.46;
tr|A0A2H4ZNK4|A0A2H4ZNK4_9EUKA polypeptide sequence
<400> 156
Met Lys Lys Gln Leu Ser Arg Lys Ile Gln Glu Glu Trp Met Ser Arg
1 5 10 15
Leu Leu Arg Asn Ala Tyr Asp Ala Gly Thr Tyr Gly Glu Val Pro Ile
20 25 30
Ala Ala Val Ile Leu Asn Glu Ser Gly Gln Cys Ile Gly Trp Gly Arg
35 40 45
Asn Cys Arg Glu Lys Asp Gln Asn Pro Leu Gly His Ala Glu Ile Ile
50 55 60
Ala Leu Arg Gln Ala Ser Tyr Leu Lys Lys Ser Trp Arg Phe Asn Glu
65 70 75 80
Cys Thr Met Leu Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala
85 90 95
Leu Leu Gln Ala Arg Ile Asn His Ile Ile Tyr Gly Ala Ser Asp Tyr
100 105 110
Lys Arg Gly Gly Phe Gly Gly Val Leu Asp Leu Ser Lys Asn Ser Ser
115 120 125
Ala His His Lys Ile Glu Ile Thr Arg Gly Val Lys Ser Ile Gln Ser
130 135 140
Cys Gln Leu Leu Glu Thr Trp Phe Arg Arg Arg Arg Arg Val
145 150 155
<210> 157
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.47;
tr|A0A239N5N1|A0A239N5N1_9PSED polypeptide sequence
<400> 157
Met Glu Gly Arg Ala Gly Ile Ile Pro Phe Asp Glu Gly Gly Ala Ala
1 5 10 15
Met Gly Pro Ala Glu Glu Asp Ser Pro Met Gln His Leu Ala Tyr Met
20 25 30
Arg Glu Ala Leu Ala Leu Ala Arg Ala Asn Val Glu Ala Gly Gly Arg
35 40 45
Pro Phe Gly Ala Val Leu Val Arg Asp Gly Glu Val Ile Ala Arg Ala
50 55 60
Ala Asn Gly Thr His Leu Asp His Asp Pro Thr Ala His Ala Glu Leu
65 70 75 80
Leu Ala Leu Arg Ala Ala Gly Arg Ala Leu Gly Ser Pro Arg Leu Asp
85 90 95
Gly Cys Val Val Tyr Ala Ser Gly His Pro Cys Pro Met Cys Leu Ala
100 105 110
Ala Met His Leu Ser Gly Val Ser Ala Ala Tyr Tyr Ala Tyr Ser Asn
115 120 125
Ala Asp Gly Glu Pro Tyr Gly Leu Ser Thr Ala Ala Val Tyr Ala Gln
130 135 140
Met Ala Gln Pro Val Glu Trp Gln Ser Leu Pro Leu Gln Ala Leu Arg
145 150 155 160
Pro Glu Asp Glu Glu Gly Leu Tyr Gly Phe Trp Arg Glu Arg Arg Pro
165 170 175
<210> 158
<211> 199
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.48;
tr|A0A328VTR2|A0A328VTR2_9PSED polypeptide sequence
<400> 158
Met His Pro Glu His Leu Ala Leu Leu Gln Gln Ala Pro Ala Ser Thr
1 5 10 15
His Ala Asp Asp Thr Trp Ala Arg Leu Cys Cys Glu Gln Ala Leu Leu
20 25 30
Ala Val Glu Glu Gly Cys Tyr Ala Val Gly Ala Leu Leu Val Asp Gly
35 40 45
Ala Gly Glu Leu Leu Cys Ser Gly Arg Asn Gln Val Phe Ala Pro Ala
50 55 60
Tyr Ala Ser Ala Ala His Ala Glu Met Arg Val Leu Asp Gln Leu Glu
65 70 75 80
Ala Glu His Ala Gln Val Asp Arg Arg Ser Leu Thr Leu Tyr Val Ser
85 90 95
Leu Glu Pro Cys Leu Met Cys Tyr Gly Arg Ile Leu Leu Ala Gly Ile
100 105 110
Thr Arg Val Arg Tyr Leu Ala Arg Asp Arg Asp Gly Gly Phe Ala Leu
115 120 125
Arg His Gly Arg Leu Pro Pro Ala Trp Ala Asn Leu Ala Ser Gly Leu
130 135 140
Ser Val Val Gln Ala Lys Ala Asp Pro Tyr Trp Leu Asp Leu Ala Glu
145 150 155 160
His Ala Ile Gly Arg Leu Gln Asp Arg Gln Thr Leu Arg Gln Arg Val
165 170 175
Ile Arg Ala Trp Arg Gly Gln Arg Thr Leu Thr Asp Glu Phe Ser Ser
180 185 190
Thr Lys Arg Thr His Ser Gly
195
<210> 159
<211> 402
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.49;
tr|A0A103YG48|A0A103YG48_CYNCS polypeptide sequence
<400> 159
Tyr Ile Arg Glu Leu His Ala Ser Ser Leu Arg Arg Asp Glu His Glu
1 5 10 15
Ile Gln Asn Pro Lys Ile Leu Val Ile Val Asp Arg Leu Ser Ser Pro
20 25 30
Ser Leu His Val Ser Leu Ser Leu Ser Leu Ser Leu Val Ile Phe Pro
35 40 45
Pro Phe Ile Pro Leu Asn Gln Thr Pro Thr His Met Glu Asn Ala Lys
50 55 60
Val Val Glu Ala Lys Asp Gly Thr Ile Ala Val Ala Ser Ala Phe Ser
65 70 75 80
Gly His Gln Glu Val Val Gln Asp Arg Asp His Lys Phe Leu Thr Arg
85 90 95
Ala Val Glu Glu Ala Tyr Lys Gly Val Glu Cys Gly Asp Gly Gly Pro
100 105 110
Phe Gly Ala Val Val Val His Lys Asp Glu Val Val Ala Ser Cys His
115 120 125
Asn Met Val Leu Lys His Thr Asp Pro Thr Ala His Ala Glu Val Thr
130 135 140
Ala Ile Arg Glu Ala Cys Lys Lys Leu Asn Lys Ile Glu Leu Ser Asp
145 150 155 160
Cys Glu Ile Tyr Ala Ser Cys Glu Pro Cys Pro Met Cys Phe Gly Ala
165 170 175
Ile His Leu Ser Arg Ile Lys Arg Leu Ile Tyr Gly Ala Lys Ala Glu
180 185 190
Ala Ala Ile Ala Ile Gly Phe Asp Asp Phe Ile Ala Asp Ala Leu Arg
195 200 205
Gly Thr Gly Phe Tyr Gln Lys Ala His Leu Glu Ile Lys Gln Ala Asp
210 215 220
Gly Asn Gly Ala Met Ile Ala Glu Gln Val Phe Glu Lys Thr Lys Ala
225 230 235 240
Lys Phe Ala Ile Asp His Lys Phe Leu Thr Arg Ala Val Glu Glu Ala
245 250 255
Tyr Lys Gly Val Glu Cys Gly Asp Gly Arg Pro Phe Gly Ala Leu Val
260 265 270
Val His Lys Asp Glu Val Val Val Ser Cys His Asn Met Val Leu Asn
275 280 285
Tyr Thr Asp Pro Thr Ala His Ala Glu Ile Thr Ala Ile Arg Glu Ala
290 295 300
Cys Lys Lys Leu Asn Arg Ile Glu Leu Ser Asp Cys Glu Met Tyr Ser
305 310 315 320
Ser Cys Glu Pro Cys Pro Met Cys Phe Gly Ala Ile Gln Ile Ser Arg
325 330 335
Ile Lys Arg Leu Val Tyr Gly Ala Lys Ala Glu Ala Ser Ile Ala Ser
340 345 350
Gly Ile Pro Ile Gly Asp Phe Ile Ser Asp Ala Leu Lys Gly Thr Gly
355 360 365
Phe His Glu Lys Ala Asn Phe Glu Ile Lys Gln Ala Asp Gly Asn Gly
370 375 380
Ala Met Ile Ala Glu Gln Val Phe Glu Arg Thr Lys Ala Met Phe Pro
385 390 395 400
Lys Arg
<210> 160
<211> 195
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.50;
tr|W5M1M8|W5M1M8_LEPOC polypeptide sequence
<400> 160
Asn Ser Ser Thr Arg Glu Ser Arg Val Met Ala Gln Met Glu Ile Asn
1 5 10 15
Gly Gly Ala Ser Pro Pro Lys Lys Pro Gly Lys Gly Gln Ser Ala Ala
20 25 30
Asp Gln Asp Met Ile Thr Gly Leu Ile Asn Lys Ala Leu Gln Ala Lys
35 40 45
Glu Phe Ala Tyr Cys Pro Tyr Ser Asn Phe Arg Val Gly Ala Ala Leu
50 55 60
Met Thr Asn Asp Gly Arg Val Phe Thr Gly Cys Asn Val Glu Asn Ala
65 70 75 80
Cys Tyr Asn Leu Gly Val Cys Ala Glu Arg Thr Ala Ile Leu Lys Ala
85 90 95
Val Ser Glu Gly Tyr Glu Ser Phe Arg Ala Ile Ala Val Ser Ser Asp
100 105 110
Leu Gln Asp Gln Phe Ile Ser Pro Cys Gly Ala Cys Arg Gln Val Met
115 120 125
Arg Glu Phe Gly Thr Gly Trp Asp Val Phe Leu Thr Lys Val Asp Gly
130 135 140
Ser Tyr Val Arg Met Thr Val Asp Glu Leu Leu Pro Met Ser Phe Gly
145 150 155 160
Pro Asp Asp Leu Lys Lys Lys Lys Val Phe Ser Leu Gln Asn Gly His
165 170 175
Glu Val Ser Thr Gln Phe Tyr Thr His Ser Pro Cys Glu Ala Gly Glu
180 185 190
Asn Asn Asn
195
<210> 161
<211> 134
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.51;
tr|A0A3N5YPZ2|A0A3N5YPZ2_9ALTE polypeptide sequence
<400> 161
Met Ser Asn Ser Glu Thr Glu His Ile Gln Ala Leu Val Asp Ala Ala
1 5 10 15
Gln Ala Ala Gln Lys Gln Ser Tyr Ser Pro Tyr Ser Ser Phe Gln Val
20 25 30
Gly Ala Ala Ile Phe Ala Asp Asp Gly Asn Thr Tyr Ser Gly Cys Asn
35 40 45
Ile Glu Asn Val Ala Tyr Pro Leu Gly Gln Cys Ala Glu Ala Thr Ala
50 55 60
Ile Gly Met Met Ile Met Gln Gly Ala Lys Arg Ile Glu Asp Ile Met
65 70 75 80
Ile Ala Ser Pro Asn Asp Gln Val Cys Pro Pro Cys Gly Gly Cys Arg
85 90 95
Gln Lys Ile Ser Glu Phe Gly Thr Ala Glu Thr Lys Ile His Met Val
100 105 110
Thr Arg Ser Gly Glu Val Ser Thr Val Thr Leu Gly Glu Leu Leu Pro
115 120 125
Leu Ala Phe Asp Ser Leu
130
<210> 162
<211> 162
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.52;
tr|A0A2A9NC86|A0A2A9NC86_9AGAR polypeptide sequence
<400> 162
Met Thr Asn Ser Thr Leu Ser Asn Glu Asp Arg Thr Arg Leu Ile Gln
1 5 10 15
Gly Ala Phe Gln Ala Arg Lys Lys Thr Tyr Ser Pro Tyr Ser Asn Phe
20 25 30
Pro Val Gly Ala Ala Leu Leu Thr Thr Asp Gly Arg Ile Ile Glu Gly
35 40 45
Ala Asn Ile Glu Asn Ala Ser Tyr Gly Gly Thr Ile Cys Ala Glu Arg
50 55 60
Thr Ala Ile Val Lys Ala Val Ser Asp Gly Tyr Arg His Phe Ala Gly
65 70 75 80
Ile Ala Val Thr Thr Lys Met Pro Thr Arg Val Ser Pro Cys Gly Ile
85 90 95
Cys Arg Gln Val Leu Arg Glu Phe Cys Ser Leu Asp Met Pro Val Leu
100 105 110
Leu Val Pro Gly Asp Tyr Pro Gln Arg Asn Pro Val Asp Asp Asp Gly
115 120 125
Ala Asp Lys Pro Gly Val Ile Thr Glu Gly Gly Val Arg Glu Thr Thr
130 135 140
Leu Gly Ala Leu Leu Pro Asp Ser Phe Gly Pro Glu Asn Leu Pro Pro
145 150 155 160
Arg Ala
<210> 163
<211> 163
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.53;
tr|A0A2D6RD43|A0A2D6RD43_9GAMM polypeptide sequence
<400> 163
Met Asn Ile Glu Asn Leu Ile Thr Glu Asn Asp Glu Thr Leu Ile Arg
1 5 10 15
Arg Cys Ile Glu Leu Ala Gly Glu Ser Val Lys Asn Gly Asp Lys Pro
20 25 30
Phe Gly Ala Leu Leu Ala Lys Asp Gly Asn Ile Ile Phe Glu Ser Ser
35 40 45
Asn Asn Ala Lys Thr Lys Val Pro Tyr His Ala Glu Ile Leu Thr Leu
50 55 60
Met Asp Ala Gln Asp Lys Leu Asn Thr Thr Asp Leu Ser Asp Tyr Ala
65 70 75 80
Leu Tyr Ser Asn Cys Glu Pro Cys Pro Met Cys Ser Phe Met Ile Arg
85 90 95
Glu Tyr Lys Leu Asp Lys Val Val Phe Ser Val His Ser Pro Tyr Met
100 105 110
Gly Gly Gln Ser Arg Trp Asn Ile Leu Glu Asp Asp Val Leu Thr Arg
115 120 125
Phe Lys Pro Tyr Phe Ser Lys Pro Pro Asn Val Val Gly Gly Val Leu
130 135 140
Glu Ser Glu Gly Lys Arg Ile Phe Asp Lys Val Gly Leu Trp Met Phe
145 150 155 160
Gly Lys Glu
<210> 164
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.54;
tr|A0A0H3AVL6|A0A0H3AVL6_BRUO2 polypeptide sequence
<400> 164
Met His Ala Lys Gly Tyr Ser Gln Gln Glu Arg Arg Ile Ile Pro Phe
1 5 10 15
Ala Asn Arg Phe Arg Phe Arg Glu Leu Cys Ser Asn Lys Ser Leu His
20 25 30
Gly Leu Arg Ala Lys Phe Pro Glu Gln Tyr Thr Lys Trp Asp Pro Met
35 40 45
Arg Lys Ala Ala Ser Ile Thr Lys Ala Asn Ser Ala Thr Pro Met Asp
50 55 60
Ile Ala Leu Glu Glu Ala His Ala Ala Gly Glu Arg Gly Glu Val Pro
65 70 75 80
Ile Gly Ala Val Ile Val Arg Asp Gly Glu Ile Ile Ala Arg Ala Gly
85 90 95
Asn Arg Thr Arg Glu Phe Asn Asp Val Thr Ala His Ala Glu Ile Leu
100 105 110
Thr Ile Arg Gln Ala Gly Glu Met Leu Gly Ser Glu Arg Leu Ile Asp
115 120 125
Cys Asp Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Ala Ala
130 135 140
Ile Ser Phe Ala Arg Ile Arg Arg Leu Tyr Tyr Gly Ala Ser Asp Pro
145 150 155 160
Lys Gly Gly Gly Ile Glu His Gly Gly Arg Phe Tyr Thr Gln Pro Thr
165 170 175
Cys His His Ala Pro Glu Ile Tyr Pro Gly Phe Cys Glu Ala Asp Ala
180 185 190
Arg Lys Ile Leu Lys Asp Phe Phe Arg Glu Lys Arg
195 200
<210> 165
<211> 165
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.55;
tr|A0A242H531|A0A242H531_9ENTE polypeptide sequence
<400> 165
Met Phe Ile Val Lys Asn Asn Ile Glu Val Ile Gln Gln Gln Ala Glu
1 5 10 15
Leu Asp Ala Lys Phe Met Lys Gln Ala Leu Lys Leu Ala Lys Asp Ala
20 25 30
Ser Asn Asn Gly Asn Glu Pro Phe Gly Ala Val Leu Val Lys Asn Asp
35 40 45
Lys Val Ile Leu Thr Gly Glu Asn Gln Ile His Thr Glu Ser Asp Pro
50 55 60
Thr Tyr His Ala Glu Leu Gly Ile Ile Arg Asp Phe Cys Thr Ser Gln
65 70 75 80
Lys Ile Thr Asp Leu Ser Glu Tyr Thr Leu Tyr Thr Ser Cys Glu Pro
85 90 95
Cys Cys Met Cys Ala Gly Ala Met Val Trp Ser Asn Leu Asp Arg Met
100 105 110
Val Tyr Gly Leu Gly His Asp Glu Leu Ala Glu Ile Ala Gly Phe Asn
115 120 125
Ile Met Ile Gly Ser Glu Glu Ile Phe Ser Lys Ser Pro Asn Arg Pro
130 135 140
Glu Val Ala Lys Gly Val Leu Lys Glu Ala Ala Val Pro Val Tyr Val
145 150 155 160
Asp Tyr Phe Gln Arg
165
<210> 166
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.56;
tr|A0A2R6XZE2|A0A2R6XZE2_9BACL polypeptide sequence
<400> 166
Met Ser Gly Arg Ile Ser Trp His Glu Tyr Phe Met Ala Gln Ala Lys
1 5 10 15
Leu Ile Ala Leu Arg Ala Thr Cys Thr Arg Leu Met Val Gly Ala Val
20 25 30
Ile Val Arg Asp Arg Arg Val Ile Ala Gly Gly Tyr Asn Gly Ser Ile
35 40 45
Ala Gly Asp Glu His Cys Ile Asp Val Gly Cys Lys Val Arg Asp Gly
50 55 60
His Cys Ile Arg Thr Ile His Ala Glu Gln Asn Ala Leu Met Gln Cys
65 70 75 80
Ala Lys Phe Gly Val Ser Thr Asp Gly Ala Glu Leu Tyr Val Thr His
85 90 95
Phe Pro Cys Leu Asn Cys Thr Lys Leu Leu Ile Gln Ala Gly Ile Arg
100 105 110
His Ile Tyr Tyr Glu Val Pro Tyr Arg Val Asp Pro Tyr Ala Ile Glu
115 120 125
Leu Leu Glu Lys Ala Gly Val Gly Thr Thr Gln Ile Thr Val Asp Leu
130 135 140
Asn Ala Tyr Val Gln Val Met Ser Lys Val Ser Thr Asp Pro Ala Leu
145 150 155 160
Thr Tyr Val Pro Glu Ser Lys Ala Gln Lys Asp Glu Tyr Gly Gln Ser
165 170 175
Val Gly Lys Ile Val
180
<210> 167
<211> 173
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.57;
tr|A0A139SHT6|A0A139SHT6_9BACT polypeptide sequence
<400> 167
Met Ser Glu Ala Asn Ala Ser Ser Glu Ser Leu Pro Ser Arg Asn Ser
1 5 10 15
Pro Val Glu Leu Ile Ala Glu Ala Ala Gly Lys Phe Gly Arg Arg Pro
20 25 30
Thr Trp Asp Glu Tyr Phe Met Ala Thr Ala Val Leu Ile Ser Thr Arg
35 40 45
Ser Ser Cys Glu Arg Leu Asn Val Gly Cys Val Ile Val Thr Ala Gly
50 55 60
Glu Ser His Lys Asn Arg Ile Val Ala Ala Gly Tyr Asn Gly His Leu
65 70 75 80
Pro Gly Ser Pro His Thr Ser Arg Met Arg Asp Gly His Glu Gln Ala
85 90 95
Thr Val His Ala Glu Gln Asn Ala Ile Ser Asp Ala Ala Arg Arg Gly
100 105 110
Ser Ser Val Glu Gly Cys Thr Ala Tyr Val Thr His Tyr Pro Cys Ile
115 120 125
Asn Cys Ala Lys Ile Leu Ala Ser Ala Gly Ile Ala Lys Ile Cys Tyr
130 135 140
Arg Leu Asp Tyr His Asn Asp Pro Leu Val Lys Pro Met Leu Ala Glu
145 150 155 160
Ala Gly Ile Glu Ile Val Gln Leu Gly Glu Ala Ala Ser
165 170
<210> 168
<211> 170
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.58;
tr|A0A261DBH2|A0A261DBH2_9RICK polypeptide sequence
<400> 168
Met Val Met Lys Lys Lys Leu Ile Thr Val Lys Arg Ser Thr Glu Phe
1 5 10 15
Asn Asn Phe Phe Met Glu Glu Ala Leu Lys Gln Ala Gln Phe Ala Leu
20 25 30
Asp Lys Asn Glu Ile Pro Val Gly Ala Ile Ile Val Asn Arg Ile Thr
35 40 45
Asn Lys Val Ile Ala Lys Ala His Asn Ile Val Glu Gln Thr Lys Asn
50 55 60
Pro Val Leu His Ala Glu Ile Val Ala Ile Asn Gln Ser Cys Gln Ile
65 70 75 80
Leu Ser Ser Lys Asn Leu Ser Asp Cys Asp Met Tyr Val Thr Leu Glu
85 90 95
Pro Cys Val Met Cys Ser Gly Ala Ile Ser Phe Ala Arg Ile Gly Arg
100 105 110
Leu Phe Tyr Ala Ala Asn Asp Pro Lys Gln Gly Ala Ile Glu Asn Gly
115 120 125
Gly Arg Phe Phe Asn Ser Lys Ser Cys Phe Tyr Arg Pro Glu Ile Tyr
130 135 140
Ser Gly Phe Ser Ala Lys Ile Ser Glu Asn Leu Ile Lys Glu Phe Phe
145 150 155 160
Tyr Asn Val Arg Tyr Gln Lys Cys Asn Pro
165 170
<210> 169
<211> 146
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.59;
tr|A0A2N0XZK6|A0A2N0XZK6_9VIBR polypeptide sequence
<400> 169
Met Thr Asp Asn Ser Leu His Glu Ser Tyr Met Arg Gln Ala Phe Glu
1 5 10 15
Leu Ser Lys Ser Ala Leu Pro Gly Cys Arg Pro Asn Pro Pro Val Gly
20 25 30
Cys Val Phe Val Lys Asp Gly Glu Val Val Ser Ser Gly Phe Ser Gln
35 40 45
Pro Pro Gly Asn His His Ala Glu Ala Gly Ala Ile Ala Ala Tyr Thr
50 55 60
Gly Ser Tyr Asp Gly Leu Val Ala Tyr Val Thr Leu Glu Pro Cys Ser
65 70 75 80
Phe Gln Gly Arg Thr Pro Ser Cys Ala Lys Ala Leu Val Arg Val Arg
85 90 95
Pro Glu Lys Val Tyr Val Ala Ile Leu Asp Pro Asp Thr Arg Asn Ser
100 105 110
Gly Ala Gly Ile Lys Ile Leu Glu Asp Ala Gly Ile Asp Val Glu Val
115 120 125
Gly Leu Leu Gly Glu Glu Val Ala Ser Phe Leu Asn Pro Tyr Leu Ile
130 135 140
Arg Asn
145
<210> 170
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.60;
tr|A0A1V5R0F9|A0A1V5R0F9_9BACT polypeptide sequence
<400> 170
Met Thr Lys Lys Glu Thr Thr Lys Leu His Ala Leu Asp Asp Phe Cys
1 5 10 15
Met Lys Lys Ala Leu Leu Leu Ala Lys Arg Ala Phe Arg Ala Asp Glu
20 25 30
Val Pro Val Gly Ala Leu Val Val Asp Ser Ser Asn Lys Val Ile Gly
35 40 45
Arg Gly Tyr Asn Gln Val Glu Lys Arg Lys Ser Gln Arg Ala His Ala
50 55 60
Glu Gln Leu Ala Ile Glu Gln Ala Cys Lys Lys Ile Gly Asp Trp Arg
65 70 75 80
Leu Glu Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Thr Met Cys
85 90 95
Met Gly Leu Ile Lys Leu Ser Arg Ile Glu Arg Val Val Phe Gly Ala
100 105 110
Ala Ser Pro Leu Phe Gly Tyr Gln Leu Asp Lys Asn Arg Lys Ser Gln
115 120 125
Leu Tyr Lys Lys Gly Val Ile Lys Ile Arg Lys Gly Val Gly Lys Ala
130 135 140
Thr Ala Ala Ala Leu Leu Lys Asp Phe Phe Lys Asn Lys Arg Met
145 150 155
<210> 171
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.61;
tr|A0A2W0H8Y3|A0A2W0H8Y3_9BACI polypeptide sequence
<400> 171
Met Lys Asn Asn Gly Arg Leu Asp His Glu Tyr Phe Met Thr Glu Ala
1 5 10 15
Leu Gln Glu Ala Lys Glu Ala Gly Gln Arg Gly Asp Leu Pro Ile Gly
20 25 30
Ala Val Ile Val His Asn Gly Arg Ile Ile Ala Arg Gly Ser Asn Met
35 40 45
Arg Lys Thr Ala Gly Ile Lys Ile Ser His Ala Glu Asn Asn Ala Met
50 55 60
His Asn Cys Ala Pro Tyr Leu Met Lys His Ala Ser Glu Cys Val Ile
65 70 75 80
Tyr Thr Thr Leu Glu Pro Cys Ile Met Cys Leu Thr Thr Leu Val Met
85 90 95
Ala Asn Ile Asp Ser Ile Val Phe Ala Ala Asp Asp Lys Tyr Met Asn
100 105 110
Met Lys Pro Phe Ile Asp Ala Asn Ser Tyr Ile Arg Asp Arg Ile His
115 120 125
Gln Tyr Lys Gly Gly Val Cys Arg Gly Glu Ser Glu Ala Leu Leu Arg
130 135 140
Lys Tyr Ser Pro Tyr Ala Ala Glu Leu Ala Leu Asn Gly Thr His Pro
145 150 155 160
His His Arg Lys Gly Gly Ala
165
<210> 172
<211> 165
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.62;
tr|A0A261BDB7|A0A261BDB7_CAERE polypeptide sequence
<400> 172
Leu Tyr Lys Leu Tyr Ile Phe Arg Met Thr Thr Thr Lys Ala Asn Leu
1 5 10 15
Thr Gln Phe Glu Gln Glu Leu Val Asp Lys Ala Val Gly Ala Met Glu
20 25 30
Lys Ala Tyr Cys Lys Tyr Ser Gly Phe Lys Val Gly Ala Ala Leu Val
35 40 45
Cys Glu Asp Gly Glu Ile Ile Ile Gly Ala Asn His Glu Asn Ala Ser
50 55 60
Tyr Gly Ala Thr Ile Cys Ala Glu Arg Ser Ala Met Val Thr Ala Leu
65 70 75 80
Thr Lys Gly His Arg Lys Phe Lys Leu Leu Ala Val Ala Thr Glu Leu
85 90 95
Glu Ala Pro Cys Ser Pro Cys Gly Ile Cys Arg Gln Tyr Leu Ile Glu
100 105 110
Phe Gly Asp Tyr Lys Val Ile Leu Gly Ser Ser Thr Ser Asp Gln Ile
115 120 125
Ile Glu Thr Thr Thr Tyr Gly Leu Leu Pro Tyr Ala Phe Thr Pro Lys
130 135 140
Ser Leu Asp Asp His Glu Lys Glu Ala Glu Glu Arg Asn His Gln Glu
145 150 155 160
Gly Glu Lys Lys His
165
<210> 173
<211> 162
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.63;
tr|A0A2E1PHI6|A0A2E1PHI6_9GAMM polypeptide sequence
<400> 173
Met Lys Glu Leu Leu Ile His Ser Trp Leu Met Leu Asn Ser Asn Ser
1 5 10 15
Lys Leu Ile Met Glu Arg Val Ile Glu Leu Ser Glu Ile Asn Leu Lys
20 25 30
Asn Gly Lys Ile Pro Ile Ala Ala Val Ile Val Asp Lys Lys Asn Tyr
35 40 45
Glu Ile Ile Ser Glu Ser Gln Asn Glu Asp Ser Pro Ile Gly His Ala
50 55 60
Glu Leu Leu Ala Ile Thr Lys Ala Leu Lys Lys Leu Asn Thr Asn Arg
65 70 75 80
Leu Asp Ser Thr Asn Leu Phe Val Thr Ile Glu Pro Cys Pro Met Cys
85 90 95
Ala Tyr Ala Ile Ser Lys Cys His Ile Asn Arg Leu Tyr Phe Gly Ser
100 105 110
Glu Asp Glu Lys Gly Gly Gly Val Ile Asn Gly Pro Arg Ile Phe Glu
115 120 125
Ser His Asn Leu Lys Lys Ile Asp Tyr Val Ser His Cys Tyr His Glu
130 135 140
Lys Thr Thr Gln Leu Met Gln Ser Phe Phe Gln Leu Lys Arg Asn Gln
145 150 155 160
Gln Leu
<210> 174
<211> 133
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.64;
tr|A0A378LUA7|A0A378LUA7_9GAMM polypeptide sequence
<400> 174
Met Asp Thr Ile Ile Lys Lys Met Ile Ser Asn Ala His Asn Thr Leu
1 5 10 15
Ala His Ser Tyr Ser Pro Tyr Ser Lys Phe Ser Val Ala Ser Cys Ile
20 25 30
Cys Thr Asp Lys Asp Asn Phe Tyr Thr Gly Val Asn Val Glu Asn Ser
35 40 45
Ala Tyr Gly Leu Ala Ile Cys Ala Glu Thr Ser Ala Ile Ser Ala Met
50 55 60
Val Thr Ala Gly Glu Lys Arg Ile Lys Ser Met Val Val Met Ala Gly
65 70 75 80
Thr Asn Ile Leu Cys Ser Pro Cys Gly Ala Cys Arg Gln Arg Ile Tyr
85 90 95
Glu Phe Ser Thr Pro Asp Thr Leu Ile His Leu Cys Asp Lys Asn Ser
100 105 110
Ile Leu Arg Thr Phe Lys Ile Asn Glu Leu Leu Pro Glu Ala Phe Lys
115 120 125
Phe Asp Phe Asn Pro
130
<210> 175
<211> 370
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.65;
tr|A0A139HQ78|A0A139HQ78_9PEZI polypeptide sequence
<400> 175
Met Ala Asp Ser Leu Lys Ser Lys Pro Gly His Ala Arg His Asp Thr
1 5 10 15
Ala Leu Ile His Gly Leu Ser Gln Ser Asp Val Gln Lys Leu Ser Glu
20 25 30
Ser Cys Val Asp Ala Lys Ser Lys Ala Tyr Cys Pro Tyr Ser His Phe
35 40 45
Arg Val Gly Cys Ala Val Leu Leu Ala Asn Gly Asp Val Val Gln Gly
50 55 60
Ala Asn Val Glu Asn Ala Ala Tyr Pro Val Gly Thr Cys Ala Glu Arg
65 70 75 80
Val Ala Leu Gly Thr Ala Val Gly Ala Lys Lys Gly Asp Phe Arg Ala
85 90 95
Leu Ala Val Ser Thr Asp Ile Ser Pro Pro Ala Ser Pro Cys Gly Met
100 105 110
Cys Arg Gln Phe Ile Arg Glu Phe Cys Glu Leu Asn Thr Pro Ile Leu
115 120 125
Met Tyr Asp Lys Asp Gly Lys Ser Val Val Met Thr Leu Glu Gln Leu
130 135 140
Leu Pro Met Ser Phe Gly Pro Asp Lys Leu Leu Pro Pro Gly Gln Leu
145 150 155 160
Glu Asn Gly Leu Met Gln Thr Gln Thr Gln Ser Ser Phe Val Thr Arg
165 170 175
Ala Phe Ser Thr Thr Ser Ser Arg Arg Gln Asp Asp Thr Pro Gln Val
180 185 190
Pro Gln Ser His Tyr Asp Phe Phe Pro Gln Thr Phe Pro Gln Gly Pro
195 200 205
Pro Pro Lys Thr Ser Phe Ser Pro Asp Leu Lys Gln Leu Arg Lys Glu
210 215 220
Phe Leu Gln Leu Gln Ala Lys Ala His Pro Asp Leu Ala Pro Gln Asp
225 230 235 240
Gln Lys Arg Arg Ala Glu Ala Leu Ser Met Arg Ile Asn Glu Ala Tyr
245 250 255
Lys Thr Leu Gln Ser Pro Leu Arg Arg Ala Gln Tyr Leu Leu Ser Gln
260 265 270
Gln Gly Ile Asp Val Glu Asp Glu Thr Ala Lys Leu Asp Asp Ser Ser
275 280 285
Leu Leu Met Glu Val Met Glu Ala Arg Glu Ala Val Glu Glu Val Glu
290 295 300
Asp Glu Glu Gln Leu Asn Glu Ile Arg Ala Glu Asn Asn Gly Arg Ile
305 310 315 320
Glu Glu Ser Val Arg Val Leu Glu Asp Ala Phe Arg Asp Asn Glu Phe
325 330 335
Glu Lys Ala Ala Gln Glu Ala Ile Arg Leu Arg Tyr Trp Val Asn Ile
340 345 350
Glu Glu Ser Ile Gln Gly Trp Glu Lys Gly Asn Gly Gly Gly Ile Leu
355 360 365
His His
370
<210> 176
<211> 165
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.66;
tr|A0A2A9FXV0|A0A2A9FXV0_9VIBR polypeptide sequence
<400> 176
Met Cys Asn Leu Lys Glu Asn Lys Asp Met Asp Lys Tyr Phe His Phe
1 5 10 15
Ala Cys Asp Ala Thr Ile Glu Gly Met Arg Glu Gly Thr Gly Gly Pro
20 25 30
Phe Gly Ala Thr Leu Thr Arg Asn Gly Glu Val Val Cys Ser Val Ala
35 40 45
Asn Thr Val Leu Lys Asp Met Asp Ile Ser Gly His Ala Glu Met Val
50 55 60
Ala Val Arg Glu Ala Cys Lys Lys Leu Asp Thr Leu Asp Leu Ser Asp
65 70 75 80
Cys Val Met Tyr Ala Thr Cys Glu Pro Cys Pro Met Cys Val Ser Val
85 90 95
Met Leu Trp Ala Gly Ile Lys Thr Cys Tyr Tyr Ala Ser Thr His Leu
100 105 110
Asp Ala Ala Lys His Gly Phe Ser Asp Gln Gln Leu Arg Asp Tyr Leu
115 120 125
Asp Gly Ser Asp Thr Ser Thr Leu Asn Met Val His Ile Glu Asp Asn
130 135 140
Arg Asp Asp Cys Ala Lys Ile Trp Thr Glu Phe Arg His Leu Asn Glu
145 150 155 160
Thr Lys Asn Asp Gly
165
<210> 177
<211> 509
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.67;
tr|A0A1A8AG96|A0A1A8AG96_NOTFU polypeptide sequence
<400> 177
Met Glu His Ser Asp Arg Trp Ser Arg Ala Glu Pro Gly Leu Ser Thr
1 5 10 15
Ser Ser Arg Glu Thr Arg Asp Gly Ser Thr Gln Thr Asp Cys Lys Leu
20 25 30
Gln Gly His Gly Pro Arg Leu Ser Lys Val Asn Leu Phe Thr Leu Leu
35 40 45
Ser Leu Trp Met Glu Leu Phe Pro Gln Glu Gln Asp Glu Glu Asn Gly
50 55 60
Gln Ser Gln Ile Arg Arg Ser Gly Leu Val Val Val Arg Glu Gly Lys
65 70 75 80
Val Val Gly Leu His Cys Ser Gly Ala Asp Leu His Ala Gly Gln Ala
85 90 95
Ala Ile Leu Gln His Gly Ala Ser Leu Ala Asn Cys Gln Leu Phe Phe
100 105 110
Ser Arg Arg Pro Cys Ala Thr Cys Leu Lys Met Ile Ile Asn Ala Gly
115 120 125
Val Arg Gln Ile Thr Phe Trp Pro Gly Asp Pro Glu Ile Ser Met Leu
130 135 140
Thr Ser Asn Gln Thr His Ser Gln Arg Thr Ser Gln Ser Ile Thr Glu
145 150 155 160
Ala Ser Leu Asp Ala Thr Ala Val Glu Lys Leu Lys Ser Asn Ser Arg
165 170 175
Pro Gln Ile Cys Val Leu Met Gln Pro Leu Ala Pro Gly Val Leu Gln
180 185 190
Phe Val Asp Glu Thr Ser Arg Arg Ser Asp Phe Met Glu Arg Met Met
195 200 205
Asp Asp Asp Pro Glu Leu Asp Ser Glu Lys Leu Phe Asn Ser Asp Arg
210 215 220
Leu Arg His Leu Lys Asp Phe Cys Arg His Phe Leu Ile Gln Thr Asp
225 230 235 240
Gln Arg His Lys Asp Ile Leu Ser Gln Met Gly Leu Lys Asn Phe Cys
245 250 255
Val Glu Pro Tyr Phe Ser Asn Leu Arg Ser Asn Met Thr Glu Leu Val
260 265 270
Glu Val Leu Ala Ala Val Ala Ala Gly Met Pro Gln Gln His Tyr Gly
275 280 285
Phe Tyr Arg Glu Glu Ser Leu Ser Leu Asp Pro His Pro Val Asp Val
290 295 300
Ser Gln Ala Val Ala Arg His Cys Ile Val Gln Ala Arg Leu Leu Ser
305 310 315 320
Tyr Arg Thr Glu Asp Pro Lys Val Gly Val Gly Ala Val Ile Trp Ala
325 330 335
Lys Gly Gln Ser Ala Cys Cys Cys Gly Thr Gly Arg Leu Tyr Leu Ile
340 345 350
Gly Cys Gly Tyr Asn Ala Tyr Pro Ala Gly Ser Lys Tyr Ala Glu Tyr
355 360 365
Pro Gln Met Asp Asn Lys Gln Glu Asp Arg Glu Arg Arg Lys Tyr Arg
370 375 380
Tyr Ile Val His Ala Glu Gln Asn Ala Leu Thr Phe Arg Thr Arg Asp
385 390 395 400
Ile Lys Pro Asp Glu Cys Ser Met Leu Phe Val Thr Lys Cys Pro Cys
405 410 415
Asp Glu Cys Ile Pro Leu Ile Arg Gly Ala Gly Val Lys His Ile Tyr
420 425 430
Thr Ser Asp Gln Asp Arg Asp Lys Asp Lys Gly Asp Ile Ser Tyr Leu
435 440 445
Arg Phe Gly Ser Leu Lys Gly Val Cys Lys Phe Ile Trp Gln Arg Ser
450 455 460
Pro Pro Val Ser Ser Ala Ser Ser Leu His Leu Thr Asn Gly Cys Val
465 470 475 480
Gly Lys His Val Arg Gln Ala Glu Gln Gln Ile Tyr Lys Asn Lys Lys
485 490 495
Leu Cys Thr Lys Gly Ser Ser Gly Ser Ser Asp Ile Cys
500 505
<210> 178
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.68;
tr|A0A3E2VN88|A0A3E2VN88_9FIRM polypeptide sequence
<400> 178
Met Glu Lys Glu Ile Thr Asn Met Asp Lys Gln Lys Leu Ile Gln Met
1 5 10 15
Ala Val Asp Gly Leu Gly Arg Ser Tyr Ala Pro Tyr Ser His Phe His
20 25 30
Val Ser Ala Ala Leu Leu Cys Ala Asp Gly Thr Val Tyr Thr Gly Asn
35 40 45
Asn Ile Glu Asn Ala Ala Tyr Thr Pro Ser Val Cys Ala Glu Arg Cys
50 55 60
Ala Ile Phe Lys Ala Val Gly Asp Gly Arg Arg Glu Phe Glu Ala Ile
65 70 75 80
Ala Val Cys Gly Gly Pro Asp Gly Val Ile Glu Asp Tyr Cys Pro Pro
85 90 95
Cys Gly Val Cys Arg Gln Val Met Arg Glu Phe Cys Asp Pro Ser Ser
100 105 110
Phe Arg Val Leu Val Ala Lys Thr Ala Glu Asp Tyr Arg Glu Tyr Thr
115 120 125
Leu Glu Gln Leu Leu Pro Asp Gly Phe Gly Pro Asp His Leu Thr Gly
130 135 140
Ser Gly Glu Arg
145
<210> 179
<211> 221
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.69;
tr|A0A2D5ZRJ2|A0A2D5ZRJ2_9BACT polypeptide sequence
<400> 179
Met Ala Arg Pro Val His Leu His Thr Gly Glu Arg Arg Thr Glu Glu
1 5 10 15
Gly Ala Thr Glu Ser Arg Ala Val Ala Ala Val Ala Thr Ala Ile Thr
20 25 30
Arg Ala Pro Arg Ala Pro Pro Arg Pro Ala Thr Gly Arg Glu Arg Asp
35 40 45
Gly Pro Pro Pro Arg Arg Val Phe Gly Gly Gly Leu Arg Val Gly Asp
50 55 60
Pro Ser Gly Tyr Asp Arg Gly Glu Ser Lys Pro Ile Gly Gly Pro Leu
65 70 75 80
Thr Glu Lys Arg Ser Asp Trp His Ser Tyr Phe Met Arg Ile Ala Gly
85 90 95
Glu Val Ala Thr Arg Ala Thr Cys Asp Arg Lys His Val Gly Ala Val
100 105 110
Ile Val Arg Asn Arg Thr Ile Leu Ser Thr Gly Tyr Asn Gly Ser Ile
115 120 125
Arg Gly Met Pro His Cys Asp Asp Val Gly His Asp Met Val Asp Gly
130 135 140
His Cys Ile Ala Thr Ile His Ala Glu Ala Asn Ala Ile Leu Gln Ala
145 150 155 160
Ala Arg Asn Gly Val Met Ile Gln Asp Gly Ser Ile Tyr Ile Thr Ala
165 170 175
Ser Pro Cys Trp Asn Cys Phe Lys Leu Val Ala Asn Ala Gly Leu Lys
180 185 190
Arg Val Tyr Tyr Gly Glu Phe Tyr Arg Asp Lys Arg Ser Phe Glu Val
195 200 205
Ala Arg Arg Leu Gly Ile Asp Leu Met His Ile Glu Val
210 215 220
<210> 180
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.70;
tr|A0A1B8WPS3|A0A1B8WPS3_9BACI polypeptide sequence
<400> 180
Met Glu Gly Val Gln Leu Ile Tyr Gln Phe Gln Trp Gly Asn Leu Ile
1 5 10 15
Met Thr Val Asn Lys Glu Asp Leu Tyr Leu Ile Asp Val Ala Arg Asn
20 25 30
Thr Ile Lys Thr Leu Tyr Val Asp Gly Lys His His Val Gly Ala Ala
35 40 45
Val Arg Thr Lys Thr Gly Lys Ile Tyr Ser Ala Val His Leu Glu Ala
50 55 60
Asn Ile Gly Arg Val Ser Val Cys Ala Glu Ala Ile Ala Leu Gly Lys
65 70 75 80
Ala Ile Ser Glu Gly Glu Ser Glu Phe Asp Thr Ile Val Ala Val Arg
85 90 95
His Pro Asp Pro Thr Gln Glu Asn Gln Lys Ile Glu Val Val Ser Pro
100 105 110
Cys Gly Ile Cys Arg Glu Leu Ile Ser Asp Tyr Gly Lys Gly Thr Asn
115 120 125
Val Ile Leu Lys Asn Lys Glu Gly Tyr Ile Lys Thr Val Ile Ser Asp
130 135 140
Leu Leu Pro Asn Lys Tyr Ile Arg Glu Asp Asn
145 150 155
<210> 181
<211> 156
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.71;
tr|A0A1W5ZQK9|A0A1W5ZQK9_9BACI polypeptide sequence
<400> 181
Met Asn Arg Phe Met Glu Arg Ala Val Ser Leu Ala Ala Glu Asn Val
1 5 10 15
Arg Val Gly Gly Gln Pro Phe Gly Ala Val Leu Val Lys Asp Asp Glu
20 25 30
Leu Val Ala Glu Gly Val Asn Glu Met His Leu Asn Tyr Asp Val Ser
35 40 45
Gly His Ala Glu Leu Leu Ala Ile Arg Arg Ala Gln Gly Glu Leu Gln
50 55 60
Thr His Asp Leu Ser Gly Tyr Thr Met Tyr Ala Ser Gly Glu Pro Cys
65 70 75 80
Pro Met Cys Leu Ser Ala Met Tyr Phe Ala Gly Ile Lys Asp Val Phe
85 90 95
Tyr Cys Ala Thr Val Glu Glu Ala Ala Gln Val Gly Leu Glu Lys Ser
100 105 110
Lys Asn Val Tyr Asp Asp Leu Gln Lys Ser Lys Gly Glu Arg Ser Leu
115 120 125
Val Met Lys Gln Met Pro Leu Glu Asp Asp Gln Glu Asp Pro Met Lys
130 135 140
Leu Trp Asp Glu Arg Thr Asn His Asn Gly Thr Ser
145 150 155
<210> 182
<211> 340
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.72;
tr|A0A378V0W4|A0A378V0W4_MYCFO polypeptide sequence
<400> 182
Met Val His Ala Gln Phe Asp Pro Thr Ala Arg Gln Ala Leu Ala Ala
1 5 10 15
Thr Ala Val Glu Ala Lys Thr Arg Lys Asp Leu Thr Trp Gln Gln Ile
20 25 30
Ala Asp Ala Ala Glu Leu Ser Pro Ala Phe Val Thr Ala Ala Val Leu
35 40 45
Gly Gln His Ala Leu Pro Ala Arg Ser Ala Glu Ala Val Ala Ala Leu
50 55 60
Leu Gly Leu Asp Asp Asp Ala Ala Leu Leu Leu Gln Thr Ile Pro Ile
65 70 75 80
Arg Gly Ser Ile Pro Gly Gly Ile Pro Thr Asp Pro Thr Ile Tyr Arg
85 90 95
Phe Tyr Glu Met Leu Gln Val Tyr Gly Thr Thr Leu Lys Ala Leu Val
100 105 110
His Glu Gln Phe Gly Asp Gly Ile Ile Ser Ala Ile Asn Phe Lys Leu
115 120 125
Asp Val Arg Lys Val Ala Asp Pro Glu Gly Gly Glu Arg Ala Val Ile
130 135 140
Thr Leu Asp Gly Lys Tyr Leu Pro Pro Asn Pro Phe Asp Arg Val Arg
145 150 155 160
Tyr Arg Gly Gly Leu Met Asp Phe Ala Gln Arg Thr Ile Asp Ile Ala
165 170 175
Arg Gln Asn Val Ala Glu Gly Gly Arg Pro Phe Ala Thr Val Ile Val
180 185 190
Lys Asn Gly Glu Ile Leu Ala Glu Ser Pro Asn Leu Val Ala Gln Thr
195 200 205
His Asp Pro Thr Ala His Ala Glu Ile Leu Ala Ile Arg Lys Ala Cys
210 215 220
Thr Arg Ile Gly Thr Glu His Leu Ile Gly Ala Thr Ile Tyr Val Leu
225 230 235 240
Ala Gln Pro Cys Pro Met Cys Leu Gly Ser Leu Tyr Tyr Cys Ser Pro
245 250 255
Asp Glu Val Val Phe Leu Thr Thr Arg Asp Ala Tyr Glu Pro His Tyr
260 265 270
Val Asp Asp Arg Lys Tyr Phe Glu Leu Asn Met Phe Tyr Asp Glu Phe
275 280 285
Ala Lys Pro Trp Asp Gln Arg Arg Leu Pro Met Arg Tyr Glu Pro Arg
290 295 300
Asp Ala Ala Val Asp Val Tyr Lys Leu Trp Gln Glu Arg Asn Gly Gly
305 310 315 320
Glu Arg Arg Val Pro Gly Ala Pro Thr Ser Thr Arg Pro Gly Lys Asn
325 330 335
Pro Arg Gly Glu
340
<210> 183
<211> 157
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.73;
tr|I3XF03|I3XF03_RHIFR polypeptide sequence
<400> 183
Met Lys Gln Arg Cys Met Ser Pro Lys Ser Ala Gln Arg Phe Trp Asp
1 5 10 15
Asn Asp Met His Asn Asn Lys Asp Arg Pro Met Ser Glu Asn Glu Leu
20 25 30
Phe Val Ala Ala Arg Glu Ala Met Ala Lys Ala His Ala Pro Tyr Ser
35 40 45
Lys Phe Pro Val Gly Ala Ala Ile Arg Ala Glu Asp Gly Gln Ile Tyr
50 55 60
Thr Gly Ala Asn Ile Glu Asn Leu Ser Phe Pro Glu Gly Trp Cys Ala
65 70 75 80
Glu Thr Thr Ala Ile Ser His Met Val Met Ala Gly Gln Arg Lys Ile
85 90 95
Met Glu Val Ala Val Ile Ala Glu Lys Leu Ala Leu Cys Pro Pro Cys
100 105 110
Gly Gly Cys Arg Gln Arg Leu Ala Glu Phe Ser Gly Ala Ser Thr Arg
115 120 125
Ile Tyr Leu Cys Asp Glu Thr Gly Ile Lys Lys Ser Leu Ala Leu Ser
130 135 140
Asp Leu Leu Pro His Ser Phe Glu Thr Glu Ile Leu Gly
145 150 155
<210> 184
<211> 595
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.74;
tr|F8IEF3|F8IEF3_ALIAT polypeptide sequence
<400> 184
Met Asp Ala Lys Glu Leu Glu Thr Arg Gly Trp Leu Cys Met Arg Ala
1 5 10 15
Val Asp Val Ile Asp Lys Lys Arg Arg Gly Glu Ala Leu Ala Glu Glu
20 25 30
Glu Leu Arg Phe Leu Ile Glu Gly Tyr Val Ala Gly Arg Ile Pro Asp
35 40 45
Tyr Gln Met Ser Ala Phe Leu Met Ala Val Val Trp Arg Gly Met Thr
50 55 60
Arg Glu Glu Thr Leu Val Leu Thr Arg Leu Leu Ala Asp Ser Gly Glu
65 70 75 80
Arg Leu Asp Leu Ser Gly Ile Pro Gly Val Lys Val Asp Lys His Ser
85 90 95
Thr Gly Gly Val Gly Asp Lys Ala Thr Leu Val Val Leu Pro Leu Val
100 105 110
Ala Ser Ile Gly Val Pro Val Ile Lys Met Ser Gly Arg Gly Leu Gly
115 120 125
His Thr Gly Gly Thr Ile Asp Lys Leu Glu Ser Ile Pro Gly Phe Arg
130 135 140
Thr Asp Leu Ser Val Ala Glu Leu Val Ala Gln Val Arg Gln Val Gly
145 150 155 160
Ile Ala Leu Gly Gly Gln Thr Ala Asp Leu Ala Pro Ala Asp Lys Lys
165 170 175
Leu Tyr Ala Leu Arg Asp Val Thr Gly Thr Val Glu Ser Leu Pro Leu
180 185 190
Ile Ala Ser Ser Val Met Ser Lys Lys Leu Ala Gly Gly Ala Asp Ala
195 200 205
Ile Val Leu Asp Val Lys Val Gly Asp Gly Ala Phe Met Lys Ser Arg
210 215 220
Ser Asp Ala Arg Arg Leu Ala Arg Leu Met Val Glu Ile Gly Glu Ala
225 230 235 240
Ala Gly Arg Arg Thr Val Ala Val Leu Ser Asn Met Asp Gln Pro Leu
245 250 255
Gly Cys Ala Ile Gly Asn Ala Leu Glu Val Ala Glu Ala Ile Arg Val
260 265 270
Leu Ser Gly Glu Gly Pro Phe Asp Leu Ala Glu Ile Ala Leu Ala Leu
275 280 285
Ala Glu Glu Met Thr Val Leu Ala Gly Val Ala Ala Thr Arg Glu Glu
290 295 300
Ala Arg Arg Met Leu Arg Gln Ser Val Ala Glu Gly Arg Ala Leu Glu
305 310 315 320
Thr Leu Arg Arg Trp Ile Ala Ala Gln Gly Gly Asp Pro Ala Val Val
325 330 335
Asp Asp Pro Ser Arg Leu Pro Gln Ala Pro Val Gln Met Pro Tyr Leu
340 345 350
Pro Lys Lys Ala Gly Phe Val Ala Lys Leu Ser Ala Leu Ala Phe Gly
355 360 365
Leu Ala Ala Met Arg Leu Gly Ala Gly Arg Glu Thr Lys Glu Glu Ala
370 375 380
Ile Asp Pro Ser Val Gly Ile Val Leu His Ala Lys Val Gly Asp Arg
385 390 395 400
Val Gln Thr His Arg Pro Met Phe Thr Val His Ala Arg Thr Gly Glu
405 410 415
Asp Ala Leu Arg Cys Ile Gln Glu Leu Glu Ala Ala Ile Gln Ile Ser
420 425 430
Asp Asp Pro Val Glu Ala Pro Pro Leu Ile Leu Ala Arg Ile Asp Arg
435 440 445
Ser Glu Ala Leu Pro Tyr Ala Asp Leu Met Asp Ala Ala Arg Glu Ala
450 455 460
Arg Asp Arg Ala Tyr Val Pro Tyr Ser Gly Phe Ala Val Gly Ala Ala
465 470 475 480
Leu Glu Leu Ala Asp Gly Arg Met Val Thr Gly Ala Asn Val Glu Asn
485 490 495
Ala Ser Tyr Gly Leu Thr Asn Cys Ala Glu Arg Ser Ala Val Phe Arg
500 505 510
Ala Val Ala Glu Gly Gly Pro Gly Thr Lys Pro Glu Ile Arg Ala Val
515 520 525
Ala Val Ile Ala Asp Ser Pro Glu Pro Val Ser Pro Cys Gly Ala Cys
530 535 540
Arg Gln Val Leu Ala Glu Phe Cys Ser Pro Asp Thr Pro Val Tyr Leu
545 550 555 560
Gly Asn Leu Gln Gly Asp Val Arg Glu Thr Thr Val Gly Ala Leu Leu
565 570 575
Pro Gly Ala Phe Thr Asp Ala Gln Met Ala Asn Val Arg Arg Gln Asp
580 585 590
Lys Glu Ala
595
<210> 185
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.75;
tr|A0A1G3M638|A0A1G3M638_9SPIR polypeptide sequence
<400> 185
Met Lys Thr Thr Asn Ile Asn Ala Leu Asp Lys Trp Asp Leu Arg Phe
1 5 10 15
Leu Gln Met Ala Glu His Val Ala Glu Trp Ser Lys Asp Pro Ser Thr
20 25 30
Lys Val Gly Ala Val Ile Val Arg Pro Asp Arg Thr Ile Ala Ser Val
35 40 45
Gly Phe Asn Gly Phe Ala Arg Gly Val Arg Asp Thr Val Glu Arg Leu
50 55 60
Trp Asn Arg Glu Leu Lys Tyr Pro Leu Thr Val His Ala Glu Leu Asn
65 70 75 80
Ala Ile Leu Ser Ala His Glu Pro Val Arg Gly His Ser Leu Tyr Val
85 90 95
Ser Pro Leu Ser Pro Cys Ser Asn Cys Ala Gly Val Ile Ile Gln Ser
100 105 110
Gly Ile Ala Arg Val Val Ala Lys Cys Gly Gln Val Asn Asn Pro Ala
115 120 125
Gln Trp Ser Glu Ser Phe Asn Leu Ala Leu Thr Ala Phe Ala Glu Ala
130 135 140
Gly Val Ser Val Ile Leu Val Glu His
145 150
<210> 186
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.76;
tr|A0A3D9LFR2|A0A3D9LFR2_9MICC polypeptide sequence
<400> 186
Met Glu Gln Asn Asp His Gly Ser Ser Gly Ala Phe Ser Asp Pro Phe
1 5 10 15
Glu Asp Asp Ile Pro Leu Thr Ala Ser Leu Pro Arg Ile Thr Gly Thr
20 25 30
Gly Ser Gly Ile Asp Trp Gln Arg Leu Glu Ser Thr Ala Arg Ala Ala
35 40 45
Met Thr Arg Ala Tyr Val Pro Tyr Ser Arg Phe Pro Val Gly Ala Ala
50 55 60
Ala Leu Val Glu Asp Gly Arg Val Val Ala Gly Cys Asn Ile Glu Asn
65 70 75 80
Ala Ser Leu Gly Leu Thr Leu Cys Ala Glu Cys Ser Leu Val Ser Asn
85 90 95
Leu Gln Met Ser Gly Gly Gly Arg Ile Val Ala Phe Tyr Cys Val Asp
100 105 110
Gly Asn Gly Glu Val Leu Met Pro Cys Gly Arg Cys Arg Gln Leu Leu
115 120 125
Tyr Glu Phe His Ala Pro Gly Met Arg Leu Met Gly Pro Asp Gly Glu
130 135 140
Leu Thr Met Asp Glu Val Leu Pro Leu Ala Phe Gly Pro Ala Asp Met
145 150 155 160
Thr His Leu Ser Asp Ser Ala Ala Ser Thr Asp Asp Pro Gly Arg Thr
165 170 175
Arg
<210> 187
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.77;
tr|A0A3B9YGB5|A0A3B9YGB5_9BACT polypeptide sequence
<400> 187
Met Ala Lys Pro Ile Ser Lys Lys Tyr Arg Lys Leu Ile Glu Thr Ala
1 5 10 15
Lys Ala Ala Arg Lys Lys Ala Tyr Ser Pro Tyr Ser Arg Tyr Gln Val
20 25 30
Gly Ala Ala Val Leu Thr Glu Ser Gly Arg Ile Tyr Ser Gly Ala Asn
35 40 45
Met Glu Asn Ala Ser Tyr Gly Leu Cys Met Cys Ala Glu Arg Val Ala
50 55 60
Ile Ala Asn Ala Val Thr Arg Gly Glu Lys Val Leu Gln Ala Val Cys
65 70 75 80
Val Val Gly Lys Lys Ala Arg Pro Cys Gly Ala Cys Arg Gln Val Met
85 90 95
Leu Glu Phe Ser Thr Lys Glu Thr Glu Leu Leu Met Val Asp Ile Asp
100 105 110
Pro Asn Ala Arg Arg Asp Thr Val Ile Arg Thr Arg Val Tyr Ser Met
115 120 125
Leu Pro Asn Pro Phe Asp Pro Phe Glu Ser Gly Met Leu Pro Gln His
130 135 140
Pro Gln Asn Leu Leu Arg Arg Arg Lys Ser Pro Gln Pro Arg Arg Lys
145 150 155 160
Arg Arg Ser Arg Pro Val His Arg Glu Val Ser Arg
165 170
<210> 188
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.78;
tr|A0A182F569|A0A182F569_ANOAL polypeptide sequence
<400> 188
Met Pro Arg Pro Ser Gln Phe Arg Val Ser Ser Ser Gln Ser Leu Ser
1 5 10 15
Asn Ser Gln Ile Gln Ala Ser Gln Ser Ser Asp Ser Val Val Asp Ile
20 25 30
Thr Ser Tyr Val Asn Ala Val Val Lys Ala Leu Leu Asn Leu Ser Cys
35 40 45
Thr Lys Thr Ile Ile Lys Arg Ala Asp Leu Val Asn Ile Ala Leu Lys
50 55 60
Gly Asn Gly Arg Leu Ile Gly Arg Val Leu Gln Asp Ala Asn Ile Glu
65 70 75 80
Leu Lys Glu Ile Tyr Gly Tyr Glu Leu Ile Glu Val Glu Lys Ser Lys
85 90 95
Thr Met Ile Leu Cys Ser Thr Leu Ala Ala Gly Ser Met Asp Glu Leu
100 105 110
Asn Asp Ala Asn Arg Arg Arg Tyr Thr Phe Leu Tyr Leu Ile Leu Gly
115 120 125
Tyr Ile Phe Met Lys Asn Gly Ser Val Pro Glu Thr Ile Val Trp Glu
130 135 140
Phe Leu Glu Thr Leu Gly Ile Glu Glu Gln Gln Glu His Asn Tyr Phe
145 150 155 160
Gly Asp Val Arg Lys Leu Tyr Asp Ser Leu Phe Lys Gln Ala Tyr Leu
165 170 175
Thr Arg Thr Lys Gln Ala Leu Glu Gly Leu Asn Asp Asp Val Met Leu
180 185 190
Ile Ser Trp Gly Val Arg Ser Lys His Glu Val Ser Lys Lys Asp Ile
195 200 205
Leu Ala Gly Phe Cys Lys Val Met Asn Arg Asp Pro Val Asp Phe Lys
210 215 220
Ala Gln Tyr Ile Glu Ala Asn Glu Lys Asp Asp Lys Met Asn Asn Asn
225 230 235 240
Ile Asn Gly Thr Val Asp Gly Arg Asn Thr Val Glu Tyr Ser Ser Leu
245 250 255
Asp Ala Ser Val Lys Glu Leu Ile Glu Ala Ala Ile Lys Val Arg Asn
260 265 270
Asn Ala Tyr Cys Pro Tyr Ser Asn Phe Ala Val Gly Ala Ala Leu Arg
275 280 285
Thr Val Gly Gly Asp Ile Val Thr Gly Cys Asn Val Glu Asn Gly Thr
290 295 300
Phe Gly Pro Ser Val Cys Ala Glu Arg Thr Ala Val Cys Lys Ala Val
305 310 315 320
Ser Glu Gly His Arg Glu Phe Thr Ala Val Ala Val Val Ala Phe Gln
325 330 335
Glu Thr Glu Phe Thr Ala Pro Cys Gly Thr Cys Arg Gln Thr Leu Ser
340 345 350
Glu Phe Ser Arg Lys Asp Ile Pro Ile Tyr Leu Val Lys Pro Ser Pro
355 360 365
Val Arg Val Met Val Thr Ser Leu Phe Gln Leu Leu Pro His Ala Phe
370 375 380
Ser Pro Ser Phe Leu Asn Lys
385 390
<210> 189
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.79;
tr|A0A264Z0D4|A0A264Z0D4_9BACI polypeptide sequence
<400> 189
Met Glu Pro Lys Lys Leu Ile Glu Glu Ala Ile Val Ala Ser Lys Gln
1 5 10 15
Ala Tyr Val Gln Tyr Ser Asn Phe His Val Gly Ala Ala Leu Leu Thr
20 25 30
Lys Asp Gly Lys Leu Tyr His Gly Cys Asn Ile Glu Asn Ala Ser Tyr
35 40 45
Gly Leu Thr Asn Cys Ala Glu Arg Thr Ala Ile Phe Lys Ala Val Ser
50 55 60
Glu Gly Glu Lys Glu Phe Gln Ala Ile Ala Val Val Gly Asp Thr Glu
65 70 75 80
Gly Pro Ile Ser Pro Cys Gly Ala Cys Arg Gln Val Leu Ala Glu Phe
85 90 95
Phe Ser Pro Asp Thr Val Val Ile Leu Ala Asn Leu Lys Gly Asp His
100 105 110
Val Val Thr Asn Ile Asn Glu Leu Leu Pro Gly Phe Phe Ser Ser Lys
115 120 125
Asp Leu Gln Lys Lys Val Lys Asn Cys Phe Glu Lys Asn Ala Leu Gly
130 135 140
Ser Ser Cys Leu Arg Pro Ile
145 150
<210> 190
<211> 229
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pYY-BEM4.80;
tr|A0A1L9Q1R3|A0A1L9Q1R3_ASPVE polypeptide sequence
<400> 190
Met Pro Leu Ser Ala Glu Glu Ala Ala Leu Val Glu Thr Ala Thr Ala
1 5 10 15
Thr Ile Asn Ser Ile Pro Leu Ser Glu Asp Tyr Ser Val Ala Ser Ala
20 25 30
Ala Lys Ala Ser Asp Gly Arg Val Phe Thr Gly Val Asn Val Tyr His
35 40 45
Phe Thr Gly Gly Pro Cys Ala Glu Leu Val Val Leu Gly Val Ala Ala
50 55 60
Ala Ala Gly Ala Ala Gln Leu Thr His Ile Val Ala Val Ala Asn Glu
65 70 75 80
Gln Arg Gly Ile Leu Ser Pro Cys Gly Arg Cys Arg Gln Val Leu Leu
85 90 95
Asp Leu Gln Pro Asn Ile Gln Val Ile Val Gly Lys Glu Gly Ser Glu
100 105 110
Gln Ser Val Pro Val Ala Gln Leu Leu Pro Phe Ser Tyr Arg Gln Pro
115 120 125
Asp Gln His Thr Pro Val Ile Phe Lys Ala Leu Thr Ser Ser Gly Pro
130 135 140
Val Val Val Asp Phe Phe Ala Thr Trp Cys Gly Pro Cys Lys Ala Val
145 150 155 160
Ala Pro Val Val Gly Lys Leu Ser Glu Thr Tyr Thr Asp Val Arg Phe
165 170 175
Ile Gln Val Asp Val Asp Lys Ala Arg Ser Ile Ser Gln Glu His Asp
180 185 190
Ile Arg Ala Met Pro Thr Phe Val Leu Tyr Lys Asp Gly Lys Leu Leu
195 200 205
Asp Lys Arg Val Val Gly Gly Asn Met Lys Glu Leu Glu Glu Gln Ile
210 215 220
Lys Ala Ile Ile Ala
225
<210> 191
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 191
gguuuuaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 192
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 192
guuucuuaca cagggcucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 193
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 193
gguuucaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 194
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 194
gccacuuaca cagggcucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 195
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 195
gacauuaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 196
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 196
ggaucucaca cagggcucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 197
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 197
guccuuaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 198
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 198
gucaccuaca cagggcucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 199
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 199
gauuucaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 200
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 200
ggugcuuaca cagggcucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 201
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 201
guccacaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 202
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 202
gauacuuaca cagggcucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 203
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 203
guguuuuagc ugcggcaagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 204
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 204
guuucuuaca gccauaauuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 205
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 205
gcuccacagc ugcggcaagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 206
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 206
gauacuuaca gccauaauuu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 207
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 207
guguuuuagg gacgaaagag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 208
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 208
guuaccuggc ucucuuagcc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 209
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 209
gcuccacagg gacgaaagag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 210
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 210
gcuugcaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 211
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 211
gauugcaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 212
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 212
gucuccaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 213
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 213
gucugcaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 214
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 214
ggacucaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 215
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 215
gcacccaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 216
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 216
gaauuuaggu caugugugcu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 217
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 217
gcauuagguc gagaucacag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 218
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 218
gccuuagguc gagaucacag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 219
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 219
guuucagguc gagaucacag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 220
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 220
gacauuaggc uaagagagcc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 221
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 221
guccuuaggc uaagagagcc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 222
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 222
gguuucaggc uaagagagcc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 223
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 223
gacauuagau uauggcucug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 224
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 224
guccuuagau uauggcucug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 225
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 225
gguuucagau uauggcucug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 226
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 226
gtgagatcaa atgaaagttt catatagaaa tacaaaacct agagaactgg catgtaagag 60
aagcaaaaat tacttcagca aggccatgtt agtaaatttg catctgtttg tccacattag 120
<210> 227
<211> 152
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 227
gtaggtgaca atgctgcagc tgcctaatct aggtgggggg aactaaattg tgggtgagct 60
gctgaatggt ctgtagtctg aggctggggt ggggggagac acaacgtccc ctccctgcaa 120
accactgcta ttctgtccct ctctctcctt ag 152
<210> 228
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 228
gtaagtggct ttcaagacca ttgttaaaaa gctctgggaa tggcgatttc atgcttacat 60
aaattggcat gcttgtgttt cag 83
<210> 229
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 229
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtctaga 60
cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120
tttctctcca cag 133
<210> 230
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 230
gtaagcacaa ctgggatggg gtgacagggg tgcaagattg aaaactggct cctctcctca 60
tagcagttct tgtgatttca g 81
<210> 231
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 231
gtaagaaatg ttatttttca gtaagtgatt tagttatttt tccttttttc tcattaaaat 60
ttctctaaca tctccctctt catgttttag 90
<210> 232
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 232
gtgagaccct agccccctca accctgccct ggcctctccc caaacctgcc cccccacgct 60
gacccccaca cccggccgcc cgcag 85
<210> 233
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 233
gtgggtgtca gaggcatcgg ggctgcgggg tagggggctg ccccacccct aacgaagtct 60
gctcctccag 70
<210> 234
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 234
gcagggaagt cctgcttccg tgccccaccg gtgctcagct gaggctccct tgaaaatgcg 60
aggctgtttc caactttggt ctgtttccct ggcag 95
<210> 235
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 235
gtggggagtt ggggtccccg aaggtgagga ccctctgggg atgagggtgc ttctctgaga 60
cactttcttt tcctcacacc tgttcctcgc cagcag 96
<210> 236
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 236
gtatagaccc cttgatctcc taaccctaac cctaacccta accctaacct acaaaatctt 60
agagcatcag tgggagcatc tcactgtcca ggctcaatat ttcttcattt tcttgcag 118
<210> 237
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 237
gtaattatga ttaaagatgg tgattgttta ttttctttta tgattgtcct tagtattatg 60
taacctgcaa attctattgc ag 82
<210> 238
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 238
gtgagtgaca caaggtgttg tctggggagt ggggaagggg gatggaagtg aatcctgttg 60
gtggggtgga gaaagggcga tctcaagagg gccactctct ccag 104
<210> 239
<211> 124
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 239
gtaagcatct ccaccatcct tctgtttact ctgatggggt ctgcaaaggg gagatgatgt 60
atagggttgg gtatctctgt aaatgtcaga tgtgaagttg atcttatgac cttctgttct 120
gcag 124
<210> 240
<211> 148
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polynucleotide
sequence
<400> 240
gtgagggtct cccaggctgg gcagggggag ggggctgctg ccttgattgc gtcccaggac 60
acagccctcc tccagcctgc cctcgccttg ctcatcccct ccccatctca gccccacccc 120
cactaactct ctctctgctc tgactcag 148
<210> 241
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 241
gtaatgattg attgcaatgt atgattacaa taatctcagt ataagttcag taataataac 60
cttccactgc tgtcctctgt gtgcacccag 90
<210> 242
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
sequence
<400> 242
gtaaatatat acaacagttt ttcatttaaa taagtgcacg gcacaaataa gaaaaatatg 60
tcaaaaatgt aaccaatagt ttttttcaaa tttag 95
<210> 243
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide
<400> 243
Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg
1 5 10 15
Lys Val
<210> 244
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide
<400> 244
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 245
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide
<400> 245
Lys Lys Thr Glu Leu Gln Thr Thr Asn Ala Glu Asn Lys Thr Lys Lys
1 5 10 15
Leu
<210> 246
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide
<400> 246
Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg Gly Glu Asn Gly Arg
1 5 10 15
Lys Thr Arg
<210> 247
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide
<400> 247
Arg Lys Ser Gly Lys Ile Ala Ala Ile Val Val Lys Arg Pro Arg Lys
1 5 10 15
<210> 248
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide
<400> 248
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 249
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
<400> 249
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys
20 25 30
<210> 250
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<220>
<221> MISC_FEATURE
<222> (1)..(1368)
<223> Exemplary PAM-binding SpCas9 polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (5)..(58)
<223> RuvC domain
<220>
<221> MISC_FEATURE
<222> (718)..(764)
<223> RuvC domain
<220>
<221> MISC_FEATURE
<222> (773)..(902)
<223> HNH domain
<400> 250
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 251
<211> 4104
<212> DNA
<213> Streptococcus pyogenes
<220>
<221> misc_feature
<222> (1)..(4104)
<223> wild type spCas9 polynucleotide sequence
<400> 251
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg attataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg gcagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggcag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa atctacaatc aattatttga agaaaaccct 600
attaacgcaa gtagagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga gaaatggctt gtttgggaat 720
ctcattgctt tgtcattggg attgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatagt gaaataacta aggctcccct atcagcttca 960
atgattaagc gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgagggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggcgcct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agataggggg atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga tattcaaaaa gcacaggtgt ctggacaagg ccatagttta 2160
catgaacaga ttgctaactt agctggcagt cctgctatta aaaaaggtat tttacagact 2220
gtaaaaattg ttgatgaact ggtcaaagta atggggcata agccagaaaa tatcgttatt 2280
gaaatggcac gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg 2340
aaacgaatcg aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt 2400
gaaaatactc aattgcaaaa tgaaaagctc tatctctatt atctacaaaa tggaagagac 2460
atgtatgtgg accaagaatt agatattaat cgtttaagtg attatgatgt cgatcacatt 2520
gttccacaaa gtttcattaa agacgattca atagacaata aggtactaac gcgttctgat 2580
aaaaatcgtg gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac 2640
tattggagac aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg 2700
aaagctgaac gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg 2760
gttgaaactc gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact 2820
aaatacgatg aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa 2880
ttagtttctg acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac 2940
catcatgccc atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat 3000
ccaaaacttg aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg 3060
attgctaagt ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat 3120
atcatgaact tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct 3180
ctaatcgaaa ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc 3240
acagtgcgca aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag 3300
acaggcggat tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct 3360
cgtaaaaaag actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat 3420
tcagtcctag tggttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa 3480
gagttactag ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt 3540
ttagaagcta aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat 3600
agtctttttg agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa 3660
aaaggaaatg agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat 3720
tatgaaaagt tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag 3780
cataagcatt atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt 3840
ttagcagatg ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca 3900
atacgtgaac aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctccc 3960
gctgctttta aatattttga tacaacaatt gatcgtaaac gatatacgtc tacaaaagaa 4020
gttttagatg ccactcttat ccatcaatcc atcactggtc tttatgaaac acgcattgat 4080
ttgagtcagc taggaggtga ctga 4104
<210> 252
<211> 1367
<212> PRT
<213> Streptococcus pyogenes
<220>
<221> MISC_FEATURE
<222> (1)..(1367)
<223> spCas9 polypeptide sequence
<400> 252
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu
705 710 715 720
His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 253
<211> 4212
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: wild-type Cas9 polynucleotide
sequence
<220>
<221> misc_feature
<222> (5)..(58)
<223> RuvC domain
<220>
<221> misc_feature
<222> (718)..(764)
<223> RuvC domain
<220>
<221> misc_feature
<222> (772)..(901)
<223> HNH domain
<220>
<221> misc_feature
<222> (906)..(1101)
<223> RuvC domain
<400> 253
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aaggctgcag ga 4212
<210> 254
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: exemplary catalytically
active Cas9 nickase (nCas9) polypeptide sequence
<400> 254
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 255
<211> 4107
<212> DNA
<213> Streptococcus pyogenes
<220>
<221> misc_feature
<222> (1)..(4107)
<223> Cas9 from Streptococcus pyogenes (NCBI Ref. Seq.: NC_002737.2)
polynucleotide sequence
<400> 255
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 256
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of sequence: catalytically inactive Cas9 (dCas9)
polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (5)..(58)
<223> RuvC domain
<220>
<221> MISC_FEATURE
<222> (718)..(764)
<223> RuvC domain
<220>
<221> MISC_FEATURE
<222> (773)..(902)
<223> HNH domain
<220>
<221> MISC_FEATURE
<222> (907)..(1102)
<223> RuvC domain
<400> 256
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 257
<211> 345
<212> PRT
<213> Sulfolobus islandicus
<220>
<221> MISC_FEATURE
<222> (1)..(345)
<223> tr|F0NN87|F0NN87_SULIHCRISPR-associatedCasx protein OS =
Sulfolobus islandicus (strain HVE10/4) GN = SiH_0402 PE=4 SV=1);
CasX polypeptide sequence
<400> 257
Met Glu Val Pro Leu Tyr Asn Ile Phe Gly Asp Asn Tyr Ile Ile Gln
1 5 10 15
Val Ala Thr Glu Ala Glu Asn Ser Thr Ile Tyr Asn Asn Lys Val Glu
20 25 30
Ile Asp Asp Glu Glu Leu Arg Asn Val Leu Asn Leu Ala Tyr Lys Ile
35 40 45
Ala Lys Asn Asn Glu Asp Ala Ala Ala Glu Arg Arg Gly Lys Ala Lys
50 55 60
Lys Lys Lys Gly Glu Glu Gly Glu Thr Thr Thr Ser Asn Ile Ile Leu
65 70 75 80
Pro Leu Ser Gly Asn Asp Lys Asn Pro Trp Thr Glu Thr Leu Lys Cys
85 90 95
Tyr Asn Phe Pro Thr Thr Val Ala Leu Ser Glu Val Phe Lys Asn Phe
100 105 110
Ser Gln Val Lys Glu Cys Glu Glu Val Ser Ala Pro Ser Phe Val Lys
115 120 125
Pro Glu Phe Tyr Glu Phe Gly Arg Ser Pro Gly Met Val Glu Arg Thr
130 135 140
Arg Arg Val Lys Leu Glu Val Glu Pro His Tyr Leu Ile Ile Ala Ala
145 150 155 160
Ala Gly Trp Val Leu Thr Arg Leu Gly Lys Ala Lys Val Ser Glu Gly
165 170 175
Asp Tyr Val Gly Val Asn Val Phe Thr Pro Thr Arg Gly Ile Leu Tyr
180 185 190
Ser Leu Ile Gln Asn Val Asn Gly Ile Val Pro Gly Ile Lys Pro Glu
195 200 205
Thr Ala Phe Gly Leu Trp Ile Ala Arg Lys Val Val Ser Ser Val Thr
210 215 220
Asn Pro Asn Val Ser Val Val Arg Ile Tyr Thr Ile Ser Asp Ala Val
225 230 235 240
Gly Gln Asn Pro Thr Thr Ile Asn Gly Gly Phe Ser Ile Asp Leu Thr
245 250 255
Lys Leu Leu Glu Lys Arg Tyr Leu Leu Ser Glu Arg Leu Glu Ala Ile
260 265 270
Ala Arg Asn Ala Leu Ser Ile Ser Ser Asn Met Arg Glu Arg Tyr Ile
275 280 285
Val Leu Ala Asn Tyr Ile Tyr Glu Tyr Leu Thr Gly Ser Lys Arg Leu
290 295 300
Glu Asp Leu Leu Tyr Phe Ala Asn Arg Asp Leu Ile Met Asn Leu Asn
305 310 315 320
Ser Asp Asp Gly Lys Val Arg Asp Leu Lys Leu Ile Ser Ala Tyr Val
325 330 335
Asn Gly Glu Leu Ile Arg Gly Glu Gly
340 345
<210> 258
<211> 345
<212> PRT
<213> Sulfolobus islandicus
<220>
<221> MISC_FEATURE
<222> (1)..(345)
<223> tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS =
Sulfolobus islandicus (strain REY15A) GN=SiRe_0771 PE=4 SV=1);
CasX polypeptide sequence
<400> 258
Met Glu Val Pro Leu Tyr Asn Ile Phe Gly Asp Asn Tyr Ile Ile Gln
1 5 10 15
Val Ala Thr Glu Ala Glu Asn Ser Thr Ile Tyr Asn Asn Lys Val Glu
20 25 30
Ile Asp Asp Glu Glu Leu Arg Asn Val Leu Asn Leu Ala Tyr Lys Ile
35 40 45
Ala Lys Asn Asn Glu Asp Ala Ala Ala Glu Arg Arg Gly Lys Ala Lys
50 55 60
Lys Lys Lys Gly Glu Glu Gly Glu Thr Thr Thr Ser Asn Ile Ile Leu
65 70 75 80
Pro Leu Ser Gly Asn Asp Lys Asn Pro Trp Thr Glu Thr Leu Lys Cys
85 90 95
Tyr Asn Phe Pro Thr Thr Val Ala Leu Ser Glu Val Phe Lys Asn Phe
100 105 110
Ser Gln Val Lys Glu Cys Glu Glu Val Ser Ala Pro Ser Phe Val Lys
115 120 125
Pro Glu Phe Tyr Lys Phe Gly Arg Ser Pro Gly Met Val Glu Arg Thr
130 135 140
Arg Arg Val Lys Leu Glu Val Glu Pro His Tyr Leu Ile Met Ala Ala
145 150 155 160
Ala Gly Trp Val Leu Thr Arg Leu Gly Lys Ala Lys Val Ser Glu Gly
165 170 175
Asp Tyr Val Gly Val Asn Val Phe Thr Pro Thr Arg Gly Ile Leu Tyr
180 185 190
Ser Leu Ile Gln Asn Val Asn Gly Ile Val Pro Gly Ile Lys Pro Glu
195 200 205
Thr Ala Phe Gly Leu Trp Ile Ala Arg Lys Val Val Ser Ser Val Thr
210 215 220
Asn Pro Asn Val Ser Val Val Ser Ile Tyr Thr Ile Ser Asp Ala Val
225 230 235 240
Gly Gln Asn Pro Thr Thr Ile Asn Gly Gly Phe Ser Ile Asp Leu Thr
245 250 255
Lys Leu Leu Glu Lys Arg Asp Leu Leu Ser Glu Arg Leu Glu Ala Ile
260 265 270
Ala Arg Asn Ala Leu Ser Ile Ser Ser Asn Met Arg Glu Arg Tyr Ile
275 280 285
Val Leu Ala Asn Tyr Ile Tyr Glu Tyr Leu Thr Gly Ser Lys Arg Leu
290 295 300
Glu Asp Leu Leu Tyr Phe Ala Asn Arg Asp Leu Ile Met Asn Leu Asn
305 310 315 320
Ser Asp Asp Gly Lys Val Arg Asp Leu Lys Leu Ile Ser Ala Tyr Val
325 330 335
Asn Gly Glu Leu Ile Arg Gly Glu Gly
340 345
<210> 259
<211> 987
<212> PRT
<213> Deltaproteobacteria
<220>
<221> MISC_FEATURE
<222> (1)..(987)
<223> CasX polypeptide sequence
<400> 259
Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn
1 5 10 15
Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val
20 25 30
Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys
35 40 45
Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn
50 55 60
Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu
65 70 75 80
Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys
85 90 95
Lys Phe Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys
100 105 110
Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys
115 120 125
Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser
130 135 140
Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala
145 150 155 160
Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Val Lys Asp
165 170 175
Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val
195 200 205
Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu
225 230 235 240
Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly
245 250 255
Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn
260 265 270
Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Val Asp Phe Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu
325 330 335
Arg Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys
340 345 350
Lys Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly
355 360 365
Val Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu
370 375 380
Pro Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro
385 390 395 400
Lys Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu
405 410 415
Lys Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu
420 425 430
Arg Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu
435 440 445
Glu Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp
450 455 460
Trp Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met
465 470 475 480
Asp Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr
485 490 495
Gly Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val
500 505 510
Val Asp Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln
515 520 525
Tyr Arg Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu
530 535 540
Phe Tyr Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr
545 550 555 560
Asp Gly Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr
565 570 575
Gly Gly Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp
580 585 590
Glu Gln Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg
595 600 605
Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys
610 615 620
Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile
625 630 635 640
Gly Arg Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg
645 650 655
Glu Val Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val
660 665 670
Ala Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu
675 680 685
Gly Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp
690 695 700
Ile Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln
705 710 715 720
Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys
725 730 735
Phe Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser
740 745 750
Ala Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val
755 760 765
Phe Ala Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe
770 775 780
Met Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys
785 790 795 800
Leu Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu
805 810 815
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
820 825 830
Tyr Ala Asp Met Asp Val Met Leu Val Arg Leu Lys Lys Thr Ser Asp
835 840 845
Gly Trp Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Tyr Gln
850 855 860
Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu Leu
865 870 875 880
Ser Ala Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp Ile
885 890 895
Ser Lys Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu Lys
900 905 910
Lys Arg Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu Asp
915 920 925
Cys Gly His Glu Val His Ala Ala Glu Gln Ala Ala Leu Asn Ile Ala
930 935 940
Arg Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr
945 950 955 960
Lys Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys
965 970 975
Arg Arg Leu Lys Glu Val Trp Lys Pro Asn Ala
980 985
<210> 260
<211> 1210
<212> PRT
<213> Parcubacteria group bacterium
<220>
<221> MISC_FEATURE
<222> (1)..(1210)
<223> APG80656.1 CRISPR-associated protein CasY [uncultured
Parcubacteria group bacterium]; CasY polypeptide sequence
<400> 260
Met Ser Lys Arg His Pro Arg Ile Ser Gly Val Lys Gly Tyr Arg Leu
1 5 10 15
His Ala Gln Arg Leu Glu Tyr Thr Gly Lys Ser Gly Ala Met Arg Thr
20 25 30
Ile Lys Tyr Pro Leu Tyr Ser Ser Pro Ser Gly Gly Arg Thr Val Pro
35 40 45
Arg Glu Ile Val Ser Ala Ile Asn Asp Asp Tyr Val Gly Leu Tyr Gly
50 55 60
Leu Ser Asn Phe Asp Asp Leu Tyr Asn Ala Glu Lys Arg Asn Glu Glu
65 70 75 80
Lys Val Tyr Ser Val Leu Asp Phe Trp Tyr Asp Cys Val Gln Tyr Gly
85 90 95
Ala Val Phe Ser Tyr Thr Ala Pro Gly Leu Leu Lys Asn Val Ala Glu
100 105 110
Val Arg Gly Gly Ser Tyr Glu Leu Thr Lys Thr Leu Lys Gly Ser His
115 120 125
Leu Tyr Asp Glu Leu Gln Ile Asp Lys Val Ile Lys Phe Leu Asn Lys
130 135 140
Lys Glu Ile Ser Arg Ala Asn Gly Ser Leu Asp Lys Leu Lys Lys Asp
145 150 155 160
Ile Ile Asp Cys Phe Lys Ala Glu Tyr Arg Glu Arg His Lys Asp Gln
165 170 175
Cys Asn Lys Leu Ala Asp Asp Ile Lys Asn Ala Lys Lys Asp Ala Gly
180 185 190
Ala Ser Leu Gly Glu Arg Gln Lys Lys Leu Phe Arg Asp Phe Phe Gly
195 200 205
Ile Ser Glu Gln Ser Glu Asn Asp Lys Pro Ser Phe Thr Asn Pro Leu
210 215 220
Asn Leu Thr Cys Cys Leu Leu Pro Phe Asp Thr Val Asn Asn Asn Arg
225 230 235 240
Asn Arg Gly Glu Val Leu Phe Asn Lys Leu Lys Glu Tyr Ala Gln Lys
245 250 255
Leu Asp Lys Asn Glu Gly Ser Leu Glu Met Trp Glu Tyr Ile Gly Ile
260 265 270
Gly Asn Ser Gly Thr Ala Phe Ser Asn Phe Leu Gly Glu Gly Phe Leu
275 280 285
Gly Arg Leu Arg Glu Asn Lys Ile Thr Glu Leu Lys Lys Ala Met Met
290 295 300
Asp Ile Thr Asp Ala Trp Arg Gly Gln Glu Gln Glu Glu Glu Leu Glu
305 310 315 320
Lys Arg Leu Arg Ile Leu Ala Ala Leu Thr Ile Lys Leu Arg Glu Pro
325 330 335
Lys Phe Asp Asn His Trp Gly Gly Tyr Arg Ser Asp Ile Asn Gly Lys
340 345 350
Leu Ser Ser Trp Leu Gln Asn Tyr Ile Asn Gln Thr Val Lys Ile Lys
355 360 365
Glu Asp Leu Lys Gly His Lys Lys Asp Leu Lys Lys Ala Lys Glu Met
370 375 380
Ile Asn Arg Phe Gly Glu Ser Asp Thr Lys Glu Glu Ala Val Val Ser
385 390 395 400
Ser Leu Leu Glu Ser Ile Glu Lys Ile Val Pro Asp Asp Ser Ala Asp
405 410 415
Asp Glu Lys Pro Asp Ile Pro Ala Ile Ala Ile Tyr Arg Arg Phe Leu
420 425 430
Ser Asp Gly Arg Leu Thr Leu Asn Arg Phe Val Gln Arg Glu Asp Val
435 440 445
Gln Glu Ala Leu Ile Lys Glu Arg Leu Glu Ala Glu Lys Lys Lys Lys
450 455 460
Pro Lys Lys Arg Lys Lys Lys Ser Asp Ala Glu Asp Glu Lys Glu Thr
465 470 475 480
Ile Asp Phe Lys Glu Leu Phe Pro His Leu Ala Lys Pro Leu Lys Leu
485 490 495
Val Pro Asn Phe Tyr Gly Asp Ser Lys Arg Glu Leu Tyr Lys Lys Tyr
500 505 510
Lys Asn Ala Ala Ile Tyr Thr Asp Ala Leu Trp Lys Ala Val Glu Lys
515 520 525
Ile Tyr Lys Ser Ala Phe Ser Ser Ser Leu Lys Asn Ser Phe Phe Asp
530 535 540
Thr Asp Phe Asp Lys Asp Phe Phe Ile Lys Arg Leu Gln Lys Ile Phe
545 550 555 560
Ser Val Tyr Arg Arg Phe Asn Thr Asp Lys Trp Lys Pro Ile Val Lys
565 570 575
Asn Ser Phe Ala Pro Tyr Cys Asp Ile Val Ser Leu Ala Glu Asn Glu
580 585 590
Val Leu Tyr Lys Pro Lys Gln Ser Arg Ser Arg Lys Ser Ala Ala Ile
595 600 605
Asp Lys Asn Arg Val Arg Leu Pro Ser Thr Glu Asn Ile Ala Lys Ala
610 615 620
Gly Ile Ala Leu Ala Arg Glu Leu Ser Val Ala Gly Phe Asp Trp Lys
625 630 635 640
Asp Leu Leu Lys Lys Glu Glu His Glu Glu Tyr Ile Asp Leu Ile Glu
645 650 655
Leu His Lys Thr Ala Leu Ala Leu Leu Leu Ala Val Thr Glu Thr Gln
660 665 670
Leu Asp Ile Ser Ala Leu Asp Phe Val Glu Asn Gly Thr Val Lys Asp
675 680 685
Phe Met Lys Thr Arg Asp Gly Asn Leu Val Leu Glu Gly Arg Phe Leu
690 695 700
Glu Met Phe Ser Gln Ser Ile Val Phe Ser Glu Leu Arg Gly Leu Ala
705 710 715 720
Gly Leu Met Ser Arg Lys Glu Phe Ile Thr Arg Ser Ala Ile Gln Thr
725 730 735
Met Asn Gly Lys Gln Ala Glu Leu Leu Tyr Ile Pro His Glu Phe Gln
740 745 750
Ser Ala Lys Ile Thr Thr Pro Lys Glu Met Ser Arg Ala Phe Leu Asp
755 760 765
Leu Ala Pro Ala Glu Phe Ala Thr Ser Leu Glu Pro Glu Ser Leu Ser
770 775 780
Glu Lys Ser Leu Leu Lys Leu Lys Gln Met Arg Tyr Tyr Pro His Tyr
785 790 795 800
Phe Gly Tyr Glu Leu Thr Arg Thr Gly Gln Gly Ile Asp Gly Gly Val
805 810 815
Ala Glu Asn Ala Leu Arg Leu Glu Lys Ser Pro Val Lys Lys Arg Glu
820 825 830
Ile Lys Cys Lys Gln Tyr Lys Thr Leu Gly Arg Gly Gln Asn Lys Ile
835 840 845
Val Leu Tyr Val Arg Ser Ser Tyr Tyr Gln Thr Gln Phe Leu Glu Trp
850 855 860
Phe Leu His Arg Pro Lys Asn Val Gln Thr Asp Val Ala Val Ser Gly
865 870 875 880
Ser Phe Leu Ile Asp Glu Lys Lys Val Lys Thr Arg Trp Asn Tyr Asp
885 890 895
Ala Leu Thr Val Ala Leu Glu Pro Val Ser Gly Ser Glu Arg Val Phe
900 905 910
Val Ser Gln Pro Phe Thr Ile Phe Pro Glu Lys Ser Ala Glu Glu Glu
915 920 925
Gly Gln Arg Tyr Leu Gly Ile Asp Ile Gly Glu Tyr Gly Ile Ala Tyr
930 935 940
Thr Ala Leu Glu Ile Thr Gly Asp Ser Ala Lys Ile Leu Asp Gln Asn
945 950 955 960
Phe Ile Ser Asp Pro Gln Leu Lys Thr Leu Arg Glu Glu Val Lys Gly
965 970 975
Leu Lys Leu Asp Gln Arg Arg Gly Thr Phe Ala Met Pro Ser Thr Lys
980 985 990
Ile Ala Arg Ile Arg Glu Ser Leu Val His Ser Leu Arg Asn Arg Ile
995 1000 1005
His His Leu Ala Leu Lys His Lys Ala Lys Ile Val Tyr Glu Leu
1010 1015 1020
Glu Val Ser Arg Phe Glu Glu Gly Lys Gln Lys Ile Lys Lys Val
1025 1030 1035
Tyr Ala Thr Leu Lys Lys Ala Asp Val Tyr Ser Glu Ile Asp Ala
1040 1045 1050
Asp Lys Asn Leu Gln Thr Thr Val Trp Gly Lys Leu Ala Val Ala
1055 1060 1065
Ser Glu Ile Ser Ala Ser Tyr Thr Ser Gln Phe Cys Gly Ala Cys
1070 1075 1080
Lys Lys Leu Trp Arg Ala Glu Met Gln Val Asp Glu Thr Ile Thr
1085 1090 1095
Thr Gln Glu Leu Ile Gly Thr Val Arg Val Ile Lys Gly Gly Thr
1100 1105 1110
Leu Ile Asp Ala Ile Lys Asp Phe Met Arg Pro Pro Ile Phe Asp
1115 1120 1125
Glu Asn Asp Thr Pro Phe Pro Lys Tyr Arg Asp Phe Cys Asp Lys
1130 1135 1140
His His Ile Ser Lys Lys Met Arg Gly Asn Ser Cys Leu Phe Ile
1145 1150 1155
Cys Pro Phe Cys Arg Ala Asn Ala Asp Ala Asp Ile Gln Ala Ser
1160 1165 1170
Gln Thr Ile Ala Leu Leu Arg Tyr Val Lys Glu Glu Lys Lys Val
1175 1180 1185
Glu Asp Tyr Phe Glu Arg Phe Arg Lys Leu Lys Asn Ile Lys Val
1190 1195 1200
Leu Gly Gln Met Lys Lys Ile
1205 1210
<210> 261
<211> 1082
<212> PRT
<213> Neisseria meningitidis
<220>
<221> MISC_FEATURE
<222> (1)..(1082)
<223> NCBI Reference: WP_002235162.1; type II CRISPR RNA-guided
endonuclease Cas9; Nme1Cas9 polypeptide sequence
<400> 261
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp
20 25 30
Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080
<210> 262
<211> 1082
<212> PRT
<213> Neisseria meningitidis
<220>
<221> MISC_FEATURE
<222> (1)..(1082)
<223> NCBI Reference: WP_002230835; type II CRISPR RNA-guided
endonuclease Cas9; Nme2Cas9 polypeptide sequence
<400> 262
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Glu
20 25 30
Glu Asn Pro Ile Arg Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asn Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Ser Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Val Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Val
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Cys Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp His Ile Leu Leu Thr
675 680 685
Gly Lys Gly Lys Arg Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Lys Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Ala His Lys Asp Thr Leu Arg Ser
835 840 845
Ala Lys Arg Phe Val Lys His Asn Glu Lys Ile Ser Val Lys Arg Val
850 855 860
Trp Leu Thr Glu Ile Lys Leu Ala Asp Leu Glu Asn Met Val Asn Tyr
865 870 875 880
Lys Asn Gly Arg Glu Ile Glu Leu Tyr Glu Ala Leu Lys Ala Arg Leu
885 890 895
Glu Ala Tyr Gly Gly Asn Ala Lys Gln Ala Phe Asp Pro Lys Asp Asn
900 905 910
Pro Phe Tyr Lys Lys Gly Gly Gln Leu Val Lys Ala Val Arg Val Glu
915 920 925
Lys Thr Gln Glu Ser Gly Val Leu Leu Asn Lys Lys Asn Ala Tyr Thr
930 935 940
Ile Ala Asp Asn Gly Asp Met Val Arg Val Asp Val Phe Cys Lys Val
945 950 955 960
Asp Lys Lys Gly Lys Asn Gln Tyr Phe Ile Val Pro Ile Tyr Ala Trp
965 970 975
Gln Val Ala Glu Asn Ile Leu Pro Asp Ile Asp Cys Lys Gly Tyr Arg
980 985 990
Ile Asp Asp Ser Tyr Thr Phe Cys Phe Ser Leu His Lys Tyr Asp Leu
995 1000 1005
Ile Ala Phe Gln Lys Asp Glu Lys Ser Lys Val Glu Phe Ala Tyr
1010 1015 1020
Tyr Ile Asn Cys Asp Ser Ser Asn Gly Arg Phe Tyr Leu Ala Trp
1025 1030 1035
His Asp Lys Gly Ser Lys Glu Gln Gln Phe Arg Ile Ser Thr Gln
1040 1045 1050
Asn Leu Val Leu Ile Gln Lys Tyr Gln Val Asn Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080
<210> 263
<211> 1300
<212> PRT
<213> Francisella novicida
<220>
<221> MISC_FEATURE
<222> (1)..(1300)
<223> wild type Cpf1 polypeptide sequence
<400> 263
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 264
<211> 1300
<212> PRT
<213> Francisella novicida
<220>
<221> MISC_FEATURE
<222> (1)..(1300)
<223> Cpf1 D917A polypeptide sequence
<400> 264
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 265
<211> 1300
<212> PRT
<213> Francisella novicida
<220>
<221> MISC_FEATURE
<222> (1)..(1300)
<223> Cpf1 E1006A polypeptide sequence
<400> 265
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 266
<211> 1300
<212> PRT
<213> Francisella novicida
<220>
<221> MISC_FEATURE
<222> (1)..(1300)
<223> Cpf1 D1255A polypeptide sequence
<400> 266
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 267
<211> 1300
<212> PRT
<213> Francisella novicida
<220>
<221> MISC_FEATURE
<222> (1)..(1300)
<223> Cpf1 D917A/E1006A polypeptide sequence
<400> 267
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 268
<211> 1300
<212> PRT
<213> Francisella novicida
<220>
<221> MISC_FEATURE
<222> (1)..(1300)
<223> Cpf1 D917A/D1255A polypeptide sequence
<400> 268
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 269
<211> 1300
<212> PRT
<213> Francisella novicida
<220>
<221> MISC_FEATURE
<222> (1)..(1300)
<223> Cpf1 E1006A/D1255A polypeptide sequence
<400> 269
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 270
<211> 1300
<212> PRT
<213> Francisella novicida
<220>
<221> MISC_FEATURE
<222> (1)..(1300)
<223> Cpf1 D917A/E1006A/D1255A polypeptide sequence
<400> 270
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 271
<211> 1052
<212> PRT
<213> Staphylococcus aureus
<220>
<221> MISC_FEATURE
<222> (1)..(1052)
<223> Exemplary SaCas9 polypeptide sequence
<400> 271
Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 272
<211> 1052
<212> PRT
<213> Staphylococcus aureus
<220>
<221> MISC_FEATURE
<222> (1)..(1052)
<223> SaCas9n polypeptide sequence
<400> 272
Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 273
<211> 1052
<212> PRT
<213> Staphylococcus aureus
<220>
<221> MISC_FEATURE
<222> (1)..(1052)
<223> SaKKH Cas9 polypeptide sequence
<400> 273
Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 274
<211> 707
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-1 polypeptide sequence
<400> 274
Met Ala Asp Thr Pro Thr Leu Phe Thr Gln Phe Leu Arg His His Leu
1 5 10 15
Pro Gly Gln Arg Phe Arg Lys Asp Ile Leu Lys Gln Ala Gly Arg Ile
20 25 30
Leu Ala Asn Lys Gly Glu Asp Ala Thr Ile Ala Phe Leu Arg Gly Lys
35 40 45
Ser Glu Glu Ser Pro Pro Asp Phe Gln Pro Pro Val Lys Cys Pro Ile
50 55 60
Ile Ala Cys Ser Arg Pro Leu Thr Glu Trp Pro Ile Tyr Gln Ala Ser
65 70 75 80
Val Ala Ile Gln Gly Tyr Val Tyr Gly Gln Ser Leu Ala Glu Phe Glu
85 90 95
Ala Ser Asp Pro Gly Cys Ser Lys Asp Gly Leu Leu Gly Trp Phe Asp
100 105 110
Lys Thr Gly Val Cys Thr Asp Tyr Phe Ser Val Gln Gly Leu Asn Leu
115 120 125
Ile Phe Gln Asn Ala Arg Lys Arg Tyr Ile Gly Val Gln Thr Lys Val
130 135 140
Thr Asn Arg Asn Glu Lys Arg His Lys Lys Leu Lys Arg Ile Asn Ala
145 150 155 160
Lys Arg Ile Ala Glu Gly Leu Pro Glu Leu Thr Ser Asp Glu Pro Glu
165 170 175
Ser Ala Leu Asp Glu Thr Gly His Leu Ile Asp Pro Pro Gly Leu Asn
180 185 190
Thr Asn Ile Tyr Cys Tyr Gln Gln Val Ser Pro Lys Pro Leu Ala Leu
195 200 205
Ser Glu Val Asn Gln Leu Pro Thr Ala Tyr Ala Gly Tyr Ser Thr Ser
210 215 220
Gly Asp Asp Pro Ile Gln Pro Met Val Thr Lys Asp Arg Leu Ser Ile
225 230 235 240
Ser Lys Gly Gln Pro Gly Tyr Ile Pro Glu His Gln Arg Ala Leu Leu
245 250 255
Ser Gln Lys Lys His Arg Arg Met Arg Gly Tyr Gly Leu Lys Ala Arg
260 265 270
Ala Leu Leu Val Ile Val Arg Ile Gln Asp Asp Trp Ala Val Ile Asp
275 280 285
Leu Arg Ser Leu Leu Arg Asn Ala Tyr Trp Arg Arg Ile Val Gln Thr
290 295 300
Lys Glu Pro Ser Thr Ile Thr Lys Leu Leu Lys Leu Val Thr Gly Asp
305 310 315 320
Pro Val Leu Asp Ala Thr Arg Met Val Ala Thr Phe Thr Tyr Lys Pro
325 330 335
Gly Ile Val Gln Val Arg Ser Ala Lys Cys Leu Lys Asn Lys Gln Gly
340 345 350
Ser Lys Leu Phe Ser Glu Arg Tyr Leu Asn Glu Thr Val Ser Val Thr
355 360 365
Ser Ile Asp Leu Gly Ser Asn Asn Leu Val Ala Val Ala Thr Tyr Arg
370 375 380
Leu Val Asn Gly Asn Thr Pro Glu Leu Leu Gln Arg Phe Thr Leu Pro
385 390 395 400
Ser His Leu Val Lys Asp Phe Glu Arg Tyr Lys Gln Ala His Asp Thr
405 410 415
Leu Glu Asp Ser Ile Gln Lys Thr Ala Val Ala Ser Leu Pro Gln Gly
420 425 430
Gln Gln Thr Glu Ile Arg Met Trp Ser Met Tyr Gly Phe Arg Glu Ala
435 440 445
Gln Glu Arg Val Cys Gln Glu Leu Gly Leu Ala Asp Gly Ser Ile Pro
450 455 460
Trp Asn Val Met Thr Ala Thr Ser Thr Ile Leu Thr Asp Leu Phe Leu
465 470 475 480
Ala Arg Gly Gly Asp Pro Lys Lys Cys Met Phe Thr Ser Glu Pro Lys
485 490 495
Lys Lys Lys Asn Ser Lys Gln Val Leu Tyr Lys Ile Arg Asp Arg Ala
500 505 510
Trp Ala Lys Met Tyr Arg Thr Leu Leu Ser Lys Glu Thr Arg Glu Ala
515 520 525
Trp Asn Lys Ala Leu Trp Gly Leu Lys Arg Gly Ser Pro Asp Tyr Ala
530 535 540
Arg Leu Ser Lys Arg Lys Glu Glu Leu Ala Arg Arg Cys Val Asn Tyr
545 550 555 560
Thr Ile Ser Thr Ala Glu Lys Arg Ala Gln Cys Gly Arg Thr Ile Val
565 570 575
Ala Leu Glu Asp Leu Asn Ile Gly Phe Phe His Gly Arg Gly Lys Gln
580 585 590
Glu Pro Gly Trp Val Gly Leu Phe Thr Arg Lys Lys Glu Asn Arg Trp
595 600 605
Leu Met Gln Ala Leu His Lys Ala Phe Leu Glu Leu Ala His His Arg
610 615 620
Gly Tyr His Val Ile Glu Val Asn Pro Ala Tyr Thr Ser Gln Thr Cys
625 630 635 640
Pro Val Cys Arg His Cys Asp Pro Asp Asn Arg Asp Gln His Asn Arg
645 650 655
Glu Ala Phe His Cys Ile Gly Cys Gly Phe Arg Gly Asn Ala Asp Leu
660 665 670
Asp Val Ala Thr His Asn Ile Ala Met Val Ala Ile Thr Gly Glu Ser
675 680 685
Leu Lys Arg Ala Arg Gly Ser Val Ala Ser Lys Thr Pro Gln Pro Leu
690 695 700
Ala Ala Glu
705
<210> 275
<211> 757
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-2 polypeptide sequence
<400> 275
Met Pro Lys Pro Ala Val Glu Ser Glu Phe Ser Lys Val Leu Lys Lys
1 5 10 15
His Phe Pro Gly Glu Arg Phe Arg Ser Ser Tyr Met Lys Arg Gly Gly
20 25 30
Lys Ile Leu Ala Ala Gln Gly Glu Glu Ala Val Val Ala Tyr Leu Gln
35 40 45
Gly Lys Ser Glu Glu Glu Pro Pro Asn Phe Gln Pro Pro Ala Lys Cys
50 55 60
His Val Val Thr Lys Ser Arg Asp Phe Ala Glu Trp Pro Ile Met Lys
65 70 75 80
Ala Ser Glu Ala Ile Gln Arg Tyr Ile Tyr Ala Leu Ser Thr Thr Glu
85 90 95
Arg Ala Ala Cys Lys Pro Gly Lys Ser Ser Glu Ser His Ala Ala Trp
100 105 110
Phe Ala Ala Thr Gly Val Ser Asn His Gly Tyr Ser His Val Gln Gly
115 120 125
Leu Asn Leu Ile Phe Asp His Thr Leu Gly Arg Tyr Asp Gly Val Leu
130 135 140
Lys Lys Val Gln Leu Arg Asn Glu Lys Ala Arg Ala Arg Leu Glu Ser
145 150 155 160
Ile Asn Ala Ser Arg Ala Asp Glu Gly Leu Pro Glu Ile Lys Ala Glu
165 170 175
Glu Glu Glu Val Ala Thr Asn Glu Thr Gly His Leu Leu Gln Pro Pro
180 185 190
Gly Ile Asn Pro Ser Phe Tyr Val Tyr Gln Thr Ile Ser Pro Gln Ala
195 200 205
Tyr Arg Pro Arg Asp Glu Ile Val Leu Pro Pro Glu Tyr Ala Gly Tyr
210 215 220
Val Arg Asp Pro Asn Ala Pro Ile Pro Leu Gly Val Val Arg Asn Arg
225 230 235 240
Cys Asp Ile Gln Lys Gly Cys Pro Gly Tyr Ile Pro Glu Trp Gln Arg
245 250 255
Glu Ala Gly Thr Ala Ile Ser Pro Lys Thr Gly Lys Ala Val Thr Val
260 265 270
Pro Gly Leu Ser Pro Lys Lys Asn Lys Arg Met Arg Arg Tyr Trp Arg
275 280 285
Ser Glu Lys Glu Lys Ala Gln Asp Ala Leu Leu Val Thr Val Arg Ile
290 295 300
Gly Thr Asp Trp Val Val Ile Asp Val Arg Gly Leu Leu Arg Asn Ala
305 310 315 320
Arg Trp Arg Thr Ile Ala Pro Lys Asp Ile Ser Leu Asn Ala Leu Leu
325 330 335
Asp Leu Phe Thr Gly Asp Pro Val Ile Asp Val Arg Arg Asn Ile Val
340 345 350
Thr Phe Thr Tyr Thr Leu Asp Ala Cys Gly Thr Tyr Ala Arg Lys Trp
355 360 365
Thr Leu Lys Gly Lys Gln Thr Lys Ala Thr Leu Asp Lys Leu Thr Ala
370 375 380
Thr Gln Thr Val Ala Leu Val Ala Ile Asp Leu Gly Gln Thr Asn Pro
385 390 395 400
Ile Ser Ala Gly Ile Ser Arg Val Thr Gln Glu Asn Gly Ala Leu Gln
405 410 415
Cys Glu Pro Leu Asp Arg Phe Thr Leu Pro Asp Asp Leu Leu Lys Asp
420 425 430
Ile Ser Ala Tyr Arg Ile Ala Trp Asp Arg Asn Glu Glu Glu Leu Arg
435 440 445
Ala Arg Ser Val Glu Ala Leu Pro Glu Ala Gln Gln Ala Glu Val Arg
450 455 460
Ala Leu Asp Gly Val Ser Lys Glu Thr Ala Arg Thr Gln Leu Cys Ala
465 470 475 480
Asp Phe Gly Leu Asp Pro Lys Arg Leu Pro Trp Asp Lys Met Ser Ser
485 490 495
Asn Thr Thr Phe Ile Ser Glu Ala Leu Leu Ser Asn Ser Val Ser Arg
500 505 510
Asp Gln Val Phe Phe Thr Pro Ala Pro Lys Lys Gly Ala Lys Lys Lys
515 520 525
Ala Pro Val Glu Val Met Arg Lys Asp Arg Thr Trp Ala Arg Ala Tyr
530 535 540
Lys Pro Arg Leu Ser Val Glu Ala Gln Lys Leu Lys Asn Glu Ala Leu
545 550 555 560
Trp Ala Leu Lys Arg Thr Ser Pro Glu Tyr Leu Lys Leu Ser Arg Arg
565 570 575
Lys Glu Glu Leu Cys Arg Arg Ser Ile Asn Tyr Val Ile Glu Lys Thr
580 585 590
Arg Arg Arg Thr Gln Cys Gln Ile Val Ile Pro Val Ile Glu Asp Leu
595 600 605
Asn Val Arg Phe Phe His Gly Ser Gly Lys Arg Leu Pro Gly Trp Asp
610 615 620
Asn Phe Phe Thr Ala Lys Lys Glu Asn Arg Trp Phe Ile Gln Gly Leu
625 630 635 640
His Lys Ala Phe Ser Asp Leu Arg Thr His Arg Ser Phe Tyr Val Phe
645 650 655
Glu Val Arg Pro Glu Arg Thr Ser Ile Thr Cys Pro Lys Cys Gly His
660 665 670
Cys Glu Val Gly Asn Arg Asp Gly Glu Ala Phe Gln Cys Leu Ser Cys
675 680 685
Gly Lys Thr Cys Asn Ala Asp Leu Asp Val Ala Thr His Asn Leu Thr
690 695 700
Gln Val Ala Leu Thr Gly Lys Thr Met Pro Lys Arg Glu Glu Pro Arg
705 710 715 720
Asp Ala Gln Gly Thr Ala Pro Ala Arg Lys Thr Lys Lys Ala Ser Lys
725 730 735
Ser Lys Ala Pro Pro Ala Glu Arg Glu Asp Gln Thr Pro Ala Gln Glu
740 745 750
Pro Ser Gln Thr Ser
755
<210> 276
<211> 766
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-3 polypeptide sequence
<400> 276
Met Glu Lys Glu Ile Thr Glu Leu Thr Lys Ile Arg Arg Glu Phe Pro
1 5 10 15
Asn Lys Lys Phe Ser Ser Thr Asp Met Lys Lys Ala Gly Lys Leu Leu
20 25 30
Lys Ala Glu Gly Pro Asp Ala Val Arg Asp Phe Leu Asn Ser Cys Gln
35 40 45
Glu Ile Ile Gly Asp Phe Lys Pro Pro Val Lys Thr Asn Ile Val Ser
50 55 60
Ile Ser Arg Pro Phe Glu Glu Trp Pro Val Ser Met Val Gly Arg Ala
65 70 75 80
Ile Gln Glu Tyr Tyr Phe Ser Leu Thr Lys Glu Glu Leu Glu Ser Val
85 90 95
His Pro Gly Thr Ser Ser Glu Asp His Lys Ser Phe Phe Asn Ile Thr
100 105 110
Gly Leu Ser Asn Tyr Asn Tyr Thr Ser Val Gln Gly Leu Asn Leu Ile
115 120 125
Phe Lys Asn Ala Lys Ala Ile Tyr Asp Gly Thr Leu Val Lys Ala Asn
130 135 140
Asn Lys Asn Lys Lys Leu Glu Lys Lys Phe Asn Glu Ile Asn His Lys
145 150 155 160
Arg Ser Leu Glu Gly Leu Pro Ile Ile Thr Pro Asp Phe Glu Glu Pro
165 170 175
Phe Asp Glu Asn Gly His Leu Asn Asn Pro Pro Gly Ile Asn Arg Asn
180 185 190
Ile Tyr Gly Tyr Gln Gly Cys Ala Ala Lys Val Phe Val Pro Ser Lys
195 200 205
His Lys Met Val Ser Leu Pro Lys Glu Tyr Glu Gly Tyr Asn Arg Asp
210 215 220
Pro Asn Leu Ser Leu Ala Gly Phe Arg Asn Arg Leu Glu Ile Pro Glu
225 230 235 240
Gly Glu Pro Gly His Val Pro Trp Phe Gln Arg Met Asp Ile Pro Glu
245 250 255
Gly Gln Ile Gly His Val Asn Lys Ile Gln Arg Phe Asn Phe Val His
260 265 270
Gly Lys Asn Ser Gly Lys Val Lys Phe Ser Asp Lys Thr Gly Arg Val
275 280 285
Lys Arg Tyr His His Ser Lys Tyr Lys Asp Ala Thr Lys Pro Tyr Lys
290 295 300
Phe Leu Glu Glu Ser Lys Lys Val Ser Ala Leu Asp Ser Ile Leu Ala
305 310 315 320
Ile Ile Thr Ile Gly Asp Asp Trp Val Val Phe Asp Ile Arg Gly Leu
325 330 335
Tyr Arg Asn Val Phe Tyr Arg Glu Leu Ala Gln Lys Gly Leu Thr Ala
340 345 350
Val Gln Leu Leu Asp Leu Phe Thr Gly Asp Pro Val Ile Asp Pro Lys
355 360 365
Lys Gly Val Val Thr Phe Ser Tyr Lys Glu Gly Val Val Pro Val Phe
370 375 380
Ser Gln Lys Ile Val Pro Arg Phe Lys Ser Arg Asp Thr Leu Glu Lys
385 390 395 400
Leu Thr Ser Gln Gly Pro Val Ala Leu Leu Ser Val Asp Leu Gly Gln
405 410 415
Asn Glu Pro Val Ala Ala Arg Val Cys Ser Leu Lys Asn Ile Asn Asp
420 425 430
Lys Ile Thr Leu Asp Asn Ser Cys Arg Ile Ser Phe Leu Asp Asp Tyr
435 440 445
Lys Lys Gln Ile Lys Asp Tyr Arg Asp Ser Leu Asp Glu Leu Glu Ile
450 455 460
Lys Ile Arg Leu Glu Ala Ile Asn Ser Leu Glu Thr Asn Gln Gln Val
465 470 475 480
Glu Ile Arg Asp Leu Asp Val Phe Ser Ala Asp Arg Ala Lys Ala Asn
485 490 495
Thr Val Asp Met Phe Asp Ile Asp Pro Asn Leu Ile Ser Trp Asp Ser
500 505 510
Met Ser Asp Ala Arg Val Ser Thr Gln Ile Ser Asp Leu Tyr Leu Lys
515 520 525
Asn Gly Gly Asp Glu Ser Arg Val Tyr Phe Glu Ile Asn Asn Lys Arg
530 535 540
Ile Lys Arg Ser Asp Tyr Asn Ile Ser Gln Leu Val Arg Pro Lys Leu
545 550 555 560
Ser Asp Ser Thr Arg Lys Asn Leu Asn Asp Ser Ile Trp Lys Leu Lys
565 570 575
Arg Thr Ser Glu Glu Tyr Leu Lys Leu Ser Lys Arg Lys Leu Glu Leu
580 585 590
Ser Arg Ala Val Val Asn Tyr Thr Ile Arg Gln Ser Lys Leu Leu Ser
595 600 605
Gly Ile Asn Asp Ile Val Ile Ile Leu Glu Asp Leu Asp Val Lys Lys
610 615 620
Lys Phe Asn Gly Arg Gly Ile Arg Asp Ile Gly Trp Asp Asn Phe Phe
625 630 635 640
Ser Ser Arg Lys Glu Asn Arg Trp Phe Ile Pro Ala Phe His Lys Ala
645 650 655
Phe Ser Glu Leu Ser Ser Asn Arg Gly Leu Cys Val Ile Glu Val Asn
660 665 670
Pro Ala Trp Thr Ser Ala Thr Cys Pro Asp Cys Gly Phe Cys Ser Lys
675 680 685
Glu Asn Arg Asp Gly Ile Asn Phe Thr Cys Arg Lys Cys Gly Val Ser
690 695 700
Tyr His Ala Asp Ile Asp Val Ala Thr Leu Asn Ile Ala Arg Val Ala
705 710 715 720
Val Leu Gly Lys Pro Met Ser Gly Pro Ala Asp Arg Glu Arg Leu Gly
725 730 735
Asp Thr Lys Lys Pro Arg Val Ala Arg Ser Arg Lys Thr Met Lys Arg
740 745 750
Lys Asp Ile Ser Asn Ser Thr Val Glu Ala Met Val Thr Ala
755 760 765
<210> 277
<211> 765
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-4 polypeptide sequence
<400> 277
Met Tyr Ser Leu Glu Met Ala Asp Leu Lys Ser Glu Pro Ser Leu Leu
1 5 10 15
Ala Lys Leu Leu Arg Asp Arg Phe Pro Gly Lys Tyr Trp Leu Pro Lys
20 25 30
Tyr Trp Lys Leu Ala Glu Lys Lys Arg Leu Thr Gly Gly Glu Glu Ala
35 40 45
Ala Cys Glu Tyr Met Ala Asp Lys Gln Leu Asp Ser Pro Pro Pro Asn
50 55 60
Phe Arg Pro Pro Ala Arg Cys Val Ile Leu Ala Lys Ser Arg Pro Phe
65 70 75 80
Glu Asp Trp Pro Val His Arg Val Ala Ser Lys Ala Gln Ser Phe Val
85 90 95
Ile Gly Leu Ser Glu Gln Gly Phe Ala Ala Leu Arg Ala Ala Pro Pro
100 105 110
Ser Thr Ala Asp Ala Arg Arg Asp Trp Leu Arg Ser His Gly Ala Ser
115 120 125
Glu Asp Asp Leu Met Ala Leu Glu Ala Gln Leu Leu Glu Thr Ile Met
130 135 140
Gly Asn Ala Ile Ser Leu His Gly Gly Val Leu Lys Lys Ile Asp Asn
145 150 155 160
Ala Asn Val Lys Ala Ala Lys Arg Leu Ser Gly Arg Asn Glu Ala Arg
165 170 175
Leu Asn Lys Gly Leu Gln Glu Leu Pro Pro Glu Gln Glu Gly Ser Ala
180 185 190
Tyr Gly Ala Asp Gly Leu Leu Val Asn Pro Pro Gly Leu Asn Leu Asn
195 200 205
Ile Tyr Cys Arg Lys Ser Cys Cys Pro Lys Pro Val Lys Asn Thr Ala
210 215 220
Arg Phe Val Gly His Tyr Pro Gly Tyr Leu Arg Asp Ser Asp Ser Ile
225 230 235 240
Leu Ile Ser Gly Thr Met Asp Arg Leu Thr Ile Ile Glu Gly Met Pro
245 250 255
Gly His Ile Pro Ala Trp Gln Arg Glu Gln Gly Leu Val Lys Pro Gly
260 265 270
Gly Arg Arg Arg Arg Leu Ser Gly Ser Glu Ser Asn Met Arg Gln Lys
275 280 285
Val Asp Pro Ser Thr Gly Pro Arg Arg Ser Thr Arg Ser Gly Thr Val
290 295 300
Asn Arg Ser Asn Gln Arg Thr Gly Arg Asn Gly Asp Pro Leu Leu Val
305 310 315 320
Glu Ile Arg Met Lys Glu Asp Trp Val Leu Leu Asp Ala Arg Gly Leu
325 330 335
Leu Arg Asn Leu Arg Trp Arg Glu Ser Lys Arg Gly Leu Ser Cys Asp
340 345 350
His Glu Asp Leu Ser Leu Ser Gly Leu Leu Ala Leu Phe Ser Gly Asp
355 360 365
Pro Val Ile Asp Pro Val Arg Asn Glu Val Val Phe Leu Tyr Gly Glu
370 375 380
Gly Ile Ile Pro Val Arg Ser Thr Lys Pro Val Gly Thr Arg Gln Ser
385 390 395 400
Lys Lys Leu Leu Glu Arg Gln Ala Ser Met Gly Pro Leu Thr Leu Ile
405 410 415
Ser Cys Asp Leu Gly Gln Thr Asn Leu Ile Ala Gly Arg Ala Ser Ala
420 425 430
Ile Ser Leu Thr His Gly Ser Leu Gly Val Arg Ser Ser Val Arg Ile
435 440 445
Glu Leu Asp Pro Glu Ile Ile Lys Ser Phe Glu Arg Leu Arg Lys Asp
450 455 460
Ala Asp Arg Leu Glu Thr Glu Ile Leu Thr Ala Ala Lys Glu Thr Leu
465 470 475 480
Ser Asp Glu Gln Arg Gly Glu Val Asn Ser His Glu Lys Asp Ser Pro
485 490 495
Gln Thr Ala Lys Ala Ser Leu Cys Arg Glu Leu Gly Leu His Pro Pro
500 505 510
Ser Leu Pro Trp Gly Gln Met Gly Pro Ser Thr Thr Phe Ile Ala Asp
515 520 525
Met Leu Ile Ser His Gly Arg Asp Asp Asp Ala Phe Leu Ser His Gly
530 535 540
Glu Phe Pro Thr Leu Glu Lys Arg Lys Lys Phe Asp Lys Arg Phe Cys
545 550 555 560
Leu Glu Ser Arg Pro Leu Leu Ser Ser Glu Thr Arg Lys Ala Leu Asn
565 570 575
Glu Ser Leu Trp Glu Val Lys Arg Thr Ser Ser Glu Tyr Ala Arg Leu
580 585 590
Ser Gln Arg Lys Lys Glu Met Ala Arg Arg Ala Val Asn Phe Val Val
595 600 605
Glu Ile Ser Arg Arg Lys Thr Gly Leu Ser Asn Val Ile Val Asn Ile
610 615 620
Glu Asp Leu Asn Val Arg Ile Phe His Gly Gly Gly Lys Gln Ala Pro
625 630 635 640
Gly Trp Asp Gly Phe Phe Arg Pro Lys Ser Glu Asn Arg Trp Phe Ile
645 650 655
Gln Ala Ile His Lys Ala Phe Ser Asp Leu Ala Ala His His Gly Ile
660 665 670
Pro Val Ile Glu Ser Asp Pro Gln Arg Thr Ser Met Thr Cys Pro Glu
675 680 685
Cys Gly His Cys Asp Ser Lys Asn Arg Asn Gly Val Arg Phe Leu Cys
690 695 700
Lys Gly Cys Gly Ala Ser Met Asp Ala Asp Phe Asp Ala Ala Cys Arg
705 710 715 720
Asn Leu Glu Arg Val Ala Leu Thr Gly Lys Pro Met Pro Lys Pro Ser
725 730 735
Thr Ser Cys Glu Arg Leu Leu Ser Ala Thr Thr Gly Lys Val Cys Ser
740 745 750
Asp His Ser Leu Ser His Asp Ala Ile Glu Lys Ala Ser
755 760 765
<210> 278
<211> 793
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-5 polypeptide sequence
<400> 278
Met Ser Ser Leu Pro Thr Pro Leu Glu Leu Leu Lys Gln Lys His Ala
1 5 10 15
Asp Leu Phe Lys Gly Leu Gln Phe Ser Ser Lys Asp Asn Lys Met Ala
20 25 30
Gly Lys Val Leu Lys Lys Asp Gly Glu Glu Ala Ala Leu Ala Phe Leu
35 40 45
Ser Glu Arg Gly Val Ser Arg Gly Glu Leu Pro Asn Phe Arg Pro Pro
50 55 60
Ala Lys Thr Leu Val Val Ala Gln Ser Arg Pro Phe Glu Glu Phe Pro
65 70 75 80
Ile Tyr Arg Val Ser Glu Ala Ile Gln Leu Tyr Val Tyr Ser Leu Ser
85 90 95
Val Lys Glu Leu Glu Thr Val Pro Ser Gly Ser Ser Thr Lys Lys Glu
100 105 110
His Gln Arg Phe Phe Gln Asp Ser Ser Val Pro Asp Phe Gly Tyr Thr
115 120 125
Ser Val Gln Gly Leu Asn Lys Ile Phe Gly Leu Ala Arg Gly Ile Tyr
130 135 140
Leu Gly Val Ile Thr Arg Gly Glu Asn Gln Leu Gln Lys Ala Lys Ser
145 150 155 160
Lys His Glu Ala Leu Asn Lys Lys Arg Arg Ala Ser Gly Glu Ala Glu
165 170 175
Thr Glu Phe Asp Pro Thr Pro Tyr Glu Tyr Met Thr Pro Glu Arg Lys
180 185 190
Leu Ala Lys Pro Pro Gly Val Asn His Ser Ile Met Cys Tyr Val Asp
195 200 205
Ile Ser Val Asp Glu Phe Asp Phe Arg Asn Pro Asp Gly Ile Val Leu
210 215 220
Pro Ser Glu Tyr Ala Gly Tyr Cys Arg Glu Ile Asn Thr Ala Ile Glu
225 230 235 240
Lys Gly Thr Val Asp Arg Leu Gly His Leu Lys Gly Gly Pro Gly Tyr
245 250 255
Ile Pro Gly His Gln Arg Lys Glu Ser Thr Thr Glu Gly Pro Lys Ile
260 265 270
Asn Phe Arg Lys Gly Arg Ile Arg Arg Ser Tyr Thr Ala Leu Tyr Ala
275 280 285
Lys Arg Asp Ser Arg Arg Val Arg Gln Gly Lys Leu Ala Leu Pro Ser
290 295 300
Tyr Arg His His Met Met Arg Leu Asn Ser Asn Ala Glu Ser Ala Ile
305 310 315 320
Leu Ala Val Ile Phe Phe Gly Lys Asp Trp Val Val Phe Asp Leu Arg
325 330 335
Gly Leu Leu Arg Asn Val Arg Trp Arg Asn Leu Phe Val Asp Gly Ser
340 345 350
Thr Pro Ser Thr Leu Leu Gly Met Phe Gly Asp Pro Val Ile Asp Pro
355 360 365
Lys Arg Gly Val Val Ala Phe Cys Tyr Lys Glu Gln Ile Val Pro Val
370 375 380
Val Ser Lys Ser Ile Thr Lys Met Val Lys Ala Pro Glu Leu Leu Asn
385 390 395 400
Lys Leu Tyr Leu Lys Ser Glu Asp Pro Leu Val Leu Val Ala Ile Asp
405 410 415
Leu Gly Gln Thr Asn Pro Val Gly Val Gly Val Tyr Arg Val Met Asn
420 425 430
Ala Ser Leu Asp Tyr Glu Val Val Thr Arg Phe Ala Leu Glu Ser Glu
435 440 445
Leu Leu Arg Glu Ile Glu Ser Tyr Arg Gln Arg Thr Asn Ala Phe Glu
450 455 460
Ala Gln Ile Arg Ala Glu Thr Phe Asp Ala Met Thr Ser Glu Glu Gln
465 470 475 480
Glu Glu Ile Thr Arg Val Arg Ala Phe Ser Ala Ser Lys Ala Lys Glu
485 490 495
Asn Val Cys His Arg Phe Gly Met Pro Val Asp Ala Val Asp Trp Ala
500 505 510
Thr Met Gly Ser Asn Thr Ile His Ile Ala Lys Trp Val Met Arg His
515 520 525
Gly Asp Pro Ser Leu Val Glu Val Leu Glu Tyr Arg Lys Asp Asn Glu
530 535 540
Ile Lys Leu Asp Lys Asn Gly Val Pro Lys Lys Val Lys Leu Thr Asp
545 550 555 560
Lys Arg Ile Ala Asn Leu Thr Ser Ile Arg Leu Arg Phe Ser Gln Glu
565 570 575
Thr Ser Lys His Tyr Asn Asp Thr Met Trp Glu Leu Arg Arg Lys His
580 585 590
Pro Val Tyr Gln Lys Leu Ser Lys Ser Lys Ala Asp Phe Ser Arg Arg
595 600 605
Val Val Asn Ser Ile Ile Arg Arg Val Asn His Leu Val Pro Arg Ala
610 615 620
Arg Ile Val Phe Ile Ile Glu Asp Leu Lys Asn Leu Gly Lys Val Phe
625 630 635 640
His Gly Ser Gly Lys Arg Glu Leu Gly Trp Asp Ser Tyr Phe Glu Pro
645 650 655
Lys Ser Glu Asn Arg Trp Phe Ile Gln Val Leu His Lys Ala Phe Ser
660 665 670
Glu Thr Gly Lys His Lys Gly Tyr Tyr Ile Ile Glu Cys Trp Pro Asn
675 680 685
Trp Thr Ser Cys Thr Cys Pro Lys Cys Ser Cys Cys Asp Ser Glu Asn
690 695 700
Arg His Gly Glu Val Phe Arg Cys Leu Ala Cys Gly Tyr Thr Cys Asn
705 710 715 720
Thr Asp Phe Gly Thr Ala Pro Asp Asn Leu Val Lys Ile Ala Thr Thr
725 730 735
Gly Lys Gly Leu Pro Gly Pro Lys Lys Arg Cys Lys Gly Ser Ser Lys
740 745 750
Gly Lys Asn Pro Lys Ile Ala Arg Ser Ser Glu Thr Gly Val Ser Val
755 760 765
Thr Glu Ser Gly Ala Pro Lys Val Lys Lys Ser Ser Pro Thr Gln Thr
770 775 780
Ser Gln Ser Ser Ser Gln Ser Ala Pro
785 790
<210> 279
<211> 441
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-6 polypeptide sequence
<400> 279
Met Asn Lys Ile Glu Lys Glu Lys Thr Pro Leu Ala Lys Leu Met Asn
1 5 10 15
Glu Asn Phe Ala Gly Leu Arg Phe Pro Phe Ala Ile Ile Lys Gln Ala
20 25 30
Gly Lys Lys Leu Leu Lys Glu Gly Glu Leu Lys Thr Ile Glu Tyr Met
35 40 45
Thr Gly Lys Gly Ser Ile Glu Pro Leu Pro Asn Phe Lys Pro Pro Val
50 55 60
Lys Cys Leu Ile Val Ala Lys Arg Arg Asp Leu Lys Tyr Phe Pro Ile
65 70 75 80
Cys Lys Ala Ser Cys Glu Ile Gln Ser Tyr Val Tyr Ser Leu Asn Tyr
85 90 95
Lys Asp Phe Met Asp Tyr Phe Ser Thr Pro Met Thr Ser Gln Lys Gln
100 105 110
His Glu Glu Phe Phe Lys Lys Ser Gly Leu Asn Ile Glu Tyr Gln Asn
115 120 125
Val Ala Gly Leu Asn Leu Ile Phe Asn Asn Val Lys Asn Thr Tyr Asn
130 135 140
Gly Val Ile Leu Lys Val Lys Asn Arg Asn Glu Lys Leu Lys Lys Lys
145 150 155 160
Ala Ile Lys Asn Asn Tyr Glu Phe Glu Glu Ile Lys Thr Phe Asn Asp
165 170 175
Asp Gly Cys Leu Ile Asn Lys Pro Gly Ile Asn Asn Val Ile Tyr Cys
180 185 190
Phe Gln Ser Ile Ser Pro Lys Ile Leu Lys Asn Ile Thr His Leu Pro
195 200 205
Lys Glu Tyr Asn Asp Tyr Asp Cys Ser Val Asp Arg Asn Ile Ile Gln
210 215 220
Lys Tyr Val Ser Arg Leu Asp Ile Pro Glu Ser Gln Pro Gly His Val
225 230 235 240
Pro Glu Trp Gln Arg Lys Leu Pro Glu Phe Asn Asn Thr Asn Asn Pro
245 250 255
Arg Arg Arg Arg Lys Trp Tyr Ser Asn Gly Arg Asn Ile Ser Lys Gly
260 265 270
Tyr Ser Val Asp Gln Val Asn Gln Ala Lys Ile Glu Asp Ser Leu Leu
275 280 285
Ala Gln Ile Lys Ile Gly Glu Asp Trp Ile Ile Leu Asp Ile Arg Gly
290 295 300
Leu Leu Arg Asp Leu Asn Arg Arg Glu Leu Ile Ser Tyr Lys Asn Lys
305 310 315 320
Leu Thr Ile Lys Asp Val Leu Gly Phe Phe Ser Asp Tyr Pro Ile Ile
325 330 335
Asp Ile Lys Lys Asn Leu Val Thr Phe Cys Tyr Lys Glu Gly Val Ile
340 345 350
Gln Val Val Ser Gln Lys Ser Ile Gly Asn Lys Lys Ser Lys Gln Leu
355 360 365
Leu Glu Lys Leu Ile Glu Asn Lys Pro Ile Ala Leu Val Ser Ile Asp
370 375 380
Leu Gly Gln Thr Asn Pro Val Ser Val Lys Ile Ser Lys Leu Asn Lys
385 390 395 400
Ile Asn Asn Lys Ile Ser Ile Glu Ser Phe Thr Tyr Arg Phe Leu Asn
405 410 415
Glu Glu Ile Leu Lys Glu Ile Glu Lys Tyr Arg Lys Asp Tyr Asp Lys
420 425 430
Leu Glu Leu Lys Leu Ile Asn Glu Ala
435 440
<210> 280
<211> 772
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-7 polypeptide sequence
<400> 280
Met Ser Asn Thr Ala Val Ser Thr Arg Glu His Met Ser Asn Lys Thr
1 5 10 15
Thr Pro Pro Ser Pro Leu Ser Leu Leu Leu Arg Ala His Phe Pro Gly
20 25 30
Leu Lys Phe Glu Ser Gln Asp Tyr Lys Ile Ala Gly Lys Lys Leu Arg
35 40 45
Asp Gly Gly Pro Glu Ala Val Ile Ser Tyr Leu Thr Gly Lys Gly Gln
50 55 60
Ala Lys Leu Lys Asp Val Lys Pro Pro Ala Lys Ala Phe Val Ile Ala
65 70 75 80
Gln Ser Arg Pro Phe Ile Glu Trp Asp Leu Val Arg Val Ser Arg Gln
85 90 95
Ile Gln Glu Lys Ile Phe Gly Ile Pro Ala Thr Lys Gly Arg Pro Lys
100 105 110
Gln Asp Gly Leu Ser Glu Thr Ala Phe Asn Glu Ala Val Ala Ser Leu
115 120 125
Glu Val Asp Gly Lys Ser Lys Leu Asn Glu Glu Thr Arg Ala Ala Phe
130 135 140
Tyr Glu Val Leu Gly Leu Asp Ala Pro Ser Leu His Ala Gln Ala Gln
145 150 155 160
Asn Ala Leu Ile Lys Ser Ala Ile Ser Ile Arg Glu Gly Val Leu Lys
165 170 175
Lys Val Glu Asn Arg Asn Glu Lys Asn Leu Ser Lys Thr Lys Arg Arg
180 185 190
Lys Glu Ala Gly Glu Glu Ala Thr Phe Val Glu Glu Lys Ala His Asp
195 200 205
Glu Arg Gly Tyr Leu Ile His Pro Pro Gly Val Asn Gln Thr Ile Pro
210 215 220
Gly Tyr Gln Ala Val Val Ile Lys Ser Cys Pro Ser Asp Phe Ile Gly
225 230 235 240
Leu Pro Ser Gly Cys Leu Ala Lys Glu Ser Ala Glu Ala Leu Thr Asp
245 250 255
Tyr Leu Pro His Asp Arg Met Thr Ile Pro Lys Gly Gln Pro Gly Tyr
260 265 270
Val Pro Glu Trp Gln His Pro Leu Leu Asn Arg Arg Lys Asn Arg Arg
275 280 285
Arg Arg Asp Trp Tyr Ser Ala Ser Leu Asn Lys Pro Lys Ala Thr Cys
290 295 300
Ser Lys Arg Ser Gly Thr Pro Asn Arg Lys Asn Ser Arg Thr Asp Gln
305 310 315 320
Ile Gln Ser Gly Arg Phe Lys Gly Ala Ile Pro Val Leu Met Arg Phe
325 330 335
Gln Asp Glu Trp Val Ile Ile Asp Ile Arg Gly Leu Leu Arg Asn Ala
340 345 350
Arg Tyr Arg Lys Leu Leu Lys Glu Lys Ser Thr Ile Pro Asp Leu Leu
355 360 365
Ser Leu Phe Thr Gly Asp Pro Ser Ile Asp Met Arg Gln Gly Val Cys
370 375 380
Thr Phe Ile Tyr Lys Ala Gly Gln Ala Cys Ser Ala Lys Met Val Lys
385 390 395 400
Thr Lys Asn Ala Pro Glu Ile Leu Ser Glu Leu Thr Lys Ser Gly Pro
405 410 415
Val Val Leu Val Ser Ile Asp Leu Gly Gln Thr Asn Pro Ile Ala Ala
420 425 430
Lys Val Ser Arg Val Thr Gln Leu Ser Asp Gly Gln Leu Ser His Glu
435 440 445
Thr Leu Leu Arg Glu Leu Leu Ser Asn Asp Ser Ser Asp Gly Lys Glu
450 455 460
Ile Ala Arg Tyr Arg Val Ala Ser Asp Arg Leu Arg Asp Lys Leu Ala
465 470 475 480
Asn Leu Ala Val Glu Arg Leu Ser Pro Glu His Lys Ser Glu Ile Leu
485 490 495
Arg Ala Lys Asn Asp Thr Pro Ala Leu Cys Lys Ala Arg Val Cys Ala
500 505 510
Ala Leu Gly Leu Asn Pro Glu Met Ile Ala Trp Asp Lys Met Thr Pro
515 520 525
Tyr Thr Glu Phe Leu Ala Thr Ala Tyr Leu Glu Lys Gly Gly Asp Arg
530 535 540
Lys Val Ala Thr Leu Lys Pro Lys Asn Arg Pro Glu Met Leu Arg Arg
545 550 555 560
Asp Ile Lys Phe Lys Gly Thr Glu Gly Val Arg Ile Glu Val Ser Pro
565 570 575
Glu Ala Ala Glu Ala Tyr Arg Glu Ala Gln Trp Asp Leu Gln Arg Thr
580 585 590
Ser Pro Glu Tyr Leu Arg Leu Ser Thr Trp Lys Gln Glu Leu Thr Lys
595 600 605
Arg Ile Leu Asn Gln Leu Arg His Lys Ala Ala Lys Ser Ser Gln Cys
610 615 620
Glu Val Val Val Met Ala Phe Glu Asp Leu Asn Ile Lys Met Met His
625 630 635 640
Gly Asn Gly Lys Trp Ala Asp Gly Gly Trp Asp Ala Phe Phe Ile Lys
645 650 655
Lys Arg Glu Asn Arg Trp Phe Met Gln Ala Phe His Lys Ser Leu Thr
660 665 670
Glu Leu Gly Ala His Lys Gly Val Pro Thr Ile Glu Val Thr Pro His
675 680 685
Arg Thr Ser Ile Thr Cys Thr Lys Cys Gly His Cys Asp Lys Ala Asn
690 695 700
Arg Asp Gly Glu Arg Phe Ala Cys Gln Lys Cys Gly Phe Val Ala His
705 710 715 720
Ala Asp Leu Glu Ile Ala Thr Asp Asn Ile Glu Arg Val Ala Leu Thr
725 730 735
Gly Lys Pro Met Pro Lys Pro Glu Ser Glu Arg Ser Gly Asp Ala Lys
740 745 750
Lys Ser Val Gly Ala Arg Lys Ala Ala Phe Lys Pro Glu Glu Asp Ala
755 760 765
Glu Ala Ala Glu
770
<210> 281
<211> 717
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-8 polypeptide sequence
<400> 281
Met Ile Lys Pro Thr Val Ser Gln Phe Leu Thr Pro Gly Phe Lys Leu
1 5 10 15
Ile Arg Asn His Ser Arg Thr Ala Gly Leu Lys Leu Lys Asn Glu Gly
20 25 30
Glu Glu Ala Cys Lys Lys Phe Val Arg Glu Asn Glu Ile Pro Lys Asp
35 40 45
Glu Cys Pro Asn Phe Gln Gly Gly Pro Ala Ile Ala Asn Ile Ile Ala
50 55 60
Lys Ser Arg Glu Phe Thr Glu Trp Glu Ile Tyr Gln Ser Ser Leu Ala
65 70 75 80
Ile Gln Glu Val Ile Phe Thr Leu Pro Lys Asp Lys Leu Pro Glu Pro
85 90 95
Ile Leu Lys Glu Glu Trp Arg Ala Gln Trp Leu Ser Glu His Gly Leu
100 105 110
Asp Thr Val Pro Tyr Lys Glu Ala Ala Gly Leu Asn Leu Ile Ile Lys
115 120 125
Asn Ala Val Asn Thr Tyr Lys Gly Val Gln Val Lys Val Asp Asn Lys
130 135 140
Asn Lys Asn Asn Leu Ala Lys Ile Asn Arg Lys Asn Glu Ile Ala Lys
145 150 155 160
Leu Asn Gly Glu Gln Glu Ile Ser Phe Glu Glu Ile Lys Ala Phe Asp
165 170 175
Asp Lys Gly Tyr Leu Leu Gln Lys Pro Ser Pro Asn Lys Ser Ile Tyr
180 185 190
Cys Tyr Gln Ser Val Ser Pro Lys Pro Phe Ile Thr Ser Lys Tyr His
195 200 205
Asn Val Asn Leu Pro Glu Glu Tyr Ile Gly Tyr Tyr Arg Lys Ser Asn
210 215 220
Glu Pro Ile Val Ser Pro Tyr Gln Phe Asp Arg Leu Arg Ile Pro Ile
225 230 235 240
Gly Glu Pro Gly Tyr Val Pro Lys Trp Gln Tyr Thr Phe Leu Ser Lys
245 250 255
Lys Glu Asn Lys Arg Arg Lys Leu Ser Lys Arg Ile Lys Asn Val Ser
260 265 270
Pro Ile Leu Gly Ile Ile Cys Ile Lys Lys Asp Trp Cys Val Phe Asp
275 280 285
Met Arg Gly Leu Leu Arg Thr Asn His Trp Lys Lys Tyr His Lys Pro
290 295 300
Thr Asp Ser Ile Asn Asp Leu Phe Asp Tyr Phe Thr Gly Asp Pro Val
305 310 315 320
Ile Asp Thr Lys Ala Asn Val Val Arg Phe Arg Tyr Lys Met Glu Asn
325 330 335
Gly Ile Val Asn Tyr Lys Pro Val Arg Glu Lys Lys Gly Lys Glu Leu
340 345 350
Leu Glu Asn Ile Cys Asp Gln Asn Gly Ser Cys Lys Leu Ala Thr Val
355 360 365
Asp Val Gly Gln Asn Asn Pro Val Ala Ile Gly Leu Phe Glu Leu Lys
370 375 380
Lys Val Asn Gly Glu Leu Thr Lys Thr Leu Ile Ser Arg His Pro Thr
385 390 395 400
Pro Ile Asp Phe Cys Asn Lys Ile Thr Ala Tyr Arg Glu Arg Tyr Asp
405 410 415
Lys Leu Glu Ser Ser Ile Lys Leu Asp Ala Ile Lys Gln Leu Thr Ser
420 425 430
Glu Gln Lys Ile Glu Val Asp Asn Tyr Asn Asn Asn Phe Thr Pro Gln
435 440 445
Asn Thr Lys Gln Ile Val Cys Ser Lys Leu Asn Ile Asn Pro Asn Asp
450 455 460
Leu Pro Trp Asp Lys Met Ile Ser Gly Thr His Phe Ile Ser Glu Lys
465 470 475 480
Ala Gln Val Ser Asn Lys Ser Glu Ile Tyr Phe Thr Ser Thr Asp Lys
485 490 495
Gly Lys Thr Lys Asp Val Met Lys Ser Asp Tyr Lys Trp Phe Gln Asp
500 505 510
Tyr Lys Pro Lys Leu Ser Lys Glu Val Arg Asp Ala Leu Ser Asp Ile
515 520 525
Glu Trp Arg Leu Arg Arg Glu Ser Leu Glu Phe Asn Lys Leu Ser Lys
530 535 540
Ser Arg Glu Gln Asp Ala Arg Gln Leu Ala Asn Trp Ile Ser Ser Met
545 550 555 560
Cys Asp Val Ile Gly Ile Glu Asn Leu Val Lys Lys Asn Asn Phe Phe
565 570 575
Gly Gly Ser Gly Lys Arg Glu Pro Gly Trp Asp Asn Phe Tyr Lys Pro
580 585 590
Lys Lys Glu Asn Arg Trp Trp Ile Asn Ala Ile His Lys Ala Leu Thr
595 600 605
Glu Leu Ser Gln Asn Lys Gly Lys Arg Val Ile Leu Leu Pro Ala Met
610 615 620
Arg Thr Ser Ile Thr Cys Pro Lys Cys Lys Tyr Cys Asp Ser Lys Asn
625 630 635 640
Arg Asn Gly Glu Lys Phe Asn Cys Leu Lys Cys Gly Ile Glu Leu Asn
645 650 655
Ala Asp Ile Asp Val Ala Thr Glu Asn Leu Ala Thr Val Ala Ile Thr
660 665 670
Ala Gln Ser Met Pro Lys Pro Thr Cys Glu Arg Ser Gly Asp Ala Lys
675 680 685
Lys Pro Val Arg Ala Arg Lys Ala Lys Ala Pro Glu Phe His Asp Lys
690 695 700
Leu Ala Pro Ser Tyr Thr Val Val Leu Arg Glu Ala Val
705 710 715
<210> 282
<211> 793
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-9 polypeptide sequence
<400> 282
Met Arg Ser Ser Arg Glu Ile Gly Asp Lys Ile Leu Met Arg Gln Pro
1 5 10 15
Ala Glu Lys Thr Ala Phe Gln Val Phe Arg Gln Glu Val Ile Gly Thr
20 25 30
Gln Lys Leu Ser Gly Gly Asp Ala Lys Thr Ala Gly Arg Leu Tyr Lys
35 40 45
Gln Gly Lys Met Glu Ala Ala Arg Glu Trp Leu Leu Lys Gly Ala Arg
50 55 60
Asp Asp Val Pro Pro Asn Phe Gln Pro Pro Ala Lys Cys Leu Val Val
65 70 75 80
Ala Val Ser His Pro Phe Glu Glu Trp Asp Ile Ser Lys Thr Asn His
85 90 95
Asp Val Gln Ala Tyr Ile Tyr Ala Gln Pro Leu Gln Ala Glu Gly His
100 105 110
Leu Asn Gly Leu Ser Glu Lys Trp Glu Asp Thr Ser Ala Asp Gln His
115 120 125
Lys Leu Trp Phe Glu Lys Thr Gly Val Pro Asp Arg Gly Leu Pro Val
130 135 140
Gln Ala Ile Asn Lys Ile Ala Lys Ala Ala Val Asn Arg Ala Phe Gly
145 150 155 160
Val Val Arg Lys Val Glu Asn Arg Asn Glu Lys Arg Arg Ser Arg Asp
165 170 175
Asn Arg Ile Ala Glu His Asn Arg Glu Asn Gly Leu Thr Glu Val Val
180 185 190
Arg Glu Ala Pro Glu Val Ala Thr Asn Ala Asp Gly Phe Leu Leu His
195 200 205
Pro Pro Gly Ile Asp Pro Ser Ile Leu Ser Tyr Ala Ser Val Ser Pro
210 215 220
Val Pro Tyr Asn Ser Ser Lys His Ser Phe Val Arg Leu Pro Glu Glu
225 230 235 240
Tyr Gln Ala Tyr Asn Val Glu Pro Asp Ala Pro Ile Pro Gln Phe Val
245 250 255
Val Glu Asp Arg Phe Ala Ile Pro Pro Gly Gln Pro Gly Tyr Val Pro
260 265 270
Glu Trp Gln Arg Leu Lys Cys Ser Thr Asn Lys His Arg Arg Met Arg
275 280 285
Gln Trp Ser Asn Gln Asp Tyr Lys Pro Lys Ala Gly Arg Arg Ala Lys
290 295 300
Pro Leu Glu Phe Gln Ala His Leu Thr Arg Glu Arg Ala Lys Gly Ala
305 310 315 320
Leu Leu Val Val Met Arg Ile Lys Glu Asp Trp Val Val Phe Asp Val
325 330 335
Arg Gly Leu Leu Arg Asn Val Glu Trp Arg Lys Val Leu Ser Glu Glu
340 345 350
Ala Arg Glu Lys Leu Thr Leu Lys Gly Leu Leu Asp Leu Phe Thr Gly
355 360 365
Asp Pro Val Ile Asp Thr Lys Arg Gly Ile Val Thr Phe Leu Tyr Lys
370 375 380
Ala Glu Ile Thr Lys Ile Leu Ser Lys Arg Thr Val Lys Thr Lys Asn
385 390 395 400
Ala Arg Asp Leu Leu Leu Arg Leu Thr Glu Pro Gly Glu Asp Gly Leu
405 410 415
Arg Arg Glu Val Gly Leu Val Ala Val Asp Leu Gly Gln Thr His Pro
420 425 430
Ile Ala Ala Ala Ile Tyr Arg Ile Gly Arg Thr Ser Ala Gly Ala Leu
435 440 445
Glu Ser Thr Val Leu His Arg Gln Gly Leu Arg Glu Asp Gln Lys Glu
450 455 460
Lys Leu Lys Glu Tyr Arg Lys Arg His Thr Ala Leu Asp Ser Arg Leu
465 470 475 480
Arg Lys Glu Ala Phe Glu Thr Leu Ser Val Glu Gln Gln Lys Glu Ile
485 490 495
Val Thr Val Ser Gly Ser Gly Ala Gln Ile Thr Lys Asp Lys Val Cys
500 505 510
Asn Tyr Leu Gly Val Asp Pro Ser Thr Leu Pro Trp Glu Lys Met Gly
515 520 525
Ser Tyr Thr His Phe Ile Ser Asp Asp Phe Leu Arg Arg Gly Gly Asp
530 535 540
Pro Asn Ile Val His Phe Asp Arg Gln Pro Lys Lys Gly Lys Val Ser
545 550 555 560
Lys Lys Ser Gln Arg Ile Lys Arg Ser Asp Ser Gln Trp Val Gly Arg
565 570 575
Met Arg Pro Arg Leu Ser Gln Glu Thr Ala Lys Ala Arg Met Glu Ala
580 585 590
Asp Trp Ala Ala Gln Asn Glu Asn Glu Glu Tyr Lys Arg Leu Ala Arg
595 600 605
Ser Lys Gln Glu Leu Ala Arg Trp Cys Val Asn Thr Leu Leu Gln Asn
610 615 620
Thr Arg Cys Ile Thr Gln Cys Asp Glu Ile Val Val Val Ile Glu Asp
625 630 635 640
Leu Asn Val Lys Ser Leu His Gly Lys Gly Ala Arg Glu Pro Gly Trp
645 650 655
Asp Asn Phe Phe Thr Pro Lys Thr Glu Asn Arg Trp Phe Ile Gln Ile
660 665 670
Leu His Lys Thr Phe Ser Glu Leu Pro Lys His Arg Gly Glu His Val
675 680 685
Ile Glu Gly Cys Pro Leu Arg Thr Ser Ile Thr Cys Pro Ala Cys Ser
690 695 700
Tyr Cys Asp Lys Asn Ser Arg Asn Gly Glu Lys Phe Val Cys Val Ala
705 710 715 720
Cys Gly Ala Thr Phe His Ala Asp Phe Glu Val Ala Thr Tyr Asn Leu
725 730 735
Val Arg Leu Ala Thr Thr Gly Met Pro Met Pro Lys Ser Leu Glu Arg
740 745 750
Gln Gly Gly Gly Glu Lys Ala Gly Gly Ala Arg Lys Ala Arg Lys Lys
755 760 765
Ala Lys Gln Val Glu Lys Ile Val Val Gln Ala Asn Ala Asn Val Thr
770 775 780
Met Asn Gly Ala Ser Leu His Ser Pro
785 790
<210> 283
<211> 812
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Casphi-10 polypeptide
sequence
<400> 283
Met Asp Met Leu Asp Thr Glu Thr Asn Tyr Ala Thr Glu Thr Pro Ala
1 5 10 15
Gln Gln Gln Asp Tyr Ser Pro Lys Pro Pro Lys Lys Ala Gln Arg Ala
20 25 30
Pro Lys Gly Phe Ser Lys Lys Ala Arg Pro Glu Lys Lys Pro Pro Lys
35 40 45
Pro Ile Thr Leu Phe Thr Gln Lys His Phe Ser Gly Val Arg Phe Leu
50 55 60
Lys Arg Val Ile Arg Asp Ala Ser Lys Ile Leu Lys Leu Ser Glu Ser
65 70 75 80
Arg Thr Ile Thr Phe Leu Glu Gln Ala Ile Glu Arg Asp Gly Ser Ala
85 90 95
Pro Pro Asp Val Thr Pro Pro Val His Asn Thr Ile Met Ala Val Thr
100 105 110
Arg Pro Phe Glu Glu Trp Pro Glu Val Ile Leu Ser Lys Ala Leu Gln
115 120 125
Lys His Cys Tyr Ala Leu Thr Lys Lys Ile Lys Ile Lys Thr Trp Pro
130 135 140
Lys Lys Gly Pro Gly Lys Lys Cys Leu Ala Ala Trp Ser Ala Arg Thr
145 150 155 160
Lys Ile Pro Leu Ile Pro Gly Gln Val Gln Ala Thr Asn Gly Leu Phe
165 170 175
Asp Arg Ile Gly Ser Ile Tyr Asp Gly Val Glu Lys Lys Val Thr Asn
180 185 190
Arg Asn Ala Asn Lys Lys Leu Glu Tyr Asp Glu Ala Ile Lys Glu Gly
195 200 205
Arg Asn Pro Ala Val Pro Glu Tyr Glu Thr Ala Tyr Asn Ile Asp Gly
210 215 220
Thr Leu Ile Asn Lys Pro Gly Tyr Asn Pro Asn Leu Tyr Ile Thr Gln
225 230 235 240
Ser Arg Thr Pro Arg Leu Ile Thr Glu Ala Asp Arg Pro Leu Val Glu
245 250 255
Lys Ile Leu Trp Gln Met Val Glu Lys Lys Thr Gln Ser Arg Asn Gln
260 265 270
Ala Arg Arg Ala Arg Leu Glu Lys Ala Ala His Leu Gln Gly Leu Pro
275 280 285
Val Pro Lys Phe Val Pro Glu Lys Val Asp Arg Ser Gln Lys Ile Glu
290 295 300
Ile Arg Ile Ile Asp Pro Leu Asp Lys Ile Glu Pro Tyr Met Pro Gln
305 310 315 320
Asp Arg Met Ala Ile Lys Ala Ser Gln Asp Gly His Val Pro Tyr Trp
325 330 335
Gln Arg Pro Phe Leu Ser Lys Arg Arg Asn Arg Arg Val Arg Ala Gly
340 345 350
Trp Gly Lys Gln Val Ser Ser Ile Gln Ala Trp Leu Thr Gly Ala Leu
355 360 365
Leu Val Ile Val Arg Leu Gly Asn Glu Ala Phe Leu Ala Asp Ile Arg
370 375 380
Gly Ala Leu Arg Asn Ala Gln Trp Arg Lys Leu Leu Lys Pro Asp Ala
385 390 395 400
Thr Tyr Gln Ser Leu Phe Asn Leu Phe Thr Gly Asp Pro Val Val Asn
405 410 415
Thr Arg Thr Asn His Leu Thr Met Ala Tyr Arg Glu Gly Val Val Asn
420 425 430
Ile Val Lys Ser Arg Ser Phe Lys Gly Arg Gln Thr Arg Glu His Leu
435 440 445
Leu Thr Leu Leu Gly Gln Gly Lys Thr Val Ala Gly Val Ser Phe Asp
450 455 460
Leu Gly Gln Lys His Ala Ala Gly Leu Leu Ala Ala His Phe Gly Leu
465 470 475 480
Gly Glu Asp Gly Asn Pro Val Phe Thr Pro Ile Gln Ala Cys Phe Leu
485 490 495
Pro Gln Arg Tyr Leu Asp Ser Leu Thr Asn Tyr Arg Asn Arg Tyr Asp
500 505 510
Ala Leu Thr Leu Asp Met Arg Arg Gln Ser Leu Leu Ala Leu Thr Pro
515 520 525
Ala Gln Gln Gln Glu Phe Ala Asp Ala Gln Arg Asp Pro Gly Gly Gln
530 535 540
Ala Lys Arg Ala Cys Cys Leu Lys Leu Asn Leu Asn Pro Asp Glu Ile
545 550 555 560
Arg Trp Asp Leu Val Ser Gly Ile Ser Thr Met Ile Ser Asp Leu Tyr
565 570 575
Ile Glu Arg Gly Gly Asp Pro Arg Asp Val His Gln Gln Val Glu Thr
580 585 590
Lys Pro Lys Gly Lys Arg Lys Ser Glu Ile Arg Ile Leu Lys Ile Arg
595 600 605
Asp Gly Lys Trp Ala Tyr Asp Phe Arg Pro Lys Ile Ala Asp Glu Thr
610 615 620
Arg Lys Ala Gln Arg Glu Gln Leu Trp Lys Leu Gln Lys Ala Ser Ser
625 630 635 640
Glu Phe Glu Arg Leu Ser Arg Tyr Lys Ile Asn Ile Ala Arg Ala Ile
645 650 655
Ala Asn Trp Ala Leu Gln Trp Gly Arg Glu Leu Ser Gly Cys Asp Ile
660 665 670
Val Ile Pro Val Leu Glu Asp Leu Asn Val Gly Ser Lys Phe Phe Asp
675 680 685
Gly Lys Gly Lys Trp Leu Leu Gly Trp Asp Asn Arg Phe Thr Pro Lys
690 695 700
Lys Glu Asn Arg Trp Phe Ile Lys Val Leu His Lys Ala Val Ala Glu
705 710 715 720
Leu Ala Pro His Arg Gly Val Pro Val Tyr Glu Val Met Pro His Arg
725 730 735
Thr Ser Met Thr Cys Pro Ala Cys His Tyr Cys His Pro Thr Asn Arg
740 745 750
Glu Gly Asp Arg Phe Glu Cys Gln Ser Cys His Val Val Lys Asn Thr
755 760 765
Asp Arg Asp Val Ala Pro Tyr Asn Ile Leu Arg Val Ala Val Glu Gly
770 775 780
Lys Thr Leu Asp Arg Trp Gln Ala Glu Lys Lys Pro Gln Ala Glu Pro
785 790 795 800
Asp Arg Pro Met Ile Leu Ile Asp Asn Gln Glu Ser
805 810
<210> 284
<211> 84
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
sequence
<400> 284
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu
<210> 285
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 285
gttttaggtc atgtgtgctg gg 22
<210> 286
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 286
tttcttacac agggctcgaa gg 22
<210> 287
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 287
gtttcaggtc atgtgtgctg gg 22
<210> 288
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 288
gccacttaca cagggctcga agg 23
<210> 289
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 289
acattaggtc atgtgtgctg gg 22
<210> 290
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 290
gatctcacac agggctcgaa gg 22
<210> 291
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 291
tccttaggtc atgtgtgctg gg 22
<210> 292
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 292
gtcacctaca cagggctcga agg 23
<210> 293
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 293
gatttcaggt catgtgtgct ggg 23
<210> 294
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 294
gtgcttacac agggctcgaa gg 22
<210> 295
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 295
tccacaggtc atgtgtgctg gg 22
<210> 296
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 296
gatacttaca cagggctcga agg 23
<210> 297
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 297
tgttttagct gcggcaaggc gg 22
<210> 298
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 298
tttcttacag ccataatttc gg 22
<210> 299
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 299
ctccacagct gcggcaaggc gg 22
<210> 300
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 300
gatacttaca gccataattt cgg 23
<210> 301
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 301
tgttttaggg acgaaagaga gg 22
<210> 302
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 302
ttacctggct ctcttagcca gg 22
<210> 303
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 303
ctccacaggg acgaaagaga gg 22
<210> 304
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 304
cttgcaggtc atgtgtgctg gg 22
<210> 305
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 305
attgcaggtc atgtgtgctg gg 22
<210> 306
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 306
tctccaggtc atgtgtgctg gg 22
<210> 307
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 307
tctgcaggtc atgtgtgctg gg 22
<210> 308
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 308
gactcaggtc atgtgtgctg gg 22
<210> 309
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 309
gcacccaggt catgtgtgct ggg 23
<210> 310
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 310
aatttaggtc atgtgtgctg gg 22
<210> 311
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 311
cattaggtcg agatcacaga gg 22
<210> 312
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 312
ccttaggtcg agatcacaga gg 22
<210> 313
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 313
gtttcaggtc gagatcacag agg 23
<210> 314
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 314
acattaggct aagagagcca gg 22
<210> 315
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 315
tccttaggct aagagagcca gg 22
<210> 316
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 316
gtttcaggct aagagagcca gg 22
<210> 317
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 317
acattagatt atggctctgc gg 22
<210> 318
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 318
tccttagatt atggctctgc gg 22
<210> 319
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 319
gtttcagatt atggctctgc gg 22
<210> 320
<211> 1129
<212> PRT
<213> Alicyclobacillus acido-terrestris
<220>
<221> MISC_FEATURE
<222> (1)..(1129)
<223> Cas12b/C2c1; sp|T0D7A2|C2C1_ALIAG CRISPR-associated endonuclease
C2c1 OS = Alicyclobacillus acido-terrestris (strain ATCC 49025 /
DSM 3922/ CIP 106132 / NCIMB 13137/GD3B) GN=c2c1 PE=1 SV=1;
Cas12b/C2c1 polypeptide sequence
<400> 320
Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Asp Asp Met Pro
1 5 10 15
Glu Ile Arg Ala Gly Leu Trp Lys Leu His Lys Glu Val Asn Ala Gly
20 25 30
Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
35 40 45
Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Asp Lys Thr
50 55 60
Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
65 70 75 80
Val Glu Asn Gly His Arg Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
85 90 95
Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
100 105 110
Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
115 120 125
Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
130 135 140
Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
145 150 155 160
Glu Glu Lys Glu Lys Ala Glu Thr Arg Lys Ser Ala Asp Arg Thr Ala
165 170 175
Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
180 185 190
Val Tyr Thr Asp Ser Glu Met Ser Ser Val Glu Trp Lys Pro Leu Arg
195 200 205
Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
210 215 220
Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Gln
225 230 235 240
Glu Tyr Ala Lys Leu Val Glu Gln Lys Asn Arg Phe Glu Gln Lys Asn
245 250 255
Phe Val Gly Gln Glu His Leu Val His Leu Val Asn Gln Leu Gln Gln
260 265 270
Asp Met Lys Glu Ala Ser Pro Gly Leu Glu Ser Lys Glu Gln Thr Ala
275 280 285
His Tyr Val Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
290 295 300
Lys Trp Gly Lys Leu Ala Pro Asp Ala Pro Phe Asp Leu Tyr Asp Ala
305 310 315 320
Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
325 330 335
Asp Leu Phe Ala Lys Leu Ala Glu Pro Glu Tyr Gln Ala Leu Trp Arg
340 345 350
Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Leu
355 360 365
Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
370 375 380
Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
385 390 395 400
Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Arg Arg His
405 410 415
Ala Ile Arg Phe His Lys Leu Leu Lys Val Glu Asn Gly Val Ala Arg
420 425 430
Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Glu Gln Leu Asp
435 440 445
Asn Leu Leu Pro Arg Asp Pro Asn Glu Pro Ile Ala Leu Tyr Phe Arg
450 455 460
Asp Tyr Gly Ala Glu Gln His Phe Thr Gly Glu Phe Gly Gly Ala Lys
465 470 475 480
Ile Gln Cys Arg Arg Asp Gln Leu Ala His Met His Arg Arg Arg Gly
485 490 495
Ala Arg Asp Val Tyr Leu Asn Val Ser Val Arg Val Gln Ser Gln Ser
500 505 510
Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
515 520 525
Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
530 535 540
Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
545 550 555 560
Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
565 570 575
Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
580 585 590
Asn Ser Lys Gly Arg Val Pro Phe Phe Phe Pro Ile Lys Gly Asn Asp
595 600 605
Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
610 615 620
Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
625 630 635 640
Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
645 650 655
Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
660 665 670
Leu Ile Glu Gln Pro Val Asp Ala Ala Asn His Met Thr Pro Asp Trp
675 680 685
Arg Glu Ala Phe Glu Asn Glu Leu Gln Lys Leu Lys Ser Leu His Gly
690 695 700
Ile Cys Ser Asp Lys Glu Trp Met Asp Ala Val Tyr Glu Ser Val Arg
705 710 715 720
Arg Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp
725 730 735
Val Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Ala Lys Asp Val
740 745 750
Val Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr
755 760 765
Lys Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val
770 775 780
Ile Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His
785 790 795 800
Ile Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile
805 810 815
Ile Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Glu Arg Gly Lys
820 825 830
Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
835 840 845
Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
850 855 860
Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Ile
865 870 875 880
Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
885 890 895
Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
900 905 910
Arg Arg Val Pro Ala Arg Cys Thr Gln Glu His Asn Pro Glu Pro Phe
915 920 925
Pro Trp Trp Leu Asn Lys Phe Val Val Glu His Thr Leu Asp Ala Cys
930 935 940
Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Ile Phe
945 950 955 960
Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
965 970 975
Asp Leu Asn Ala Ala Gln Asn Leu Gln Gln Arg Leu Trp Ser Asp Phe
980 985 990
Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly
995 1000 1005
Glu Leu Val Leu Ile Pro Arg Leu Thr Gly Lys Arg Thr Ala Asp
1010 1015 1020
Ser Tyr Ser Asn Lys Val Phe Tyr Thr Asn Thr Gly Val Thr Tyr
1025 1030 1035
Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln
1040 1045 1050
Glu Lys Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp
1055 1060 1065
Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly
1070 1075 1080
Ile Ile Asn Arg Gly Asn Trp Thr Arg Gln Lys Glu Phe Trp Ser
1085 1090 1095
Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg
1100 1105 1110
Ser Arg Val Pro Leu Gln Asp Ser Ala Cys Glu Asn Thr Gly Asp
1115 1120 1125
Ile
<210> 321
<211> 1368
<212> PRT
<213> Mus musculus
<220>
<221> MISC_FEATURE
<222> (1)..(1368)
<223> high fidelity Cas9 polypeptide sequence
<400> 321
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Ala Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Ala Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Ala Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Ala Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 322
<211> 1368
<212> PRT
<213> S. pyogenes
<220>
<221> MISC_FEATURE
<222> (1)..(1368)
<223> PAM-binding SpEQR Cas9 polypeptide sequence
<400> 322
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Val Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 323
<211> 1368
<212> PRT
<213> S. pyogenes
<220>
<221> MISC_FEATURE
<222> (1)..(1368)
<223> PAM-binding SpVQR Cas9 polypeptide sequence
<400> 323
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 324
<211> 1368
<212> PRT
<213> S. pyogenes
<220>
<221> MISC_FEATURE
<222> (1)..(1368)
<223> SpVQR Cas9 polypeptide sequence
<400> 324
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Arg
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Glu Tyr Arg Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 325
<211> 1359
<212> PRT
<213> Streptococcus macacae
<220>
<221> MISC_FEATURE
<222> (1)..(1359)
<223> SpyMacCas9 polypeptide sequence
<400> 325
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu
705 710 715 720
His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Ile Gln Thr Val Gly Gln Asn Gly Gly Leu Phe Asp Asp Asn Pro
1100 1105 1110
Lys Ser Pro Leu Glu Val Thr Pro Ser Lys Leu Val Pro Leu Lys
1115 1120 1125
Lys Glu Leu Asn Pro Lys Lys Tyr Gly Gly Tyr Gln Lys Pro Thr
1130 1135 1140
Thr Ala Tyr Pro Val Leu Leu Ile Thr Asp Thr Lys Gln Leu Ile
1145 1150 1155
Pro Ile Ser Val Met Asn Lys Lys Gln Phe Glu Gln Asn Pro Val
1160 1165 1170
Lys Phe Leu Arg Asp Arg Gly Tyr Gln Gln Val Gly Lys Asn Asp
1175 1180 1185
Phe Ile Lys Leu Pro Lys Tyr Thr Leu Val Asp Ile Gly Asp Gly
1190 1195 1200
Ile Lys Arg Leu Trp Ala Ser Ser Lys Glu Ile His Lys Gly Asn
1205 1210 1215
Gln Leu Val Val Ser Lys Lys Ser Gln Ile Leu Leu Tyr His Ala
1220 1225 1230
His His Leu Asp Ser Asp Leu Ser Asn Asp Tyr Leu Gln Asn His
1235 1240 1245
Asn Gln Gln Phe Asp Val Leu Phe Asn Glu Ile Ile Ser Phe Ser
1250 1255 1260
Lys Lys Cys Lys Leu Gly Lys Glu His Ile Gln Lys Ile Glu Asn
1265 1270 1275
Val Tyr Ser Asn Lys Lys Asn Ser Ala Ser Ile Glu Glu Leu Ala
1280 1285 1290
Glu Ser Phe Ile Lys Leu Leu Gly Phe Thr Gln Leu Gly Ala Thr
1295 1300 1305
Ser Pro Phe Asn Phe Leu Gly Val Lys Leu Asn Gln Lys Gln Tyr
1310 1315 1320
Lys Gly Lys Lys Asp Tyr Ile Leu Pro Cys Thr Glu Gly Thr Leu
1325 1330 1335
Ile Arg Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Val Asp Leu
1340 1345 1350
Ser Lys Ile Gly Glu Asp
1355
<210> 326
<211> 1410
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: CP5 polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(341)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (342)..(362)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (363)..(1388)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1389)..(1410)
<223> Bipartite nuclear localization sequence
<400> 326
Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1 5 10 15
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
20 25 30
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
35 40 45
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
50 55 60
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
65 70 75 80
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
85 90 95
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Met Gln Pro Thr Val
100 105 110
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
115 120 125
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg
130 135 140
Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
145 150 155 160
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
165 170 175
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Lys Phe
180 185 190
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
195 200 205
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
210 215 220
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp
225 230 235 240
Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
245 250 255
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
260 265 270
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
275 280 285
Thr Asn Leu Gly Ala Pro Arg Ala Phe Lys Tyr Phe Asp Thr Thr Ile
290 295 300
Ala Arg Lys Glu Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
305 310 315 320
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
325 330 335
Gln Leu Gly Gly Asp Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
340 345 350
Ser Gly Gly Ser Gly Gly Ser Gly Gly Met Asp Lys Lys Tyr Ser Ile
355 360 365
Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp
370 375 380
Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp
385 390 395 400
Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser
405 410 415
Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg
420 425 430
Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser
435 440 445
Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu
450 455 460
Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe
465 470 475 480
Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile
485 490 495
Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu
500 505 510
Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His
515 520 525
Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys
530 535 540
Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn
545 550 555 560
Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg
565 570 575
Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly
580 585 590
Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly
595 600 605
Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys
610 615 620
Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu
625 630 635 640
Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn
645 650 655
Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu
660 665 670
Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu
675 680 685
His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu
690 695 700
Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr
705 710 715 720
Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe
725 730 735
Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val
740 745 750
Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn
755 760 765
Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu
770 775 780
Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
785 790 795 800
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu
805 810 815
Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu
820 825 830
Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser
835 840 845
Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro
850 855 860
Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr
865 870 875 880
Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg
885 890 895
Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu
900 905 910
Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp
915 920 925
Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val
930 935 940
Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys
945 950 955 960
Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile
965 970 975
Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met
980 985 990
Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val
995 1000 1005
Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu
1010 1015 1020
Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys
1025 1030 1035
Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn
1040 1045 1050
Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
1055 1060 1065
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
1070 1075 1080
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
1085 1090 1095
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
1100 1105 1110
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
1115 1120 1125
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
1130 1135 1140
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
1145 1150 1155
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
1160 1165 1170
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu
1175 1180 1185
Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val
1190 1195 1200
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
1205 1210 1215
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser
1220 1225 1230
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
1235 1240 1245
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
1250 1255 1260
Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1265 1270 1275
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1280 1285 1290
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
1295 1300 1305
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu
1310 1315 1320
Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
1325 1330 1335
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
1340 1345 1350
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1355 1360 1365
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1370 1375 1380
Ala Lys Ser Glu Gln Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly
1385 1390 1395
Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1400 1405 1410
<210> 327
<211> 1302
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Cas12c1 polypeptide sequence
<400> 327
Met Gln Thr Lys Lys Thr His Leu His Leu Ile Ser Ala Lys Ala Ser
1 5 10 15
Arg Lys Tyr Arg Arg Thr Ile Ala Cys Leu Ser Asp Thr Ala Lys Lys
20 25 30
Asp Leu Glu Arg Arg Lys Gln Ser Gly Ala Ala Asp Pro Ala Gln Glu
35 40 45
Leu Ser Cys Leu Lys Thr Ile Lys Phe Lys Leu Glu Val Pro Glu Gly
50 55 60
Ser Lys Leu Pro Ser Phe Asp Arg Ile Ser Gln Ile Tyr Asn Ala Leu
65 70 75 80
Glu Thr Ile Glu Lys Gly Ser Leu Ser Tyr Leu Leu Phe Ala Leu Ile
85 90 95
Leu Ser Gly Phe Arg Ile Phe Pro Asn Ser Ser Ala Ala Lys Thr Phe
100 105 110
Ala Ser Ser Ser Cys Tyr Lys Asn Asp Gln Phe Ala Ser Gln Ile Lys
115 120 125
Glu Ile Phe Gly Glu Met Val Lys Asn Phe Ile Pro Ser Glu Leu Glu
130 135 140
Ser Ile Leu Lys Lys Gly Arg Arg Lys Asn Asn Lys Asp Trp Thr Glu
145 150 155 160
Glu Asn Ile Lys Arg Val Leu Asn Ser Glu Phe Gly Arg Lys Asn Ser
165 170 175
Glu Gly Ser Ser Ala Leu Phe Asp Ser Phe Leu Ser Lys Phe Ser Gln
180 185 190
Glu Leu Phe Arg Lys Phe Asp Ser Trp Asn Glu Val Asn Lys Lys Tyr
195 200 205
Leu Glu Ala Ala Glu Leu Leu Asp Ser Met Leu Ala Ser Tyr Gly Pro
210 215 220
Phe Asp Ser Val Cys Lys Met Ile Gly Asp Ser Asp Ser Arg Asn Ser
225 230 235 240
Leu Pro Asp Lys Ser Thr Ile Ala Phe Thr Asn Asn Ala Glu Ile Thr
245 250 255
Val Asp Ile Glu Ser Ser Val Met Pro Tyr Met Ala Ile Ala Ala Leu
260 265 270
Leu Arg Glu Tyr Arg Gln Ser Lys Ser Lys Ala Ala Pro Val Ala Tyr
275 280 285
Val Gln Ser His Leu Thr Thr Thr Asn Gly Asn Gly Leu Ser Trp Phe
290 295 300
Phe Lys Phe Gly Leu Asp Leu Ile Arg Lys Ala Pro Val Ser Ser Lys
305 310 315 320
Gln Ser Thr Ser Asp Gly Ser Lys Ser Leu Gln Glu Leu Phe Ser Val
325 330 335
Pro Asp Asp Lys Leu Asp Gly Leu Lys Phe Ile Lys Glu Ala Cys Glu
340 345 350
Ala Leu Pro Glu Ala Ser Leu Leu Cys Gly Glu Lys Gly Glu Leu Leu
355 360 365
Gly Tyr Gln Asp Phe Arg Thr Ser Phe Ala Gly His Ile Asp Ser Trp
370 375 380
Val Ala Asn Tyr Val Asn Arg Leu Phe Glu Leu Ile Glu Leu Val Asn
385 390 395 400
Gln Leu Pro Glu Ser Ile Lys Leu Pro Ser Ile Leu Thr Gln Lys Asn
405 410 415
His Asn Leu Val Ala Ser Leu Gly Leu Gln Glu Ala Glu Val Ser His
420 425 430
Ser Leu Glu Leu Phe Glu Gly Leu Val Lys Asn Val Arg Gln Thr Leu
435 440 445
Lys Lys Leu Ala Gly Ile Asp Ile Ser Ser Ser Pro Asn Glu Gln Asp
450 455 460
Ile Lys Glu Phe Tyr Ala Phe Ser Asp Val Leu Asn Arg Leu Gly Ser
465 470 475 480
Ile Arg Asn Gln Ile Glu Asn Ala Val Gln Thr Ala Lys Lys Asp Lys
485 490 495
Ile Asp Leu Glu Ser Ala Ile Glu Trp Lys Glu Trp Lys Lys Leu Lys
500 505 510
Lys Leu Pro Lys Leu Asn Gly Leu Gly Gly Gly Val Pro Lys Gln Gln
515 520 525
Glu Leu Leu Asp Lys Ala Leu Glu Ser Val Lys Gln Ile Arg His Tyr
530 535 540
Gln Arg Ile Asp Phe Glu Arg Val Ile Gln Trp Ala Val Asn Glu His
545 550 555 560
Cys Leu Glu Thr Val Pro Lys Phe Leu Val Asp Ala Glu Lys Lys Lys
565 570 575
Ile Asn Lys Glu Ser Ser Thr Asp Phe Ala Ala Lys Glu Asn Ala Val
580 585 590
Arg Phe Leu Leu Glu Gly Ile Gly Ala Ala Ala Arg Gly Lys Thr Asp
595 600 605
Ser Val Ser Lys Ala Ala Tyr Asn Trp Phe Val Val Asn Asn Phe Leu
610 615 620
Ala Lys Lys Asp Leu Asn Arg Tyr Phe Ile Asn Cys Gln Gly Cys Ile
625 630 635 640
Tyr Lys Pro Pro Tyr Ser Lys Arg Arg Ser Leu Ala Phe Ala Leu Arg
645 650 655
Ser Asp Asn Lys Asp Thr Ile Glu Val Val Trp Glu Lys Phe Glu Thr
660 665 670
Phe Tyr Lys Glu Ile Ser Lys Glu Ile Glu Lys Phe Asn Ile Phe Ser
675 680 685
Gln Glu Phe Gln Thr Phe Leu His Leu Glu Asn Leu Arg Met Lys Leu
690 695 700
Leu Leu Arg Arg Ile Gln Lys Pro Ile Pro Ala Glu Ile Ala Phe Phe
705 710 715 720
Ser Leu Pro Gln Glu Tyr Tyr Asp Ser Leu Pro Pro Asn Val Ala Phe
725 730 735
Leu Ala Leu Asn Gln Glu Ile Thr Pro Ser Glu Tyr Ile Thr Gln Phe
740 745 750
Asn Leu Tyr Ser Ser Phe Leu Asn Gly Asn Leu Ile Leu Leu Arg Arg
755 760 765
Ser Arg Ser Tyr Leu Arg Ala Lys Phe Ser Trp Val Gly Asn Ser Lys
770 775 780
Leu Ile Tyr Ala Ala Lys Glu Ala Arg Leu Trp Lys Ile Pro Asn Ala
785 790 795 800
Tyr Trp Lys Ser Asp Glu Trp Lys Met Ile Leu Asp Ser Asn Val Leu
805 810 815
Val Phe Asp Lys Ala Gly Asn Val Leu Pro Ala Pro Thr Leu Lys Lys
820 825 830
Val Cys Glu Arg Glu Gly Asp Leu Arg Leu Phe Tyr Pro Leu Leu Arg
835 840 845
Gln Leu Pro His Asp Trp Cys Tyr Arg Asn Pro Phe Val Lys Ser Val
850 855 860
Gly Arg Glu Lys Asn Val Ile Glu Val Asn Lys Glu Gly Glu Pro Lys
865 870 875 880
Val Ala Ser Ala Leu Pro Gly Ser Leu Phe Arg Leu Ile Gly Pro Ala
885 890 895
Pro Phe Lys Ser Leu Leu Asp Asp Cys Phe Phe Asn Pro Leu Asp Lys
900 905 910
Asp Leu Arg Glu Cys Met Leu Ile Val Asp Gln Glu Ile Ser Gln Lys
915 920 925
Val Glu Ala Gln Lys Val Glu Ala Ser Leu Glu Ser Cys Thr Tyr Ser
930 935 940
Ile Ala Val Pro Ile Arg Tyr His Leu Glu Glu Pro Lys Val Ser Asn
945 950 955 960
Gln Phe Glu Asn Val Leu Ala Ile Asp Gln Gly Glu Ala Gly Leu Ala
965 970 975
Tyr Ala Val Phe Ser Leu Lys Ser Ile Gly Glu Ala Glu Thr Lys Pro
980 985 990
Ile Ala Val Gly Thr Ile Arg Ile Pro Ser Ile Arg Arg Leu Ile His
995 1000 1005
Ser Val Ser Thr Tyr Arg Lys Lys Lys Gln Arg Leu Gln Asn Phe
1010 1015 1020
Lys Gln Asn Tyr Asp Ser Thr Ala Phe Ile Met Arg Glu Asn Val
1025 1030 1035
Thr Gly Asp Val Cys Ala Lys Ile Val Gly Leu Met Lys Glu Phe
1040 1045 1050
Asn Ala Phe Pro Val Leu Glu Tyr Asp Val Lys Asn Leu Glu Ser
1055 1060 1065
Gly Ser Arg Gln Leu Ser Ala Val Tyr Lys Ala Val Asn Ser His
1070 1075 1080
Phe Leu Tyr Phe Lys Glu Pro Gly Arg Asp Ala Leu Arg Lys Gln
1085 1090 1095
Leu Trp Tyr Gly Gly Asp Ser Trp Thr Ile Asp Gly Ile Glu Ile
1100 1105 1110
Val Thr Arg Glu Arg Lys Glu Asp Gly Lys Glu Gly Val Glu Lys
1115 1120 1125
Ile Val Pro Leu Lys Val Phe Pro Gly Arg Ser Val Ser Ala Arg
1130 1135 1140
Phe Thr Ser Lys Thr Cys Ser Cys Cys Gly Arg Asn Val Phe Asp
1145 1150 1155
Trp Leu Phe Thr Glu Lys Lys Ala Lys Thr Asn Lys Lys Phe Asn
1160 1165 1170
Val Asn Ser Lys Gly Glu Leu Thr Thr Ala Asp Gly Val Ile Gln
1175 1180 1185
Leu Phe Glu Ala Asp Arg Ser Lys Gly Pro Lys Phe Tyr Ala Arg
1190 1195 1200
Arg Lys Glu Arg Thr Pro Leu Thr Lys Pro Ile Ala Lys Gly Ser
1205 1210 1215
Tyr Ser Leu Glu Glu Ile Glu Arg Arg Val Arg Thr Asn Leu Arg
1220 1225 1230
Arg Ala Pro Lys Ser Lys Gln Ser Arg Asp Thr Ser Gln Ser Gln
1235 1240 1245
Tyr Phe Cys Val Tyr Lys Asp Cys Ala Leu His Phe Ser Gly Met
1250 1255 1260
Gln Ala Asp Glu Asn Ala Ala Ile Asn Ile Gly Arg Arg Phe Leu
1265 1270 1275
Thr Ala Leu Arg Lys Asn Arg Arg Ser Asp Phe Pro Ser Asn Val
1280 1285 1290
Lys Ile Ser Asp Arg Leu Leu Asp Asn
1295 1300
<210> 328
<211> 1218
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Cas12c2 polypeptide sequence
<400> 328
Met Thr Lys His Ser Ile Pro Leu His Ala Phe Arg Asn Ser Gly Ala
1 5 10 15
Asp Ala Arg Lys Trp Lys Gly Arg Ile Ala Leu Leu Ala Lys Arg Gly
20 25 30
Lys Glu Thr Met Arg Thr Leu Gln Phe Pro Leu Glu Met Ser Glu Pro
35 40 45
Glu Ala Ala Ala Ile Asn Thr Thr Pro Phe Ala Val Ala Tyr Asn Ala
50 55 60
Ile Glu Gly Thr Gly Lys Gly Thr Leu Phe Asp Tyr Trp Ala Lys Leu
65 70 75 80
His Leu Ala Gly Phe Arg Phe Phe Pro Ser Gly Gly Ala Ala Thr Ile
85 90 95
Phe Arg Gln Gln Ala Val Phe Glu Asp Ala Ser Trp Asn Ala Ala Phe
100 105 110
Cys Gln Gln Ser Gly Lys Asp Trp Pro Trp Leu Val Pro Ser Lys Leu
115 120 125
Tyr Glu Arg Phe Thr Lys Ala Pro Arg Glu Val Ala Lys Lys Asp Gly
130 135 140
Ser Lys Lys Ser Ile Glu Phe Thr Gln Glu Asn Val Ala Asn Glu Ser
145 150 155 160
His Val Ser Leu Val Gly Ala Ser Ile Thr Asp Lys Thr Pro Glu Asp
165 170 175
Gln Lys Glu Phe Phe Leu Lys Met Ala Gly Ala Leu Ala Glu Lys Phe
180 185 190
Asp Ser Trp Lys Ser Ala Asn Glu Asp Arg Ile Val Ala Met Lys Val
195 200 205
Ile Asp Glu Phe Leu Lys Ser Glu Gly Leu His Leu Pro Ser Leu Glu
210 215 220
Asn Ile Ala Val Lys Cys Ser Val Glu Thr Lys Pro Asp Asn Ala Thr
225 230 235 240
Val Ala Trp His Asp Ala Pro Met Ser Gly Val Gln Asn Leu Ala Ile
245 250 255
Gly Val Phe Ala Thr Cys Ala Ser Arg Ile Asp Asn Ile Tyr Asp Leu
260 265 270
Asn Gly Gly Lys Leu Ser Lys Leu Ile Gln Glu Ser Ala Thr Thr Pro
275 280 285
Asn Val Thr Ala Leu Ser Trp Leu Phe Gly Lys Gly Leu Glu Tyr Phe
290 295 300
Arg Thr Thr Asp Ile Asp Thr Ile Met Gln Asp Phe Asn Ile Pro Ala
305 310 315 320
Ser Ala Lys Glu Ser Ile Lys Pro Leu Val Glu Ser Ala Gln Ala Ile
325 330 335
Pro Thr Met Thr Val Leu Gly Lys Lys Asn Tyr Ala Pro Phe Arg Pro
340 345 350
Asn Phe Gly Gly Lys Ile Asp Ser Trp Ile Ala Asn Tyr Ala Ser Arg
355 360 365
Leu Met Leu Leu Asn Asp Ile Leu Glu Gln Ile Glu Pro Gly Phe Glu
370 375 380
Leu Pro Gln Ala Leu Leu Asp Asn Glu Thr Leu Met Ser Gly Ile Asp
385 390 395 400
Met Thr Gly Asp Glu Leu Lys Glu Leu Ile Glu Ala Val Tyr Ala Trp
405 410 415
Val Asp Ala Ala Lys Gln Gly Leu Ala Thr Leu Leu Gly Arg Gly Gly
420 425 430
Asn Val Asp Asp Ala Val Gln Thr Phe Glu Gln Phe Ser Ala Met Met
435 440 445
Asp Thr Leu Asn Gly Thr Leu Asn Thr Ile Ser Ala Arg Tyr Val Arg
450 455 460
Ala Val Glu Met Ala Gly Lys Asp Glu Ala Arg Leu Glu Lys Leu Ile
465 470 475 480
Glu Cys Lys Phe Asp Ile Pro Lys Trp Cys Lys Ser Val Pro Lys Leu
485 490 495
Val Gly Ile Ser Gly Gly Leu Pro Lys Val Glu Glu Glu Ile Lys Val
500 505 510
Met Asn Ala Ala Phe Lys Asp Val Arg Ala Arg Met Phe Val Arg Phe
515 520 525
Glu Glu Ile Ala Ala Tyr Val Ala Ser Lys Gly Ala Gly Met Asp Val
530 535 540
Tyr Asp Ala Leu Glu Lys Arg Glu Leu Glu Gln Ile Lys Lys Leu Lys
545 550 555 560
Ser Ala Val Pro Glu Arg Ala His Ile Gln Ala Tyr Arg Ala Val Leu
565 570 575
His Arg Ile Gly Arg Ala Val Gln Asn Cys Ser Glu Lys Thr Lys Gln
580 585 590
Leu Phe Ser Ser Lys Val Ile Glu Met Gly Val Phe Lys Asn Pro Ser
595 600 605
His Leu Asn Asn Phe Ile Phe Asn Gln Lys Gly Ala Ile Tyr Arg Ser
610 615 620
Pro Phe Asp Arg Ser Arg His Ala Pro Tyr Gln Leu His Ala Asp Lys
625 630 635 640
Leu Leu Lys Asn Asp Trp Leu Glu Leu Leu Ala Glu Ile Ser Ala Thr
645 650 655
Leu Met Ala Ser Glu Ser Thr Glu Gln Met Glu Asp Ala Leu Arg Leu
660 665 670
Glu Arg Thr Arg Leu Gln Leu Gln Leu Ser Gly Leu Pro Asp Trp Glu
675 680 685
Tyr Pro Ala Ser Leu Ala Lys Pro Asp Ile Glu Val Glu Ile Gln Thr
690 695 700
Ala Leu Lys Met Gln Leu Ala Lys Asp Thr Val Thr Ser Asp Val Leu
705 710 715 720
Gln Arg Ala Phe Asn Leu Tyr Ser Ser Val Leu Ser Gly Leu Thr Phe
725 730 735
Lys Leu Leu Arg Arg Ser Phe Ser Leu Lys Met Arg Phe Ser Val Ala
740 745 750
Asp Thr Thr Gln Leu Ile Tyr Val Pro Lys Val Cys Asp Trp Ala Ile
755 760 765
Pro Lys Gln Tyr Leu Gln Ala Glu Gly Glu Ile Gly Ile Ala Ala Arg
770 775 780
Val Val Thr Glu Ser Ser Pro Ala Lys Met Val Thr Glu Val Glu Met
785 790 795 800
Lys Glu Pro Lys Ala Leu Gly His Phe Met Gln Gln Ala Pro His Asp
805 810 815
Trp Tyr Phe Asp Ala Ser Leu Gly Gly Thr Gln Val Ala Gly Arg Ile
820 825 830
Val Glu Lys Gly Lys Glu Val Gly Lys Glu Arg Lys Leu Val Gly Tyr
835 840 845
Arg Met Arg Gly Asn Ser Ala Tyr Lys Thr Val Leu Asp Lys Ser Leu
850 855 860
Val Gly Asn Thr Glu Leu Ser Gln Cys Ser Met Ile Ile Glu Ile Pro
865 870 875 880
Tyr Thr Gln Thr Val Asp Ala Asp Phe Arg Ala Gln Val Gln Ala Gly
885 890 895
Leu Pro Lys Val Ser Ile Asn Leu Pro Val Lys Glu Thr Ile Thr Ala
900 905 910
Ser Asn Lys Asp Glu Gln Met Leu Phe Asp Arg Phe Val Ala Ile Asp
915 920 925
Leu Gly Glu Arg Gly Leu Gly Tyr Ala Val Phe Asp Ala Lys Thr Leu
930 935 940
Glu Leu Gln Glu Ser Gly His Arg Pro Ile Lys Ala Ile Thr Asn Leu
945 950 955 960
Leu Asn Arg Thr His His Tyr Glu Gln Arg Pro Asn Gln Arg Gln Lys
965 970 975
Phe Gln Ala Lys Phe Asn Val Asn Leu Ser Glu Leu Arg Glu Asn Thr
980 985 990
Val Gly Asp Val Cys His Gln Ile Asn Arg Ile Cys Ala Tyr Tyr Asn
995 1000 1005
Ala Phe Pro Val Leu Glu Tyr Met Val Pro Asp Arg Leu Asp Lys
1010 1015 1020
Gln Leu Lys Ser Val Tyr Glu Ser Val Thr Asn Arg Tyr Ile Trp
1025 1030 1035
Ser Ser Thr Asp Ala His Lys Ser Ala Arg Val Gln Phe Trp Leu
1040 1045 1050
Gly Gly Glu Thr Trp Glu His Pro Tyr Leu Lys Ser Ala Lys Asp
1055 1060 1065
Lys Lys Pro Leu Val Leu Ser Pro Gly Arg Gly Ala Ser Gly Lys
1070 1075 1080
Gly Thr Ser Gln Thr Cys Ser Cys Cys Gly Arg Asn Pro Phe Asp
1085 1090 1095
Leu Ile Lys Asp Met Lys Pro Arg Ala Lys Ile Ala Val Val Asp
1100 1105 1110
Gly Lys Ala Lys Leu Glu Asn Ser Glu Leu Lys Leu Phe Glu Arg
1115 1120 1125
Asn Leu Glu Ser Lys Asp Asp Met Leu Ala Arg Arg His Arg Asn
1130 1135 1140
Glu Arg Ala Gly Met Glu Gln Pro Leu Thr Pro Gly Asn Tyr Thr
1145 1150 1155
Val Asp Glu Ile Lys Ala Leu Leu Arg Ala Asn Leu Arg Arg Ala
1160 1165 1170
Pro Lys Asn Arg Arg Thr Lys Asp Thr Thr Val Ser Glu Tyr His
1175 1180 1185
Cys Val Phe Ser Asp Cys Gly Lys Thr Met His Ala Asp Glu Asn
1190 1195 1200
Ala Ala Val Asn Ile Gly Gly Lys Phe Ile Ala Asp Ile Glu Lys
1205 1210 1215
<210> 329
<211> 1252
<212> PRT
<213> Oleiphilus sp. HI0009
<220>
<221> MISC_FEATURE
<222> (1)..(1252)
<223> OspCas12c polypeptide sequence
<400> 329
Met Thr Lys Leu Arg His Arg Gln Lys Lys Leu Thr His Asp Trp Ala
1 5 10 15
Gly Ser Lys Lys Arg Glu Val Leu Gly Ser Asn Gly Lys Leu Gln Asn
20 25 30
Pro Leu Leu Met Pro Val Lys Lys Gly Gln Val Thr Glu Phe Arg Lys
35 40 45
Ala Phe Ser Ala Tyr Ala Arg Ala Thr Lys Gly Glu Met Thr Asp Gly
50 55 60
Arg Lys Asn Met Phe Thr His Ser Phe Glu Pro Phe Lys Thr Lys Pro
65 70 75 80
Ser Leu His Gln Cys Glu Leu Ala Asp Lys Ala Tyr Gln Ser Leu His
85 90 95
Ser Tyr Leu Pro Gly Ser Leu Ala His Phe Leu Leu Ser Ala His Ala
100 105 110
Leu Gly Phe Arg Ile Phe Ser Lys Ser Gly Glu Ala Thr Ala Phe Gln
115 120 125
Ala Ser Ser Lys Ile Glu Ala Tyr Glu Ser Lys Leu Ala Ser Glu Leu
130 135 140
Ala Cys Val Asp Leu Ser Ile Gln Asn Leu Thr Ile Ser Thr Leu Phe
145 150 155 160
Asn Ala Leu Thr Thr Ser Val Arg Gly Lys Gly Glu Glu Thr Ser Ala
165 170 175
Asp Pro Leu Ile Ala Arg Phe Tyr Thr Leu Leu Thr Gly Lys Pro Leu
180 185 190
Ser Arg Asp Thr Gln Gly Pro Glu Arg Asp Leu Ala Glu Val Ile Ser
195 200 205
Arg Lys Ile Ala Ser Ser Phe Gly Thr Trp Lys Glu Met Thr Ala Asn
210 215 220
Pro Leu Gln Ser Leu Gln Phe Phe Glu Glu Glu Leu His Ala Leu Asp
225 230 235 240
Ala Asn Val Ser Leu Ser Pro Ala Phe Asp Val Leu Ile Lys Met Asn
245 250 255
Asp Leu Gln Gly Asp Leu Lys Asn Arg Thr Ile Val Phe Asp Pro Asp
260 265 270
Ala Pro Val Phe Glu Tyr Asn Ala Glu Asp Pro Ala Asp Ile Ile Ile
275 280 285
Lys Leu Thr Ala Arg Tyr Ala Lys Glu Ala Val Ile Lys Asn Gln Asn
290 295 300
Val Gly Asn Tyr Val Lys Asn Ala Ile Thr Thr Thr Asn Ala Asn Gly
305 310 315 320
Leu Gly Trp Leu Leu Asn Lys Gly Leu Ser Leu Leu Pro Val Ser Thr
325 330 335
Asp Asp Glu Leu Leu Glu Phe Ile Gly Val Glu Arg Ser His Pro Ser
340 345 350
Cys His Ala Leu Ile Glu Leu Ile Ala Gln Leu Glu Ala Pro Glu Leu
355 360 365
Phe Glu Lys Asn Val Phe Ser Asp Thr Arg Ser Glu Val Gln Gly Met
370 375 380
Ile Asp Ser Ala Val Ser Asn His Ile Ala Arg Leu Ser Ser Ser Arg
385 390 395 400
Asn Ser Leu Ser Met Asp Ser Glu Glu Leu Glu Arg Leu Ile Lys Ser
405 410 415
Phe Gln Ile His Thr Pro His Cys Ser Leu Phe Ile Gly Ala Gln Ser
420 425 430
Leu Ser Gln Gln Leu Glu Ser Leu Pro Glu Ala Leu Gln Ser Gly Val
435 440 445
Asn Ser Ala Asp Ile Leu Leu Gly Ser Thr Gln Tyr Met Leu Thr Asn
450 455 460
Ser Leu Val Glu Glu Ser Ile Ala Thr Tyr Gln Arg Thr Leu Asn Arg
465 470 475 480
Ile Asn Tyr Leu Ser Gly Val Ala Gly Gln Ile Asn Gly Ala Ile Lys
485 490 495
Arg Lys Ala Ile Asp Gly Glu Lys Ile His Leu Pro Ala Ala Trp Ser
500 505 510
Glu Leu Ile Ser Leu Pro Phe Ile Gly Gln Pro Val Ile Asp Val Glu
515 520 525
Ser Asp Leu Ala His Leu Lys Asn Gln Tyr Gln Thr Leu Ser Asn Glu
530 535 540
Phe Asp Thr Leu Ile Ser Ala Leu Gln Lys Asn Phe Asp Leu Asn Phe
545 550 555 560
Asn Lys Ala Leu Leu Asn Arg Thr Gln His Phe Glu Ala Met Cys Arg
565 570 575
Ser Thr Lys Lys Asn Ala Leu Ser Lys Pro Glu Ile Val Ser Tyr Arg
580 585 590
Asp Leu Leu Ala Arg Leu Thr Ser Cys Leu Tyr Arg Gly Ser Leu Val
595 600 605
Leu Arg Arg Ala Gly Ile Glu Val Leu Lys Lys His Lys Ile Phe Glu
610 615 620
Ser Asn Ser Glu Leu Arg Glu His Val His Glu Arg Lys His Phe Val
625 630 635 640
Phe Val Ser Pro Leu Asp Arg Lys Ala Lys Lys Leu Leu Arg Leu Thr
645 650 655
Asp Ser Arg Pro Asp Leu Leu His Val Ile Asp Glu Ile Leu Gln His
660 665 670
Asp Asn Leu Glu Asn Lys Asp Arg Glu Ser Leu Trp Leu Val Arg Ser
675 680 685
Gly Tyr Leu Leu Ala Gly Leu Pro Asp Gln Leu Ser Ser Ser Phe Ile
690 695 700
Asn Leu Pro Ile Ile Thr Gln Lys Gly Asp Arg Arg Leu Ile Asp Leu
705 710 715 720
Ile Gln Tyr Asp Gln Ile Asn Arg Asp Ala Phe Val Met Leu Val Thr
725 730 735
Ser Ala Phe Lys Ser Asn Leu Ser Gly Leu Gln Tyr Arg Ala Asn Lys
740 745 750
Gln Ser Phe Val Val Thr Arg Thr Leu Ser Pro Tyr Leu Gly Ser Lys
755 760 765
Leu Val Tyr Val Pro Lys Asp Lys Asp Trp Leu Val Pro Ser Gln Met
770 775 780
Phe Glu Gly Arg Phe Ala Asp Ile Leu Gln Ser Asp Tyr Met Val Trp
785 790 795 800
Lys Asp Ala Gly Arg Leu Cys Val Ile Asp Thr Ala Lys His Leu Ser
805 810 815
Asn Ile Lys Lys Ser Val Phe Ser Ser Glu Glu Val Leu Ala Phe Leu
820 825 830
Arg Glu Leu Pro His Arg Thr Phe Ile Gln Thr Glu Val Arg Gly Leu
835 840 845
Gly Val Asn Val Asp Gly Ile Ala Phe Asn Asn Gly Asp Ile Pro Ser
850 855 860
Leu Lys Thr Phe Ser Asn Cys Val Gln Val Lys Val Ser Arg Thr Asn
865 870 875 880
Thr Ser Leu Val Gln Thr Leu Asn Arg Trp Phe Glu Gly Gly Lys Val
885 890 895
Ser Pro Pro Ser Ile Gln Phe Glu Arg Ala Tyr Tyr Lys Lys Asp Asp
900 905 910
Gln Ile His Glu Asp Ala Ala Lys Arg Lys Ile Arg Phe Gln Met Pro
915 920 925
Ala Thr Glu Leu Val His Ala Ser Asp Asp Ala Gly Trp Thr Pro Ser
930 935 940
Tyr Leu Leu Gly Ile Asp Pro Gly Glu Tyr Gly Met Gly Leu Ser Leu
945 950 955 960
Val Ser Ile Asn Asn Gly Glu Val Leu Asp Ser Gly Phe Ile His Ile
965 970 975
Asn Ser Leu Ile Asn Phe Ala Ser Lys Lys Ser Asn His Gln Thr Lys
980 985 990
Val Val Pro Arg Gln Gln Tyr Lys Ser Pro Tyr Ala Asn Tyr Leu Glu
995 1000 1005
Gln Ser Lys Asp Ser Ala Ala Gly Asp Ile Ala His Ile Leu Asp
1010 1015 1020
Arg Leu Ile Tyr Lys Leu Asn Ala Leu Pro Val Phe Glu Ala Leu
1025 1030 1035
Ser Gly Asn Ser Gln Ser Ala Ala Asp Gln Val Trp Thr Lys Val
1040 1045 1050
Leu Ser Phe Tyr Thr Trp Gly Asp Asn Asp Ala Gln Asn Ser Ile
1055 1060 1065
Arg Lys Gln His Trp Phe Gly Ala Ser His Trp Asp Ile Lys Gly
1070 1075 1080
Met Leu Arg Gln Pro Pro Thr Glu Lys Lys Pro Lys Pro Tyr Ile
1085 1090 1095
Ala Phe Pro Gly Ser Gln Val Ser Ser Tyr Gly Asn Ser Gln Arg
1100 1105 1110
Cys Ser Cys Cys Gly Arg Asn Pro Ile Glu Gln Leu Arg Glu Met
1115 1120 1125
Ala Lys Asp Thr Ser Ile Lys Glu Leu Lys Ile Arg Asn Ser Glu
1130 1135 1140
Ile Gln Leu Phe Asp Gly Thr Ile Lys Leu Phe Asn Pro Asp Pro
1145 1150 1155
Ser Thr Val Ile Glu Arg Arg Arg His Asn Leu Gly Pro Ser Arg
1160 1165 1170
Ile Pro Val Ala Asp Arg Thr Phe Lys Asn Ile Ser Pro Ser Ser
1175 1180 1185
Leu Glu Phe Lys Glu Leu Ile Thr Ile Val Ser Arg Ser Ile Arg
1190 1195 1200
His Ser Pro Glu Phe Ile Ala Lys Lys Arg Gly Ile Gly Ser Glu
1205 1210 1215
Tyr Phe Cys Ala Tyr Ser Asp Cys Asn Ser Ser Leu Asn Ser Glu
1220 1225 1230
Ala Asn Ala Ala Ala Asn Val Ala Gln Lys Phe Gln Lys Gln Leu
1235 1240 1245
Phe Phe Glu Leu
1250
<210> 330
<211> 767
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Cas12g1 polypeptide sequence
<400> 330
Met Ala Gln Ala Ser Ser Thr Pro Ala Val Ser Pro Arg Pro Arg Pro
1 5 10 15
Arg Tyr Arg Glu Glu Arg Thr Leu Val Arg Lys Leu Leu Pro Arg Pro
20 25 30
Gly Gln Ser Lys Gln Glu Phe Arg Glu Asn Val Lys Lys Leu Arg Lys
35 40 45
Ala Phe Leu Gln Phe Asn Ala Asp Val Ser Gly Val Cys Gln Trp Ala
50 55 60
Ile Gln Phe Arg Pro Arg Tyr Gly Lys Pro Ala Glu Pro Thr Glu Thr
65 70 75 80
Phe Trp Lys Phe Phe Leu Glu Pro Glu Thr Ser Leu Pro Pro Asn Asp
85 90 95
Ser Arg Ser Pro Glu Phe Arg Arg Leu Gln Ala Phe Glu Ala Ala Ala
100 105 110
Gly Ile Asn Gly Ala Ala Ala Leu Asp Asp Pro Ala Phe Thr Asn Glu
115 120 125
Leu Arg Asp Ser Ile Leu Ala Val Ala Ser Arg Pro Lys Thr Lys Glu
130 135 140
Ala Gln Arg Leu Phe Ser Arg Leu Lys Asp Tyr Gln Pro Ala His Arg
145 150 155 160
Met Ile Leu Ala Lys Val Ala Ala Glu Trp Ile Glu Ser Arg Tyr Arg
165 170 175
Arg Ala His Gln Asn Trp Glu Arg Asn Tyr Glu Glu Trp Lys Lys Glu
180 185 190
Lys Gln Glu Trp Glu Gln Asn His Pro Glu Leu Thr Pro Glu Ile Arg
195 200 205
Glu Ala Phe Asn Gln Ile Phe Gln Gln Leu Glu Val Lys Glu Lys Arg
210 215 220
Val Arg Ile Cys Pro Ala Ala Arg Leu Leu Gln Asn Lys Asp Asn Cys
225 230 235 240
Gln Tyr Ala Gly Lys Asn Lys His Ser Val Leu Cys Asn Gln Phe Asn
245 250 255
Glu Phe Lys Lys Asn His Leu Gln Gly Lys Ala Ile Lys Phe Phe Tyr
260 265 270
Lys Asp Ala Glu Lys Tyr Leu Arg Cys Gly Leu Gln Ser Leu Lys Pro
275 280 285
Asn Val Gln Gly Pro Phe Arg Glu Asp Trp Asn Lys Tyr Leu Arg Tyr
290 295 300
Met Asn Leu Lys Glu Glu Thr Leu Arg Gly Lys Asn Gly Gly Arg Leu
305 310 315 320
Pro His Cys Lys Asn Leu Gly Gln Glu Cys Glu Phe Asn Pro His Thr
325 330 335
Ala Leu Cys Lys Gln Tyr Gln Gln Gln Leu Ser Ser Arg Pro Asp Leu
340 345 350
Val Gln His Asp Glu Leu Tyr Arg Lys Trp Arg Arg Glu Tyr Trp Arg
355 360 365
Glu Pro Arg Lys Pro Val Phe Arg Tyr Pro Ser Val Lys Arg His Ser
370 375 380
Ile Ala Lys Ile Phe Gly Glu Asn Tyr Phe Gln Ala Asp Phe Lys Asn
385 390 395 400
Ser Val Val Gly Leu Arg Leu Asp Ser Met Pro Ala Gly Gln Tyr Leu
405 410 415
Glu Phe Ala Phe Ala Pro Trp Pro Arg Asn Tyr Arg Pro Gln Pro Gly
420 425 430
Glu Thr Glu Ile Ser Ser Val His Leu His Phe Val Gly Thr Arg Pro
435 440 445
Arg Ile Gly Phe Arg Phe Arg Val Pro His Lys Arg Ser Arg Phe Asp
450 455 460
Cys Thr Gln Glu Glu Leu Asp Glu Leu Arg Ser Arg Thr Phe Pro Arg
465 470 475 480
Lys Ala Gln Asp Gln Lys Phe Leu Glu Ala Ala Arg Lys Arg Leu Leu
485 490 495
Glu Thr Phe Pro Gly Asn Ala Glu Gln Glu Leu Arg Leu Leu Ala Val
500 505 510
Asp Leu Gly Thr Asp Ser Ala Arg Ala Ala Phe Phe Ile Gly Lys Thr
515 520 525
Phe Gln Gln Ala Phe Pro Leu Lys Ile Val Lys Ile Glu Lys Leu Tyr
530 535 540
Glu Gln Trp Pro Asn Gln Lys Gln Ala Gly Asp Arg Arg Asp Ala Ser
545 550 555 560
Ser Lys Gln Pro Arg Pro Gly Leu Ser Arg Asp His Val Gly Arg His
565 570 575
Leu Gln Lys Met Arg Ala Gln Ala Ser Glu Ile Ala Gln Lys Arg Gln
580 585 590
Glu Leu Thr Gly Thr Pro Ala Pro Glu Thr Thr Thr Asp Gln Ala Ala
595 600 605
Lys Lys Ala Thr Leu Gln Pro Phe Asp Leu Arg Gly Leu Thr Val His
610 615 620
Thr Ala Arg Met Ile Arg Asp Trp Ala Arg Leu Asn Ala Arg Gln Ile
625 630 635 640
Ile Gln Leu Ala Glu Glu Asn Gln Val Asp Leu Ile Val Leu Glu Ser
645 650 655
Leu Arg Gly Phe Arg Pro Pro Gly Tyr Glu Asn Leu Asp Gln Glu Lys
660 665 670
Lys Arg Arg Val Ala Phe Phe Ala His Gly Arg Ile Arg Arg Lys Val
675 680 685
Thr Glu Lys Ala Val Glu Arg Gly Met Arg Val Val Thr Val Pro Tyr
690 695 700
Leu Ala Ser Ser Lys Val Cys Ala Glu Cys Arg Lys Lys Gln Lys Asp
705 710 715 720
Asn Lys Gln Trp Glu Lys Asn Lys Lys Arg Gly Leu Phe Lys Cys Glu
725 730 735
Gly Cys Gly Ser Gln Ala Gln Val Asp Glu Asn Ala Ala Arg Val Leu
740 745 750
Gly Arg Val Phe Trp Gly Glu Ile Glu Leu Pro Thr Ala Ile Pro
755 760 765
<210> 331
<211> 870
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Cas12h1 polypeptide sequence
<400> 331
Met Lys Val His Glu Ile Pro Arg Ser Gln Leu Leu Lys Ile Lys Gln
1 5 10 15
Tyr Glu Gly Ser Phe Val Glu Trp Tyr Arg Asp Leu Gln Glu Asp Arg
20 25 30
Lys Lys Phe Ala Ser Leu Leu Phe Arg Trp Ala Ala Phe Gly Tyr Ala
35 40 45
Ala Arg Glu Asp Asp Gly Ala Thr Tyr Ile Ser Pro Ser Gln Ala Leu
50 55 60
Leu Glu Arg Arg Leu Leu Leu Gly Asp Ala Glu Asp Val Ala Ile Lys
65 70 75 80
Phe Leu Asp Val Leu Phe Lys Gly Gly Ala Pro Ser Ser Ser Cys Tyr
85 90 95
Ser Leu Phe Tyr Glu Asp Phe Ala Leu Arg Asp Lys Ala Lys Tyr Ser
100 105 110
Gly Ala Lys Arg Glu Phe Ile Glu Gly Leu Ala Thr Met Pro Leu Asp
115 120 125
Lys Ile Ile Glu Arg Ile Arg Gln Asp Glu Gln Leu Ser Lys Ile Pro
130 135 140
Ala Glu Glu Trp Leu Ile Leu Gly Ala Glu Tyr Ser Pro Glu Glu Ile
145 150 155 160
Trp Glu Gln Val Ala Pro Arg Ile Val Asn Val Asp Arg Ser Leu Gly
165 170 175
Lys Gln Leu Arg Glu Arg Leu Gly Ile Lys Cys Arg Arg Pro His Asp
180 185 190
Ala Gly Tyr Cys Lys Ile Leu Met Glu Val Val Ala Arg Gln Leu Arg
195 200 205
Ser His Asn Glu Thr Tyr His Glu Tyr Leu Asn Gln Thr His Glu Met
210 215 220
Lys Thr Lys Val Ala Asn Asn Leu Thr Asn Glu Phe Asp Leu Val Cys
225 230 235 240
Glu Phe Ala Glu Val Leu Glu Glu Lys Asn Tyr Gly Leu Gly Trp Tyr
245 250 255
Val Leu Trp Gln Gly Val Lys Gln Ala Leu Lys Glu Gln Lys Lys Pro
260 265 270
Thr Lys Ile Gln Ile Ala Val Asp Gln Leu Arg Gln Pro Lys Phe Ala
275 280 285
Gly Leu Leu Thr Ala Lys Trp Arg Ala Leu Lys Gly Ala Tyr Asp Thr
290 295 300
Trp Lys Leu Lys Lys Arg Leu Glu Lys Arg Lys Ala Phe Pro Tyr Met
305 310 315 320
Pro Asn Trp Asp Asn Asp Tyr Gln Ile Pro Val Gly Leu Thr Gly Leu
325 330 335
Gly Val Phe Thr Leu Glu Val Lys Arg Thr Glu Val Val Val Asp Leu
340 345 350
Lys Glu His Gly Lys Leu Phe Cys Ser His Ser His Tyr Phe Gly Asp
355 360 365
Leu Thr Ala Glu Lys His Pro Ser Arg Tyr His Leu Lys Phe Arg His
370 375 380
Lys Leu Lys Leu Arg Lys Arg Asp Ser Arg Val Glu Pro Thr Ile Gly
385 390 395 400
Pro Trp Ile Glu Ala Ala Leu Arg Glu Ile Thr Ile Gln Lys Lys Pro
405 410 415
Asn Gly Val Phe Tyr Leu Gly Leu Pro Tyr Ala Leu Ser His Gly Ile
420 425 430
Asp Asn Phe Gln Ile Ala Lys Arg Phe Phe Ser Ala Ala Lys Pro Asp
435 440 445
Lys Glu Val Ile Asn Gly Leu Pro Ser Glu Met Val Val Gly Ala Ala
450 455 460
Asp Leu Asn Leu Ser Asn Ile Val Ala Pro Val Lys Ala Arg Ile Gly
465 470 475 480
Lys Gly Leu Glu Gly Pro Leu His Ala Leu Asp Tyr Gly Tyr Gly Glu
485 490 495
Leu Ile Asp Gly Pro Lys Ile Leu Thr Pro Asp Gly Pro Arg Cys Gly
500 505 510
Glu Leu Ile Ser Leu Lys Arg Asp Ile Val Glu Ile Lys Ser Ala Ile
515 520 525
Lys Glu Phe Lys Ala Cys Gln Arg Glu Gly Leu Thr Met Ser Glu Glu
530 535 540
Thr Thr Thr Trp Leu Ser Glu Val Glu Ser Pro Ser Asp Ser Pro Arg
545 550 555 560
Cys Met Ile Gln Ser Arg Ile Ala Asp Thr Ser Arg Arg Leu Asn Ser
565 570 575
Phe Lys Tyr Gln Met Asn Lys Glu Gly Tyr Gln Asp Leu Ala Glu Ala
580 585 590
Leu Arg Leu Leu Asp Ala Met Asp Ser Tyr Asn Ser Leu Leu Glu Ser
595 600 605
Tyr Gln Arg Met His Leu Ser Pro Gly Glu Gln Ser Pro Lys Glu Ala
610 615 620
Lys Phe Asp Thr Lys Arg Ala Ser Phe Arg Asp Leu Leu Arg Arg Arg
625 630 635 640
Val Ala His Thr Ile Val Glu Tyr Phe Asp Asp Cys Asp Ile Val Phe
645 650 655
Phe Glu Asp Leu Asp Gly Pro Ser Asp Ser Asp Ser Arg Asn Asn Ala
660 665 670
Leu Val Lys Leu Leu Ser Pro Arg Thr Leu Leu Leu Tyr Ile Arg Gln
675 680 685
Ala Leu Glu Lys Arg Gly Ile Gly Met Val Glu Val Ala Lys Asp Gly
690 695 700
Thr Ser Gln Asn Asn Pro Ile Ser Gly His Val Gly Trp Arg Asn Lys
705 710 715 720
Gln Asn Lys Ser Glu Ile Tyr Phe Tyr Glu Asp Lys Glu Leu Leu Val
725 730 735
Met Asp Ala Asp Glu Val Gly Ala Met Asn Ile Leu Cys Arg Gly Leu
740 745 750
Asn His Ser Val Cys Pro Tyr Ser Phe Val Thr Lys Ala Pro Glu Lys
755 760 765
Lys Asn Asp Glu Lys Lys Glu Gly Asp Tyr Gly Lys Arg Val Lys Arg
770 775 780
Phe Leu Lys Asp Arg Tyr Gly Ser Ser Asn Val Arg Phe Leu Val Ala
785 790 795 800
Ser Met Gly Phe Val Thr Val Thr Thr Lys Arg Pro Lys Asp Ala Leu
805 810 815
Val Gly Lys Arg Leu Tyr Tyr His Gly Gly Glu Leu Val Thr His Asp
820 825 830
Leu His Asn Arg Met Lys Asp Glu Ile Lys Tyr Leu Val Glu Lys Glu
835 840 845
Val Leu Ala Arg Arg Val Ser Leu Ser Asp Ser Thr Ile Lys Ser Tyr
850 855 860
Lys Ser Phe Ala His Val
865 870
<210> 332
<211> 1093
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Cas12i1 polypeptide sequence
<400> 332
Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr
1 5 10 15
Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn
20 25 30
Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp
35 40 45
Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala
50 55 60
Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe
65 70 75 80
Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn
85 90 95
Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln
100 105 110
Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp
115 120 125
Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu
130 135 140
Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys
145 150 155 160
Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met
165 170 175
Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr
180 185 190
Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val
195 200 205
Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr
210 215 220
Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile
225 230 235 240
Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu
245 250 255
Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg
260 265 270
Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe
275 280 285
Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met
290 295 300
Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys
305 310 315 320
Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu
325 330 335
Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr
340 345 350
Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile
355 360 365
Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His
370 375 380
Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu
385 390 395 400
Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr
405 410 415
Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu
420 425 430
Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile
435 440 445
Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln
450 455 460
Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn
465 470 475 480
Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys
485 490 495
His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile
500 505 510
Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His
515 520 525
Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala
530 535 540
Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys
545 550 555 560
Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu
565 570 575
Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln
580 585 590
Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr
595 600 605
Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe
610 615 620
Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr
625 630 635 640
Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr
645 650 655
Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn
660 665 670
Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser
675 680 685
Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys
690 695 700
Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu
705 710 715 720
Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln
725 730 735
Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser
740 745 750
Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile
755 760 765
Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu
770 775 780
Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser
785 790 795 800
Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr
805 810 815
Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val
820 825 830
Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu
835 840 845
Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val
850 855 860
Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu
865 870 875 880
Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile
885 890 895
Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu
900 905 910
Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val
915 920 925
Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr
930 935 940
Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg
945 950 955 960
Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg
965 970 975
Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr
980 985 990
Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly
995 1000 1005
Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys
1010 1015 1020
Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu
1025 1030 1035
Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys
1040 1045 1050
Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe
1055 1060 1065
Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu
1070 1075 1080
Val Asp Ile Gln Lys Asp Phe Lys Lys Lys
1085 1090
<210> 333
<211> 1054
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: Cas12i2 polypeptide sequence
<400> 333
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 334
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 334
Gly Gly Gly Ser
1
<210> 335
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 335
Gly Gly Gly Gly Ser
1 5
<210> 336
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 336
Glu Ala Ala Ala Lys
1 5
<210> 337
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 337
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 338
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: linker peptide sequence
<400> 338
Gly Gly Ser Gly Gly Ser
1 5
<210> 339
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 339
Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
1 5 10 15
Glu Ser Ser Gly
20
<210> 340
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 340
ggaggctctg gaggaagc 18
<210> 341
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 341
ggctcttctg gatctgaaac acctggcaca agcgagagcg ccacccctga gagctctggc 60
<210> 342
<211> 1129
<212> PRT
<213> Alicyclobacillus acidiphilus
<220>
<221> MISC_FEATURE
<222> (1)..(1129)
<223> AacCas12b polypeptide sequence
<400> 342
Met Ala Val Lys Ser Met Lys Val Lys Leu Arg Leu Asp Asn Met Pro
1 5 10 15
Glu Ile Arg Ala Gly Leu Trp Lys Leu His Thr Glu Val Asn Ala Gly
20 25 30
Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
35 40 45
Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Tyr Lys Thr
50 55 60
Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
65 70 75 80
Val Glu Asn Gly His Cys Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
85 90 95
Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
100 105 110
Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
115 120 125
Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
130 135 140
Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
145 150 155 160
Glu Glu Lys Ala Lys Ala Glu Ala Arg Lys Ser Thr Asp Arg Thr Ala
165 170 175
Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
180 185 190
Val Tyr Thr Asp Ser Asp Met Ser Ser Val Gln Trp Lys Pro Leu Arg
195 200 205
Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
210 215 220
Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Glu
225 230 235 240
Ala Tyr Ala Lys Leu Val Glu Gln Lys Ser Arg Phe Glu Gln Lys Asn
245 250 255
Phe Val Gly Gln Glu His Leu Val Gln Leu Val Asn Gln Leu Gln Gln
260 265 270
Asp Met Lys Glu Ala Ser His Gly Leu Glu Ser Lys Glu Gln Thr Ala
275 280 285
His Tyr Leu Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
290 295 300
Lys Trp Glu Lys Leu Asp Pro Asp Ala Pro Phe Asp Leu Tyr Asp Thr
305 310 315 320
Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
325 330 335
Asp Leu Phe Ala Lys Leu Ala Glu Pro Lys Tyr Gln Ala Leu Trp Arg
340 345 350
Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Val
355 360 365
Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
370 375 380
Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
385 390 395 400
Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Gly Arg His
405 410 415
Ala Ile Arg Phe Gln Lys Leu Leu Thr Val Glu Asp Gly Val Ala Lys
420 425 430
Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Ala Gln Leu Asp
435 440 445
Asp Leu Leu Pro Arg Asp Pro His Glu Leu Val Ala Leu Tyr Phe Gln
450 455 460
Asp Tyr Gly Ala Glu Gln His Leu Ala Gly Glu Phe Gly Gly Ala Lys
465 470 475 480
Ile Gln Tyr Arg Arg Asp Gln Leu Asn His Leu His Ala Arg Arg Gly
485 490 495
Ala Arg Asp Val Tyr Leu Asn Leu Ser Val Arg Val Gln Ser Gln Ser
500 505 510
Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
515 520 525
Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
530 535 540
Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
545 550 555 560
Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
565 570 575
Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
580 585 590
Asn Ser Glu Gly Arg Val Pro Phe Cys Phe Pro Ile Glu Gly Asn Glu
595 600 605
Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
610 615 620
Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
625 630 635 640
Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
645 650 655
Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
660 665 670
Leu Ile Glu Gln Pro Met Asp Ala Asn Gln Met Thr Pro Asp Trp Arg
675 680 685
Glu Ala Phe Glu Asp Glu Leu Gln Lys Leu Lys Ser Leu Tyr Gly Ile
690 695 700
Cys Gly Asp Arg Glu Trp Thr Glu Ala Val Tyr Glu Ser Val Arg Arg
705 710 715 720
Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp Val
725 730 735
Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Gln Lys Asp Val Val
740 745 750
Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr Lys
755 760 765
Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val Ile
770 775 780
Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His Ile
785 790 795 800
Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile Ile
805 810 815
Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Asp Glu Arg Gly Lys
820 825 830
Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
835 840 845
Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
850 855 860
Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Leu
865 870 875 880
Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
885 890 895
Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
900 905 910
Arg Arg Val Pro Ala Arg Cys Ala Arg Glu Gln Asn Pro Glu Pro Phe
915 920 925
Pro Trp Trp Leu Asn Lys Phe Val Ala Glu His Lys Leu Asp Gly Cys
930 935 940
Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Phe Phe
945 950 955 960
Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
965 970 975
Asp Leu Asn Ala Ala Gln Asn Leu Gln Arg Arg Leu Trp Ser Asp Phe
980 985 990
Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly
995 1000 1005
Glu Pro Val Leu Ile Pro Arg Thr Thr Gly Lys Arg Thr Ala Asp
1010 1015 1020
Ser Tyr Gly Asn Lys Val Phe Tyr Thr Lys Thr Gly Val Thr Tyr
1025 1030 1035
Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln
1040 1045 1050
Glu Glu Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp
1055 1060 1065
Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly
1070 1075 1080
Ile Ile Asn Arg Gly Asp Trp Thr Arg Gln Lys Glu Phe Trp Ser
1085 1090 1095
Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg
1100 1105 1110
Ser Arg Val Arg Leu Gln Glu Ser Ala Cys Glu Asn Thr Gly Asp
1115 1120 1125
Ile
<210> 343
<211> 1140
<212> PRT
<213> Bacillus hisashii
<220>
<221> MISC_FEATURE
<222> (1)..(1140)
<223> BhCas12b polypeptide sequence
<400> 343
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
20 25 30
Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
35 40 45
Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
50 55 60
His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
65 70 75 80
Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
85 90 95
Ser Phe Thr His Glu Val Asp Lys Asp Glu Val Phe Asn Ile Leu Arg
100 105 110
Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
115 120 125
Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
130 135 140
Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
145 150 155 160
Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
165 170 175
Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
180 185 190
Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Tyr Thr Asp
195 200 205
Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
210 215 220
Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
225 230 235 240
Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
245 250 255
Tyr Glu Lys Val Glu Lys Glu Tyr Lys Thr Leu Glu Glu Arg Ile Lys
260 265 270
Glu Asp Ile Gln Ala Leu Lys Ala Leu Glu Gln Tyr Glu Lys Glu Arg
275 280 285
Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
290 295 300
Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
305 310 315 320
Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
325 330 335
Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
340 345 350
Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
355 360 365
Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
370 375 380
Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
385 390 395 400
His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
405 410 415
Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
420 425 430
Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
435 440 445
Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
450 455 460
Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
465 470 475 480
Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
485 490 495
Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
500 505 510
Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
515 520 525
Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
530 535 540
Ile His Arg Asp Asp Phe Pro Lys Val Val Asn Phe Lys Pro Lys Glu
545 550 555 560
Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
565 570 575
Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
580 585 590
Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
595 600 605
Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
610 615 620
Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
625 630 635 640
Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
645 650 655
Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
660 665 670
Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
675 680 685
Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
690 695 700
Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
705 710 715 720
Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
725 730 735
Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
740 745 750
Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
755 760 765
Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
770 775 780
Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
785 790 795 800
Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
805 810 815
Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln
820 825 830
Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn
835 840 845
Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met
850 855 860
Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu
865 870 875 880
Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg
885 890 895
Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr
900 905 910
Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu
915 920 925
Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu
930 935 940
Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg
945 950 955 960
Lys Cys Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln
965 970 975
Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys
980 985 990
Ala Tyr Gln Val Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp
995 1000 1005
Gln Lys Gln Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile
1010 1015 1020
Leu Lys Asp Gly Val Tyr Glu Trp Val Asn Ala Gly Lys Leu Lys
1025 1030 1035
Ile Lys Lys Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp
1040 1045 1050
Ser Asp Ile Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys
1055 1060 1065
Gly Glu Lys Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe
1070 1075 1080
Pro Ser Asp Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu
1085 1090 1095
Glu Arg Ile Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser
1100 1105 1110
Thr Ile Glu Asp Asp Ser Ser Lys Gln Ser Met Lys Arg Pro Ala
1115 1120 1125
Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1130 1135 1140
<210> 344
<211> 1108
<212> PRT
<213> Bacillus thermoamylovorans
<220>
<221> MISC_FEATURE
<222> (1)..(1108)
<223> BTCas12b.BTCas12b polypeptide sequence
<400> 344
Met Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
1 5 10 15
Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
20 25 30
Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
35 40 45
His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
50 55 60
Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
65 70 75 80
Ser Phe Thr His Glu Val Asp Lys Asp Val Val Phe Asn Ile Leu Arg
85 90 95
Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
100 105 110
Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
115 120 125
Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
130 135 140
Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
145 150 155 160
Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
165 170 175
Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Phe Thr Asp
180 185 190
Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
195 200 205
Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
210 215 220
Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
225 230 235 240
Tyr Glu Lys Val Glu Lys Glu His Lys Thr Leu Glu Glu Arg Ile Lys
245 250 255
Glu Asp Ile Gln Ala Phe Lys Ser Leu Glu Gln Tyr Glu Lys Glu Arg
260 265 270
Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
275 280 285
Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
290 295 300
Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
305 310 315 320
Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
325 330 335
Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
340 345 350
Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
355 360 365
Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
370 375 380
His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
385 390 395 400
Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
405 410 415
Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
420 425 430
Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
435 440 445
Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
450 455 460
Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
465 470 475 480
Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
485 490 495
Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
500 505 510
Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
515 520 525
Ile His Arg Asp Asp Phe Pro Lys Phe Val Asn Phe Lys Pro Lys Glu
530 535 540
Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
545 550 555 560
Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
565 570 575
Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
580 585 590
Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
595 600 605
Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
610 615 620
Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
625 630 635 640
Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
645 650 655
Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
660 665 670
Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
675 680 685
Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
690 695 700
Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
705 710 715 720
Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
725 730 735
Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
740 745 750
Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
755 760 765
Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
770 775 780
Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
785 790 795 800
Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln
805 810 815
Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn
820 825 830
Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met
835 840 845
Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu
850 855 860
Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg
865 870 875 880
Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr
885 890 895
Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu
900 905 910
Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu
915 920 925
Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg
930 935 940
Lys Leu Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln
945 950 955 960
Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys
965 970 975
Ala Tyr Gln Val Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp
980 985 990
Gln Lys Gln Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu
995 1000 1005
Lys Asp Gly Val Tyr Glu Trp Gly Asn Ala Gly Lys Leu Lys Ile
1010 1015 1020
Lys Lys Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser
1025 1030 1035
Asp Ile Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly
1040 1045 1050
Glu Lys Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro
1055 1060 1065
Ser Asp Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu
1070 1075 1080
Arg Ile Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr
1085 1090 1095
Ile Glu Asp Asp Ser Ser Lys Gln Ser Met
1100 1105
<210> 345
<211> 1112
<212> PRT
<213> Bacillus sp. V3-13
<220>
<221> MISC_FEATURE
<222> (1)..(1112)
<223> BvCas12b (Bacillus sp. V3-13) polypeptide sequence
<400> 345
Met Ala Ile Arg Ser Ile Lys Leu Lys Met Lys Thr Asn Ser Gly Thr
1 5 10 15
Asp Ser Ile Tyr Leu Arg Lys Ala Leu Trp Arg Thr His Gln Leu Ile
20 25 30
Asn Glu Gly Ile Ala Tyr Tyr Met Asn Leu Leu Thr Leu Tyr Arg Gln
35 40 45
Glu Ala Ile Gly Asp Lys Thr Lys Glu Ala Tyr Gln Ala Glu Leu Ile
50 55 60
Asn Ile Ile Arg Asn Gln Gln Arg Asn Asn Gly Ser Ser Glu Glu His
65 70 75 80
Gly Ser Asp Gln Glu Ile Leu Ala Leu Leu Arg Gln Leu Tyr Glu Leu
85 90 95
Ile Ile Pro Ser Ser Ile Gly Glu Ser Gly Asp Ala Asn Gln Leu Gly
100 105 110
Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn Ser Gln Ser Gly Lys
115 120 125
Gly Thr Ser Asn Ala Gly Arg Lys Pro Arg Trp Lys Arg Leu Lys Glu
130 135 140
Glu Gly Asn Pro Asp Trp Glu Leu Glu Lys Lys Lys Asp Glu Glu Arg
145 150 155 160
Lys Ala Lys Asp Pro Thr Val Lys Ile Phe Asp Asn Leu Asn Lys Tyr
165 170 175
Gly Leu Leu Pro Leu Phe Pro Leu Phe Thr Asn Ile Gln Lys Asp Ile
180 185 190
Glu Trp Leu Pro Leu Gly Lys Arg Gln Ser Val Arg Lys Trp Asp Lys
195 200 205
Asp Met Phe Ile Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu Ser Trp
210 215 220
Asn Arg Arg Val Ala Asp Glu Tyr Lys Gln Leu Lys Glu Lys Thr Glu
225 230 235 240
Ser Tyr Tyr Lys Glu His Leu Thr Gly Gly Glu Glu Trp Ile Glu Lys
245 250 255
Ile Arg Lys Phe Glu Lys Glu Arg Asn Met Glu Leu Glu Lys Asn Ala
260 265 270
Phe Ala Pro Asn Asp Gly Tyr Phe Ile Thr Ser Arg Gln Ile Arg Gly
275 280 285
Trp Asp Arg Val Tyr Glu Lys Trp Ser Lys Leu Pro Glu Ser Ala Ser
290 295 300
Pro Glu Glu Leu Trp Lys Val Val Ala Glu Gln Gln Asn Lys Met Ser
305 310 315 320
Glu Gly Phe Gly Asp Pro Lys Val Phe Ser Phe Leu Ala Asn Arg Glu
325 330 335
Asn Arg Asp Ile Trp Arg Gly His Ser Glu Arg Ile Tyr His Ile Ala
340 345 350
Ala Tyr Asn Gly Leu Gln Lys Lys Leu Ser Arg Thr Lys Glu Gln Ala
355 360 365
Thr Phe Thr Leu Pro Asp Ala Ile Glu His Pro Leu Trp Ile Arg Tyr
370 375 380
Glu Ser Pro Gly Gly Thr Asn Leu Asn Leu Phe Lys Leu Glu Glu Lys
385 390 395 400
Gln Lys Lys Asn Tyr Tyr Val Thr Leu Ser Lys Ile Ile Trp Pro Ser
405 410 415
Glu Glu Lys Trp Ile Glu Lys Glu Asn Ile Glu Ile Pro Leu Ala Pro
420 425 430
Ser Ile Gln Phe Asn Arg Gln Ile Lys Leu Lys Gln His Val Lys Gly
435 440 445
Lys Gln Glu Ile Ser Phe Ser Asp Tyr Ser Ser Arg Ile Ser Leu Asp
450 455 460
Gly Val Leu Gly Gly Ser Arg Ile Gln Phe Asn Arg Lys Tyr Ile Lys
465 470 475 480
Asn His Lys Glu Leu Leu Gly Glu Gly Asp Ile Gly Pro Val Phe Phe
485 490 495
Asn Leu Val Val Asp Val Ala Pro Leu Gln Glu Thr Arg Asn Gly Arg
500 505 510
Leu Gln Ser Pro Ile Gly Lys Ala Leu Lys Val Ile Ser Ser Asp Phe
515 520 525
Ser Lys Val Ile Asp Tyr Lys Pro Lys Glu Leu Met Asp Trp Met Asn
530 535 540
Thr Gly Ser Ala Ser Asn Ser Phe Gly Val Ala Ser Leu Leu Glu Gly
545 550 555 560
Met Arg Val Met Ser Ile Asp Met Gly Gln Arg Thr Ser Ala Ser Val
565 570 575
Ser Ile Phe Glu Val Val Lys Glu Leu Pro Lys Asp Gln Glu Gln Lys
580 585 590
Leu Phe Tyr Ser Ile Asn Asp Thr Glu Leu Phe Ala Ile His Lys Arg
595 600 605
Ser Phe Leu Leu Asn Leu Pro Gly Glu Val Val Thr Lys Asn Asn Lys
610 615 620
Gln Gln Arg Gln Glu Arg Arg Lys Lys Arg Gln Phe Val Arg Ser Gln
625 630 635 640
Ile Arg Met Leu Ala Asn Val Leu Arg Leu Glu Thr Lys Lys Thr Pro
645 650 655
Asp Glu Arg Lys Lys Ala Ile His Lys Leu Met Glu Ile Val Gln Ser
660 665 670
Tyr Asp Ser Trp Thr Ala Ser Gln Lys Glu Val Trp Glu Lys Glu Leu
675 680 685
Asn Leu Leu Thr Asn Met Ala Ala Phe Asn Asp Glu Ile Trp Lys Glu
690 695 700
Ser Leu Val Glu Leu His His Arg Ile Glu Pro Tyr Val Gly Gln Ile
705 710 715 720
Val Ser Lys Trp Arg Lys Gly Leu Ser Glu Gly Arg Lys Asn Leu Ala
725 730 735
Gly Ile Ser Met Trp Asn Ile Asp Glu Leu Glu Asp Thr Arg Arg Leu
740 745 750
Leu Ile Ser Trp Ser Lys Arg Ser Arg Thr Pro Gly Glu Ala Asn Arg
755 760 765
Ile Glu Thr Asp Glu Pro Phe Gly Ser Ser Leu Leu Gln His Ile Gln
770 775 780
Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Ile Ile Met
785 790 795 800
Thr Ala Leu Gly Phe Lys Tyr Asp Lys Glu Glu Lys Asp Arg Tyr Lys
805 810 815
Arg Trp Lys Glu Thr Tyr Pro Ala Cys Gln Ile Ile Leu Phe Glu Asn
820 825 830
Leu Asn Arg Tyr Leu Phe Asn Leu Asp Arg Ser Arg Arg Glu Asn Ser
835 840 845
Arg Leu Met Lys Trp Ala His Arg Ser Ile Pro Arg Thr Val Ser Met
850 855 860
Gln Gly Glu Met Phe Gly Leu Gln Val Gly Asp Val Arg Ser Glu Tyr
865 870 875 880
Ser Ser Arg Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His
885 890 895
Ala Leu Thr Glu Glu Asp Leu Lys Ala Gly Ser Asn Thr Leu Lys Arg
900 905 910
Leu Ile Glu Asp Gly Phe Ile Asn Glu Ser Glu Leu Ala Tyr Leu Lys
915 920 925
Lys Gly Asp Ile Ile Pro Ser Gln Gly Gly Glu Leu Phe Val Thr Leu
930 935 940
Ser Lys Arg Tyr Lys Lys Asp Ser Asp Asn Asn Glu Leu Thr Val Ile
945 950 955 960
His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln
965 970 975
Gln Asn Ser Glu Val Tyr Arg Val Pro Cys Gln Leu Ala Arg Met Gly
980 985 990
Glu Asp Lys Leu Tyr Ile Pro Lys Ser Gln Thr Glu Thr Ile Lys Lys
995 1000 1005
Tyr Phe Gly Lys Gly Ser Phe Val Lys Asn Asn Thr Glu Gln Glu
1010 1015 1020
Val Tyr Lys Trp Glu Lys Ser Glu Lys Met Lys Ile Lys Thr Asp
1025 1030 1035
Thr Thr Phe Asp Leu Gln Asp Leu Asp Gly Phe Glu Asp Ile Ser
1040 1045 1050
Lys Thr Ile Glu Leu Ala Gln Glu Gln Gln Lys Lys Tyr Leu Thr
1055 1060 1065
Met Phe Arg Asp Pro Ser Gly Tyr Phe Phe Asn Asn Glu Thr Trp
1070 1075 1080
Arg Pro Gln Lys Glu Tyr Trp Ser Ile Val Asn Asn Ile Ile Lys
1085 1090 1095
Ser Cys Leu Lys Lys Lys Ile Leu Ser Asn Lys Val Glu Leu
1100 1105 1110
<210> 346
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 5'UTR oligonucleotide
sequence
<400> 346
gggaaataag agagaaaaga agagtaagaa gaaatataag agccacc 47
<210> 347
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 3'UTR (TriLink standard UTR)
polynucleotide sequence
<400> 347
gctggagcct cggtggccat gcttcttgcc ccttgggcct ccccccagcc cctcctcccc 60
ttcctgcacc cgtacccccg tggtctttga ataaagtctg a 101
<210> 348
<211> 3420
<212> DNA
<213> Bacillus hisashii
<220>
<221> misc_feature
<222> (1)..(3420)
<223> bhCas12b (V4) polynucleotide sequence
<400> 348
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgccaccaga 60
tccttcatcc tgaagatcga gcccaacgag gaagtgaaga aaggcctctg gaaaacccac 120
gaggtgctga accacggaat cgcctactac atgaatatcc tgaagctgat ccggcaagag 180
gccatctacg agcaccacga gcaggacccc aagaatccca agaaggtgtc caaggccgag 240
atccaggccg agctgtggga tttcgtgctg aagatgcaga agtgcaacag cttcacacac 300
gaggtggaca aggacgaggt gttcaacatc ctgagagagc tgtacgagga actggtgccc 360
agcagcgtgg aaaagaaggg cgaagccaac cagctgagca acaagtttct gtaccctctg 420
gtggacccca acagccagtc tggaaaggga acagccagca gcggcagaaa gcccagatgg 480
tacaacctga agattgccgg cgatccctcc tgggaagaag agaagaagaa gtgggaagaa 540
gataagaaaa aggacccgct ggccaagatc ctgggcaagc tggctgagta cggactgatc 600
cctctgttca tcccctacac cgacagcaac gagcccatcg tgaaagaaat caagtggatg 660
gaaaagtccc ggaaccagag cgtgcggcgg ctggataagg acatgttcat tcaggccctg 720
gaacggttcc tgagctggga gagctggaac ctgaaagtga aagaggaata cgagaaggtc 780
gagaaagagt acaagaccct ggaagagagg atcaaagagg acatccaggc tctgaaggct 840
ctggaacagt atgagaaaga gcggcaagaa cagctgctgc gggacaccct gaacaccaac 900
gagtaccggc tgagcaagag aggccttaga ggctggcggg aaatcatcca gaaatggctg 960
aaaatggacg agaacgagcc ctccgagaag tacctggaag tgttcaagga ctaccagcgg 1020
aagcacccta gagaggccgg cgattacagc gtgtacgagt tcctgtccaa gaaagagaac 1080
cacttcatct ggcggaatca ccctgagtac ccctacctgt acgccacctt ctgcgagatc 1140
gacaagaaaa agaaggacgc caagcagcag gccaccttca cactggccga tcctatcaat 1200
caccctctgt gggtccgatt cgaggaaaga agcggcagca acctgaacaa gtacagaatc 1260
ctgaccgagc agctgcacac cgagaagctg aagaaaaagc tgacagtgca gctggaccgg 1320
ctgatctacc ctacagaatc tggcggctgg gaagagaagg gcaaagtgga cattgtgctg 1380
ctgcccagcc ggcagttcta caaccagatc ttcctggaca tcgaggaaaa gggcaagcac 1440
gccttcacct acaaggatga gagcatcaag ttccctctga agggcacact cggcggagcc 1500
agagtgcagt tcgacagaga tcacctgaga agataccctc acaaggtgga aagcggcaac 1560
gtgggcagaa tctacttcaa catgaccgtg aacatcgagc ctacagagtc cccagtgtcc 1620
aagtctctga agatccaccg ggacgacttc cccaaggtgg tcaacttcaa gcccaaagaa 1680
ctgaccgagt ggatcaagga cagcaagggc aagaaactga agtccggcat cgagtccctg 1740
gaaatcggcc tgagagtgat gagcatcgac ctgggacaga gacaggccgc tgccgcctct 1800
attttcgagg tggtggatca gaagcccgac atcgaaggca agctgttttt cccaatcaag 1860
ggcaccgagc tgtatgccgt gcacagagcc agcttcaaca tcaagctgcc cggcgagaca 1920
ctggtcaaga gcagagaagt gctgcggaag gccagagagg acaatctgaa actgatgaac 1980
cagaagctca acttcctgcg gaacgtgctg cacttccagc agttcgagga catcaccgag 2040
agagagaagc gggtcaccaa gtggatcagc agacaagaga acagcgacgt gcccctggtg 2100
taccaggatg agctgatcca gatccgcgag ctgatgtaca agccttacaa ggactgggtc 2160
gccttcctga agcagctcca caagagactg gaagtcgaga tcggcaaaga agtgaagcac 2220
tggcggaagt ccctgagcga cggaagaaag ggcctgtacg gcatctccct gaagaacatc 2280
gacgagatcg atcggacccg gaagttcctg ctgagatggt ccctgaggcc taccgaacct 2340
ggcgaagtgc gtagactgga acccggccag agattcgcca tcgaccagct gaatcacctg 2400
aacgccctga aagaagatcg gctgaagaag atggccaaca ccatcatcat gcacgccctg 2460
ggctactgct acgacgtgcg gaagaagaaa tggcaggcta agaaccccgc ctgccagatc 2520
atcctgttcg aggatctgag caactacaac ccctacgagg aaaggtcccg cttcgagaac 2580
agcaagctca tgaagtggtc cagacgcgag atccccagac aggttgcact gcagggcgag 2640
atctatggcc tgcaagtggg agaagtgggc gctcagttca gcagcagatt ccacgccaag 2700
acaggcagcc ctggcatcag atgtagcgtc gtgaccaaag agaagctgca ggacaatcgg 2760
ttcttcaaga atctgcagag agagggcaga ctgaccctgg acaaaatcgc cgtgctgaaa 2820
gagggcgatc tgtacccaga caaaggcggc gagaagttca tcagcctgag caaggatcgg 2880
aagtgcgtga ccacacacgc cgacatcaac gccgctcaga acctgcagaa gcggttctgg 2940
acaagaaccc acggcttcta caaggtgtac tgcaaggcct accaggtgga cggccagacc 3000
gtgtacatcc ctgagagcaa ggaccagaag cagaagatca tcgaagagtt cggcgagggc 3060
tacttcattc tgaaggacgg ggtgtacgaa tgggtcaacg ccggcaagct gaaaatcaag 3120
aagggcagct ccaagcagag cagcagcgag ctggtggata gcgacatcct gaaagacagc 3180
ttcgacctgg cctccgagct gaaaggcgaa aagctgatgc tgtacaggga ccccagcggc 3240
aatgtgttcc ccagcgacaa atggatggcc gctggcgtgt tcttcggaaa gctggaacgc 3300
atcctgatca gcaagctgac caaccagtac tccatcagca ccatcgagga cgacagcagc 3360
aagcagtcta tgaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 3420
<210> 349
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 349
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala
<210> 350
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 350
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc c 51
<210> 351
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 101 Cas9 TadAins 1015
polypeptide sequence
<400> 351
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Gly Ser Ser Gly Ser Glu Thr Pro
1010 1015 1020
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val
1025 1030 1035
Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala
1040 1045 1050
Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu
1055 1060 1065
Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
1070 1075 1080
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
1085 1090 1095
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr
1100 1105 1110
Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met
1115 1120 1125
Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala
1130 1135 1140
Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro
1145 1150 1155
Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp
1160 1165 1170
Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
1175 1180 1185
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Tyr Asp
1190 1195 1200
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 352
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 102 Cas9 TadAins 1022
polypeptide sequence
<400> 352
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Gly
1010 1015 1020
Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
1025 1030 1035
Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met
1040 1045 1050
Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu
1055 1060 1065
Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
1070 1075 1080
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
1085 1090 1095
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn
1100 1105 1110
Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys
1115 1120 1125
Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
1130 1135 1140
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu
1145 1150 1155
Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile
1160 1165 1170
Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr
1175 1180 1185
Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys Ala
1190 1195 1200
Gln Ser Ser Thr Asp Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 353
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 103 Cas9 TadAins 1029
polypeptide sequence
<400> 353
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Ser Ser Gly Ser Glu Thr Pro Gly
1025 1030 1035
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu
1040 1045 1050
Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys
1055 1060 1065
Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val
1070 1075 1080
Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly
1085 1090 1095
Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
1100 1105 1110
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
1115 1120 1125
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile
1130 1135 1140
His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys
1145 1150 1155
Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly
1160 1165 1170
Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu
1175 1180 1185
Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val
1190 1195 1200
Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 354
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 103 Cas9 TadAins 1040
polypeptide sequence
<400> 354
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
1040 1045 1050
Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu
1055 1060 1065
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp
1070 1075 1080
Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg
1085 1090 1095
Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
1100 1105 1110
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val
1115 1120 1125
Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe
1130 1135 1140
Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile
1145 1150 1155
Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala
1160 1165 1170
Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
1175 1180 1185
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
1190 1195 1200
Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln
1205 1210 1215
Lys Lys Ala Gln Ser Ser Thr Asp Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 355
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 105 Cas9 TadAins 1068
polypeptide sequence
<400> 355
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
1070 1075 1080
Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp
1085 1090 1095
Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
1100 1105 1110
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile
1115 1120 1125
Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala
1130 1135 1140
His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln
1145 1150 1155
Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro
1160 1165 1170
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg
1175 1180 1185
Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser
1190 1195 1200
Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu
1205 1210 1215
Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys
1220 1225 1230
Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
1235 1240 1245
Ala Gln Ser Ser Thr Asp Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 356
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 106 Cas9 TadAins 1247
polypeptide sequence
<400> 356
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Gly
1235 1240 1245
Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
1250 1255 1260
Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met
1265 1270 1275
Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu
1280 1285 1290
Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
1295 1300 1305
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
1310 1315 1320
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn
1325 1330 1335
Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys
1340 1345 1350
Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
1355 1360 1365
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu
1370 1375 1380
Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile
1385 1390 1395
Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr
1400 1405 1410
Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys Ala
1415 1420 1425
Gln Ser Ser Thr Asp Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 357
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 107 Cas9 TadAins 1054
polypeptide sequence
<400> 357
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
1055 1060 1065
Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr
1070 1075 1080
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
1085 1090 1095
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val
1100 1105 1110
Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr
1115 1120 1125
Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
1130 1135 1140
Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu
1145 1150 1155
Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly
1160 1165 1170
Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly
1175 1180 1185
Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val
1190 1195 1200
Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
1205 1210 1215
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
1220 1225 1230
Lys Ala Gln Ser Ser Thr Asp Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 358
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 108 Cas9 TadAins 1026
polypeptide sequence
<400> 358
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
1025 1030 1035
Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His
1040 1045 1050
Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg
1055 1060 1065
Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
1070 1075 1080
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp
1085 1090 1095
Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu
1100 1105 1110
Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr
1115 1120 1125
Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg
1130 1135 1140
Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
1145 1150 1155
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
1160 1165 1170
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala
1175 1180 1185
Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala
1190 1195 1200
Gln Lys Lys Ala Gln Ser Ser Thr Asp Gln Glu Ile Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 359
<211> 1540
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 109 Cas9 TadAins 768
polypeptide sequence
<400> 359
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
770 775 780
Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg
785 790 795 800
His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro
805 810 815
Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp
820 825 830
Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met
835 840 845
Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp
850 855 860
Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala
865 870 875 880
Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala
885 890 895
Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly
900 905 910
Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys
915 920 925
Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Thr Thr Gln Lys
930 935 940
Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
945 950 955 960
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr
965 970 975
Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg
980 985 990
Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr
995 1000 1005
Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser
1010 1015 1020
Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys
1025 1030 1035
Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
1040 1045 1050
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
1055 1060 1065
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu
1070 1075 1080
Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
1085 1090 1095
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr
1100 1105 1110
Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
1115 1120 1125
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln
1130 1135 1140
Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp
1145 1150 1155
Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
1160 1165 1170
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1175 1180 1185
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1190 1195 1200
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1205 1210 1215
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1220 1225 1230
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1235 1240 1245
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1250 1255 1260
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1265 1270 1275
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1280 1285 1290
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1295 1300 1305
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1310 1315 1320
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1325 1330 1335
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1340 1345 1350
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1355 1360 1365
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1370 1375 1380
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1385 1390 1395
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1400 1405 1410
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1415 1420 1425
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1430 1435 1440
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1445 1450 1455
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1460 1465 1470
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1475 1480 1485
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1490 1495 1500
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1505 1510 1515
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1520 1525 1530
Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 360
<211> 1540
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.1 Cas9 TadAins 1250
polypeptide sequence
<400> 360
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
1250 1255 1260
Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr
1265 1270 1275
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
1280 1285 1290
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val
1295 1300 1305
Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr
1310 1315 1320
Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
1325 1330 1335
Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu
1340 1345 1350
Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly
1355 1360 1365
Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly
1370 1375 1380
Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val
1385 1390 1395
Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
1400 1405 1410
Cys Tyr Phe Phe Arg Met Pro Arg Glu Asp Asn Glu Gln Lys Gln
1415 1420 1425
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1430 1435 1440
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1445 1450 1455
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1460 1465 1470
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1475 1480 1485
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1490 1495 1500
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1505 1510 1515
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1520 1525 1530
Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 361
<211> 1543
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.2 Cas9 TadAins 1250
polypeptide sequence
<400> 361
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Gly Ser Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser
1250 1255 1260
Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser
1265 1270 1275
His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
1280 1285 1290
Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn
1295 1300 1305
Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His
1310 1315 1320
Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly
1325 1330 1335
Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val
1340 1345 1350
Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
1355 1360 1365
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
1370 1375 1380
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn
1385 1390 1395
His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala
1400 1405 1410
Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Glu Asp Asn Glu
1415 1420 1425
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
1430 1435 1440
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
1445 1450 1455
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
1460 1465 1470
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1475 1480 1485
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1490 1495 1500
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
1505 1510 1515
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1520 1525 1530
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 362
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.3 Cas9 TadAins 1250
polypeptide sequence
<400> 362
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Gly Ser Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser
1250 1255 1260
Glu Ser Ala Thr Pro Glu Ser Gly Ser Ser Ser Gly Ser Glu Val
1265 1270 1275
Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala
1280 1285 1290
Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu
1295 1300 1305
Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
1310 1315 1320
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
1325 1330 1335
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr
1340 1345 1350
Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met
1355 1360 1365
Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala
1370 1375 1380
Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro
1385 1390 1395
Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp
1400 1405 1410
Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Glu
1415 1420 1425
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1430 1435 1440
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1445 1450 1455
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1460 1465 1470
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1475 1480 1485
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1490 1495 1500
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1505 1510 1515
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1520 1525 1530
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540 1545
<210> 363
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.4 Cas9 TadAins 1250
polypeptide sequence
<400> 363
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Gly Ser Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser
1250 1255 1260
Glu Ser Ala Thr Pro Glu Ser Gly Ser Ser Ser Gly Ser Glu Val
1265 1270 1275
Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala
1280 1285 1290
Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu
1295 1300 1305
Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
1310 1315 1320
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
1325 1330 1335
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr
1340 1345 1350
Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met
1355 1360 1365
Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala
1370 1375 1380
Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro
1385 1390 1395
Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp
1400 1405 1410
Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Glu
1415 1420 1425
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1430 1435 1440
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1445 1450 1455
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1460 1465 1470
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1475 1480 1485
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1490 1495 1500
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1505 1510 1515
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1520 1525 1530
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540 1545
<210> 364
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.5 Cas9 TadAins 1249
polypeptide sequence
<400> 364
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Gly Ser Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
1250 1255 1260
Ser Ala Thr Pro Glu Ser Gly Ser Ser Ser Gly Ser Glu Val Glu
1265 1270 1275
Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys
1280 1285 1290
Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val
1295 1300 1305
Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly
1310 1315 1320
Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
1325 1330 1335
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
1340 1345 1350
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile
1355 1360 1365
His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys
1370 1375 1380
Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly
1385 1390 1395
Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu
1400 1405 1410
Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Pro Glu
1415 1420 1425
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1430 1435 1440
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1445 1450 1455
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1460 1465 1470
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1475 1480 1485
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1490 1495 1500
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1505 1510 1515
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1520 1525 1530
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540 1545
<210> 365
<211> 1551
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.5 Cas9 TadAins delta
59-66 1250 polypeptide sequence
<400> 365
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Gly Ser Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser
1250 1255 1260
Glu Ser Ala Thr Pro Glu Ser Gly Ser Ser Gly Ser Glu Val Glu
1265 1270 1275
Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys
1280 1285 1290
Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val
1295 1300 1305
Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala His Ala
1310 1315 1320
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr
1325 1330 1335
Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val
1340 1345 1350
Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
1355 1360 1365
Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
1370 1375 1380
Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr
1385 1390 1395
Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe
1400 1405 1410
Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys Ala Gln
1415 1420 1425
Ser Ser Thr Asp Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1430 1435 1440
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1445 1450 1455
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1460 1465 1470
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1475 1480 1485
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1490 1495 1500
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1505 1510 1515
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1520 1525 1530
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1535 1540 1545
Gly Gly Asp
1550
<210> 366
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.6 Cas9 TadAins 1251
polypeptide sequence
<400> 366
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Gly Ser Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1250 1255 1260
Ser Glu Ser Ala Thr Pro Glu Ser Gly Ser Ser Ser Gly Ser Glu
1265 1270 1275
Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu
1280 1285 1290
Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
1295 1300 1305
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
1310 1315 1320
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu
1325 1330 1335
Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala
1340 1345 1350
Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala
1355 1360 1365
Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn
1370 1375 1380
Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr
1385 1390 1395
Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
1400 1405 1410
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg
1415 1420 1425
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1430 1435 1440
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1445 1450 1455
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1460 1465 1470
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1475 1480 1485
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1490 1495 1500
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1505 1510 1515
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1520 1525 1530
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540 1545
<210> 367
<211> 1546
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.7 Cas9 TadAins 1252
polypeptide sequence
<400> 367
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Gly Ser Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly
1250 1255 1260
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Ser Ser Ser Gly Ser
1265 1270 1275
Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1280 1285 1290
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
1295 1300 1305
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg
1310 1315 1320
Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala
1325 1330 1335
Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp
1340 1345 1350
Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly
1355 1360 1365
Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg
1370 1375 1380
Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
1385 1390 1395
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
1400 1405 1410
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg
1415 1420 1425
Arg Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1430 1435 1440
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1445 1450 1455
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1460 1465 1470
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1475 1480 1485
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1490 1495 1500
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1505 1510 1515
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1520 1525 1530
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540 1545
<210> 368
<211> 1533
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 110.8 Cas9 TadAins delta
59-66 C-truncate 1250 polypeptide sequence
<400> 368
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
1250 1255 1260
Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr
1265 1270 1275
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
1280 1285 1290
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val
1295 1300 1305
Ile Gly Glu Gly Trp Asn Arg Ala His Ala Glu Ile Met Ala Leu
1310 1315 1320
Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala
1325 1330 1335
Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala
1340 1345 1350
Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn
1355 1360 1365
Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr
1370 1375 1380
Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
1385 1390 1395
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
1400 1405 1410
Gln Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1415 1420 1425
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1430 1435 1440
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1445 1450 1455
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1460 1465 1470
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1475 1480 1485
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1490 1495 1500
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1505 1510 1515
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1520 1525 1530
<210> 369
<211> 1549
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 111.1 Cas9 TadAins 997
polypeptide sequence
<400> 369
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
995 1000 1005
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
1010 1015 1020
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg
1025 1030 1035
Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala
1040 1045 1050
Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp
1055 1060 1065
Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly
1070 1075 1080
Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg
1085 1090 1095
Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
1100 1105 1110
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
1115 1120 1125
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro
1130 1135 1140
Arg Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
1145 1150 1155
Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
1160 1165 1170
Pro Glu Ser Ser Gly Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1175 1180 1185
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1190 1195 1200
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1205 1210 1215
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1220 1225 1230
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1235 1240 1245
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1250 1255 1260
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1265 1270 1275
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1280 1285 1290
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1295 1300 1305
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1310 1315 1320
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1325 1330 1335
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1340 1345 1350
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1355 1360 1365
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1370 1375 1380
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1385 1390 1395
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1400 1405 1410
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1415 1420 1425
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1430 1435 1440
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1445 1450 1455
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1460 1465 1470
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1475 1480 1485
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1490 1495 1500
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1505 1510 1515
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1520 1525 1530
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1535 1540 1545
Asp
<210> 370
<211> 1555
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 111.2 Cas9 TadAins 997
polypeptide sequence
<400> 370
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
995 1000 1005
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
1010 1015 1020
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg
1025 1030 1035
Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala
1040 1045 1050
Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp
1055 1060 1065
Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly
1070 1075 1080
Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg
1085 1090 1095
Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
1100 1105 1110
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
1115 1120 1125
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro
1130 1135 1140
Arg Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
1145 1150 1155
Gly Ser Ser Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
1160 1165 1170
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Ile Lys Lys Tyr
1175 1180 1185
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1190 1195 1200
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1205 1210 1215
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1220 1225 1230
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1235 1240 1245
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1250 1255 1260
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1265 1270 1275
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1280 1285 1290
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1295 1300 1305
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1310 1315 1320
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1325 1330 1335
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1340 1345 1350
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1355 1360 1365
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1370 1375 1380
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1385 1390 1395
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1400 1405 1410
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1415 1420 1425
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1430 1435 1440
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1445 1450 1455
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1460 1465 1470
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1475 1480 1485
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1490 1495 1500
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1505 1510 1515
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1520 1525 1530
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1535 1540 1545
Leu Ser Gln Leu Gly Gly Asp
1550 1555
<210> 371
<211> 1421
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 112 delta HNH TadA
polypeptide sequence
<400> 371
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Glu Val Glu Phe Ser His Glu
785 790 795 800
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
805 810 815
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile
820 825 830
Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
835 840 845
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr
850 855 860
Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
865 870 875 880
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly
885 890 895
Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu
900 905 910
His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
915 920 925
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
930 935 940
Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Gly
945 950 955 960
Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
965 970 975
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met
980 985 990
Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
995 1000 1005
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1010 1015 1020
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1025 1030 1035
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1040 1045 1050
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1055 1060 1065
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1070 1075 1080
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1085 1090 1095
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1100 1105 1110
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1115 1120 1125
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1130 1135 1140
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1145 1150 1155
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1160 1165 1170
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1175 1180 1185
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1190 1195 1200
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1205 1210 1215
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1220 1225 1230
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1235 1240 1245
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1250 1255 1260
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1265 1270 1275
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1280 1285 1290
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1295 1300 1305
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1310 1315 1320
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1325 1330 1335
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1340 1345 1350
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1355 1360 1365
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1370 1375 1380
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1385 1390 1395
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1400 1405 1410
Asp Leu Ser Gln Leu Gly Gly Asp
1415 1420
<210> 372
<211> 1552
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 113 N-term single TadA helix
trunc 165-end polypeptide sequence
<400> 372
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Ser Gly Gly Ser Ser Gly Gly
145 150 155 160
Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
165 170 175
Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly
180 185 190
Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu
195 200 205
Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg
210 215 220
His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly
225 230 235 240
Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr
245 250 255
Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn
260 265 270
Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser
275 280 285
Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly
290 295 300
Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr
305 310 315 320
His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg
325 330 335
Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe
340 345 350
Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu
355 360 365
Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro
370 375 380
Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu
385 390 395 400
Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu
405 410 415
Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu
420 425 430
Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu
435 440 445
Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala
450 455 460
Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu
465 470 475 480
Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile
485 490 495
Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His
500 505 510
His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro
515 520 525
Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala
530 535 540
Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile
545 550 555 560
Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys
565 570 575
Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly
580 585 590
Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
595 600 605
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile
610 615 620
Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala
625 630 635 640
Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr
645 650 655
Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala
660 665 670
Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn
675 680 685
Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val
690 695 700
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys
705 710 715 720
Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu
725 730 735
Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr
740 745 750
Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu
755 760 765
Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile
770 775 780
Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu
785 790 795 800
Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile
805 810 815
Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met
820 825 830
Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
835 840 845
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu
850 855 860
Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu
865 870 875 880
Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln
885 890 895
Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
900 905 910
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val
915 920 925
Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
930 935 940
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn
945 950 955 960
Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
965 970 975
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
980 985 990
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
995 1000 1005
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1010 1015 1020
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1025 1030 1035
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1040 1045 1050
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1055 1060 1065
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1070 1075 1080
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1085 1090 1095
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1100 1105 1110
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1115 1120 1125
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1130 1135 1140
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1145 1150 1155
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1160 1165 1170
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1175 1180 1185
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1190 1195 1200
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1205 1210 1215
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1220 1225 1230
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1235 1240 1245
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1250 1255 1260
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1265 1270 1275
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1280 1285 1290
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1295 1300 1305
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1310 1315 1320
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1325 1330 1335
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1340 1345 1350
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1355 1360 1365
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1370 1375 1380
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1385 1390 1395
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1400 1405 1410
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1415 1420 1425
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1430 1435 1440
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1445 1450 1455
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1460 1465 1470
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1475 1480 1485
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1490 1495 1500
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1505 1510 1515
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1520 1525 1530
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1535 1540 1545
Leu Gly Gly Asp
1550
<210> 373
<211> 1545
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 114 N-term single TadA helix
trunc 165-end delta 59-65 polypeptide sequence
<400> 373
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Thr
35 40 45
Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln
50 55 60
Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys
65 70 75 80
Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
85 90 95
Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
100 105 110
Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
115 120 125
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met
130 135 140
Pro Arg Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
145 150 155 160
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly
165 170 175
Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser
180 185 190
Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys
195 200 205
Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu
210 215 220
Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg
225 230 235 240
Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile
245 250 255
Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp
260 265 270
Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys
275 280 285
Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala
290 295 300
Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val
305 310 315 320
Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala
325 330 335
His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn
340 345 350
Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr
355 360 365
Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp
370 375 380
Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu
385 390 395 400
Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly
405 410 415
Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn
420 425 430
Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr
435 440 445
Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala
450 455 460
Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser
465 470 475 480
Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
485 490 495
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu
500 505 510
Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe
515 520 525
Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala
530 535 540
Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
545 550 555 560
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu
565 570 575
Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
580 585 590
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro
595 600 605
Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg
610 615 620
Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala
625 630 635 640
Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu
645 650 655
Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met
660 665 670
Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His
675 680 685
Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val
690 695 700
Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu
705 710 715 720
Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
725 730 735
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe
740 745 750
Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu
755 760 765
Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu
770 775 780
Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
785 790 795 800
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr
805 810 815
Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg
820 825 830
Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg
835 840 845
Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
850 855 860
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
865 870 875 880
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser
885 890 895
Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys
900 905 910
Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met
915 920 925
Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
930 935 940
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg
945 950 955 960
Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
965 970 975
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
980 985 990
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn
995 1000 1005
Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe
1010 1015 1020
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp
1025 1030 1035
Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
1040 1045 1050
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu
1055 1060 1065
Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
1070 1075 1080
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
1085 1090 1095
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
1100 1105 1110
Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
1115 1120 1125
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe
1130 1135 1140
Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1145 1150 1155
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1160 1165 1170
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1175 1180 1185
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1190 1195 1200
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1205 1210 1215
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1220 1225 1230
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1235 1240 1245
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1250 1255 1260
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1265 1270 1275
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1280 1285 1290
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1295 1300 1305
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1310 1315 1320
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1325 1330 1335
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1340 1345 1350
Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1355 1360 1365
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1370 1375 1380
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1385 1390 1395
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1400 1405 1410
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1415 1420 1425
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1430 1435 1440
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1445 1450 1455
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1460 1465 1470
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1475 1480 1485
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1490 1495 1500
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1505 1510 1515
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1520 1525 1530
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540 1545
<210> 374
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 115.1 Cas9 TadAins1004
polypeptide sequence
<400> 374
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Gly Ser Ser Gly Ser
995 1000 1005
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
1010 1015 1020
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1025 1030 1035
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly
1040 1045 1050
Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn
1055 1060 1065
Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met
1070 1075 1080
Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile
1085 1090 1095
Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala
1100 1105 1110
Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
1115 1120 1125
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu
1130 1135 1140
His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile
1145 1150 1155
Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met
1160 1165 1170
Pro Arg Gln Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1175 1180 1185
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1190 1195 1200
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1205 1210 1215
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1220 1225 1230
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1235 1240 1245
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1250 1255 1260
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1265 1270 1275
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1280 1285 1290
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1295 1300 1305
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1310 1315 1320
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1325 1330 1335
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1340 1345 1350
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1355 1360 1365
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1370 1375 1380
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1385 1390 1395
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1400 1405 1410
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1415 1420 1425
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1430 1435 1440
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1445 1450 1455
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1460 1465 1470
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1475 1480 1485
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1490 1495 1500
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1505 1510 1515
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1520 1525 1530
Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 375
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 115.2 Cas9 TadAins1005
polypeptide sequence
<400> 375
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Gly Ser Ser Gly
995 1000 1005
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
1010 1015 1020
Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala
1025 1030 1035
Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val
1040 1045 1050
Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp
1055 1060 1065
Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile
1070 1075 1080
Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu
1085 1090 1095
Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
1100 1105 1110
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly
1115 1120 1125
Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val
1130 1135 1140
Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
1145 1150 1155
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg
1160 1165 1170
Met Pro Arg Gln Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1175 1180 1185
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1190 1195 1200
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1205 1210 1215
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1220 1225 1230
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1235 1240 1245
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1250 1255 1260
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1265 1270 1275
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1280 1285 1290
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1295 1300 1305
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1310 1315 1320
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1325 1330 1335
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1340 1345 1350
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1355 1360 1365
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1370 1375 1380
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1385 1390 1395
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1400 1405 1410
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1415 1420 1425
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1430 1435 1440
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1445 1450 1455
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1460 1465 1470
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1475 1480 1485
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1490 1495 1500
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1505 1510 1515
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1520 1525 1530
Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 376
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 115.3 Cas9 TadAins1006
polypeptide sequence
<400> 376
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Gly Ser Ser
995 1000 1005
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1010 1015 1020
Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His
1025 1030 1035
Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro
1040 1045 1050
Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly
1055 1060 1065
Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu
1070 1075 1080
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
1085 1090 1095
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
1100 1105 1110
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe
1115 1120 1125
Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
1130 1135 1140
Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
1145 1150 1155
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe
1160 1165 1170
Arg Met Pro Arg Gln Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1175 1180 1185
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1190 1195 1200
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1205 1210 1215
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1220 1225 1230
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1235 1240 1245
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1250 1255 1260
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1265 1270 1275
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1280 1285 1290
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1295 1300 1305
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1310 1315 1320
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1325 1330 1335
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1340 1345 1350
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1355 1360 1365
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1370 1375 1380
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1385 1390 1395
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1400 1405 1410
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1415 1420 1425
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1430 1435 1440
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1445 1450 1455
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1460 1465 1470
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1475 1480 1485
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1490 1495 1500
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1505 1510 1515
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1520 1525 1530
Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 377
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 115.4 Cas9 TadAins1007
polypeptide sequence
<400> 377
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Gly Ser
995 1000 1005
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
1010 1015 1020
Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg
1025 1030 1035
His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val
1040 1045 1050
Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu
1055 1060 1065
Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
1070 1075 1080
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr
1085 1090 1095
Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val
1100 1105 1110
Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
1115 1120 1125
Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
1130 1135 1140
Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr
1145 1150 1155
Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe
1160 1165 1170
Phe Arg Met Pro Arg Gln Glu Phe Val Tyr Gly Asp Tyr Lys Val
1175 1180 1185
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1190 1195 1200
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1205 1210 1215
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1220 1225 1230
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1235 1240 1245
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1250 1255 1260
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1265 1270 1275
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1280 1285 1290
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1295 1300 1305
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1310 1315 1320
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1325 1330 1335
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1340 1345 1350
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1355 1360 1365
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1370 1375 1380
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1385 1390 1395
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1400 1405 1410
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1415 1420 1425
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1430 1435 1440
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1445 1450 1455
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1460 1465 1470
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1475 1480 1485
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1490 1495 1500
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1505 1510 1515
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1520 1525 1530
Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 378
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 116.1 Cas9 TadAins C-term
truncate2 792 polypeptide sequence
<400> 378
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Gly Ser Ser Gly Ser Glu Thr Pro
785 790 795 800
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu
805 810 815
Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg
820 825 830
Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn
835 840 845
Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp
850 855 860
Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val
865 870 875 880
Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu
885 890 895
Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg
900 905 910
Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu
915 920 925
Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr
930 935 940
Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe
945 950 955 960
Arg Met Pro Arg Gln Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
965 970 975
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly
980 985 990
Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
995 1000 1005
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
1010 1015 1020
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1025 1030 1035
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
1040 1045 1050
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
1055 1060 1065
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
1070 1075 1080
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1085 1090 1095
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1100 1105 1110
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
1115 1120 1125
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1130 1135 1140
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1145 1150 1155
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1160 1165 1170
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1175 1180 1185
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1190 1195 1200
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1205 1210 1215
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1220 1225 1230
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1235 1240 1245
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1250 1255 1260
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1265 1270 1275
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1280 1285 1290
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1295 1300 1305
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1310 1315 1320
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1325 1330 1335
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1340 1345 1350
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1355 1360 1365
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1370 1375 1380
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1385 1390 1395
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1400 1405 1410
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1415 1420 1425
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1430 1435 1440
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1445 1450 1455
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1460 1465 1470
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1475 1480 1485
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1490 1495 1500
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1505 1510 1515
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1520 1525 1530
Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 379
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 116.2 Cas9 TadAins C-term
truncate2 791 polypeptide sequence
<400> 379
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Ser Gly Ser Glu Thr Pro Gly
785 790 795 800
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe
805 810 815
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
820 825 830
Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
835 840 845
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
850 855 860
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
865 870 875 880
Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro
885 890 895
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
900 905 910
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
915 920 925
Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
930 935 940
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg
945 950 955 960
Met Pro Arg Gln Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
965 970 975
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly
980 985 990
Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
995 1000 1005
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
1010 1015 1020
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1025 1030 1035
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
1040 1045 1050
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
1055 1060 1065
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
1070 1075 1080
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1085 1090 1095
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1100 1105 1110
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
1115 1120 1125
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1130 1135 1140
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1145 1150 1155
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1160 1165 1170
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1175 1180 1185
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1190 1195 1200
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1205 1210 1215
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1220 1225 1230
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1235 1240 1245
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1250 1255 1260
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1265 1270 1275
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1280 1285 1290
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1295 1300 1305
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1310 1315 1320
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1325 1330 1335
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1340 1345 1350
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1355 1360 1365
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1370 1375 1380
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1385 1390 1395
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1400 1405 1410
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1415 1420 1425
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1430 1435 1440
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1445 1450 1455
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1460 1465 1470
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1475 1480 1485
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1490 1495 1500
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1505 1510 1515
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1520 1525 1530
Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 380
<211> 1541
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 116.3 Cas9 TadAins C-term
truncate2 790 polypeptide sequence
<400> 380
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
785 790 795 800
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser
805 810 815
His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg
820 825 830
Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg
835 840 845
Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr
850 855 860
Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln
865 870 875 880
Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys
885 890 895
Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
900 905 910
Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
915 920 925
Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
930 935 940
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met
945 950 955 960
Pro Arg Gln Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
965 970 975
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly
980 985 990
Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
995 1000 1005
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
1010 1015 1020
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1025 1030 1035
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
1040 1045 1050
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
1055 1060 1065
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
1070 1075 1080
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1085 1090 1095
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1100 1105 1110
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
1115 1120 1125
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1130 1135 1140
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1145 1150 1155
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1160 1165 1170
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1175 1180 1185
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1190 1195 1200
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1205 1210 1215
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1220 1225 1230
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1235 1240 1245
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1250 1255 1260
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1265 1270 1275
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1280 1285 1290
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1295 1300 1305
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1310 1315 1320
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1325 1330 1335
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1340 1345 1350
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1355 1360 1365
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1370 1375 1380
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1385 1390 1395
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1400 1405 1410
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1415 1420 1425
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1430 1435 1440
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1445 1450 1455
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1460 1465 1470
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1475 1480 1485
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1490 1495 1500
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1505 1510 1515
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1520 1525 1530
Asp Leu Ser Gln Leu Gly Gly Asp
1535 1540
<210> 381
<211> 1484
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 117 Cas9 delta 1017-1069
polypeptide sequence
<400> 381
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Ser Ser Gly Ser Glu Val Glu
1010 1015 1020
Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys
1025 1030 1035
Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val
1040 1045 1050
Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly
1055 1060 1065
Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
1070 1075 1080
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
1085 1090 1095
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile
1100 1105 1110
His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys
1115 1120 1125
Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly
1130 1135 1140
Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu
1145 1150 1155
Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val
1160 1165 1170
Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Glu Ile
1175 1180 1185
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu
1190 1195 1200
Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr
1205 1210 1215
Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp
1220 1225 1230
Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly
1235 1240 1245
Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala
1250 1255 1260
Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu
1265 1270 1275
Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn
1280 1285 1290
Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys
1295 1300 1305
Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu
1310 1315 1320
Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys
1325 1330 1335
Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr
1340 1345 1350
Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn
1355 1360 1365
Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp
1370 1375 1380
Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu
1385 1390 1395
Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His
1400 1405 1410
Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1415 1420 1425
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe
1430 1435 1440
Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val
1445 1450 1455
Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu
1460 1465 1470
Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1475 1480
<210> 382
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 118 Cas9 TadA-CP116ins 1067
polypeptide sequence
<400> 382
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Met Asn
1055 1060 1065
His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala
1070 1075 1080
Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn
1085 1090 1095
Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser Gly Ser
1100 1105 1110
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
1115 1120 1125
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1130 1135 1140
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly
1145 1150 1155
Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn
1160 1165 1170
Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met
1175 1180 1185
Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile
1190 1195 1200
Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala
1205 1210 1215
Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
1220 1225 1230
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu
1235 1240 1245
His Tyr Pro Gly Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 383
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 119 Cas9 TadAins 701
polypeptide sequence
<400> 383
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Gly Ser Ser
690 695 700
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
705 710 715 720
Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
725 730 735
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
740 745 750
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
755 760 765
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
770 775 780
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
785 790 795 800
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
805 810 815
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
820 825 830
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
835 840 845
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
850 855 860
Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
865 870 875 880
Lys Ala Gln Ser Ser Thr Asp Leu Thr Phe Lys Glu Asp Ile Gln Lys
885 890 895
Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn
900 905 910
Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys
915 920 925
Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
930 935 940
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln
945 950 955 960
Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu
965 970 975
Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu
980 985 990
Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
995 1000 1005
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1010 1015 1020
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1025 1030 1035
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1040 1045 1050
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1055 1060 1065
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1070 1075 1080
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1085 1090 1095
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1100 1105 1110
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1115 1120 1125
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1130 1135 1140
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1145 1150 1155
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1160 1165 1170
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1175 1180 1185
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1190 1195 1200
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 384
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 120 Cas9 TadACP136ins 1248
polypeptide sequence
<400> 384
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu
1250 1255 1260
Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val
1265 1270 1275
Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser
1280 1285 1290
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1295 1300 1305
Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His
1310 1315 1320
Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro
1325 1330 1335
Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly
1340 1345 1350
Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu
1355 1360 1365
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
1370 1375 1380
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
1385 1390 1395
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe
1400 1405 1410
Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
1415 1420 1425
Val Leu His Tyr Pro Gly Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 385
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 121 Cas9 TadACP136ins 1052
polypeptide sequence
<400> 385
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu
1055 1060 1065
Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val
1070 1075 1080
Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser
1085 1090 1095
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1100 1105 1110
Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His
1115 1120 1125
Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro
1130 1135 1140
Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly
1145 1150 1155
Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu
1160 1165 1170
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
1175 1180 1185
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
1190 1195 1200
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe
1205 1210 1215
Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
1220 1225 1230
Val Leu His Tyr Pro Gly Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 386
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 122 Cas9 TadACP136ins 1041
polypeptide sequence
<400> 386
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
1040 1045 1050
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
1055 1060 1065
Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly
1070 1075 1080
Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
1085 1090 1095
Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met
1100 1105 1110
Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu
1115 1120 1125
Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
1130 1135 1140
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
1145 1150 1155
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn
1160 1165 1170
Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys
1175 1180 1185
Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
1190 1195 1200
Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu
1205 1210 1215
Met Asp Val Leu His Tyr Pro Gly Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 387
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 123 Cas9 TadACP139ins 1299
polypeptide sequence
<400> 387
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Met Asn His Arg Val Glu Ile Thr Glu Gly
1295 1300 1305
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg
1310 1315 1320
Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser
1325 1330 1335
Thr Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
1340 1345 1350
Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu
1355 1360 1365
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp
1370 1375 1380
Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg
1385 1390 1395
Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro
1400 1405 1410
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val
1415 1420 1425
Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe
1430 1435 1440
Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile
1445 1450 1455
Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala
1460 1465 1470
Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 388
<211> 1454
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 124 Cas9 delta 792-872
TadAins polypeptide sequence
<400> 388
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Glu Val Glu Phe Ser His Glu
785 790 795 800
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
805 810 815
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile
820 825 830
Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
835 840 845
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr
850 855 860
Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
865 870 875 880
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly
885 890 895
Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu
900 905 910
His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
915 920 925
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
930 935 940
Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Glu Glu
945 950 955 960
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
965 970 975
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
980 985 990
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val
995 1000 1005
Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
1010 1015 1020
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu
1025 1030 1035
Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg
1040 1045 1050
Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His
1055 1060 1065
His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu
1070 1075 1080
Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp
1085 1090 1095
Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln
1100 1105 1110
Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile
1115 1120 1125
Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile
1130 1135 1140
Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1145 1150 1155
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu
1160 1165 1170
Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr
1175 1180 1185
Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp
1190 1195 1200
Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly
1205 1210 1215
Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala
1220 1225 1230
Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu
1235 1240 1245
Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn
1250 1255 1260
Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys
1265 1270 1275
Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu
1280 1285 1290
Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys
1295 1300 1305
Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr
1310 1315 1320
Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn
1325 1330 1335
Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp
1340 1345 1350
Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu
1355 1360 1365
Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His
1370 1375 1380
Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1385 1390 1395
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe
1400 1405 1410
Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val
1415 1420 1425
Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu
1430 1435 1440
Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1445 1450
<210> 389
<211> 1420
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 125 Cas9 delta 792-906
TadAins polypeptide sequence
<400> 389
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Glu Val Glu Phe Ser His Glu
785 790 795 800
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
805 810 815
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile
820 825 830
Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
835 840 845
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr
850 855 860
Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
865 870 875 880
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly
885 890 895
Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu
900 905 910
His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
915 920 925
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
930 935 940
Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Leu
945 950 955 960
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
965 970 975
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
980 985 990
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
995 1000 1005
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln
1010 1015 1020
Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp
1025 1030 1035
Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
1040 1045 1050
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1055 1060 1065
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1070 1075 1080
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1085 1090 1095
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1100 1105 1110
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1115 1120 1125
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1130 1135 1140
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1145 1150 1155
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1160 1165 1170
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1175 1180 1185
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1190 1195 1200
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1205 1210 1215
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1220 1225 1230
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1235 1240 1245
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1250 1255 1260
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1265 1270 1275
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1280 1285 1290
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1295 1300 1305
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1310 1315 1320
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1325 1330 1335
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1340 1345 1350
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1355 1360 1365
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1370 1375 1380
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1385 1390 1395
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1400 1405 1410
Leu Ser Gln Leu Gly Gly Asp
1415 1420
<210> 390
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 126 TadA CP65ins 1003
polypeptide sequence
<400> 390
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Thr Ala His Ala Glu
995 1000 1005
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
1010 1015 1020
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
1025 1030 1035
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe
1040 1045 1050
Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
1055 1060 1065
Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
1070 1075 1080
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe
1085 1090 1095
Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser
1100 1105 1110
Ser Thr Asp Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
1115 1120 1125
Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His
1130 1135 1140
Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg
1145 1150 1155
Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn
1160 1165 1170
Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp
1175 1180 1185
Pro Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1190 1195 1200
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 391
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 127 TadA CP65ins 1016
polypeptide sequence
<400> 391
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Thr Ala His Ala Glu Ile Met Ala
1010 1015 1020
Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp
1025 1030 1035
Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly
1040 1045 1050
Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg
1055 1060 1065
Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
1070 1075 1080
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
1085 1090 1095
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro
1100 1105 1110
Arg Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
1115 1120 1125
Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
1130 1135 1140
Pro Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp
1145 1150 1155
Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
1160 1165 1170
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile
1175 1180 1185
Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Tyr Asp
1190 1195 1200
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 392
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 128 TadA CP65ins 1022
polypeptide sequence
<400> 392
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Thr
1010 1015 1020
Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
1025 1030 1035
Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu
1040 1045 1050
Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly
1055 1060 1065
Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly
1070 1075 1080
Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val
1085 1090 1095
Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
1100 1105 1110
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
1115 1120 1125
Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser Gly Ser Glu Thr Pro
1130 1135 1140
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val
1145 1150 1155
Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala
1160 1165 1170
Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu
1175 1180 1185
Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
1190 1195 1200
Gly Leu His Asp Pro Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 393
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 129 TadA CP65ins 1029
polypeptide sequence
<400> 393
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Thr Ala His Ala Glu Ile Met Ala Leu
1025 1030 1035
Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala
1040 1045 1050
Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala
1055 1060 1065
Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn
1070 1075 1080
Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr
1085 1090 1095
Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
1100 1105 1110
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
1115 1120 1125
Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly
1130 1135 1140
Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
1145 1150 1155
Glu Ser Ser Gly Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met
1160 1165 1170
Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu
1175 1180 1185
Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
1190 1195 1200
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Gly Lys Ala
1205 1210 1215
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 394
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 130 TadA CP65ins 1041
polypeptide sequence
<400> 394
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly
1040 1045 1050
Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val
1055 1060 1065
Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
1070 1075 1080
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
1085 1090 1095
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn
1100 1105 1110
His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala
1115 1120 1125
Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn
1130 1135 1140
Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser Gly Ser
1145 1150 1155
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
1160 1165 1170
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1175 1180 1185
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly
1190 1195 1200
Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn
1205 1210 1215
Arg Ala Ile Gly Leu His Asp Pro Asn Ile Met Asn Phe Phe Lys
1220 1225 1230
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 395
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 131 TadA CP65ins 1054
polypeptide sequence
<400> 395
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu
1055 1060 1065
Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr
1070 1075 1080
Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg
1085 1090 1095
Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
1100 1105 1110
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
1115 1120 1125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala
1130 1135 1140
Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala
1145 1150 1155
Gln Lys Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser Gly Ser Glu
1160 1165 1170
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser
1175 1180 1185
Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1190 1195 1200
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
1205 1210 1215
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg
1220 1225 1230
Ala Ile Gly Leu His Asp Pro Gly Glu Ile Arg Lys Arg Pro Leu
1235 1240 1245
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1250 1255 1260
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1265 1270 1275
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1280 1285 1290
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1295 1300 1305
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1310 1315 1320
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1325 1330 1335
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1340 1345 1350
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1355 1360 1365
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1370 1375 1380
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1385 1390 1395
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1400 1405 1410
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1415 1420 1425
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 396
<211> 1554
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 132 TadA CP65ins 1246
polypeptide sequence
<400> 396
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Thr
1235 1240 1245
Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
1250 1255 1260
Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu
1265 1270 1275
Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly
1280 1285 1290
Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly
1295 1300 1305
Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val
1310 1315 1320
Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
1325 1330 1335
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
1340 1345 1350
Lys Ala Gln Ser Ser Thr Asp Gly Ser Ser Gly Ser Glu Thr Pro
1355 1360 1365
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Ser Glu Val
1370 1375 1380
Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala
1385 1390 1395
Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu
1400 1405 1410
Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
1415 1420 1425
Gly Leu His Asp Pro Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1430 1435 1440
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1445 1450 1455
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1460 1465 1470
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1475 1480 1485
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1490 1495 1500
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1505 1510 1515
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1520 1525 1530
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1535 1540 1545
Ser Gln Leu Gly Gly Asp
1550
<210> 397
<211> 160
<212> PRT
<213> Staphylococcus aureus
<220>
<221> MISC_FEATURE
<222> (1)..(160)
<223> TadA polypeptide sequence
<400> 397
Met Gly Ser His Met Thr Asn Asp Ile Tyr Phe Met Thr Leu Ala Ile
1 5 10 15
Glu Glu Ala Lys Lys Ala Ala Gln Leu Gly Glu Val Pro Ile Gly Ala
20 25 30
Ile Ile Thr Lys Asp Asp Glu Val Ile Ala Arg Ala His Asn Leu Arg
35 40 45
Glu Thr Leu Gln Gln Pro Thr Ala His Ala Glu His Ile Ala Ile Glu
50 55 60
Arg Ala Ala Lys Val Leu Gly Ser Trp Arg Leu Glu Gly Cys Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Thr Ile Val Met
85 90 95
Ser Arg Ile Pro Arg Val Val Tyr Gly Ala Asp Asp Pro Lys Gly Gly
100 105 110
Cys Ser Gly Ser Leu Met Asn Leu Leu Gln Gln Ser Asn Phe Asn His
115 120 125
Arg Ala Ile Val Asp Lys Gly Val Leu Lys Glu Ala Cys Ser Thr Leu
130 135 140
Leu Thr Thr Phe Phe Lys Asn Leu Arg Ala Asn Lys Lys Ser Thr Asn
145 150 155 160
<210> 398
<211> 161
<212> PRT
<213> Bacillus subtilis
<220>
<221> MISC_FEATURE
<222> (1)..(161)
<223> TadA polypeptide sequence
<400> 398
Met Thr Gln Asp Glu Leu Tyr Met Lys Glu Ala Ile Lys Glu Ala Lys
1 5 10 15
Lys Ala Glu Glu Lys Gly Glu Val Pro Ile Gly Ala Val Leu Val Ile
20 25 30
Asn Gly Glu Ile Ile Ala Arg Ala His Asn Leu Arg Glu Thr Glu Gln
35 40 45
Arg Ser Ile Ala His Ala Glu Met Leu Val Ile Asp Glu Ala Cys Lys
50 55 60
Ala Leu Gly Thr Trp Arg Leu Glu Gly Ala Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Val Val Leu Ser Arg Val Glu
85 90 95
Lys Val Val Phe Gly Ala Phe Asp Pro Lys Gly Gly Cys Ser Gly Thr
100 105 110
Leu Met Asn Leu Leu Gln Glu Glu Arg Phe Asn His Gln Ala Glu Val
115 120 125
Val Ser Gly Val Leu Glu Glu Glu Cys Gly Gly Met Leu Ser Ala Phe
130 135 140
Phe Arg Glu Leu Arg Lys Lys Lys Lys Ala Ala Arg Lys Asn Leu Ser
145 150 155 160
Glu
<210> 399
<211> 183
<212> PRT
<213> Salmonella typhimurium
<220>
<221> MISC_FEATURE
<222> (1)..(183)
<223> TadA polypeptide sequence
<400> 399
Met Pro Pro Ala Phe Ile Thr Gly Val Thr Ser Leu Ser Asp Val Glu
1 5 10 15
Leu Asp His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg
20 25 30
Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val His Asn
35 40 45
His Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp
50 55 60
Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val
65 70 75 80
Leu Gln Asn Tyr Arg Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu
85 90 95
Pro Cys Val Met Cys Ala Gly Ala Met Val His Ser Arg Ile Gly Arg
100 105 110
Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu
115 120 125
Ile Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Ile
130 135 140
Glu Gly Val Leu Arg Asp Glu Cys Ala Thr Leu Leu Ser Asp Phe Phe
145 150 155 160
Arg Met Arg Arg Gln Glu Ile Lys Ala Leu Lys Lys Ala Asp Arg Ala
165 170 175
Glu Gly Ala Gly Pro Ala Val
180
<210> 400
<211> 164
<212> PRT
<213> Shewanella putrefaciens
<220>
<221> MISC_FEATURE
<222> (1)..(164)
<223> TadA polypeptide sequence
<400> 400
Met Asp Glu Tyr Trp Met Gln Val Ala Met Gln Met Ala Glu Lys Ala
1 5 10 15
Glu Ala Ala Gly Glu Val Pro Val Gly Ala Val Leu Val Lys Asp Gly
20 25 30
Gln Gln Ile Ala Thr Gly Tyr Asn Leu Ser Ile Ser Gln His Asp Pro
35 40 45
Thr Ala His Ala Glu Ile Leu Cys Leu Arg Ser Ala Gly Lys Lys Leu
50 55 60
Glu Asn Tyr Arg Leu Leu Asp Ala Thr Leu Tyr Ile Thr Leu Glu Pro
65 70 75 80
Cys Ala Met Cys Ala Gly Ala Met Val His Ser Arg Ile Ala Arg Val
85 90 95
Val Tyr Gly Ala Arg Asp Glu Lys Thr Gly Ala Ala Gly Thr Val Val
100 105 110
Asn Leu Leu Gln His Pro Ala Phe Asn His Gln Val Glu Val Thr Ser
115 120 125
Gly Val Leu Ala Glu Ala Cys Ser Ala Gln Leu Ser Arg Phe Phe Lys
130 135 140
Arg Arg Arg Asp Glu Lys Lys Ala Leu Lys Leu Ala Gln Arg Ala Gln
145 150 155 160
Gln Gly Ile Glu
<210> 401
<211> 173
<212> PRT
<213> Haemophilus influenzae
<220>
<221> MISC_FEATURE
<222> (1)..(173)
<223> TadA polypeptide sequence
<400> 401
Met Asp Ala Ala Lys Val Arg Ser Glu Phe Asp Glu Lys Met Met Arg
1 5 10 15
Tyr Ala Leu Glu Leu Ala Asp Lys Ala Glu Ala Leu Gly Glu Ile Pro
20 25 30
Val Gly Ala Val Leu Val Asp Asp Ala Arg Asn Ile Ile Gly Glu Gly
35 40 45
Trp Asn Leu Ser Ile Val Gln Ser Asp Pro Thr Ala His Ala Glu Ile
50 55 60
Ile Ala Leu Arg Asn Gly Ala Lys Asn Ile Gln Asn Tyr Arg Leu Leu
65 70 75 80
Asn Ser Thr Leu Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Ala Gly
85 90 95
Ala Ile Leu His Ser Arg Ile Lys Arg Leu Val Phe Gly Ala Ser Asp
100 105 110
Tyr Lys Thr Gly Ala Ile Gly Ser Arg Phe His Phe Phe Asp Asp Tyr
115 120 125
Lys Met Asn His Thr Leu Glu Ile Thr Ser Gly Val Leu Ala Glu Glu
130 135 140
Cys Ser Gln Lys Leu Ser Thr Phe Phe Gln Lys Arg Arg Glu Glu Lys
145 150 155 160
Lys Ile Glu Lys Ala Leu Leu Lys Ser Leu Ser Asp Lys
165 170
<210> 402
<211> 161
<212> PRT
<213> Caulobacter crescentus
<220>
<221> MISC_FEATURE
<222> (1)..(161)
<223> TadA polypeptide sequence
<400> 402
Met Arg Thr Asp Glu Ser Glu Asp Gln Asp His Arg Met Met Arg Leu
1 5 10 15
Ala Leu Asp Ala Ala Arg Ala Ala Ala Glu Ala Gly Glu Thr Pro Val
20 25 30
Gly Ala Val Ile Leu Asp Pro Ser Thr Gly Glu Val Ile Ala Thr Ala
35 40 45
Gly Asn Gly Pro Ile Ala Ala His Asp Pro Thr Ala His Ala Glu Ile
50 55 60
Ala Ala Met Arg Ala Ala Ala Ala Lys Leu Gly Asn Tyr Arg Leu Thr
65 70 75 80
Asp Leu Thr Leu Val Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly
85 90 95
Ala Ile Ser His Ala Arg Ile Gly Arg Val Val Phe Gly Ala Asp Asp
100 105 110
Pro Lys Gly Gly Ala Val Val His Gly Pro Lys Phe Phe Ala Gln Pro
115 120 125
Thr Cys His Trp Arg Pro Glu Val Thr Gly Gly Val Leu Ala Asp Glu
130 135 140
Ser Ala Asp Leu Leu Arg Gly Phe Phe Arg Ala Arg Arg Lys Ala Lys
145 150 155 160
Ile
<210> 403
<211> 179
<212> PRT
<213> Geobacter sulfurreducens
<220>
<221> MISC_FEATURE
<222> (1)..(179)
<223> TadA polypeptide sequence
<400> 403
Met Ser Ser Leu Lys Lys Thr Pro Ile Arg Asp Asp Ala Tyr Trp Met
1 5 10 15
Gly Lys Ala Ile Arg Glu Ala Ala Lys Ala Ala Ala Arg Asp Glu Val
20 25 30
Pro Ile Gly Ala Val Ile Val Arg Asp Gly Ala Val Ile Gly Arg Gly
35 40 45
His Asn Leu Arg Glu Gly Ser Asn Asp Pro Ser Ala His Ala Glu Met
50 55 60
Ile Ala Ile Arg Gln Ala Ala Arg Arg Ser Ala Asn Trp Arg Leu Thr
65 70 75 80
Gly Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Leu Met Cys Met Gly
85 90 95
Ala Ile Ile Leu Ala Arg Leu Glu Arg Val Val Phe Gly Cys Tyr Asp
100 105 110
Pro Lys Gly Gly Ala Ala Gly Ser Leu Tyr Asp Leu Ser Ala Asp Pro
115 120 125
Arg Leu Asn His Gln Val Arg Leu Ser Pro Gly Val Cys Gln Glu Glu
130 135 140
Cys Gly Thr Met Leu Ser Asp Phe Phe Arg Asp Leu Arg Arg Arg Lys
145 150 155 160
Lys Ala Lys Ala Thr Pro Ala Leu Phe Ile Asp Glu Arg Lys Val Pro
165 170 175
Pro Glu Pro
<210> 404
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: TadA*8 polypeptide sequence
<400> 404
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Thr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp
165
<210> 405
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: gRNA scaffold polynucleotide
sequence
<400> 405
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu 80
<210> 406
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: gRNA scaffold polynucleotide
sequence
<400> 406
guuuuuguac ucucaagauu uaaguaacug uacaacgaaa cuuacacagu uacuuaaauc 60
uugcagaagc uacaaagaua aggcuucaug ccgaaaucaa cacccuguca uuuuauggca 120
gggug 125
<210> 407
<211> 76
<212> RNA
<213> S. pyogenes
<220>
<221> misc_feature
<222> (1)..(76)
<223> S. pyogenes gRNA scaffold ologonucleotide sequence
<400> 407
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 408
<211> 84
<212> RNA
<213> S. aureus
<220>
<221> misc_feature
<222> (1)..(84)
<223> S. aureus gRNA scaffold oligonucleotide sequence
<400> 408
guuuuaguac ucuguaauga aaauuacaga aucuacuaaa acaaggcaaa augccguguu 60
uaucucguca acuuguuggc gaga 84
<210> 409
<211> 97
<212> RNA
<213> Bacillus hisashii
<220>
<221> misc_feature
<222> (1)..(97)
<223> BhCas12b gRNA scaffold oligonucleotide sequence
<400> 409
guucugucuu uuggucagga caaccgucua gcuauaagug cugcagggug ugagaaacuc 60
cuauugcugg acgaugucuc uuacgaggca uuagcac 97
<210> 410
<211> 88
<212> RNA
<213> Bacillus sp.
<220>
<221> misc_feature
<222> (1)..(88)
<223> BvCas12b gRNA scaffold oligonucleotide sequence
<400> 410
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcac 88
<210> 411
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: gRNA scaffold nucleotide
sequence; oligonucleotide sequence
<220>
<221> modified_base
<222> (78)..(80)
<223> um
<220>
<221> misc_feature
<222> (78)..(80)
<223> In embodiments, a nucleotide(s) is linked to the preceding 5'
nucleotide by a 3' phosphorothioate internucleotide liknage
<400> 411
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
gggaccgagu cggugcuuuu 80
<210> 412
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: gRNA scaffold nucleotide
sequence
<220>
<221> misc_feature
<222> (78)..(80)
<223> In embodiments, a nucleotide(s) is linked to the preceding 5'
nucleotide by a 3' phosphorothioate internucleotide liknage
<220>
<221> modified_base
<222> (78)..(80)
<223> um
<400> 412
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu 80
<210> 413
<211> 117
<212> RNA
<213> Bacillus hisashii
<220>
<221> misc_feature
<222> (1)..(117)
<223> BhCas12b gRNA scaffold + guide sequence; oligonucleotide sequence
<220>
<221> misc_feature
<222> (1)..(97)
<223> BhCas12b sgRNA scaffold
<220>
<221> misc_feature
<222> (98)..(117)
<223> n is a, c, g, or u
<400> 413
guucugucuu uuggucagga caaccgucua gcuauaagug cugcagggug ugagaaacuc 60
cuauugcugg acgaugucuc uuacgaggca uuagcacnnn nnnnnnnnnn nnnnnnn 117
<210> 414
<211> 108
<212> RNA
<213> Bacillus sp.
<220>
<221> misc_feature
<222> (1)..(108)
<223> BvCas12b gRNA scaffold + guide sequence; oligonucleotide sequence
<220>
<221> misc_feature
<222> (1)..(88)
<223> BvCas12b gRNA scaffold
<220>
<221> misc_feature
<222> (89)..(108)
<223> n is a, c, g, or u
<400> 414
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacnn nnnnnnnnnn nnnnnnnn 108
<210> 415
<211> 119
<212> RNA
<213> Alicyclobacillus acidiphilus
<220>
<221> misc_feature
<222> (1)..(119)
<223> AaCas12b gRNA scaffold + guide sequence; oligonucleotide sequence
<220>
<221> misc_feature
<222> (1)..(99)
<223> AaCas12b gRNA scaffold
<220>
<221> misc_feature
<222> (100)..(119)
<223> n is a, c, g, or u
<400> 415
gucuaaagga cagaauuuuu caacgggugu gccaauggcc acuuuccagg uggcaaagcc 60
cguugaacuu cucaaaaaga acgaucugag aaguggcacn nnnnnnnnnn nnnnnnnnn 119
<210> 416
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
sequence
<400> 416
Pro Lys Lys Lys Arg Lys Val Glu Gly Ala Asp Lys Arg Thr Ala Asp
1 5 10 15
Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
20 25
<210> 417
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 417
Arg Lys Ser Gly Lys Ile Ala Ala Ile Val Val Lys Arg Pro Arg Lys
1 5 10 15
Pro Lys Lys Lys Arg Lys Val
20
<210> 418
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 418
Ser Gly Gly Ser Ser Gly Gly Ser
1 5
<210> 419
<211> 1609
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pNMG-B335
ABE8.1_Y147T_CP5_NGC PAM_monomer polypeptide sequence
<400> 419
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Thr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Glu Ile Gly Lys Ala Thr Ala Lys Tyr
195 200 205
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
210 215 220
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
225 230 235 240
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
245 250 255
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
260 265 270
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
275 280 285
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly
290 295 300
Gly Phe Met Gln Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
305 310 315 320
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
325 330 335
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
340 345 350
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
355 360 365
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
370 375 380
Met Leu Ala Ser Ala Lys Phe Leu Gln Lys Gly Asn Glu Leu Ala Leu
385 390 395 400
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
405 410 415
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
420 425 430
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
435 440 445
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
450 455 460
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
465 470 475 480
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Arg Ala Phe
485 490 495
Lys Tyr Phe Asp Thr Thr Ile Ala Arg Lys Glu Tyr Arg Ser Thr Lys
500 505 510
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
515 520 525
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly Gly Ser Gly
530 535 540
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
545 550 555 560
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
565 570 575
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
580 585 590
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
595 600 605
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
610 615 620
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
625 630 635 640
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
645 650 655
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
660 665 670
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
675 680 685
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
690 695 700
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
705 710 715 720
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
725 730 735
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
740 745 750
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
755 760 765
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
770 775 780
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
785 790 795 800
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
805 810 815
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
820 825 830
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
835 840 845
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
850 855 860
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
865 870 875 880
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
885 890 895
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
900 905 910
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
915 920 925
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
930 935 940
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
945 950 955 960
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
965 970 975
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
980 985 990
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
995 1000 1005
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala
1010 1015 1020
Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
1025 1030 1035
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
1040 1045 1050
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
1055 1060 1065
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu
1070 1075 1080
Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
1085 1090 1095
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
1100 1105 1110
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr
1115 1120 1125
Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val
1130 1135 1140
Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
1145 1150 1155
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
1160 1165 1170
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1175 1180 1185
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
1190 1195 1200
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
1205 1210 1215
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
1220 1225 1230
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
1235 1240 1245
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
1250 1255 1260
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
1265 1270 1275
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
1280 1285 1290
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
1295 1300 1305
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1310 1315 1320
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1325 1330 1335
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1340 1345 1350
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1355 1360 1365
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1370 1375 1380
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1385 1390 1395
Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1400 1405 1410
Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp
1415 1420 1425
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1430 1435 1440
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1445 1450 1455
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1460 1465 1470
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1475 1480 1485
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1490 1495 1500
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1505 1510 1515
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1520 1525 1530
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1535 1540 1545
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1550 1555 1560
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1565 1570 1575
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Gly Ala Asp Lys Arg
1580 1585 1590
Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys
1595 1600 1605
Val
<210> 420
<211> 1807
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: pNMG-357_ABE8.14 with NGC PAM
CP5 polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(174)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (175)..(198)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (199)..(365)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (366)..(397)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (398)..(738)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (739)..(759)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (760)..(1785)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1786)..(1807)
<223> Bipartite nuclear localization sequence
<400> 420
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Gly Gly Ser Ser Gly Gly Ser Ser Gly
165 170 175
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
180 185 190
Gly Ser Ser Gly Gly Ser Met Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Thr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Glu Ile Gly
385 390 395 400
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
405 410 415
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
420 425 430
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
435 440 445
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
450 455 460
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
465 470 475 480
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp
485 490 495
Asp Pro Lys Lys Tyr Gly Gly Phe Met Gln Pro Thr Val Ala Tyr Ser
500 505 510
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
515 520 525
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
530 535 540
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
545 550 555 560
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
565 570 575
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Lys Phe Leu Gln Lys
580 585 590
Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
595 600 605
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
610 615 620
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
625 630 635 640
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
645 650 655
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
660 665 670
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
675 680 685
Gly Ala Pro Arg Ala Phe Lys Tyr Phe Asp Thr Thr Ile Ala Arg Lys
690 695 700
Glu Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
705 710 715 720
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly
725 730 735
Gly Asp Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
740 745 750
Ser Gly Gly Ser Gly Gly Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala
755 760 765
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
770 775 780
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
785 790 795 800
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
805 810 815
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
820 825 830
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
835 840 845
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
850 855 860
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
865 870 875 880
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
885 890 895
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
900 905 910
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
915 920 925
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
930 935 940
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
945 950 955 960
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
965 970 975
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
980 985 990
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
995 1000 1005
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
1010 1015 1020
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala
1025 1030 1035
Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn
1040 1045 1050
Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
1055 1060 1065
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr
1070 1075 1080
Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
1085 1090 1095
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser
1100 1105 1110
Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu
1115 1120 1125
Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
1130 1135 1140
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
1145 1150 1155
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
1160 1165 1170
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
1175 1180 1185
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
1190 1195 1200
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
1205 1210 1215
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro
1220 1225 1230
Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
1235 1240 1245
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
1250 1255 1260
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val
1265 1270 1275
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg
1280 1285 1290
Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
1295 1300 1305
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys
1310 1315 1320
Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
1325 1330 1335
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His
1340 1345 1350
Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
1355 1360 1365
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
1370 1375 1380
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
1385 1390 1395
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg
1400 1405 1410
Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
1415 1420 1425
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
1430 1435 1440
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
1445 1450 1455
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly
1460 1465 1470
Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
1475 1480 1485
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
1490 1495 1500
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
1505 1510 1515
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys
1520 1525 1530
Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu
1535 1540 1545
Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln
1550 1555 1560
Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg
1565 1570 1575
Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
1580 1585 1590
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
1595 1600 1605
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1610 1615 1620
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
1625 1630 1635
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
1640 1645 1650
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
1655 1660 1665
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1670 1675 1680
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1685 1690 1695
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
1700 1705 1710
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1715 1720 1725
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1730 1735 1740
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1745 1750 1755
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1760 1765 1770
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Gly Ala
1775 1780 1785
Asp Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys
1790 1795 1800
Lys Arg Lys Val
1805
<210> 421
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: ABE8.8-m polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(167)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (168)..(199)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (200)..(1566)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1567)..(1588)
<223> Bipartite nuclear localization sequence
<400> 421
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1520 1525 1530
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 422
<211> 1786
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: ABE8.8-d polypeptide sequence
<220>
<221> MISC_FEATURE
<222> (1)..(167)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (168)..(199)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (200)..(365)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (366)..(397)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (398)..(1764)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1765)..(1786)
<223> Bipartite nuclear localization sequence
<400> 422
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg Met Pro Arg Arg
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
1010 1015 1020
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
1025 1030 1035
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
1040 1045 1050
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
1055 1060 1065
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
1070 1075 1080
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
1085 1090 1095
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
1100 1105 1110
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
1115 1120 1125
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
1130 1135 1140
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1145 1150 1155
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
1160 1165 1170
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1175 1180 1185
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1190 1195 1200
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1205 1210 1215
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1250 1255 1260
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1265 1270 1275
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1280 1285 1290
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1295 1300 1305
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1310 1315 1320
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1325 1330 1335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1340 1345 1350
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1355 1360 1365
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1370 1375 1380
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1385 1390 1395
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1400 1405 1410
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1415 1420 1425
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1430 1435 1440
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1445 1450 1455
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1490 1495 1500
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1505 1510 1515
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1520 1525 1530
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1535 1540 1545
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1550 1555 1560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1565 1570 1575
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1580 1585 1590
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1595 1600 1605
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1610 1615 1620
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1625 1630 1635
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1640 1645 1650
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1655 1660 1665
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1670 1675 1680
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1685 1690 1695
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1700 1705 1710
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1730 1735 1740
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1745 1750 1755
Ser Gln Leu Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp
1760 1765 1770
Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1775 1780 1785
<210> 423
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: ABE8.13-m polypeptide
sequence
<220>
<221> MISC_FEATURE
<222> (1)..(167)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (168)..(199)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (200)..(1566)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1567)..(1588)
<223> Bipartite nuclear localization sequence
<400> 423
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1520 1525 1530
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 424
<211> 1786
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: ABE8.13-d polypeptide
sequence
<220>
<221> MISC_FEATURE
<222> (1)..(167)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (168)..(199)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (200)..(365)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (366)..(397)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (398)..(1764)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1765)..(1786)
<223> Bipartite nuclear localization sequence
<400> 424
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Tyr Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg Met Pro Arg Arg
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
1010 1015 1020
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
1025 1030 1035
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
1040 1045 1050
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
1055 1060 1065
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
1070 1075 1080
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
1085 1090 1095
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
1100 1105 1110
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
1115 1120 1125
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
1130 1135 1140
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1145 1150 1155
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
1160 1165 1170
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1175 1180 1185
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1190 1195 1200
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1205 1210 1215
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1250 1255 1260
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1265 1270 1275
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1280 1285 1290
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1295 1300 1305
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1310 1315 1320
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1325 1330 1335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1340 1345 1350
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1355 1360 1365
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1370 1375 1380
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1385 1390 1395
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1400 1405 1410
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1415 1420 1425
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1430 1435 1440
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1445 1450 1455
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1490 1495 1500
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1505 1510 1515
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1520 1525 1530
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1535 1540 1545
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1550 1555 1560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1565 1570 1575
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1580 1585 1590
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1595 1600 1605
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1610 1615 1620
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1625 1630 1635
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1640 1645 1650
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1655 1660 1665
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1670 1675 1680
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1685 1690 1695
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1700 1705 1710
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1730 1735 1740
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1745 1750 1755
Ser Gln Leu Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp
1760 1765 1770
Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1775 1780 1785
<210> 425
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: ABE8.17-m polypeptide
sequence
<220>
<221> MISC_FEATURE
<222> (1)..(167)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (168)..(199)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (200)..(1566)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1567)..(1588)
<223> Bipartite nuclear localization sequence
<400> 425
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1520 1525 1530
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 426
<211> 1786
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: ABE8.17-d polypeptide
sequence
<220>
<221> MISC_FEATURE
<222> (1)..(167)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (168)..(199)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (200)..(365)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (366)..(397)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (398)..(1764)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1765)..(1786)
<223> Bipartite nuclear localization sequence
<400> 426
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Ser Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Arg
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
1010 1015 1020
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
1025 1030 1035
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
1040 1045 1050
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
1055 1060 1065
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
1070 1075 1080
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
1085 1090 1095
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
1100 1105 1110
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
1115 1120 1125
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
1130 1135 1140
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1145 1150 1155
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
1160 1165 1170
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1175 1180 1185
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1190 1195 1200
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1205 1210 1215
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1250 1255 1260
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1265 1270 1275
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1280 1285 1290
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1295 1300 1305
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1310 1315 1320
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1325 1330 1335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1340 1345 1350
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1355 1360 1365
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1370 1375 1380
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1385 1390 1395
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1400 1405 1410
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1415 1420 1425
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1430 1435 1440
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1445 1450 1455
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1490 1495 1500
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1505 1510 1515
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1520 1525 1530
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1535 1540 1545
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1550 1555 1560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1565 1570 1575
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1580 1585 1590
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1595 1600 1605
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1610 1615 1620
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1625 1630 1635
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1640 1645 1650
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1655 1660 1665
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1670 1675 1680
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1685 1690 1695
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1700 1705 1710
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1730 1735 1740
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1745 1750 1755
Ser Gln Leu Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp
1760 1765 1770
Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1775 1780 1785
<210> 427
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: ABE8.20-m polypeptide
sequence
<220>
<221> MISC_FEATURE
<222> (1)..(167)
<223> Adenosine deaminse sequence
<220>
<221> MISC_FEATURE
<222> (168)..(199)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (200)..(1566)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1567)..(1588)
<223> Bipartite nuclear localization sequence
<400> 427
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu
65 70 75 80
Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1520 1525 1530
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 428
<211> 1786
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: ABE8.20-d polypeptide
sequence
<220>
<221> MISC_FEATURE
<222> (1)..(167)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (168)..(199)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (200)..(365)
<223> Adenosine deaminase sequence
<220>
<221> MISC_FEATURE
<222> (366)..(397)
<223> Linker sequence
<220>
<221> MISC_FEATURE
<222> (398)..(1764)
<223> Sequence derived from Cas9
<220>
<221> MISC_FEATURE
<222> (1765)..(1786)
<223> Bipartite nuclear localization sequence
<400> 428
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Tyr Asp Ala Thr Leu Tyr Ser Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Arg Phe Phe Arg Met Pro Arg Arg
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
1010 1015 1020
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
1025 1030 1035
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
1040 1045 1050
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
1055 1060 1065
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
1070 1075 1080
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
1085 1090 1095
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
1100 1105 1110
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
1115 1120 1125
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
1130 1135 1140
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1145 1150 1155
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
1160 1165 1170
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1175 1180 1185
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1190 1195 1200
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1205 1210 1215
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1250 1255 1260
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1265 1270 1275
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1280 1285 1290
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1295 1300 1305
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1310 1315 1320
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1325 1330 1335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1340 1345 1350
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1355 1360 1365
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1370 1375 1380
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1385 1390 1395
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1400 1405 1410
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1415 1420 1425
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1430 1435 1440
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1445 1450 1455
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1490 1495 1500
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1505 1510 1515
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1520 1525 1530
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1535 1540 1545
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1550 1555 1560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1565 1570 1575
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1580 1585 1590
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1595 1600 1605
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1610 1615 1620
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1625 1630 1635
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1640 1645 1650
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1655 1660 1665
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1670 1675 1680
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1685 1690 1695
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1700 1705 1710
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1730 1735 1740
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1745 1750 1755
Ser Gln Leu Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp
1760 1765 1770
Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1775 1780 1785
<210> 429
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 01. monoABE8.1_bpNLS + Y147T
polypeptide sequence
<400> 429
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Thr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 430
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 02. monoABE8.1_bpNLS + Y147R
polypeptide sequence
<400> 430
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 431
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 03. monoABE8.1_bpNLS + Q154S
polypeptide sequence
<400> 431
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Ser Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 432
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 04. monoABE8.1_bpNLS + Y123H
polypeptide sequence
<400> 432
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 433
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 05. monoABE8.1_bpNLS + V82S
polypeptide sequence
<400> 433
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 434
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 06. monoABE8.1_bpNLS + T166R
polypeptide sequence
<400> 434
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Arg Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 435
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 07. monoABE8.1_bpNLS + Q154R
polypeptide sequence
<400> 435
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 436
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 08. monoABE8.1_bpNLS +
Y147R_Q154R_Y123H polypeptide sequence
<400> 436
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 437
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 09. monoABE8.1_bpNLS +
Y147R_Q154R_I76Y polypeptide sequence
<400> 437
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 438
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 10. monoABE8.1_bpNLS +
Y147R_Q154R_T166R polypeptide sequence
<400> 438
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Arg Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 439
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 11. monoABE8.1_bpNLS +
Y147T_Q154R polypeptide sequence
<400> 439
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Thr Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 440
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 12. monoABE8.1_bpNLS +
Y147T_Q154S polypeptide sequence
<400> 440
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Thr Phe Phe Arg Met Pro Arg Ser Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 441
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 13. monoABE8.1_bpNLS +
H123Y123H_Y147R_Q154R_I76Y polypeptide sequence
<400> 441
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Tyr Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Arg Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 442
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: 14. monoABE8.1_bpNLS + V82S +
Q154R polypeptide sequence
<400> 442
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln
1520 1525 1530
Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 443
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 443
Ser Gly Gly Ser
1
<210> 444
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 444
Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
1 5 10 15
Thr Pro Glu Ser Ser Gly Gly Ser
20
<210> 445
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
sequence
<400> 445
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
<210> 446
<211> 104
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
sequence
<400> 446
Gly Gly Ser Gly Gly Ser Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
1 5 10 15
Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
20 25 30
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
35 40 45
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
50 55 60
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
65 70 75 80
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
85 90 95
Thr Ser Gly Gly Ser Gly Gly Ser
100
<210> 447
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 447
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser
20
<210> 448
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
sequence
<400> 448
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
Ser Gly Gly Ser Ser Gly Gly Ser
35 40
<210> 449
<211> 64
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
sequence
<400> 449
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
35 40 45
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
50 55 60
<210> 450
<211> 92
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic polypeptide
sequence
<400> 450
Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser
1 5 10 15
Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser
20 25 30
Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu
35 40 45
Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser
50 55 60
Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr
65 70 75 80
Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser
85 90
<210> 451
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 451
Pro Ala Pro Ala Pro
1 5
<210> 452
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 452
Pro Ala Pro Ala Pro Ala
1 5
<210> 453
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 453
Pro Ala Pro Ala Pro Ala Pro
1 5
<210> 454
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 454
Pro Ala Pro Ala Pro Ala Pro Ala
1 5
<210> 455
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 455
Pro Ala Pro Ala Pro Ala Pro Ala Pro
1 5
<210> 456
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 456
Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro
1 5 10 15
<210> 457
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 457
Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala
1 5 10 15
Pro Ala Pro Ala Pro
20
<210> 458
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 458
aaccgcacat gccgaaatta tgg 23
<210> 459
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 459
atgccgaaat tatggctctg cgg 23
<210> 460
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 460
Thr Ala His Ala Glu Ile Met
1 5
<210> 461
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 461
Ala Glu Ile Met Ala Leu Arg
1 5
<210> 462
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 462
atgagcgagg tcgagttctc tcacga 26
<210> 463
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 463
gtgagcgagg tcgagttctc tcacga 26
<210> 464
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 464
gtgagcgagg tcgagttctc tcatga 26
<210> 465
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 465
acgagcgagg tcgagttctc tcacga 26
<210> 466
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 466
acgagcgagg tcgagttctc tcatga 26
<210> 467
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 467
Met Ser Glu Val Glu Phe Ser His
1 5
<210> 468
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 468
Val Ser Glu Val Glu Phe Ser His
1 5
<210> 469
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 469
Thr Ser Glu Val Glu Phe Ser His
1 5
<210> 470
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 470
atgagcgagg tcgagttctc tcacga 26
<210> 471
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 471
atgagcgagg tcgagtggtc tcacga 26
<210> 472
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 472
atgagcgagg tcgagtggtc tcatga 26
<210> 473
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 473
atgagcgagg tcgaggggtc tcacga 26
<210> 474
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 474
atgagcgagg tcgaggggtc tcatga 26
<210> 475
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 475
atgagcgagg tcgaggcctc tcacga 26
<210> 476
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<400> 476
atgagcgagg tcgaggcctc tcatga 26
<210> 477
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 477
Met Ser Glu Val Glu Phe Ser His
1 5
<210> 478
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 478
Met Ser Glu Val Glu Trp Ser His
1 5
<210> 479
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 479
Met Ser Glu Val Glu Val Ser His
1 5
<210> 480
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic peptide sequence
<400> 480
Met Ser Glu Val Glu Ala Ser His
1 5
<210> 481
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of artificial sequence: synthetic oligonucleotide
sequence
<220>
<221> misc_feature
<222> (21)..(22)
<223> n is a, c, g, or t
<400> 481
tttttttttt tttttttttt nn 22
<210> 482
<211> 306
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: DnaE Intein-N polynucleotide
sequence
<400> 482
tgcctgtcat acgaaaccga gatactgaca gtagaatatg gccttctgcc aatcgggaag 60
attgtggaga aacggataga atgcacagtt tactctgtcg ataacaatgg taacatttat 120
actcagccag ttgcccagtg gcacgaccgg ggagagcagg aagtattcga atactgtctg 180
gaggatggaa gtctcattag ggccactaag gaccacaaat ttatgacagt cgatggccag 240
atgctgccta tagacgaaat ctttgagcga gagttggacc tcatgcgagt tgacaacctt 300
cctaat 306
<210> 483
<211> 102
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: DnaE Intein-N polypeptide
sequence
<400> 483
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 484
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: DnaE Intein-C polynucleotide
sequence
<400> 484
atgatcaaga tagctacaag gaagtatctt ggcaaacaaa acgtttatga tattggagtc 60
gaaagagatc acaactttgc tctgaagaac ggattcatag cttctaat 108
<210> 485
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Intein-C polypeptide sequence
<400> 485
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Asn
35
<210> 486
<211> 303
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Cfa-N polynucleotide sequence
<400> 486
tgcctgtctt atgataccga gatacttacc gttgaatatg gcttcttgcc tattggaaag 60
attgtcgaag agagaattga atgcacagta tatactgtag acaagaatgg tttcgtttac 120
acacagccca ttgctcaatg gcacaatcgc ggcgaacaag aagtatttga gtactgtctc 180
gaggatggaa gcatcatacg agcaactaaa gatcataaat tcatgaccac tgacgggcag 240
atgttgccaa tagatgagat attcgagcgg ggcttggatc tcaaacaagt ggatggattg 300
cca 303
<210> 487
<211> 101
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Cfa-N polypeptide sequence
<400> 487
Cys Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Glu Arg Ile Glu Cys Thr Val Tyr Thr
20 25 30
Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His
35 40 45
Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Ile Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Gly Leu Asp Leu Lys Gln
85 90 95
Val Asp Gly Leu Pro
100
<210> 488
<211> 159
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Cfa-C polynucleotide sequence
<400> 488
atgaagagga ctgccgatgg atcagagttt gaatctccca agaagaagag gaaagtaaag 60
ataatatctc gaaaaagtct tggtacccaa aatgtctatg atattggagt ggagaaagat 120
cacaacttcc ttctcaagaa cggtctcgta gccagcaac 159
<210> 489
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Cfa-C polypeptide sequence
<400> 489
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Lys Ile Ile Ser Arg Lys Ser Leu Gly Thr Gln Asn Val
20 25 30
Tyr Asp Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Lys Asn Gly
35 40 45
Leu Val Ala Ser Asn
50
<210> 490
<211> 1081
<212> PRT
<213> Neisseria meningitidis
<220>
<221> MISC_FEATURE
<222> (1)..(1081)
<223> Nme3Cas9; WP_002217928.1 type II CRISPR RNA-guided endonuclease
Cas9 [Neisseria meningitidis]
<400> 490
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Glu
20 25 30
Glu Asn Pro Ile Arg Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Cys Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Asn Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Ser Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Thr Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Ala Tyr Ala Asp Glu Glu Asp Trp Thr Val Ile Asp
980 985 990
Glu Ser Phe Arg Phe Lys Phe Val Leu Tyr Ser Asn Asp Leu Ile Lys
995 1000 1005
Val Gln Leu Lys Lys Asp Ser Phe Leu Gly Tyr Phe Ser Gly Leu
1010 1015 1020
Asp Arg Ala Thr Gly Ala Ile Ser Leu Arg Glu His Asp Leu Glu
1025 1030 1035
Lys Ser Lys Gly Lys Asp Gly Met His Arg Ile Gly Val Lys Thr
1040 1045 1050
Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Met Gly Lys Glu
1055 1060 1065
Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080
<210> 491
<211> 66
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Telomerase Ku Binding Motif
oligonucleotide sequence
<400> 491
uucuugucgu acuuauagau cgcuacguua uuucaauuuu gaaaaucuga guccugggag 60
ugcgga 66
<210> 492
<211> 1094
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Telomerase Ku Heterodimer
polypeptide sequence
<400> 492
Met Ser Gly Trp Glu Ser Tyr Tyr Lys Thr Glu Gly Asp Glu Glu Ala
1 5 10 15
Glu Glu Glu Gln Glu Glu Asn Leu Glu Ala Ser Gly Asp Tyr Lys Tyr
20 25 30
Ser Gly Arg Asp Ser Leu Ile Phe Leu Val Asp Ala Ser Lys Ala Met
35 40 45
Phe Glu Ser Gln Ser Glu Asp Glu Leu Thr Pro Phe Asp Met Ser Ile
50 55 60
Gln Cys Ile Gln Ser Val Tyr Ile Ser Lys Ile Ile Ser Ser Asp Arg
65 70 75 80
Asp Leu Leu Ala Val Val Phe Tyr Gly Thr Glu Lys Asp Lys Asn Ser
85 90 95
Val Asn Phe Lys Asn Ile Tyr Val Leu Gln Glu Leu Asp Asn Pro Gly
100 105 110
Ala Lys Arg Ile Leu Glu Leu Asp Gln Phe Lys Gly Gln Gln Gly Gln
115 120 125
Lys Arg Phe Gln Asp Met Met Gly His Gly Ser Asp Tyr Ser Leu Ser
130 135 140
Glu Val Leu Trp Val Cys Ala Asn Leu Phe Ser Asp Val Gln Phe Lys
145 150 155 160
Met Ser His Lys Arg Ile Met Leu Phe Thr Asn Glu Asp Asn Pro His
165 170 175
Gly Asn Asp Ser Ala Lys Ala Ser Arg Ala Arg Thr Lys Ala Gly Asp
180 185 190
Leu Arg Asp Thr Gly Ile Phe Leu Asp Leu Met His Leu Lys Lys Pro
195 200 205
Gly Gly Phe Asp Ile Ser Leu Phe Tyr Arg Asp Ile Ile Ser Ile Ala
210 215 220
Glu Asp Glu Asp Leu Arg Val His Phe Glu Glu Ser Ser Lys Leu Glu
225 230 235 240
Asp Leu Leu Arg Lys Val Arg Ala Lys Glu Thr Arg Lys Arg Ala Leu
245 250 255
Ser Arg Leu Lys Leu Lys Leu Asn Lys Asp Ile Val Ile Ser Val Gly
260 265 270
Ile Tyr Asn Leu Val Gln Lys Ala Leu Lys Pro Pro Pro Ile Lys Leu
275 280 285
Tyr Arg Glu Thr Asn Glu Pro Val Lys Thr Lys Thr Arg Thr Phe Asn
290 295 300
Thr Ser Thr Gly Gly Leu Leu Leu Pro Ser Asp Thr Lys Arg Ser Gln
305 310 315 320
Ile Tyr Gly Ser Arg Gln Ile Ile Leu Glu Lys Glu Glu Thr Glu Glu
325 330 335
Leu Lys Arg Phe Asp Asp Pro Gly Leu Met Leu Met Gly Phe Lys Pro
340 345 350
Leu Val Leu Leu Lys Lys His His Tyr Leu Arg Pro Ser Leu Phe Val
355 360 365
Tyr Pro Glu Glu Ser Leu Val Ile Gly Ser Ser Thr Leu Phe Ser Ala
370 375 380
Leu Leu Ile Lys Cys Leu Glu Lys Glu Val Ala Ala Leu Cys Arg Tyr
385 390 395 400
Thr Pro Arg Arg Asn Ile Pro Pro Tyr Phe Val Ala Leu Val Pro Gln
405 410 415
Glu Glu Glu Leu Asp Asp Gln Lys Ile Gln Val Thr Pro Pro Gly Phe
420 425 430
Gln Leu Val Phe Leu Pro Phe Ala Asp Asp Lys Arg Lys Met Pro Phe
435 440 445
Thr Glu Lys Ile Met Ala Thr Pro Glu Gln Val Gly Lys Met Lys Ala
450 455 460
Ile Val Glu Lys Leu Arg Phe Thr Tyr Arg Ser Asp Ser Phe Glu Asn
465 470 475 480
Pro Val Leu Gln Gln His Phe Arg Asn Leu Glu Ala Leu Ala Leu Asp
485 490 495
Leu Met Glu Pro Glu Gln Ala Val Asp Leu Thr Leu Pro Lys Val Glu
500 505 510
Ala Met Asn Lys Arg Leu Gly Ser Leu Val Asp Glu Phe Lys Glu Leu
515 520 525
Val Tyr Pro Pro Asp Tyr Asn Pro Glu Gly Lys Val Thr Lys Arg Lys
530 535 540
His Asp Asn Glu Gly Ser Gly Ser Lys Arg Pro Lys Val Glu Tyr Ser
545 550 555 560
Glu Glu Glu Leu Lys Thr His Ile Ser Lys Gly Thr Leu Gly Lys Phe
565 570 575
Thr Val Pro Met Leu Lys Glu Ala Cys Arg Ala Tyr Gly Leu Lys Ser
580 585 590
Gly Leu Lys Lys Gln Glu Leu Leu Glu Ala Leu Thr Lys His Phe Gln
595 600 605
Asp Met Val Arg Ser Gly Asn Lys Ala Ala Val Val Leu Cys Met Asp
610 615 620
Val Gly Phe Thr Met Ser Asn Ser Ile Pro Gly Ile Glu Ser Pro Phe
625 630 635 640
Glu Gln Ala Lys Lys Val Ile Thr Met Phe Val Gln Arg Gln Val Phe
645 650 655
Ala Glu Asn Lys Asp Glu Ile Ala Leu Val Leu Phe Gly Thr Asp Gly
660 665 670
Thr Asp Asn Pro Leu Ser Gly Gly Asp Gln Tyr Gln Asn Ile Thr Val
675 680 685
His Arg His Leu Met Leu Pro Asp Phe Asp Leu Leu Glu Asp Ile Glu
690 695 700
Ser Lys Ile Gln Pro Gly Ser Gln Gln Ala Asp Phe Leu Asp Ala Leu
705 710 715 720
Ile Val Ser Met Asp Val Ile Gln His Glu Thr Ile Gly Lys Lys Phe
725 730 735
Glu Lys Arg His Ile Glu Ile Phe Thr Asp Leu Ser Ser Arg Phe Ser
740 745 750
Lys Ser Gln Leu Asp Ile Ile Ile His Ser Leu Lys Lys Cys Asp Ile
755 760 765
Ser Glu Arg His Ser Ile His Trp Pro Cys Arg Leu Thr Ile Gly Ser
770 775 780
Asn Leu Ser Ile Arg Ile Ala Ala Tyr Lys Ser Ile Leu Gln Glu Arg
785 790 795 800
Val Lys Lys Thr Trp Thr Val Val Asp Ala Lys Thr Leu Lys Lys Glu
805 810 815
Asp Ile Gln Lys Glu Thr Val Tyr Cys Leu Asn Asp Asp Asp Glu Thr
820 825 830
Glu Val Leu Lys Glu Asp Ile Ile Gln Gly Phe Arg Tyr Gly Ser Asp
835 840 845
Ile Val Pro Phe Ser Lys Val Asp Glu Glu Gln Met Lys Tyr Lys Ser
850 855 860
Glu Gly Lys Cys Phe Ser Val Leu Gly Phe Cys Lys Ser Ser Gln Val
865 870 875 880
Gln Arg Arg Phe Phe Met Gly Asn Gln Val Leu Lys Val Phe Ala Ala
885 890 895
Arg Asp Asp Glu Ala Ala Ala Val Ala Leu Ser Ser Leu Ile His Ala
900 905 910
Leu Asp Asp Leu Asp Met Val Ala Ile Val Arg Tyr Ala Tyr Asp Lys
915 920 925
Arg Ala Asn Pro Gln Val Gly Val Ala Phe Pro His Ile Lys His Asn
930 935 940
Tyr Glu Cys Leu Val Tyr Val Gln Leu Pro Phe Met Glu Asp Leu Arg
945 950 955 960
Gln Tyr Met Phe Ser Ser Leu Lys Asn Ser Lys Lys Tyr Ala Pro Thr
965 970 975
Glu Ala Gln Leu Asn Ala Val Asp Ala Leu Ile Asp Ser Met Ser Leu
980 985 990
Ala Lys Lys Asp Glu Lys Thr Asp Thr Leu Glu Asp Leu Phe Pro Thr
995 1000 1005
Thr Lys Ile Pro Asn Pro Arg Phe Gln Arg Leu Phe Gln Cys Leu
1010 1015 1020
Leu His Arg Ala Leu His Pro Arg Glu Pro Leu Pro Pro Ile Gln
1025 1030 1035
Gln His Ile Trp Asn Met Leu Asn Pro Pro Ala Glu Val Thr Thr
1040 1045 1050
Lys Ser Gln Ile Pro Leu Ser Lys Ile Lys Thr Leu Phe Pro Leu
1055 1060 1065
Ile Glu Ala Lys Lys Lys Asp Gln Val Thr Ala Gln Glu Ile Phe
1070 1075 1080
Gln Asp Asn His Glu Asp Gly Pro Thr Ala Lys
1085 1090
<210> 493
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Telomerase Sm7 consensus site
(single stranded) oligonucleotide sequence
<400> 493
aauuuuugga 10
<210> 494
<211> 83
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: MS2 coat protein polypeptide
sequence
<400> 494
Gly Ser Val Ile Asp Val Ser Ser Gln Arg Val Asn Val Gln Arg Pro
1 5 10 15
Leu Asp Ala Leu Gly Asn Ser Leu Asn Ser Pro Val Ile Ile Lys Leu
20 25 30
Lys Gly Asp Arg Glu Phe Arg Gly Val Leu Lys Ser Phe Asp Leu His
35 40 45
Met Asn Leu Val Leu Asn Asp Ala Glu Glu Leu Glu Asp Gly Glu Val
50 55 60
Thr Arg Arg Leu Gly Thr Val Leu Ile Arg Gly Asp Asn Ile Val Tyr
65 70 75 80
Ile Ser Pro
<210> 495
<211> 26
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: PP7 phage operator stem loop
oligonucleotide sequence
<400> 495
auaaggaguu uauauggaaa cccuua 26
<210> 496
<211> 128
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: PP7 coat protein (PCP)
polypeptide sequence
<400> 496
Met Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr Leu
1 5 10 15
Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys Val
20 25 30
Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln Asn
35 40 45
Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala Asp
50 55 60
Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro Lys Val Arg
65 70 75 80
Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala Asn Ser Thr
85 90 95
Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala
100 105 110
Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg
115 120 125
<210> 497
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: SfMu Com stem loop
oligonucleotide sequence
<400> 497
cugaaugccu gcgagcauc 19
<210> 498
<211> 62
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: SfMu Com binding protein
polypeptide sequence
<400> 498
Met Lys Ser Ile Arg Cys Lys Asn Cys Asn Lys Leu Leu Phe Lys Ala
1 5 10 15
Asp Ser Phe Asp His Ile Glu Ile Arg Cys Pro Arg Cys Lys Arg His
20 25 30
Ile Ile Met Leu Asn Ala Cys Glu His Pro Thr Glu Lys His Cys Gly
35 40 45
Lys Arg Glu Lys Ile Thr His Ser Asp Glu Thr Val Arg Tyr
50 55 60
<210> 499
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: leucine zipper polypeptide
sequence
<400> 499
Leu Glu Ile Arg Ala Ala Phe Leu Arg Gln Arg Asn Thr Ala Leu Arg
1 5 10 15
Thr Glu Val Ala Glu Leu Glu Gln Glu Val Gln Arg Leu Glu Asn Glu
20 25 30
Val Ser Gln Tyr Glu Thr Arg Tyr Gly Pro Leu Gly Gly Gly Lys
35 40 45
<210> 500
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: leucine zipper polypeptide
sequence
<400> 500
Leu Glu Ile Glu Ala Ala Phe Leu Glu Arg Glu Asn Thr Ala Leu Glu
1 5 10 15
Thr Arg Val Ala Glu Leu Arg Gln Arg Val Gln Arg Leu Arg Asn Arg
20 25 30
Val Ser Gln Tyr Arg Thr Arg Tyr Gly Pro Leu Gly Gly Gly Lys
35 40 45
<210> 501
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<220>
<221> misc_feature
<222> (20)..(20)
<223> n is a, c, g, or t
<400> 501
caccatgagc gaggtcgagn gg 22
<210> 502
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 502
gccaccatga gcgaggtcga gg 22
<210> 503
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 503
gtgtcgaagt tcgccctgga gagg 24
<210> 504
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 504
atgccgagat aatggccctc cgg 23
<210> 505
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 505
atgccgagat aatggccctt cgg 23
<210> 506
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 506
atgccgagat catggcacta cgg 23
<210> 507
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 507
atgccgagat catggcactc cgg 23
<210> 508
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 508
atgccgagat catggcactg cgg 23
<210> 509
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 509
atgccgagat catggcgcta cgg 23
<210> 510
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 510
atgccgagat catggcgctc cgg 23
<210> 511
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 511
atgccgagat catggcgtta cgg 23
<210> 512
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 512
atgccgagat tatggcacta cgg 23
<210> 513
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 513
atgccgagat tatggcactc cgg 23
<210> 514
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 514
atgccgagat tatggcactg cgg 23
<210> 515
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 515
atgccgagat tatggcactt cgg 23
<210> 516
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 516
atgccgagat tatggcgctg cgg 23
<210> 517
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 517
atgccgagat tatggctcta cgg 23
<210> 518
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 518
atgcggagat catggcgctg cgg 23
<210> 519
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 519
atgctgagat aatggccctc cgg 23
<210> 520
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 520
aaccgcacat gccgaaatta tgg 23
<210> 521
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 521
atgccgaaat tatggctctg cgg 23
<210> 522
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 522
acacatgaca cagggctcga agg 23
<210> 523
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic oligonucleotide
sequence
<400> 523
gccccagcac acatgacaca ggg 23
<210> 524
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 524
gcaccaugag cgaggucgag uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 525
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 525
ggccaccaug agcgaggucg uuuuagagcu agaaauagca aguuaaaaua aggcuagucc 60
guuaucaacu ugaaaaagug gcaccgaguc ggugcuuuuu u 101
<210> 526
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 526
gugucgaagu ucgcccugga gguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 527
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 527
gaugccgaga uaauggcccu cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 528
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 528
gaugccgaga uaauggcccu uguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 529
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 529
gaugccgaga ucauggcacu aguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 530
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 530
gaugccgaga ucauggcacu cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 531
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 531
gaugccgaga ucauggcacu gguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 532
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 532
gaugccgaga ucauggcgcu aguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 533
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 533
gaugccgaga ucauggcgcu cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 534
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 534
gaugccgaga ucauggcguu aguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 535
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 535
gaugccgaga uuauggcacu aguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 536
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 536
gaugccgaga uuauggcacu cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 537
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 537
gaugccgaga uuauggcacu gguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 538
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 538
gaugccgaga uuauggcacu uguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 539
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 539
gaugccgaga uuauggcgcu gguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 540
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 540
gaugccgaga uuauggcucu aguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 541
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 541
gaugcggaga ucauggcgcu gguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 542
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 542
gaugcugaga uaauggcccu cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 543
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 543
gaaccgcaca ugccgaaauu aguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 544
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 544
ggcagguguc gacauaucua uguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 545
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 545
gaugccgaaa uuauggcucu gguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 546
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 546
gacacaugac acagggcucg aguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
<210> 547
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: synthetic polynucleotide
sequence
<400> 547
ggccccagca cacaugacac aguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuu 103
Claims (188)
- 데아미나아제 도메인 또는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 또는 이의 단편을 코딩하는 폴리뉴클레오티드로서, 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 데마이나아제 또는 napDNApb 또는 이의 단편을 코딩하는 오픈 리딩 프레임에 삽입되는 것인, 폴리뉴클레오티드.
- 인트론을 포함하는 데아미나아제 도메인 또는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 오픈 리딩 프레임을 코딩하는 폴리뉴클레오티드로서, 인트론은 스플라이드 수용체 또는 스플라이스 공여체 부위에 변경을 포함하고, 여기서 변경은 염기 편집 mRNA의 스플라이싱 감소 또는 제거를 통해 염기 편집 폴리펩티드의 발현을 감소 또는 제거하는 것인, 폴리뉴클레오티드.
- 염기 편집 폴리펩티드 또는 이의 단편을 코딩하는 폴리뉴클레오티드로서, 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 염기 편집 폴리펩티드 또는 이의 단편을 코딩하는 오픈 리딩 프레임에 삽입되는 것인, 폴리뉴클레오티드.
- 청구항 3에 있어서, 염기 편집은 게놈 DNA에서 높은 편집 효율을 갖는 것인, 폴리뉴클레오티드.
- 인트론을 포함하는 염기 편집 오픈 리딩 프레임을 포함하는 폴리뉴클레오티드로서, 인트론은 스플라이드 수용체 또는 스플라이스 공여체 부위에 변경을 포함하고, 여기서 변경은 염기 편집 mRNA의 스플라이싱 감소 또는 제거를 통해 염기 편집 폴리펩티드의 발현을 감소 또는 제거하는 것인, 폴리뉴클레오티드.
- 청구항 3 내지 5 중 어느 한 항에 있어서, 여기서 염기 편집은 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 또는 데아미나아제 도메인을 포함하는, 폴리뉴클레오티드.
- 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 또는 데아미나아제 도메인을 포함하는 염기 편집기를 코딩하는 폴리뉴클레오티드로서, 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 napDNAbp 도메인 또는 데아미나아제 도메인을 코딩하는 오픈 리딩 프레임에 삽입되는 것인, 폴리뉴클레오티드.
- 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인, 및 데아미나아제 도메인, 또는 이의 단편을 포함하는 염기 편집기를 코딩하는 폴리뉴클레오티드로서, 폴리뉴클레오티드는 인트론을 포함하는 염기 편집기 오픈 리딩 프레임을 포함하고, 인트론은 스플라이드 수용체 또는 스플라이스 공여체 부위에 변경을 포함하며, 여기서 변경은 염기 편집기 mRNA의 스플라이싱을 감소시키는 것인, 폴리뉴클레오티드.
- 청구항 1, 2 또는 6 내지 8 중 어느 한 항에 있어서, 여기서 데아미나아제 도메인은 사이티딘 데아미나아제 도메인 또는 아데노신 데아미나아제 도메인인 것인, 폴리뉴클레오티드.
- 청구항 1, 2 또는 6 내지 9 중 어느 한 항에 있어서, 여기서 napDNAbp 도메인은 Cas9, Cas12a/Cpf1, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 및 Cas12j/CasΦ도메인으로 구성된 그룹으로부터 선택되는 Cas 도메인인 것인, 폴리뉴클레오티드.
- 청구항 1 내지 10 중 어느 한 항에 있어서, 여기서 인트론은 NF1, PAX2, EEF1A1, HBB, IGHG1, SLC50A1, ABCB11, BRSK2, PLXNB3, TMPRSS6, IL32, ANTXRL, PKHD1L1, PADI1, KRT6C, 및 HMCN2로 구성된 그룹으로부터 선택되는 서열로부터 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 NF1에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 PAX2에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 EEF1A1에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 HBB 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 IGHG1 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 SLC50A1 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 ABCB11 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 BRSK2 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 PLXNB3 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 TMPRSS6 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 IL32 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 PKHD1L1 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 PADI1 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 KRT6C 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 11에 있어서, 인트론은 HMCN2 에서 유래한 것인, 폴리뉴클레오티드.
- 청구항 1 내지 26 중 어느 한 항에 있어서, 인트론은 포유류 유전자에 자연적으로 존재하는 인트론 대비 적어도 약 85% 핵산 서열 상동성을 갖는 것인, 폴리뉴클레오티드.
- 청구항 1 내지 26 중 어느 한 항에 있어서, 인트론은 비-포유류 유전자에 자연적으로 존재하는 인트론 대비 적어도 약 85% 핵산 서열 상동성을 갖는 것인, 폴리뉴클레오티드.
- 청구항 1 내지 10 중 어느 한 항에 있어서, 인트론은 합성 인트론인 것인, 폴리뉴클레오티드.
- 청구항 1 내지 26 중 어느 한 항에 있어서, 인트론은 다음 중 어느 하나 대비 적어도 약 85% 핵산 서열 상동성을 갖는 서열을 포함하는, 폴리뉴클레오티드:
a) GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG (서열번호: 226);
b) GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG (서열번호: 227);
c) GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG (서열번호: 228);
d) GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG (서열번호: 229);
e) GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG (서열번호: 230);
f) GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG (서열번호: 231);
g) GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG (서열번호: 232);
h) GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG (서열번호: 233);
i) GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG (서열번호: 234);
j) GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG (서열번호: 235);
k) GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG (서열번호: 236);
l) GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG (서열번호: 237);
m) GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG (서열번호: 238);
n) GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTC TGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG (서열번호: 239);
o) GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG (서열번호: 240);
p) GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG (서열번호: 241); 또는
q) GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG (서열번호: 242).
- 청구항 1 내지 26 중 어느 한 항에 있어서, 인트론은 다음 중 하나로부터의 핵산 서열을 포함하는 것인, 폴리뉴클레오티드:
a) GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG (서열번호: 226);
b) GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG (서열번호: 227);
c) GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG (서열번호: 228);
d) GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG (서열번호: 229);
e) GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG (서열번호: 230);
f) GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG (서열번호: 231);
g) GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG (서열번호: 232);
h) GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG (서열번호: 233);
i) GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG (서열번호: 234);
j) GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG (서열번호: 235);
k) GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG (서열번호: 236);
l) GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG (서열번호: 237);
m) GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG (서열번호: 238);
n) GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG (서열번호: 239);
o) GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG (서열번호: 240);
p) GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG (서열번호: 241); 또는
q) GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG (서열번호: 242).
- 청구항 1 내지 31 중 어느 한 항에 있어서, 인트론은 약 10 염기쌍 내지 약 500 염기쌍 사이를 포함하는, 폴리뉴클레오티드.
- 청구항 32에 있어서, 인트론은 약 70 염기쌍 내지 150 염기쌍 사이를 포함하는, 폴리뉴클레오티드.
- 청구항 32에 있어서, 인트론은 약 100 염기쌍 내지 200 염기쌍 사이를 포함하는, 폴리뉴클레오티드.
- 청구항 1 내지 34에 있어서, 인트론은 프로토스페이서(protospacer) 서열에 근접하게 삽입되는 것인, 폴리뉴클레오티드.
- 청구항 35에 있어서, 인트론은 프로토스페이서 서열의 약 10 내지 30 염기쌍 내에 삽입되는 것인, 폴리뉴클레오티드.
- 청구항 35 또는 36에 있어서, 프로토스페이서 서열은 NGG 또는 NNGRRT인 것인, 폴리뉴클레오티드.
- 청구항 1, 2 또는 6 내지 37 중 어느 한 항에 있어서, 데아미나아제 도메인은 TadA 도메인을 포함하는, 폴리뉴클레오티드.
- 청구항 38에 있어서, 인트론은 TadA의 코돈 18, 23, 59, 62, 87 또는 129의 내부 또는 바로 뒤에 삽입되는 것인, 폴리뉴클레오티드.
- 청구항 39에 있어서, 인트론은 TadA의 코돈 87의 바로 뒤에 삽입되는 것인, 폴리뉴클레오티드.
- 청구항 2, 5 또는 8 중 어느 한 항에 있어서, 변경은 단일-염기 편집인 것인, 폴리뉴클레오티드.
- 청구항 41에 있어서, 단일-염기 편집은 A 에서 G로의 염기 편집인 것인, 폴리뉴클레오티드.
- 청구항 41에 있어서, 단일-염기 편집은 C에서 T로의 염기 편집인 것인, 폴리뉴클레오티드.
- 청구항 1 내지 43 중 어느 한 항에 있어서, 링커를 코딩하는 폴리뉴클레오티드 서열을 추가로 포함하는, 폴리뉴클레오티드.
- 청구항 44에 있어서, 인트론은 링커를 코딩하는 폴리뉴클레오티드 서열 내에 삽입되는 것인, 폴리뉴클레오티드.
- 청구항 1 내지 45 중 어느 한 항에 있어서, 프로그래밍 가능한 DNA 결합 단백질 도메인은 Cas9 도메인인 것인, 폴리뉴클레오티드.
- 청구항 46에 있어서, Cas9 도메인은 Cas9의 Asn309 및 Thr310에 상응하는 아미노산 잔기 사이에 스플릿되고, 잔기 310은 Thr310Cys으로 돌연변이된 것인, 폴리뉴클레오티드.
- 다음을 포함하는 조성물:
(i) 데아미나아제 도메인 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드, 여기서 napDNAbp 도메인의 N-말단 단편은 스플릿된 인테인-N에 융합된 것이고, 및
(ii) napDNAbp 도메인의 C-말단 단편을 코딩하는 제2 폴리뉴클레오티드, 여기서 napDNAbp 도메인의 C-말단 단편은 스플릿된 인테인-C에 융합되는 것이며,
제1 또는 제2 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 폴리뉴클레오티드의 오픈 리딩 프레임에 삽입된다.
- 다음을 포함하는 조성물:
(i) 데아미나아제 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드, 여기서 데아미나아제 도메인의 N-말단 단편은 스플릿된 인테인-N에 융합되고, 및
(ii) 데아미나아제 도메인의 C-말단 단편 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인을 코딩하는 제2 폴리뉴클레오티드, 여기서 데아미나아제 도메인의 C-말단 단편은 스플릿된 인테인-C에 융합되는 것이며,
여기서 제1 또는 제2 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 폴리뉴클레오티드의 오픈 리딩 프레임에 삽입된다.
- 청구항 48 또는 49 중 어느 한 항에 있어서, 인트론은 스플라이스 수용체 또는 스플라이스 공여체 부위에 변경을 포함하고, 여기서 변경은 염기 편집기 mRNA의 스플라이싱을 감소 또는 제거하는, 조성물.
- 청구항 48 내지 50 중 어느 한 항에 있어서, 데아미나아제 도메인은 사이티딘 데아미나아제 도메인 또는 아데노신 데아미나아제 도메인인 것인, 조성물.
- 청구항 48 내지 51 중 어느 한 항에 있어서, 데아미나아제 도메인은 TadA 도메인인 것인, 조성물.
- 청구항 48 내지 52 중 어느 한 항에 있어서, napDNAbp 도메인은 Cas9, Cas12a/Cpf1, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 및 Cas12j/CasΦ도메인으로 구성된 그룹으로부터 선택되는 Cas 도메인인 것인, 조성물.
- 청구항 48 내지 53 중 어느 한 항에 있어서, napDNAbp 도메인은 Cas9 도메인인 것인, 조성물.
- 청구항 54에 있어서, Cas9 도메인의 N- 및 C-말단 도메인이 아미노산 잔기 Asn309 및 Thr310 사이에서 스플릿되는 것인, 조성물.
- 청구항 54 또는 55에 있어서, Cas9 도메인은 Thr310Cys 돌연변이를 포함하는, 조성물.
- 청구항 48 내지 56 중 어느 한 항에 있어서, 인트론은 NF1, PAX2, EEF1A1, HBB, IGHG1, SLC50A1, ABCB11, BRSK2, PLXNB3, TMPRSS6, IL32, ANTXRL, PKHD1L1, PADI1, KRT6C, 및 HMCN2로 구성된 그룹으로부터 선택되는 서열로부터 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 NF1에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 PAX2에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 EEF1A1에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 HBB에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 IGHG1에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 SLC50A1에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 ABCB11에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 BRSK2에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 PLXNB3에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 TMPRSS6에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 IL32에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 PKHD1L1에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 PADI1에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 KRT6C에서 유래한 것인, 조성물.
- 청구항 57에 있어서, 인트론은 HMCN2에서 유래한 것인, 조성물.
- 청구항 48 내지 72 중 어느 한 항에 있어서, 링커 폴리뉴클레오티드 서열을 추가로 포함하는, 조성물.
- 청구항 73에 있어서, 인트론은 링커 폴리뉴클레오티드 서열 내에 삽입되는 것인, 조성물.
- 다음을 포함하는 염기 편집기 시스템:
(i) 데아미나아제 도메인, 또는 이의 단편을 포함하는 염기 편집기를 코딩하는 폴리뉴클레오티드;
(ii) 염기 편집기에서 세포 게놈의 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA; 및
(iii) 염기 편집기가 염기 편집기를 코딩하는 폴리뉴클레오티드를 편집하도록 지시하는 하나 이상의 가이드 RNA를 포함하고, 여기서 편집은 코딩된 염기 편집기의 활성 및/또는 발현의 감소를 초래하는 것이다.
- 청구항 75에 있어서, 편집기는 데아미나아제 도메인의 촉매 잔기를 변경하는, 염기 편집기 시스템.
- 청구항 75 또는 76에 있어서, 데아미나아제 도메인은 아데노신 데아미나아제 도메인인 것인, 염기 편집기.
- 청구항 75 또는 76에 있어서, 데아미나아제 도메인은 사이티딘 데아미나아제 도메인인 것인, 염기 편집기.
- 청구항 77에 있어서, 데아미나아제 도메인의 변경된 촉매 잔기는 다음 참조 서열의 His57 (H57), Glu59 (E59), Cys87 (C87), 또는 Cys90 (C90)인 것인, 염기 편집기 시스템:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD (서열번호: 1), 또는 또 다른 아데노신 데아미나아제의 상응하는 위치.
- 청구항 76 또는 79에 있어서, 변경된 촉매 잔기가 E59인 것인, 염기 편집기 시스템.
- 청구항 76 또는 79에 있어서, 촉매 잔기의 변경이 E59G인 것인, 염기 편집기 시스템.
- 청구항 76 또는 79에 있어서, 변경된 촉매 잔기가 H57인 것인, 염기 편집기 시스템.
- 청구항 76 또는 79에 있어서, 촉매 잔기의 변경이 H57R인 것인, 염기 편집기 시스템.
- 청구항 76 또는 79에 있어서, 변경된 촉매 잔기가 C87인 것인, 염기 편집기 시스템.
- 청구항 76 또는 79에 있어서, 촉매 잔기의 변경이 C87R인 것인, 염기 편집기 시스템.
- 청구항 76 또는 79에 있어서, 변경된 촉매 잔기가 C90인 것인, 염기 편집기 시스템.
- 청구항 76 또는 79에 있어서, 촉매 잔기의 변경이 C90R인 것인, 염기 편집기 시스템.
- 다음을 포함하는 염기 편집기 시스템:
(i) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 포함하고;
(ii) 자기-불활성화 염기 편집기가 세포의 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA; 및
(iii) 자기-불활성화 염기 편집기가 자기-불활성화 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA.
- 다음을 포함하는 염기 편집기 시스템:
(i) 염기 편집기를 코딩하는 청구항 3 내지 47 중 어느 한 항의 폴리뉴클레오티드;
(ii) 염기 편집기가 세포의 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA; 및
(iii) 염기 편집기가 염기 편집기를 코딩하는 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA.
- 다음을 포함하는 염기 편집기 시스템:
(i) 염기 편집기를 코딩하는 청구항 48 내지 74 중 어느 한 항의 조성물;
(ii) 염기 편집기가 세포의 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA; 및
(iii) 염기 편집기가 (i)의 조성물의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA.
- 다음을 포함하는 염기 편집기 시스템:
(i) 데아미나아제 도메인 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드, 여기서 napDNAbp 도메인의 N-말단 단편은 스플릿된 인테인-N과 융합되고;
(ii) napDNAbp 도메인의 C-말단 단편을 코딩하는 제2 폴리뉴클레오티드, 여기서 napDNAbp 도메인의 C-말단 단편은 스플릿된 인테인-C와 융합되며,
여기서 제1 및 제2 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 오픈 리딩 프레임에 삽입되며, 여기서 제1 및 제2 폴리뉴클레오티드는 염기 편집기를 코딩하고;
(iii) 염기 편집기가 세포의 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA; 및
(iv) 염기 편집기가 (i) 또는 (ii)의 조성물의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA.
- 다음을 포함하는 염기 편집기 시스템:
(i) 데아미나아제 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드, 여기서 데아미나아제 도메인의 N-말단 단편은 스플릿된 인테인-N과 융합되고;
(ii) 데아미나아제 도메인의 C-말단 단편 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인을 코딩하는 제2 폴리뉴클레오티드, 여기서 데아미나아제 도메인의 C-말단 단편은 스플릿된 인테인-C와 융합되며;
여기서 제1 및 제2 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 오픈 리딩 프레임에 삽입되며, 여기서 제1 및 제2 폴리뉴클레오티드는 염기 편집기를 코딩하고;
(iii) 염기 편집기가 세포의 게놈 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA; 및
(iv) 염기 편집기가 (i) 또는 (ii)의 조성물의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 하나 이상의 가이드 RNA.
- 청구항 75 내지 92 중 어느 한 항에 있어서, 염기 편집기 시스템은 다음에서 선택되는 폴리뉴클레오티드 서열을 포함하는 것인, 염기 편집기 시스템:
a) gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 191);
b) gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 192);
c) gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 193);
d) GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 194);
e) gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 195);
f) gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 196);
g) gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 197);
h) GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 198);
i) GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 190);
j) gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 200);
k) gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 201);
l) GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 202);
m) gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 203);
n) gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 204);
o) gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 205);
p) GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 206);
q) gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 207);
r) gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 208 );
s) gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 209);
t) gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 210);
u) gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 211);
v) gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 212);
w) gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 213);
x) gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 214);
y) GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 215);
z) gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 216);
aa) gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 217);
bb) gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 218);
cc) GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 219);
dd) gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 220);
ee) gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 221);
ff) gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 222);
gg) gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 223);
hh) gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 224);
ii) gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 225);
jj) gCACCAUGAGCGAGGUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 524);
kk) gGCCACCAUGAGCGAGGUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 525);
ll) GUGUCGAAGUUCGCCCUGGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 526);
mm) gAUGCCGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 527);
nn) gAUGCCGAGAUAAUGGCCCUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 528);
oo) gAUGCCGAGAUCAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 529);
pp) gAUGCCGAGAUCAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 530);
qq) gAUGCCGAGAUCAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 531);
rr) gAUGCCGAGAUCAUGGCGCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 532);
ss) gAUGCCGAGAUCAUGGCGCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 533);
tt) gAUGCCGAGAUCAUGGCGUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 534);
uu) gAUGCCGAGAUUAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 535);
vv) gAUGCCGAGAUUAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 536);
ww) gAUGCCGAGAUUAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 537);
xx) gAUGCCGAGAUUAUGGCACUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 538);
yy) gAUGCCGAGAUUAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 539);
zz) gAUGCCGAGAUUAUGGCUCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 540);
aaa) gAUGCGGAGAUCAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 541);
bbb) gAUGCUGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 542);
ccc) gAACCGCACAUGCCGAAAUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 543);
ddd) gGCAGGUGUCGACAUAUCUAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 544);
eee) gAUGCCGAAAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 545);
fff) gACACAUGACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 546); 또는
ggg) gGCCCCAGCACACAUGACACAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 547).
- 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 포함하는 벡터로서, 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 포함하는 것인, 벡터.
- 청구항 1 내지 47 중 어느 한 항의 폴리뉴클레오티드 또는 청구항 75 내지 93 중 어느 한 항의 염기 편집기 시스템을 포함하는 벡터.
- 청구항 48 내지 74 중 어느 한 항의 조성물의 제1 폴리뉴클레오티드 및/또는 제2 폴리뉴클레오티드를 포함하는 벡터.
- 청구항 94 내지 96 중 어느 한 항에 있어서, 발현 벡터가 포유류 발현 벡터인 것인, 벡터.
- 청구항 94 내지 97 중 어느 한 항에 있어서, 벡터가 지질 나노입자인 것인, 벡터.
- 청구항 94 내지 98 중 어느 한 항에 있어서, 벡터가 아데노-관련 바이러스(AAV) 벡터, 레트로바이러스 벡터, 아데노바이러스 벡터, 렌티바이러스 벡터, 센다이 바이러스 벡터, 및 헤르페스 바이러스 벡터로 구성된 그룹으로부터 선택되는 바이러스 벡터인 것인, 벡터.
- 청구항 99에 있어서, 벡터는 AAV 벡터인 것인, 벡터.
- 청구항 100에 있어서, AAV 벡터는 AAV2 또는 AAV8인 것인, 벡터.
- 청구항 94 내지 101 중 어느 한 항에 있어서, 벡터는 프로모터를 포함하는, 벡터.
- 청구항 102에 있어서, 프로모터는 CMV 프로모터인, 벡터.
- 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 포함하는 벡터는 포함하는 세포로서, 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 포함하는 것인, 세포.
- 청구항 1 내지 47 중 어느 한 항의 폴리뉴클레오티드, 청구항 48 내지 74 중 어느 한 항의 조성물, 청구항 75 내지 93 중 어느 한 항의 염기 편집기 시스템, 또는 청구항 94 내지 103 중 어느 한 항의 벡터를 포함하는 세포.
- 청구항 104 또는 105에 있어서, 세포는 in vitro 또는 in vivo인 것인, 세포.
- 청구항 1 내지 47 중 어느 한 항의 폴리뉴클레오티드, 청구항 75 내지 93 중 어느 한 항의 염기 편집기 시스템, 청구항 94 내지 103 중 어느 한 항의 벡터, 또는 청구항 104 내지 106 중 어느 한 항의 세포를 포함하는 제약학적 조성물.
- 청구항 107에 있어서, 제약학적으로 허용되는 부형제, 희석제, 또는 담체를 추가로 포함하는, 제약학적 조성물.
- 청구항 1 내지 47 중 어느 한 항의 폴리뉴클레오티드, 청구항 48 내지 74 중 어느 한 항의 조성물, 청구항 75 내지 93 중 어느 한 항의 염기 편집기 시스템, 청구항 94 내지 103 중 어느 한 항의 벡터, 또는 청구항 104 내지 106 중 어느 한 항의 세포, 청구항 107 또는 108의 제약학적 조성물을 포함하는 키트.
- 청구항 109에 있어서, 이를 사용하기 위한 지시서를 추가로 포함하는, 키트.
- 다음 단계를 포함하는 자기-불활성화 염기 편집기의 발현을 감소 또는 제거하는 방법:
(a) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 제공하는 단계, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 포함하고; 및
(b) 폴리뉴클레오티드를 가이드 RNA 및 자기-불활성화 염기 편집기 폴리펩티드와 접촉시키는 단계, 여기서 가이드 RNA는 염기 편집기가 인트론의 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하여, 자기-불활성화 염기 편집기 발현이 감소 또는 제거되는 변경을 야기한다.
- 다음 단계를 포함하는 자기-불활성화 염기 편집 방법:
(a) 데아미나아제 도메인, 또는 이의 단편을 포함하는 염기 편집기를 코딩하는 폴리뉴클레오티드를 세포에 발현시키는 단계;
(b) 세포를, 염기 편집기가 세포의 게놈 부위를 편집하도록 지시하는 제1 가이드 RNA와 접촉시켜, 세포 게놈의 변경을 생성시키는 단계; 및
(c) 세포를, 염기 편집기가 염기 편집기를 코딩하는 폴리뉴클레오티드를 편집하도록 지시하는 제2 가이드 RNA와 접촉시키고, 여기서 편집은 코딩된 염기 편집기의 활성 및/또는 발현을 감소시켜, 염기 편집기의 발현을 감소 또는 제거하는 변경을 생성한다.
- 청구항 112에 있어서, 편집은 데아미나아제 도메인의 촉매 잔기를 변경하는, 방법.
- 청구항 112 또는 113에 있어서, 데아미나아제 도메인이 아데노신 데아미나아제 도메인인 것인, 방법.
- 청구항 112 또는 113에 있어서, 데아미나아제 도메인이 사이티딘 데아미나아제 도메인인 것인, 방법.
- 청구항 114에 있어서, 데아미나아제 도메인의 변경된 촉매 잔기는 다음 참조 서열의 His57 (H57), Glu59 (E59), Cys87 (C87), 또는 Cys90 (C90) 인 것인, 방법:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD (서열번호: 1), 또는 또 다른 아데노신 데아미나아제의 상응하는 위치.
- 청구항 116에 있어서, 변경된 촉매 잔기가 변경된 촉매 잔기가 E59인 것인, 방법.
- 청구항 116에 있어서, 촉매 잔기의 변경이 E59G인 것인, 방법.
- 청구항 116에 있어서, 변경된 촉매 잔기가 H57인 것인, 방법.
- 청구항 116에 있어서, 촉매 잔기의 변경이 H57R인 것인, 방법.
- 청구항 116에 있어서, 변경된 촉매 잔기가 C87인 것인, 방법.
- 청구항 116에 있어서, 촉매 잔기의 변경이 C87R인 것인, 방법.
- 청구항 116에 있어서, 변경된 촉매 잔기가 C90인 것인, 방법.
- 청구항 116에 있어서, 촉매 잔기의 변경이 C90R인 것인, 방법.
- 다음을 포함하는 자기-불활성화 염기 편집 방법:
(a) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 세포에 발현하는 단계, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 포함하고;
(b) 자기-불활성화 염기 편집기가 세포의 게놈 부위를 편집하도록 지시하는 제1 가이드 RNA를 세포에 접촉시켜, 세포 게놈에 변화를 생성하는 단계; 및
(c) 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA를 세포와 접촉시켜, 자기-불활성화 염기 편집기의 발현을 감소 또는 제거하는 단계.
- 다음 단계를 포함하는 유기체의 게놈 편집 방법:
(a) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 유기체의 세포에 발현시키고, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 포함하는, 단계;
(b) 자기-불활성화 염기 편집기가 세포 게놈의 부위를 편집하도록 지시하는 제1 가이드 RNA와 세포를 접촉시켜, 세포 게놈 변경을 생성시키는 단계; 및
(c) 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 세포를 접촉시켜, 자기-불활성화 염기 편집기의 발현을 감소 또는 제거하는 변경을 생성시키는 단계.
- 다음 단계를 포함하는 대상체를 치료하는 방법:
(a) 자기-불활성화 염기 편집기 또는 이의 단편을 코딩하는 폴리뉴클레오티드를 개체의 세포에 발현시키고, 여기서 폴리뉴클레오티드는 자기-불활성화 염기 편집기 또는 이의 단편의 오픈 리딩 프레임에 삽입된 인트론을 포함하는, 단계;
(b) 자기-불활성화 염기 편집기가 세포 게놈의 부위를 편집하도록 지시하는 제1 가이드 RNA와 세포를 접촉시켜, 대상체를 치료하기 위해 세포 게놈의 변경을 생성하는 단계; 및
(c) 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 세포를 접촉시켜, 자기-불활성화 염기 편집기의 발현을 감소 또는 제거하는 변경을 생성시키는 단계.
- 청구항 75 내지 93 중 어느 한 항의 염기 편집기 시스템, 청구항 94 내지 103 중 어느 한 항의 벡터, 청구항 104 내지 106 중 어느 한 항의 세포, 청구항 107 또는 108의 제약학적 조성물을 대상체에 투여하는 단계를 포함하여, 대상체를 치료하는, 대상체를 치료하는 방법.
- 다음 단계를 포함하는 유기체 게놈 편집 방법:
(a) 데아미나아제 도메인을 코딩하는 제1 폴리뉴클레오티드 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인의 N-말단 단편, 및 napDNAbp 도메인의 C-말단 단편을 코딩하는 제2 폴리뉴클레오티드를 유기체의 세포에 발현시키는 단계, 여기서 napDNAbp 도메인의 N-말단 단편은 스플릿된 인테인-N과 융합되고, 여기서 napDNAbp 도메인의 C-말단 단편은 스플릿된 인테인-C와 융합되며, 여기서 제1 또는 제2 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 오픈 리딩 프레임에 삽입되며, 여기서 세포에서의 제1 및 제2 폴리뉴클레오티드의 발현은 자기-불활성화 염기 편집기의 형성을 초래하고;
(b) 세포를, 자기-불활성화 염기 편집기가 세포 게놈의 부위를 편집하도록 지시하는 제1 가이드 RNA와 접촉시켜, 세포 게놈의 변경을 생성하는 단계; 및
(c) 세포를, 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 접촉시켜, 자기-불활성화 염기 편집기의 발현을 감소 또는 제거하는 변경을 생성하는 단계.
- 다음 단계를 포함하는 유기체 게놈 편집 방법:
(a) 데아미나아제 도메인의 N-말단 단편을 코딩하는 제1 폴리뉴클레오티드, 및 데아미나아제 도메인의 C-말단 단편 및 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인을 코딩하는 제2 폴리뉴클레오티드를 유기체 세포에 발현하는 단계로서, 여기서 데아미나아제 도메인의 N-말단 단편은 스플릿된 인테인-N과 융합되고, 여기서 데아미나아제 도메인의 C-말단 단편은 스플릿된 인테인-C와 융합되며, 여기서 제1 또는 제2 폴리뉴클레오티드는 인트론을 포함하고, 여기서 인트론은 오픈 리딩 프레임에 삽입되며, 여기서 세포에서의 제1 및 제2 폴리뉴클레오티드의 발현은 자기-불활성화 염기 편집기의 형성을 초래하는, 단계;
(b) 세포를, 자기-불활성화 염기 편집기가 세포 게놈의 부위를 편집하도록 지시하는 제1 가이드 RNA와 접촉시켜, 세포 게놈 변경을 생성하는 단계; 및
(c) 세포를, 자기-불활성화 염기 편집기가 (a)의 폴리뉴클레오티드의 인트론에 존재하는 스플라이스 수용체 또는 스플라이스 공여체 부위를 편집하도록 지시하는 제2 가이드 RNA와 접촉시켜, 자기-불활성화 염기 편집기의 발현을 감소 또는 제거하는 변경을 생성하는 단계.
- 청구항 111 내지 130 중 어느 한 항에 있어서, 방법은 in vivo에서 수행되는 것인, 방법.
- 청구항 129 내지 130 중 어느 한 항에 있어서, 제1 폴리뉴클레오티드 및/또는 제2 폴리뉴클레오티드는 벡터에 의해 세포에 발현되는 것인, 방법.
- 청구항 129 내지 130 중 어느 한 항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드는 별도의 벡터에 의해 세포에서 발현되는 것인, 방법.
- 청구항 112 내지 133 중 어느 한 항에 있어서, 제1 가이드 RNA 및/또는 제2 가이드 RNA가 벡터에 의해 세포로 전달되는 것인, 방법.
- 청구항 112 내지 133 중 어느 한 항에 있어서, 제1 가이드 RNA 및/또는 제2 가이드 RNA가 제1 폴리뉴클레오티드 및/또는 제2 폴리뉴클레오티드와 동일한 벡터로 세포에 전달되는 것인, 방법.
- 청구항 129 내지 135 중 어느 한 항에 있어서, 제1 가이드 RNA 및/또는 제2 가이드 RNA가 제1 폴리뉴클레오티드 및/또는 제2 폴리뉴클레오티드와 다른 벡터로 세포에 전달되는 것인, 방법.
- 청구항 132 내지 136 중 어느 한 항에 있어서, 벡터는 지질 나노입자인 것인, 방법.
- 청구항 132 내지 137 중 어느 한 항에 있어서, 벡터는 바이러스 벡터인 것인, 방법.
- 청구항 138에 있어서, 바이러스 벡터는 아데노-관련 바이러스 (AAV) 벡터인 것인, 방법.
- 청구항 139에 있어서, AAV 벡터는 AAV2 또는 AAV8인 것인, 방법.
- 청구항 129 내지 140 중 어느 한 항에 있어서, napDNAbp 도메인은 Cas9 도메인인 것인, 방법.
- 청구항 141에 있어서, Cas9 도메인의 N- 및 C-말단 도메인이 아미노산 잔기 Asn309 및 Thr310 사이에서 스플릿되는 것인, 방법.
- 청구항 141 또는 142에 있어서, Cas9 도메인은 Thr310Cys 돌연변이를 포함하는, 방법.
- 청구항 111 내지 143 중 어느 한 항에 있어서, 염기 편집기는 핵산 프로그래밍 가능한 DNA 결합 단백질(napDNAbp) 도메인 및 데아미나아제 도메인을 포함하는, 방법.
- 청구항 144에 있어서, 인트론을 포함하는 오픈 리딩 프레임은 napDNAbp 도메인 또는 데아미나아제 도메인인 것인, 방법.
- 청구항 11 또는 125 내지 145 중 어느 한 항에 있어서, 자기-불활성화 염기 편집기 폴리펩티드는 게놈 DNA의 높은 편집 효율을 유지하는, 방법.
- 청구항 83, 84, 112 내지 124, 또는 129 내지 146 중 어느 한 항에 있어서, 데아미나아제 도메인은 사이티딘 데아미나아제 도메인 또는 아데노신 데아미나아제 도메인인 것인, 방법.
- 청구항 144 또는 145에 있어서, napDNAbp 도메인은 Cas9, Cas12a/Cpf1, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, 및 Cas12j/CasΦ도메인으로 구성된 그룹으로부터 선택되는 Cas 도메인인 것인, 방법.
- 청구항 111, 125 내지 127 또는 129 내지 148 중 어느 한 항에 있어서, 변경은 인트론의 5'말단에 있는 공통 스플라이스 공여체 부위 또는 인트론의 3'말단에 있는 공통 스플라이스 수용체 서열에 있는 것인, 방법.
- 청구항 111, 125 내지 127 또는 129 내지 149 중 어느 한 항에 있어서, 인트론은 약 10 염기쌍 내지 약 500 염기쌍 사이를 포함하는, 방법.
- 청구항 150에 있어서, 인트론은 약 70 염기쌍 내지 150 염기쌍 사이를 포함하는, 방법.
- 청구항 150에 있어서, 인트론은 약 100 염기쌍 내지 200 염기쌍 사이를 포함하는, 방법.
- 청구항 111, 125 내지 127, 또는 129 내지 152 중 어느 한 항에 있어서, 인트론은 프로토스페이서(protospacer) 서열에 근접하게 삽입되는 것인, 방법.
- 청구항 153에 있어서, 인트론은 프로토스페이서 서열의 약 10 내지 30 염기쌍 내에 삽인되는 것인, 방법.
- 청구항 153 또는 154에 있어서, 프로토스페이서 서열은 NGG 또는 NNGRRT인 것인, 방법.
- 청구항 147에 있어서, 아데노신 데아미나아제 도메인은 TadA 도메인을 포함하는, 방법.
- 청구항 156에 있어서, 인트론은 TadA의 코돈 18, 23, 59, 62, 87 또는 129의 내부 또는 바로 뒤에 삽입되는 것인, 방법.
- 청구항 157에 있어서, 인트론은 TadA의 코돈 87의 바로 뒤에 삽입되는 것인, 방법.
- 청구항 111 내지 127 또는 129 내지 158 중 어느 한 항에 있어서, 변경은 단일-염기 편집인 것인, 방법.
- 청구항 159에 있어서, 단일-염기 편집은 A 에서 G로의 염기 편집인 것인, 방법.
- 청구항 159에 있어서, 단일-염기 편집은 C에서 T로의 염기 편집인 것인, 방법.
- 청구항 111, 125 내지 127 또는 129 내지 161 중 어느 한 항에 있어서, 인트론은 NF1, PAX2, EEF1A1, HBB, IGHG1, SLC50A1, ABCB11, BRSK2, PLXNB3, TMPRSS6, IL32, ANTXRL, PKHD1L1, PADI1, KRT6C, 및 HMCN2로 구성된 그룹으로부터 선택되는 서열로부터 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 NF1에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 PAX2에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 EEF1A1에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 HBB 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 IGHG1 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 SLC50A1 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 ABCB11 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 BRSK2 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 PLXNB3 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 TMPRSS6 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 IL32 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 PKHD1L1 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 PADI1 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 KRT6C 에서 유래한 것인, 방법.
- 청구항 162에 있어서, 인트론은 HMCN2 에서 유래한 것인, 방법.
- 청구항 111, 125 내지 127 또는 129 내지 161 중 어느 한 항에 있어서, 인트론은 포유류 유전자에 자연적으로 존재하는 인트론 대비 적어도 약 85% 핵산 서열 상동성을 갖는 것인, 방법.
- 청구항 111, 125 내지 127 또는 129 내지 161 중 어느 한 항에 있어서, 인트론은 비-포유류 유전자에 자연적으로 존재하는 인트론 대비 적어도 약 85% 핵산 서열 상동성을 갖는 것인, 방법.
- 청구항 111, 125 내지 127 또는 129 내지 161 중 어느 한 항에 있어서, 인트론은 합성 인트론인 것인, 방법.
- 청구항 111, 125 내지 127 또는 129 내지 161 중 어느 한 항에 있어서, 인트론은 다음 중 어느 하나 대비 적어도 약 85%, 90%, 95% 또는 99% 핵산 서열 상동성을 갖는 서열을 포함하는 방법:
a) GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG (서열번호: 226);
b) GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG (서열번호: 227);
c) GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG (서열번호: 228);
d) GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG (서열번호: 229);
e) GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG (서열번호: 230);
f) GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG (서열번호: 231);
g) GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG (서열번호: 232);
h) GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG (서열번호: 233);
i) GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG (서열번호: 234);
j) GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG (서열번호: 235);
k) GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG (서열번호: 236);
l) GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG (서열번호: 237);
m) GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG (서열번호: 238);
n) GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG (서열번호: 239);
o) GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG (서열번호: 240);
p) GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG (서열번호: 241); 또는
q) GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG (서열번호: 242).
- 청구항 111, 125 내지 127 또는 129 내지 161 중 어느 한 항에 있어서, 인트론은 다음 중 하나로부터의 핵산 서열을 포함하는 방법:
a) GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG (서열번호: 226);
b) GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG (서열번호: 227);
c) GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG (서열번호: 228);
d) GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG (서열번호: 229);
e) GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG (서열번호: 230);
f) GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG (서열번호: 231);
g) GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG (서열번호: 232);
h) GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG (서열번호: 233);
i) GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG (서열번호: 234);
j) GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG (서열번호: 235);
k) GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG (서열번호: 236);
l) GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG (서열번호: 237);
m) GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG (서열번호: 238);
n) GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG (서열번호: 239);
o) GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG (서열번호: 240);
p) GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG (서열번호: 241); 또는
q) GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG (서열번호: 242).
- 청구항 112 내지 182 중 어느 한 항에 있어서, 제2 가이드 RNA는 다음으로부터 선택되는 폴리뉴클레오티드 서열을 포함하는, 방법:
a) gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 191);
b) gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 192);
c) gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 193);
d) GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 194);
e) gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 195);
f) gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 196);
g) gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 197);
h) GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 198);
i) GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 190);
j) gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 200);
k) gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 201);
l) GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 202);
m) gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 203);
n) gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 204);
o) gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 205);
p) GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 206);
q) gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 207);
r) gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 208 );
s) gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 209);
t) gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 210);
u) gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 211);
v) gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 212);
w) gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 213);
x) gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 214);
y) GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 215);
z) gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 216);
aa) gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 217);
bb) gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 218);
cc) GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 219);
dd) gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 220);
ee) gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 221);
ff) gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 222);
gg) gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 223);
hh) gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 224);
ii) gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 225);
jj) gCACCAUGAGCGAGGUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 524);
kk) gGCCACCAUGAGCGAGGUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 525);
ll) GUGUCGAAGUUCGCCCUGGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 526);
mm) gAUGCCGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 527);
nn) gAUGCCGAGAUAAUGGCCCUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 528);
oo) gAUGCCGAGAUCAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 529);
pp) gAUGCCGAGAUCAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 530);
qq) gAUGCCGAGAUCAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 531);
rr) gAUGCCGAGAUCAUGGCGCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 532);
ss) gAUGCCGAGAUCAUGGCGCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 533);
tt) gAUGCCGAGAUCAUGGCGUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 534);
uu) gAUGCCGAGAUUAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 535);
vv) gAUGCCGAGAUUAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 536);
ww) gAUGCCGAGAUUAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 537);
xx) gAUGCCGAGAUUAUGGCACUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 538);
yy) gAUGCCGAGAUUAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 539);
zz) gAUGCCGAGAUUAUGGCUCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 540);
aaa) gAUGCGGAGAUCAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 541);
bbb) gAUGCUGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 542);
ccc) gAACCGCACAUGCCGAAAUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 543);
ddd) gGCAGGUGUCGACAUAUCUAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 544);
eee) gAUGCCGAAAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 545);
fff) gACACAUGACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 546); 또는
ggg) gGCCCCAGCACACAUGACACAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (서열번호: 547).
- 청구항 111 내지 127 또는 129 내지 183 중 어느 한 항에 있어서, 폴리뉴클레오티드가 링커 폴리뉴클레오티드 서열을 추가로 포함하는, 방법.
- 청구항 184에 있어서, 인트론은 링커 폴리뉴클레오티드 서열 내에 삽입되는 것인, 방법.
- 청구항 126 내지 130 중 어느 한 항에 있어서, 개체 또는 유기체가 인간인 것인, 방법.
- 청구항 186에 있어서, 개체 또는 유기체는 포유류인 것인, 방법.
- 청구항 187에 있어서, 포유류는 인간인 것인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163194431P | 2021-05-28 | 2021-05-28 | |
US63/194,431 | 2021-05-28 | ||
PCT/US2022/031419 WO2022251687A2 (en) | 2021-05-28 | 2022-05-27 | Compositions and methods for the self-inactivation of base editors |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240012377A true KR20240012377A (ko) | 2024-01-29 |
Family
ID=84230360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237039212A KR20240012377A (ko) | 2021-05-28 | 2022-05-27 | 염기 편집기의 자기-불활성화용 조성물 및 방법 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP4346840A2 (ko) |
KR (1) | KR20240012377A (ko) |
CN (1) | CN117729926A (ko) |
AU (1) | AU2022280952A1 (ko) |
CA (1) | CA3219628A1 (ko) |
WO (1) | WO2022251687A2 (ko) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018027078A1 (en) * | 2016-08-03 | 2018-02-08 | President And Fellows Of Harard College | Adenosine nucleobase editors and uses thereof |
AU2018378672A1 (en) * | 2017-12-06 | 2020-07-09 | Generation Bio Co. | Gene editing using a modified closed-ended dna (ceDNA) |
US20230159956A1 (en) * | 2018-05-11 | 2023-05-25 | Beam Therapeutics Inc. | Methods of editing single nucleotide polymorphism using programmable base editor systems |
-
2022
- 2022-05-27 WO PCT/US2022/031419 patent/WO2022251687A2/en active Application Filing
- 2022-05-27 CN CN202280036220.2A patent/CN117729926A/zh active Pending
- 2022-05-27 EP EP22812298.2A patent/EP4346840A2/en active Pending
- 2022-05-27 CA CA3219628A patent/CA3219628A1/en active Pending
- 2022-05-27 AU AU2022280952A patent/AU2022280952A1/en active Pending
- 2022-05-27 KR KR1020237039212A patent/KR20240012377A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
CA3219628A1 (en) | 2022-12-01 |
WO2022251687A2 (en) | 2022-12-01 |
EP4346840A2 (en) | 2024-04-10 |
AU2022280952A1 (en) | 2023-11-23 |
AU2022280952A9 (en) | 2023-11-30 |
WO2022251687A3 (en) | 2023-01-19 |
CN117729926A (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020223060B2 (en) | Compositions and methods for treating hemoglobinopathies | |
JP2022546608A (ja) | 新規核酸塩基エディター及びその使用方法 | |
KR20210023831A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 병원성 아미노산을 치환하는 방법 | |
US20220387622A1 (en) | Methods of editing a single nucleotide polymorphism using programmable base editor systems | |
WO2020168135A1 (en) | Compositions and methods for treating alpha-1 antitrypsin deficiency | |
EP4022050A2 (en) | Compositions and methods for editing a mutation to permit transcription or expression | |
AU2020276218A1 (en) | Compositions and methods for treating hepatitis B | |
US20220290164A1 (en) | Recombinant rabies viruses for gene therapy | |
KR20240012377A (ko) | 염기 편집기의 자기-불활성화용 조성물 및 방법 | |
JP2024511163A (ja) | アデノシンデアミナーゼバリアント及びその使用 | |
CA3198671A1 (en) | Compositions and methods for treating glycogen storage disease type 1a | |
CN117729931A (zh) | 用于治疗转甲状腺素蛋白淀粉样变性的组合物和方法 | |
CA3225808A1 (en) | Context-specific adenine base editors and uses thereof | |
WO2023049935A1 (en) | Compositions and methods for treating hepatitis b virus infection | |
WO2023086953A1 (en) | Compositions and methods for the treatment of hereditary angioedema (hae) | |
CN117561074A (zh) | 腺苷脱氨酶变体及其用途 |