KR20230054457A - 카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법 - Google Patents
카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법 Download PDFInfo
- Publication number
- KR20230054457A KR20230054457A KR1020237010115A KR20237010115A KR20230054457A KR 20230054457 A KR20230054457 A KR 20230054457A KR 1020237010115 A KR1020237010115 A KR 1020237010115A KR 20237010115 A KR20237010115 A KR 20237010115A KR 20230054457 A KR20230054457 A KR 20230054457A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- leu
- seq
- lys
- glu
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 108091028043 Nucleic acid sequence Proteins 0.000 title claims abstract description 41
- 239000012636 effector Substances 0.000 claims abstract description 321
- 102000008579 Transposases Human genes 0.000 claims abstract description 271
- 108010020764 Transposases Proteins 0.000 claims abstract description 271
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 239
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 238
- 239000002773 nucleotide Substances 0.000 claims abstract description 236
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 225
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 225
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 157
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 157
- 239000002157 polynucleotide Substances 0.000 claims abstract description 157
- 102000018120 Recombinases Human genes 0.000 claims abstract description 137
- 108010091086 Recombinases Proteins 0.000 claims abstract description 137
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 149
- 229920001184 polypeptide Polymers 0.000 claims description 133
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 133
- 101710163270 Nuclease Proteins 0.000 claims description 65
- 108010042407 Endonucleases Proteins 0.000 claims description 62
- 108020005004 Guide RNA Proteins 0.000 claims description 33
- 125000006850 spacer group Chemical group 0.000 claims description 24
- 102000004533 Endonucleases Human genes 0.000 claims description 22
- 244000005700 microbiome Species 0.000 claims description 13
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 claims 17
- 102000004357 Transferases Human genes 0.000 claims 1
- 108090000992 Transferases Proteins 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 description 140
- 102000004169 proteins and genes Human genes 0.000 description 113
- 235000018102 proteins Nutrition 0.000 description 111
- 210000004027 cell Anatomy 0.000 description 71
- 108020004414 DNA Proteins 0.000 description 70
- 102000053602 DNA Human genes 0.000 description 70
- 230000005945 translocation Effects 0.000 description 44
- 102100031780 Endonuclease Human genes 0.000 description 40
- 230000000694 effects Effects 0.000 description 40
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 36
- 108010050848 glycylleucine Proteins 0.000 description 36
- 230000017105 transposition Effects 0.000 description 36
- 239000013612 plasmid Substances 0.000 description 35
- 238000000338 in vitro Methods 0.000 description 34
- 108010061833 Integrases Proteins 0.000 description 32
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 32
- 229920002477 rna polymer Polymers 0.000 description 31
- 102100034343 Integrase Human genes 0.000 description 28
- 230000010354 integration Effects 0.000 description 28
- 238000009739 binding Methods 0.000 description 26
- 230000027455 binding Effects 0.000 description 25
- 230000006870 function Effects 0.000 description 21
- 235000001014 amino acid Nutrition 0.000 description 20
- 108010064235 lysylglycine Proteins 0.000 description 20
- 229940024606 amino acid Drugs 0.000 description 19
- 150000001413 amino acids Chemical class 0.000 description 19
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 18
- 230000000295 complement effect Effects 0.000 description 18
- 239000012634 fragment Substances 0.000 description 18
- 239000000047 product Substances 0.000 description 17
- 108010005233 alanylglutamic acid Proteins 0.000 description 16
- 230000003197 catalytic effect Effects 0.000 description 16
- 102000004190 Enzymes Human genes 0.000 description 15
- 108090000790 Enzymes Proteins 0.000 description 15
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 15
- 108010092854 aspartyllysine Proteins 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 15
- 230000008685 targeting Effects 0.000 description 15
- 230000037431 insertion Effects 0.000 description 14
- 238000003780 insertion Methods 0.000 description 14
- 108091034117 Oligonucleotide Proteins 0.000 description 13
- 108010034529 leucyl-lysine Proteins 0.000 description 13
- 239000003550 marker Substances 0.000 description 13
- 241000588724 Escherichia coli Species 0.000 description 12
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 12
- 108010061238 threonyl-glycine Proteins 0.000 description 12
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 11
- 241000880493 Leptailurus serval Species 0.000 description 11
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 11
- 108010054155 lysyllysine Proteins 0.000 description 11
- 238000007481 next generation sequencing Methods 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- 108010087924 alanylproline Proteins 0.000 description 10
- 108010013835 arginine glutamate Proteins 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 108010051242 phenylalanylserine Proteins 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 229950010342 uridine triphosphate Drugs 0.000 description 10
- 108010044940 alanylglutamine Proteins 0.000 description 9
- 108010077245 asparaginyl-proline Proteins 0.000 description 9
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 9
- 108010049041 glutamylalanine Proteins 0.000 description 9
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 9
- 108010017391 lysylvaline Proteins 0.000 description 9
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 8
- 108010008355 arginyl-glutamine Proteins 0.000 description 8
- 108010068265 aspartyltyrosine Proteins 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 108010015792 glycyllysine Proteins 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 108010009298 lysylglutamic acid Proteins 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 108010080629 tryptophan-leucine Proteins 0.000 description 8
- 108010073969 valyllysine Proteins 0.000 description 8
- 238000010453 CRISPR/Cas method Methods 0.000 description 7
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 7
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 7
- 108010041407 alanylaspartic acid Proteins 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 7
- 108010062796 arginyllysine Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 108010016616 cysteinylglycine Proteins 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 238000007480 sanger sequencing Methods 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 6
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 6
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 6
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 6
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 108010060035 arginylproline Proteins 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 6
- 238000002337 electrophoretic mobility shift assay Methods 0.000 description 6
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 6
- 108010038320 lysylphenylalanine Proteins 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 229920002401 polyacrylamide Polymers 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 108010048818 seryl-histidine Proteins 0.000 description 6
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 5
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 5
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 5
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 5
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 5
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 5
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 5
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 5
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 5
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- 230000001086 cytosolic effect Effects 0.000 description 5
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 238000010362 genome editing Methods 0.000 description 5
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 108010087823 glycyltyrosine Proteins 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 108010015796 prolylisoleucine Proteins 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 239000001226 triphosphate Substances 0.000 description 5
- 235000011178 triphosphate Nutrition 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 4
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 4
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 4
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 4
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 4
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 4
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 4
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 4
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 4
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 4
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 4
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 4
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 4
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 4
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 4
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 4
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 4
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 4
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 4
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 4
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 4
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 4
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 4
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 4
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 4
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 4
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 4
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 4
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 4
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 4
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 4
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 108010066427 N-valyltryptophan Proteins 0.000 description 4
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 4
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 4
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 4
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 4
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 4
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 4
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- VYXSBFYARXAAKO-UHFFFAOYSA-N ethyl 2-[3-(ethylamino)-6-ethylimino-2,7-dimethylxanthen-9-yl]benzoate;hydron;chloride Chemical compound [Cl-].C1=2C=C(C)C(NCC)=CC=2OC2=CC(=[NH+]CC)C(C)=CC2=C1C1=CC=CC=C1C(=O)OCC VYXSBFYARXAAKO-UHFFFAOYSA-N 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 108010000761 leucylarginine Proteins 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 4
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 4
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 3
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 3
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 3
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 3
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 3
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 3
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 3
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 3
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 3
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 3
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 3
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 3
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 3
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 3
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 3
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 3
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 3
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 3
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 3
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 3
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 3
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 3
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 3
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 3
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 3
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 3
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 3
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 3
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 3
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 3
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 3
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 3
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 3
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 3
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 3
- 241000282465 Canis Species 0.000 description 3
- -1 Cascade Blue Chemical compound 0.000 description 3
- 108010053770 Deoxyribonucleases Proteins 0.000 description 3
- 102000016911 Deoxyribonucleases Human genes 0.000 description 3
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 3
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 3
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 3
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 3
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 3
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 3
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 3
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 3
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 3
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 3
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 3
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 3
- 108050008753 HNH endonucleases Proteins 0.000 description 3
- 102000000310 HNH endonucleases Human genes 0.000 description 3
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 3
- LDFWDDVELNOGII-MXAVVETBSA-N His-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N LDFWDDVELNOGII-MXAVVETBSA-N 0.000 description 3
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 3
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 3
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 3
- AREBLHSMLMRICD-PYJNHQTQSA-N Ile-His-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AREBLHSMLMRICD-PYJNHQTQSA-N 0.000 description 3
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 3
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 3
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 3
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 3
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 3
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 3
- 102000012330 Integrases Human genes 0.000 description 3
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 3
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 3
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 3
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 3
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 3
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 3
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 3
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 3
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 3
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 3
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 3
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 3
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 3
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 3
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 3
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 3
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 3
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 3
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 3
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 3
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 3
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 3
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 3
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 3
- KXYLFJIQDIMURW-IHPCNDPISA-N Lys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCCN)=CNC2=C1 KXYLFJIQDIMURW-IHPCNDPISA-N 0.000 description 3
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 3
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 3
- ZDJICAUBMUKVEJ-CIUDSAMLSA-N Met-Ser-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O ZDJICAUBMUKVEJ-CIUDSAMLSA-N 0.000 description 3
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 3
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 3
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 3
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 3
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 3
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 3
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 3
- JJKSSJVYOVRJMZ-FXQIFTODSA-N Ser-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)CN=C(N)N JJKSSJVYOVRJMZ-FXQIFTODSA-N 0.000 description 3
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 3
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 3
- 241000191967 Staphylococcus aureus Species 0.000 description 3
- 239000004098 Tetracycline Substances 0.000 description 3
- VOGXLRKCWFLJBY-HSHDSVGOSA-N Thr-Arg-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VOGXLRKCWFLJBY-HSHDSVGOSA-N 0.000 description 3
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 3
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- OBWQLWYNNZPWGX-QEJZJMRPSA-N Trp-Gln-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OBWQLWYNNZPWGX-QEJZJMRPSA-N 0.000 description 3
- XKDOQXAXKFQWQJ-SRVKXCTJSA-N Tyr-Cys-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O XKDOQXAXKFQWQJ-SRVKXCTJSA-N 0.000 description 3
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 3
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 3
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 3
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 3
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 3
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 3
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 3
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 3
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 3
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 3
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 3
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 3
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 3
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 3
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 108010011559 alanylphenylalanine Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 108010054813 diprotin B Proteins 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 108010053037 kyotorphin Proteins 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 3
- 229920002521 macromolecule Polymers 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 235000004252 protein component Nutrition 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 3
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 229960002180 tetracycline Drugs 0.000 description 3
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 3
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 2
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 2
- DWINFPQUSSHSFS-UVBJJODRSA-N Ala-Arg-Trp Chemical compound N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O DWINFPQUSSHSFS-UVBJJODRSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 2
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 2
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 2
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 2
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 2
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 2
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 2
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 2
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 2
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 2
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 2
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 2
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 2
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 2
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 2
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 2
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 2
- QJWLLRZTJFPCHA-STECZYCISA-N Arg-Tyr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QJWLLRZTJFPCHA-STECZYCISA-N 0.000 description 2
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 2
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 2
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 2
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 2
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 2
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- UYXXMIZGHYKYAT-NHCYSSNCSA-N Asn-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N UYXXMIZGHYKYAT-NHCYSSNCSA-N 0.000 description 2
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 2
- KMCRKVOLRCOMBG-DJFWLOJKSA-N Asn-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KMCRKVOLRCOMBG-DJFWLOJKSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 2
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 2
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 2
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 2
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 2
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 2
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 2
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 2
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 2
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 2
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 2
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 2
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 2
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 2
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 2
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 2
- RKNIUWSZIAUEPK-PBCZWWQYSA-N Asp-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N)O RKNIUWSZIAUEPK-PBCZWWQYSA-N 0.000 description 2
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 2
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 2
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 2
- NONWUQAWAANERO-BZSNNMDCSA-N Asp-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 NONWUQAWAANERO-BZSNNMDCSA-N 0.000 description 2
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 2
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 2
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 2
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 2
- KGIHMGPYGXBYJJ-SRVKXCTJSA-N Cys-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CS KGIHMGPYGXBYJJ-SRVKXCTJSA-N 0.000 description 2
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 2
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 2
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 2
- SSWAFVQFQWOJIJ-XIRDDKMYSA-N Gln-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N SSWAFVQFQWOJIJ-XIRDDKMYSA-N 0.000 description 2
- PCKOTDPDHIBGRW-CIUDSAMLSA-N Gln-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N PCKOTDPDHIBGRW-CIUDSAMLSA-N 0.000 description 2
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 2
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 2
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 2
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 2
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 2
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- FGWRYRAVBVOHIB-XIRDDKMYSA-N Gln-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O FGWRYRAVBVOHIB-XIRDDKMYSA-N 0.000 description 2
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 2
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 2
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 2
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 2
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 2
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 2
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 2
- OWVURWCRZZMAOZ-XHNCKOQMSA-N Glu-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OWVURWCRZZMAOZ-XHNCKOQMSA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 2
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 2
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 2
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 2
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 2
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- JPUNZXVHHRZMNL-XIRDDKMYSA-N Glu-Pro-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JPUNZXVHHRZMNL-XIRDDKMYSA-N 0.000 description 2
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 2
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 2
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 2
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 2
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 2
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 2
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- LGQZOQRDEUIZJY-YUMQZZPRSA-N Gly-Cys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O LGQZOQRDEUIZJY-YUMQZZPRSA-N 0.000 description 2
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 2
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 2
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 2
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- ZWRDOVYMQAAISL-UWVGGRQHSA-N Gly-Met-Lys Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCCN ZWRDOVYMQAAISL-UWVGGRQHSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 2
- RZEDHGORCKRINR-STQMWFEESA-N Gly-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN RZEDHGORCKRINR-STQMWFEESA-N 0.000 description 2
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 2
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 2
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 2
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 2
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 2
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 2
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- APDIECQNNDGFPD-PYJNHQTQSA-N Ile-His-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N APDIECQNNDGFPD-PYJNHQTQSA-N 0.000 description 2
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 2
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 2
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 2
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 2
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 2
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 2
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 2
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 2
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 2
- RWHRUZORDWZESH-ZQINRCPSSA-N Ile-Trp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RWHRUZORDWZESH-ZQINRCPSSA-N 0.000 description 2
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 2
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 108091029795 Intergenic region Proteins 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- KWURTLAFFDOTEQ-GUBZILKMSA-N Leu-Cys-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KWURTLAFFDOTEQ-GUBZILKMSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 2
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 2
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 2
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 2
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 2
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 2
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 2
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 2
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 2
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 2
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 2
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 2
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 2
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 2
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 2
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 2
- XATKLFSXFINPSB-JYJNAYRXSA-N Lys-Tyr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O XATKLFSXFINPSB-JYJNAYRXSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- CTVJSFRHUOSCQQ-DCAQKATOSA-N Met-Arg-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTVJSFRHUOSCQQ-DCAQKATOSA-N 0.000 description 2
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 2
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 2
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 2
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 2
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 2
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 2
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 2
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 2
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 2
- XLTSAUGGDYRFLS-UMPQAUOISA-N Met-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCSC)N)O XLTSAUGGDYRFLS-UMPQAUOISA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 2
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 2
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 2
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 2
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 2
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 2
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 2
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 2
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 2
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 2
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 2
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 2
- QXNSKJLSLYCTMT-FXQIFTODSA-N Pro-Cys-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O QXNSKJLSLYCTMT-FXQIFTODSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 2
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 2
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 2
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 2
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 2
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 2
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 2
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 2
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 2
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 2
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 2
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 2
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 2
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 2
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 2
- DXDMNBJJEXYMLA-UBHSHLNASA-N Trp-Asn-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 DXDMNBJJEXYMLA-UBHSHLNASA-N 0.000 description 2
- SSNGFWKILJLTQM-QEJZJMRPSA-N Trp-Gln-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SSNGFWKILJLTQM-QEJZJMRPSA-N 0.000 description 2
- NLYCSLWTDMPLSX-QEJZJMRPSA-N Trp-Gln-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N NLYCSLWTDMPLSX-QEJZJMRPSA-N 0.000 description 2
- AFSYEUHJBVCPEL-JBACZVJFSA-N Trp-Gln-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 AFSYEUHJBVCPEL-JBACZVJFSA-N 0.000 description 2
- HXNVJPQADLRHGR-JBACZVJFSA-N Trp-Glu-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXNVJPQADLRHGR-JBACZVJFSA-N 0.000 description 2
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 2
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 2
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 2
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 2
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 2
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 2
- AXWBYOVVDRBOGU-SIUGBPQLSA-N Tyr-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AXWBYOVVDRBOGU-SIUGBPQLSA-N 0.000 description 2
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 2
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 2
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 2
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 2
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 2
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 2
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 2
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 2
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 2
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 2
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010073101 phenylalanylleucine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 238000000734 protein sequencing Methods 0.000 description 2
- 229950010131 puromycin Drugs 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000003260 vortexing Methods 0.000 description 2
- 108010027345 wheylin-1 peptide Proteins 0.000 description 2
- SUQWGICKJIJKNO-IHRRRGAJSA-N (2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]acetyl]amino]pentanedioic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O SUQWGICKJIJKNO-IHRRRGAJSA-N 0.000 description 1
- WZUMSFQGYWBRNX-AVGNSLFASA-N (2s)-6-amino-2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-hydroxypropanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]hexanoic acid Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)CN)CC1=CN=CN1 WZUMSFQGYWBRNX-AVGNSLFASA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- LAXVMANLDGWYJP-UHFFFAOYSA-N 2-amino-5-(2-aminoethyl)naphthalene-1-sulfonic acid Chemical compound NC1=CC=C2C(CCN)=CC=CC2=C1S(O)(=O)=O LAXVMANLDGWYJP-UHFFFAOYSA-N 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- SJQRQOKXQKVJGJ-UHFFFAOYSA-N 5-(2-aminoethylamino)naphthalene-1-sulfonic acid Chemical compound C1=CC=C2C(NCCN)=CC=CC2=C1S(O)(=O)=O SJQRQOKXQKVJGJ-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- NJYVEMPWNAYQQN-UHFFFAOYSA-N 5-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 NJYVEMPWNAYQQN-UHFFFAOYSA-N 0.000 description 1
- WQZIDRAQTRIQDX-UHFFFAOYSA-N 6-carboxy-x-rhodamine Chemical compound OC(=O)C1=CC=C(C([O-])=O)C=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 WQZIDRAQTRIQDX-UHFFFAOYSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 108010044087 AS-I toxin Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 1
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- FOWHQTWRLFTELJ-FXQIFTODSA-N Ala-Asp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N FOWHQTWRLFTELJ-FXQIFTODSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 1
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 1
- FRFDXQWNDZMREB-ACZMJKKPSA-N Ala-Cys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRFDXQWNDZMREB-ACZMJKKPSA-N 0.000 description 1
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 1
- YEELWQSXYBJVSV-UWJYBYFXSA-N Ala-Cys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YEELWQSXYBJVSV-UWJYBYFXSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- IXTPACPAXIOCRG-ACZMJKKPSA-N Ala-Glu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N IXTPACPAXIOCRG-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- SHKGHIFSEAGTNL-DLOVCJGASA-N Ala-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 SHKGHIFSEAGTNL-DLOVCJGASA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- IAUSCRHURCZUJP-CIUDSAMLSA-N Ala-Lys-Cys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CS)C(O)=O IAUSCRHURCZUJP-CIUDSAMLSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- DGLQWAFPIXDKRL-UBHSHLNASA-N Ala-Met-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N DGLQWAFPIXDKRL-UBHSHLNASA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- IEAUDUOCWNPZBR-LKTVYLICSA-N Ala-Trp-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IEAUDUOCWNPZBR-LKTVYLICSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 241001600138 Aliivibrio wodanis Species 0.000 description 1
- 244000153158 Ammi visnaga Species 0.000 description 1
- 235000010585 Ammi visnaga Nutrition 0.000 description 1
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- KGSJCPBERYUXCN-BPNCWPANSA-N Arg-Ala-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KGSJCPBERYUXCN-BPNCWPANSA-N 0.000 description 1
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 1
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- CFGHCPUPFHWMCM-FDARSICLSA-N Arg-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N CFGHCPUPFHWMCM-FDARSICLSA-N 0.000 description 1
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 1
- PSOPJDUQUVFSLS-GUBZILKMSA-N Arg-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PSOPJDUQUVFSLS-GUBZILKMSA-N 0.000 description 1
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- XFXZKCRBBOVJKS-BVSLBCMMSA-N Arg-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XFXZKCRBBOVJKS-BVSLBCMMSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- ZUVDFJXRAICIAJ-BPUTZDHNSA-N Arg-Trp-Asp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 ZUVDFJXRAICIAJ-BPUTZDHNSA-N 0.000 description 1
- XOZYYXMHMIEJET-XIRDDKMYSA-N Arg-Trp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O XOZYYXMHMIEJET-XIRDDKMYSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- 241000512259 Ascophyllum nodosum Species 0.000 description 1
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- DXZNJWFECGJCQR-FXQIFTODSA-N Asn-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N DXZNJWFECGJCQR-FXQIFTODSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 1
- VWJFQGXPYOPXJH-ZLUOBGJFSA-N Asn-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)N VWJFQGXPYOPXJH-ZLUOBGJFSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- KWQPAXYXVMHJJR-AVGNSLFASA-N Asn-Gln-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KWQPAXYXVMHJJR-AVGNSLFASA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 1
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 1
- YGHCVNQOZZMHRZ-DJFWLOJKSA-N Asn-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N YGHCVNQOZZMHRZ-DJFWLOJKSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- PBFXCUOEGVJTMV-QXEWZRGKSA-N Asn-Met-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O PBFXCUOEGVJTMV-QXEWZRGKSA-N 0.000 description 1
- UOUHBHOBGDCQPQ-IHPCNDPISA-N Asn-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)N)N UOUHBHOBGDCQPQ-IHPCNDPISA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- GBAWQWASNGUNQF-ZLUOBGJFSA-N Asp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N GBAWQWASNGUNQF-ZLUOBGJFSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 1
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- KVPHTGVUMJGMCX-BIIVOSGPSA-N Asp-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)C(=O)O KVPHTGVUMJGMCX-BIIVOSGPSA-N 0.000 description 1
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 1
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- OEDJQRXNDRUGEU-SRVKXCTJSA-N Asp-Leu-His Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O OEDJQRXNDRUGEU-SRVKXCTJSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- YVHGKXAOSVBGJV-CIUDSAMLSA-N Asp-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N YVHGKXAOSVBGJV-CIUDSAMLSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 1
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- SXLCDCZHNCLFGZ-BPUTZDHNSA-N Asp-Pro-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SXLCDCZHNCLFGZ-BPUTZDHNSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 1
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- LTARLVHGOGBRHN-AAEUAGOBSA-N Asp-Trp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O LTARLVHGOGBRHN-AAEUAGOBSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- LEYKQPDPZJIRTA-AQZXSJQPSA-N Asp-Trp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LEYKQPDPZJIRTA-AQZXSJQPSA-N 0.000 description 1
- KNOGLZBISUBTFW-QRTARXTBSA-N Asp-Trp-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O KNOGLZBISUBTFW-QRTARXTBSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000209443 Ceratophyllum demersum Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 244000249214 Chlorella pyrenoidosa Species 0.000 description 1
- 235000007091 Chlorella pyrenoidosa Nutrition 0.000 description 1
- 241000243321 Cnidaria Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- KQLDDLUWUFBQHP-UHFFFAOYSA-N Cordycepin Natural products C1=NC=2C(N)=NC=NC=2N1C1OCC(CO)C1O KQLDDLUWUFBQHP-UHFFFAOYSA-N 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- FMDCYTBSPZMPQE-JBDRJPRFSA-N Cys-Ala-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMDCYTBSPZMPQE-JBDRJPRFSA-N 0.000 description 1
- DCJNIJAWIRPPBB-CIUDSAMLSA-N Cys-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N DCJNIJAWIRPPBB-CIUDSAMLSA-N 0.000 description 1
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 1
- JTNKVWLMDHIUOG-IHRRRGAJSA-N Cys-Arg-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JTNKVWLMDHIUOG-IHRRRGAJSA-N 0.000 description 1
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 1
- XGIAHEUULGOZHH-GUBZILKMSA-N Cys-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N XGIAHEUULGOZHH-GUBZILKMSA-N 0.000 description 1
- HRJLVSQKBLZHSR-ZLUOBGJFSA-N Cys-Asn-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O HRJLVSQKBLZHSR-ZLUOBGJFSA-N 0.000 description 1
- KLLFLHBKSJAUMZ-ACZMJKKPSA-N Cys-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N KLLFLHBKSJAUMZ-ACZMJKKPSA-N 0.000 description 1
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 1
- UUERSUCTHOZPMG-SRVKXCTJSA-N Cys-Asn-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UUERSUCTHOZPMG-SRVKXCTJSA-N 0.000 description 1
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 1
- AVFGSUXQKHIQJS-QEJZJMRPSA-N Cys-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CS)N)C(O)=O)=CNC2=C1 AVFGSUXQKHIQJS-QEJZJMRPSA-N 0.000 description 1
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 1
- UYYZZJXUVIZTMH-AVGNSLFASA-N Cys-Glu-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UYYZZJXUVIZTMH-AVGNSLFASA-N 0.000 description 1
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- RWAZRMXTVSIVJR-YUMQZZPRSA-N Cys-Gly-His Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CNC=N1)C(O)=O RWAZRMXTVSIVJR-YUMQZZPRSA-N 0.000 description 1
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 1
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 1
- YKKHFPGOZXQAGK-QWRGUYRKSA-N Cys-Gly-Tyr Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YKKHFPGOZXQAGK-QWRGUYRKSA-N 0.000 description 1
- RRJOQIBQVZDVCW-SRVKXCTJSA-N Cys-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N RRJOQIBQVZDVCW-SRVKXCTJSA-N 0.000 description 1
- HAYVLBZZBDCKRA-SRVKXCTJSA-N Cys-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N HAYVLBZZBDCKRA-SRVKXCTJSA-N 0.000 description 1
- QCUJUETWTSWPNZ-NAKRPEOUSA-N Cys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CS)N QCUJUETWTSWPNZ-NAKRPEOUSA-N 0.000 description 1
- YFAFBAPQHGULQT-HJPIBITLSA-N Cys-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N YFAFBAPQHGULQT-HJPIBITLSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 1
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 1
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 1
- KVGPYKUIHZJWGA-BQBZGAKWSA-N Cys-Met-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O KVGPYKUIHZJWGA-BQBZGAKWSA-N 0.000 description 1
- ZGERHCJBLPQPGV-ACZMJKKPSA-N Cys-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N ZGERHCJBLPQPGV-ACZMJKKPSA-N 0.000 description 1
- DRXOWZZHCSBUOI-YJRXYDGGSA-N Cys-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N)O DRXOWZZHCSBUOI-YJRXYDGGSA-N 0.000 description 1
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 1
- MHYHLWUGWUBUHF-GUBZILKMSA-N Cys-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N MHYHLWUGWUBUHF-GUBZILKMSA-N 0.000 description 1
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000258955 Echinodermata Species 0.000 description 1
- 102100030011 Endoribonuclease Human genes 0.000 description 1
- 108010093099 Endoribonucleases Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- DLOHWQXXGMEZDW-CIUDSAMLSA-N Gln-Arg-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DLOHWQXXGMEZDW-CIUDSAMLSA-N 0.000 description 1
- LTLXPHKSQQILNF-CIUDSAMLSA-N Gln-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N LTLXPHKSQQILNF-CIUDSAMLSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- PONUFVLSGMQFAI-AVGNSLFASA-N Gln-Asn-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PONUFVLSGMQFAI-AVGNSLFASA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- FJAYYNIXQNERSO-ACZMJKKPSA-N Gln-Cys-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FJAYYNIXQNERSO-ACZMJKKPSA-N 0.000 description 1
- GNDJOCGXGLNCKY-ACZMJKKPSA-N Gln-Cys-Cys Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O GNDJOCGXGLNCKY-ACZMJKKPSA-N 0.000 description 1
- CXFUMJQFZVCETK-FXQIFTODSA-N Gln-Cys-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O CXFUMJQFZVCETK-FXQIFTODSA-N 0.000 description 1
- VVWWRZZMPSPVQU-KBIXCLLPSA-N Gln-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N VVWWRZZMPSPVQU-KBIXCLLPSA-N 0.000 description 1
- PZVJDMJHKUWSIV-AVGNSLFASA-N Gln-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)O PZVJDMJHKUWSIV-AVGNSLFASA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- WVUZERSNWGUKJY-BPUTZDHNSA-N Gln-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N WVUZERSNWGUKJY-BPUTZDHNSA-N 0.000 description 1
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- GLAPJAHOPFSLKL-SRVKXCTJSA-N Gln-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N GLAPJAHOPFSLKL-SRVKXCTJSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 1
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 1
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 1
- NMYFPKCIGUJMIK-GUBZILKMSA-N Gln-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NMYFPKCIGUJMIK-GUBZILKMSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 1
- KFHASAPTUOASQN-JYJNAYRXSA-N Gln-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KFHASAPTUOASQN-JYJNAYRXSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 1
- CMBXOSFZCFGDLE-IHRRRGAJSA-N Gln-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O CMBXOSFZCFGDLE-IHRRRGAJSA-N 0.000 description 1
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- KHHDJQRWIFHXHS-NRPADANISA-N Gln-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHHDJQRWIFHXHS-NRPADANISA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 1
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- LSTFYPOGBGFIPP-FXQIFTODSA-N Glu-Cys-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O LSTFYPOGBGFIPP-FXQIFTODSA-N 0.000 description 1
- ISXJHXGYMJKXOI-GUBZILKMSA-N Glu-Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O ISXJHXGYMJKXOI-GUBZILKMSA-N 0.000 description 1
- UENPHLAAKDPZQY-XKBZYTNZSA-N Glu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O UENPHLAAKDPZQY-XKBZYTNZSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- QBLCUWAGTGRXAY-UHFFFAOYSA-N Glu-Glu-Tyr-Tyr Chemical compound C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)N)CC1=CC=C(O)C=C1 QBLCUWAGTGRXAY-UHFFFAOYSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 1
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- BIHMNDPWRUROFZ-JYJNAYRXSA-N Glu-His-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BIHMNDPWRUROFZ-JYJNAYRXSA-N 0.000 description 1
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- JJSVALISDCNFCU-SZMVWBNQSA-N Glu-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JJSVALISDCNFCU-SZMVWBNQSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- ZTVGZOIBLRPQNR-KKUMJFAQSA-N Glu-Met-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZTVGZOIBLRPQNR-KKUMJFAQSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- VJVAQZYGLMJPTK-QEJZJMRPSA-N Glu-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VJVAQZYGLMJPTK-QEJZJMRPSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 1
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 1
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 1
- MQVNVZUEPUIAFA-WDSKDSINSA-N Gly-Cys-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN MQVNVZUEPUIAFA-WDSKDSINSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- LEGMTEAZGRRIMY-ZKWXMUAHSA-N Gly-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN LEGMTEAZGRRIMY-ZKWXMUAHSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 1
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 1
- PYFHPYDQHCEVIT-KBPBESRZSA-N Gly-Trp-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O PYFHPYDQHCEVIT-KBPBESRZSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- MBSSHYPAEHPSGY-LSJOCFKGSA-N His-Ala-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O MBSSHYPAEHPSGY-LSJOCFKGSA-N 0.000 description 1
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- CJGDTAHEMXLRMB-ULQDDVLXSA-N His-Arg-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CJGDTAHEMXLRMB-ULQDDVLXSA-N 0.000 description 1
- WJUYPBBCSSLVJE-CIUDSAMLSA-N His-Asn-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N WJUYPBBCSSLVJE-CIUDSAMLSA-N 0.000 description 1
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 1
- FAQYEASGXHQQAA-XIRDDKMYSA-N His-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC3=CN=CN3)N FAQYEASGXHQQAA-XIRDDKMYSA-N 0.000 description 1
- CYHWWHKRCKHYGQ-GUBZILKMSA-N His-Cys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CYHWWHKRCKHYGQ-GUBZILKMSA-N 0.000 description 1
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 1
- LPZUKJALYGXBIE-SRVKXCTJSA-N His-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N LPZUKJALYGXBIE-SRVKXCTJSA-N 0.000 description 1
- IMPKSPYRPUXYAP-SZMVWBNQSA-N His-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC3=CN=CN3)N IMPKSPYRPUXYAP-SZMVWBNQSA-N 0.000 description 1
- YTKOTXRIWQHSAZ-GUBZILKMSA-N His-Glu-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N YTKOTXRIWQHSAZ-GUBZILKMSA-N 0.000 description 1
- TXLQHACKRLWYCM-DCAQKATOSA-N His-Glu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O TXLQHACKRLWYCM-DCAQKATOSA-N 0.000 description 1
- VTMLJMNQHKBPON-QWRGUYRKSA-N His-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 VTMLJMNQHKBPON-QWRGUYRKSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- ORZGPQXISSXQGW-IHRRRGAJSA-N His-His-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O ORZGPQXISSXQGW-IHRRRGAJSA-N 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- NDKSHNQINMRKHT-PEXQALLHSA-N His-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N NDKSHNQINMRKHT-PEXQALLHSA-N 0.000 description 1
- BILZDIPAKWZFSG-PYJNHQTQSA-N His-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N BILZDIPAKWZFSG-PYJNHQTQSA-N 0.000 description 1
- WTJBVCUCLWFGAH-JUKXBJQTSA-N His-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WTJBVCUCLWFGAH-JUKXBJQTSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 1
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 1
- XKIYNCLILDLGRS-QWRGUYRKSA-N His-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 XKIYNCLILDLGRS-QWRGUYRKSA-N 0.000 description 1
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 1
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WHKLDLQHSYAVGU-ACRUOGEOSA-N His-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WHKLDLQHSYAVGU-ACRUOGEOSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 1
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- KECFCPNPPYCGBL-PMVMPFDFSA-N His-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CN=CN4)N KECFCPNPPYCGBL-PMVMPFDFSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- RNVUQLOKVIPNEM-BZSNNMDCSA-N His-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O RNVUQLOKVIPNEM-BZSNNMDCSA-N 0.000 description 1
- CMPHFUWXKBPNRS-WDSOQIARSA-N His-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 CMPHFUWXKBPNRS-WDSOQIARSA-N 0.000 description 1
- 108091006054 His-tagged proteins Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 241001504070 Huperzia Species 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- DXUJSRIVSWEOAG-NAKRPEOUSA-N Ile-Arg-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N DXUJSRIVSWEOAG-NAKRPEOUSA-N 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 1
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- LDRALPZEVHVXEK-KBIXCLLPSA-N Ile-Cys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N LDRALPZEVHVXEK-KBIXCLLPSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 1
- VCYVLFAWCJRXFT-HJPIBITLSA-N Ile-Cys-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N VCYVLFAWCJRXFT-HJPIBITLSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- WNQKUUQIVDDAFA-ZPFDUUQYSA-N Ile-Gln-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N WNQKUUQIVDDAFA-ZPFDUUQYSA-N 0.000 description 1
- QHGBCRCMBCWMBJ-UHFFFAOYSA-N Ile-Glu-Ala-Lys Natural products CCC(C)C(N)C(=O)NC(CCC(O)=O)C(=O)NC(C)C(=O)NC(C(O)=O)CCCCN QHGBCRCMBCWMBJ-UHFFFAOYSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- LWWILHPVAKKLQS-QXEWZRGKSA-N Ile-Gly-Met Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N LWWILHPVAKKLQS-QXEWZRGKSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 1
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 1
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- JJQQGCMKLOEGAV-OSUNSFLBSA-N Ile-Thr-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)O)N JJQQGCMKLOEGAV-OSUNSFLBSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- RTSQPLLOYSGMKM-DSYPUSFNSA-N Ile-Trp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N RTSQPLLOYSGMKM-DSYPUSFNSA-N 0.000 description 1
- YBHKCXNNNVDYEB-SPOWBLRKSA-N Ile-Trp-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N YBHKCXNNNVDYEB-SPOWBLRKSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 1
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 1
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- DUBAVOVZNZKEQQ-AVGNSLFASA-N Leu-Arg-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCN=C(N)N DUBAVOVZNZKEQQ-AVGNSLFASA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 1
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- PPTAQBNUFKTJKA-BJDJZHNGSA-N Leu-Cys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PPTAQBNUFKTJKA-BJDJZHNGSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 1
- URJUVJDTPXCQFL-IHPCNDPISA-N Leu-Trp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N URJUVJDTPXCQFL-IHPCNDPISA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 1
- LXGSOEPHQJONMG-PMVMPFDFSA-N Leu-Trp-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N LXGSOEPHQJONMG-PMVMPFDFSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 1
- KSFQPRLZAUXXPT-GARJFASQSA-N Lys-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)C(=O)O KSFQPRLZAUXXPT-GARJFASQSA-N 0.000 description 1
- XFBBBRDEQIPGNR-KATARQTJSA-N Lys-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O XFBBBRDEQIPGNR-KATARQTJSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- YFGWNAROEYWGNL-GUBZILKMSA-N Lys-Gln-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YFGWNAROEYWGNL-GUBZILKMSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 1
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- URBJRJKWSUFCKS-AVGNSLFASA-N Lys-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N URBJRJKWSUFCKS-AVGNSLFASA-N 0.000 description 1
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 1
- KVNLHIXLLZBAFQ-RWMBFGLXSA-N Lys-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N KVNLHIXLLZBAFQ-RWMBFGLXSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 1
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 1
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 1
- USPJSTBDIGJPFK-PMVMPFDFSA-N Lys-Tyr-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O USPJSTBDIGJPFK-PMVMPFDFSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 1
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 1
- IVCPHARVJUYDPA-FXQIFTODSA-N Met-Asn-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IVCPHARVJUYDPA-FXQIFTODSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- MYKLINMAGAIRPJ-CIUDSAMLSA-N Met-Gln-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MYKLINMAGAIRPJ-CIUDSAMLSA-N 0.000 description 1
- HLYIDXAXQIJYIG-CIUDSAMLSA-N Met-Gln-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HLYIDXAXQIJYIG-CIUDSAMLSA-N 0.000 description 1
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 1
- GXYYFDKJHLRNSI-SRVKXCTJSA-N Met-Gln-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GXYYFDKJHLRNSI-SRVKXCTJSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- DJDFBVNNDAUPRW-GUBZILKMSA-N Met-Glu-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DJDFBVNNDAUPRW-GUBZILKMSA-N 0.000 description 1
- PQPMMGQTRQFSDA-SRVKXCTJSA-N Met-Glu-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O PQPMMGQTRQFSDA-SRVKXCTJSA-N 0.000 description 1
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 1
- CUICVBQQHMKBRJ-LSJOCFKGSA-N Met-His-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O CUICVBQQHMKBRJ-LSJOCFKGSA-N 0.000 description 1
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 1
- RVYDCISQIGHAFC-ZPFDUUQYSA-N Met-Ile-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O RVYDCISQIGHAFC-ZPFDUUQYSA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- AFVOKRHYSSFPHC-STECZYCISA-N Met-Ile-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFVOKRHYSSFPHC-STECZYCISA-N 0.000 description 1
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 1
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- WXUUEPIDLLQBLJ-DCAQKATOSA-N Met-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N WXUUEPIDLLQBLJ-DCAQKATOSA-N 0.000 description 1
- WYDFQSJOARJAMM-GUBZILKMSA-N Met-Pro-Asp Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WYDFQSJOARJAMM-GUBZILKMSA-N 0.000 description 1
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 1
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 1
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- YJNDFEWPGLNLNH-IHRRRGAJSA-N Met-Tyr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CC=C(O)C=C1 YJNDFEWPGLNLNH-IHRRRGAJSA-N 0.000 description 1
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- KPVLLNDCBYXKNV-CYDGBPFRSA-N Met-Val-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KPVLLNDCBYXKNV-CYDGBPFRSA-N 0.000 description 1
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101100387128 Myxococcus xanthus (strain DK1622) devR gene Proteins 0.000 description 1
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 241001250129 Nannochloropsis gaditana Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 1
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 1
- OXUMFAOVGFODPN-KKUMJFAQSA-N Phe-Asn-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OXUMFAOVGFODPN-KKUMJFAQSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- VUYCNYVLKACHPA-KKUMJFAQSA-N Phe-Asp-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VUYCNYVLKACHPA-KKUMJFAQSA-N 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- PSBJZLMFFTULDX-IXOXFDKPSA-N Phe-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N)O PSBJZLMFFTULDX-IXOXFDKPSA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- PMKIMKUGCSVFSV-CQDKDKBSSA-N Phe-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PMKIMKUGCSVFSV-CQDKDKBSSA-N 0.000 description 1
- PPHFTNABKQRAJV-JYJNAYRXSA-N Phe-His-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PPHFTNABKQRAJV-JYJNAYRXSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- HTXVATDVCRFORF-MGHWNKPDSA-N Phe-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N HTXVATDVCRFORF-MGHWNKPDSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- ZIQQNOXKEFDPBE-BZSNNMDCSA-N Phe-Lys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N ZIQQNOXKEFDPBE-BZSNNMDCSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 1
- NJONQBYLTANINY-IHPCNDPISA-N Phe-Trp-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CC(N)=O)C(O)=O NJONQBYLTANINY-IHPCNDPISA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 1
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000985694 Polypodiopsida Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- NGNNPLJHUFCOMZ-FXQIFTODSA-N Pro-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 NGNNPLJHUFCOMZ-FXQIFTODSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- FFSLAIOXRMOFIZ-GJZGRUSLSA-N Pro-Gly-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)CNC(=O)[C@@H]1CCCN1 FFSLAIOXRMOFIZ-GJZGRUSLSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- JRQCDSNPRNGWRG-AVGNSLFASA-N Pro-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2 JRQCDSNPRNGWRG-AVGNSLFASA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- BWCZJGJKOFUUCN-ZPFDUUQYSA-N Pro-Ile-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O BWCZJGJKOFUUCN-ZPFDUUQYSA-N 0.000 description 1
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 1
- SWRNSCMUXRLHCR-ULQDDVLXSA-N Pro-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 SWRNSCMUXRLHCR-ULQDDVLXSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- DYJTXTCEXMCPBF-UFYCRDLUSA-N Pro-Tyr-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O DYJTXTCEXMCPBF-UFYCRDLUSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 101710086053 Putative endonuclease Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000195474 Sargassum Species 0.000 description 1
- 241000593524 Sargassum patens Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 1
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 1
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- MHVXPTAMDHLTHB-IHPCNDPISA-N Ser-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MHVXPTAMDHLTHB-IHPCNDPISA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 1
- HXPNJVLVHKABMJ-KKUMJFAQSA-N Ser-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N)O HXPNJVLVHKABMJ-KKUMJFAQSA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000320123 Streptococcus pyogenes M1 GAS Species 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 101100273269 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) cse3 gene Proteins 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 1
- RJBFAHKSFNNHAI-XKBZYTNZSA-N Thr-Gln-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O RJBFAHKSFNNHAI-XKBZYTNZSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- XUGYQLFEJYZOKQ-NGTWOADLSA-N Thr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XUGYQLFEJYZOKQ-NGTWOADLSA-N 0.000 description 1
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 1
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- MJBBMTOGSOSAKJ-HJXMPXNTSA-N Trp-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MJBBMTOGSOSAKJ-HJXMPXNTSA-N 0.000 description 1
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 1
- MVHHTXAUJCIOMZ-WDSOQIARSA-N Trp-Arg-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N MVHHTXAUJCIOMZ-WDSOQIARSA-N 0.000 description 1
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 1
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 1
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 1
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 1
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 1
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- GQEXFCQNAJHJTI-IHPCNDPISA-N Trp-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GQEXFCQNAJHJTI-IHPCNDPISA-N 0.000 description 1
- GQNCRIFNDVFRNF-BPUTZDHNSA-N Trp-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O GQNCRIFNDVFRNF-BPUTZDHNSA-N 0.000 description 1
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 1
- ABRICLFKFRFDKS-IHPCNDPISA-N Trp-Ser-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ABRICLFKFRFDKS-IHPCNDPISA-N 0.000 description 1
- RKISDJMICOREEL-QRTARXTBSA-N Trp-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RKISDJMICOREEL-QRTARXTBSA-N 0.000 description 1
- BABINGWMZBWXIX-BPUTZDHNSA-N Trp-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BABINGWMZBWXIX-BPUTZDHNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- CDRYEAWHKJSGAF-BPNCWPANSA-N Tyr-Ala-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O CDRYEAWHKJSGAF-BPNCWPANSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- WDIJBEWLXLQQKD-ULQDDVLXSA-N Tyr-Arg-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O WDIJBEWLXLQQKD-ULQDDVLXSA-N 0.000 description 1
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 1
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- SMLCYZYQFRTLCO-UWJYBYFXSA-N Tyr-Cys-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O SMLCYZYQFRTLCO-UWJYBYFXSA-N 0.000 description 1
- CGDZGRLRXPNCOC-SRVKXCTJSA-N Tyr-Cys-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CGDZGRLRXPNCOC-SRVKXCTJSA-N 0.000 description 1
- QOIKZODVIPOPDD-AVGNSLFASA-N Tyr-Cys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOIKZODVIPOPDD-AVGNSLFASA-N 0.000 description 1
- ZAGPDPNPWYPEIR-SRVKXCTJSA-N Tyr-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ZAGPDPNPWYPEIR-SRVKXCTJSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- OHNXAUCZVWGTLL-KKUMJFAQSA-N Tyr-His-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N)O OHNXAUCZVWGTLL-KKUMJFAQSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- KYPMKDGKAYQCHO-RYUDHWBXSA-N Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- AVFGBGGRZOKSFS-KJEVXHAQSA-N Tyr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O AVFGBGGRZOKSFS-KJEVXHAQSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 1
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 1
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 1
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 1
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- XTOCLOATLKOZAU-JBACZVJFSA-N Tyr-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N XTOCLOATLKOZAU-JBACZVJFSA-N 0.000 description 1
- ABZWHLRQBSBPTO-RNXOBYDBSA-N Tyr-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=C(C=C4)O)N ABZWHLRQBSBPTO-RNXOBYDBSA-N 0.000 description 1
- AXKADNRGSUKLKI-WIRXVTQYSA-N Tyr-Trp-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 AXKADNRGSUKLKI-WIRXVTQYSA-N 0.000 description 1
- GPLTZEMVOCZVAV-UFYCRDLUSA-N Tyr-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 GPLTZEMVOCZVAV-UFYCRDLUSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- VKYDVKAKGDNZED-STECZYCISA-N Tyr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N VKYDVKAKGDNZED-STECZYCISA-N 0.000 description 1
- SMUWZUSWMWVOSL-JYJNAYRXSA-N Tyr-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SMUWZUSWMWVOSL-JYJNAYRXSA-N 0.000 description 1
- CCEVJBJLPRNAFH-BVSLBCMMSA-N Tyr-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N CCEVJBJLPRNAFH-BVSLBCMMSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- WOCYUGQDXPTQPY-FXQIFTODSA-N Val-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N WOCYUGQDXPTQPY-FXQIFTODSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- JOQSQZFKFYJKKJ-GUBZILKMSA-N Val-Arg-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JOQSQZFKFYJKKJ-GUBZILKMSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- UBTBGUDNDFZLGP-SRVKXCTJSA-N Val-Arg-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UBTBGUDNDFZLGP-SRVKXCTJSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 1
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- PHZGFLFMGLXCFG-FHWLQOOXSA-N Val-Lys-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PHZGFLFMGLXCFG-FHWLQOOXSA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- ILMVQSHENUZYIZ-JYJNAYRXSA-N Val-Met-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N ILMVQSHENUZYIZ-JYJNAYRXSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 1
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- KJFBXCFOPAKPTM-BZSNNMDCSA-N Val-Trp-Val Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 KJFBXCFOPAKPTM-BZSNNMDCSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 1
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- AZJLCKAEZFNJDI-DJLDLDEBSA-N [[(2r,3s,5r)-5-(4-aminopyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 AZJLCKAEZFNJDI-DJLDLDEBSA-N 0.000 description 1
- AZRNEVJSOSKAOC-VPHBQDTQSA-N [[(2r,3s,5r)-5-[5-[(e)-3-[6-[5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]hexanoylamino]prop-1-enyl]-2,4-dioxopyrimidin-1-yl]-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(\C=C\CNC(=O)CCCCCNC(=O)CCCC[C@H]2[C@H]3NC(=O)N[C@H]3CS2)=C1 AZRNEVJSOSKAOC-VPHBQDTQSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- ZXZIQGYRHQJWSY-NKWVEPMBSA-N [hydroxy-[[(2s,5r)-5-(6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(NC=NC2=O)=C2N=C1 ZXZIQGYRHQJWSY-NKWVEPMBSA-N 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 101150106467 cas6 gene Proteins 0.000 description 1
- 101150044165 cas7 gene Proteins 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- OFEZSBMBBKLLBJ-BAJZRUMYSA-N cordycepin Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)C[C@H]1O OFEZSBMBBKLLBJ-BAJZRUMYSA-N 0.000 description 1
- OFEZSBMBBKLLBJ-UHFFFAOYSA-N cordycepine Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)CC1O OFEZSBMBBKLLBJ-UHFFFAOYSA-N 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 238000004163 cytometry Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010039747 glycyl-seryl-histidyl-lysine Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 240000004308 marijuana Species 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010065320 prolyl-lysyl-glutamyl-lysine Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000001995 reticulocyte Anatomy 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- 102000023888 sequence-specific DNA binding proteins Human genes 0.000 description 1
- 108091008420 sequence-specific DNA binding proteins Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- IBVCSSOEYUMRLC-GABYNLOESA-N texas red-5-dutp Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(C#CCNS(=O)(=O)C=2C=C(C(C=3C4=CC=5CCCN6CCCC(C=56)=C4OC4=C5C6=[N+](CCC5)CCCC6=CC4=3)=CC=2)S([O-])(=O)=O)=C1 IBVCSSOEYUMRLC-GABYNLOESA-N 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 101150065732 tir gene Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 108010014563 tryptophyl-cysteinyl-serine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Saccharide Compounds (AREA)
- Enzymes And Modification Thereof (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템 및 방법을 제공한다. 이 시스템 및 방법은 재조합효소 또는 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; Cas 이펙터, 및 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 카고 뉴클레오타이드를 표적 핵산 부위로 끌어들이도록 구성된 재조합효소 또는 전위효소 복합체를 포함할 수 있다.
Description
관련 출원
본원은 2020년 8월 24일자로 출원된 미국 가출원 제63/069,703호(발명의 명칭: "SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES"), 2021년 5월 10일자로 출원된 미국 가출원 제63/186,698호(발명의 명칭: "SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES"), 및 2021년 8월 12일자로 출원된 미국 가출원 제63/232,593호(발명의 명칭: "SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES")의 이익을 주장하고, 이 출원들 각각은 전체적으로 본원에 참고로 포함된다.
Cas 효소는 그와 관련된 클러스터링된 규칙적으로 이격된 짧은 팔린드로믹 반복부(CRISPR) 가이드 리보핵산(RNA)과 함께 CRISPR-RNA 가이딩 핵산 절단을 통해 감염성 바이러스 및 플라스미드와 같은 비-자가 핵산으로부터 미생물을 보호하는 역할을 하는, 원핵생물 면역 시스템의 널리 보급된(박테리아의 약 45%, 고세균의 약 84%) 구성요소인 것으로 보인다. CRISPR RNA 요소를 코딩하는 데옥시리보핵산(DNA) 요소는 구조와 길이가 비교적 보존되어 있을 수 있지만, 그의 CRISPR 관련(Cas) 단백질은 매우 다양하며 다양한 핵산 상호작용 도메인을 함유한다. CRISPR DNA 요소는 1987년에 이미 관찰되었지만, CRISPR/Cas 복합체의 프로그래밍 가능한 엔도뉴클레아제(endonuclease) 절단 능력은 비교적 최근에야 인식되어, 다양한 DNA 조작 및 유전자 편집 응용분야에서 재조합 CRISPR/Cas 시스템의 사용으로 이어졌다.
서열목록
본원은 ASCII 형식으로 전자적으로 제출되었고 전체적으로 본원에 참고로 포함되는 서열목록을 함유한다. 2021년 8월 20일자로 생성된 상기 ASCII 사본은 명칭이 55921-714_601_SL.txt이고 크기가 488,452 바이트이다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, 재조합효소(recombinase) 또는 전위효소(transposase) 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 II 타입 II Cas 이펙터, 및 상기 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 카고 뉴클레오타이드 서열을 상기 표적 핵산 부위로 끌어들이도록 구성된 상기 재조합효소 또는 전위효소 복합체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 3'에 위치한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 Tn7 타입 전위효소 복합체이다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 클래스 II 타입 II Cas 이펙터는 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개 또는 4개의 폴리펩티드(들)를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 19 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 II Cas 이펙터 및 상기 재조합효소 또는 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 측면 또는 실시양태 중 임의의 측면 또는 실시양태의 시스템을 발현시키거나 본원에 기재된 측면 또는 실시양태 중 임의의 측면 또는 실시양태의 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터가 아니다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 5'에 위치한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 TnsA 서브유닛은 서열번호 7 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 20 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 21 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터가 아니다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 측면 또는 실시양태 중 어느 한 측면 또는 실시양태의 시스템을 발현시키거나 본원에 기재된 측면 또는 실시양태 중 어느 한 측면 또는 실시양태의 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서, 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을, 클래스 II 타입 II Cas 이펙터, 및 상기 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 상기 카고 뉴클레오타이드를 상기 표적 핵산 부위로 끌어들이도록 구성된 재조합효소 또는 전위효소 복합체; 및 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산과 접촉시키는 단계를 포함하는 방법을 제공한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 표적 핵산은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 3'에 위치한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 Tn7 타입 전위효소 복합체이다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 클래스 II 타입 II Cas 이펙터는 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개 또는 4개의 폴리펩티드(들)를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 19 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 II Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서, 상기 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을, 클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체; 및 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산과 접촉시키는 단계를 포함하는 방법을 제공한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 표적 핵산 부위는 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 3'에 위치한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 TnsA 서브유닛은 서열번호 7 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 20 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 21 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터가 아니다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 I 타입 I-F Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 3'에 위치한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 5'에 위치한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 I 타입 I-F Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 클래스 I 타입 I-F Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 44 내지 46 또는 51 내지 53 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 측면 또는 실시양태 중 어느 한 측면 또는 실시양태의 시스템을 발현시키거나 본원에 기재된 측면 또는 실시양태 중 어느 한 측면 또는 실시양태의 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsB, TnsC 및 TniQ 구성요소를 포함하는 Tn7 타입 전위효소 복합체를 포함하는 시스템을 제공하는 것으로, 이때 (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 폴리펩티드를 포함하거나; (b) 상기 Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 TnsB, TnsC 또는 TniQ 구성요소를 포함한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 TnsB, TnsC 또는 TniQ 구성요소를 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터이다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 5'에 위치한다. 일부 실시양태에서, 상기 PAM 서열은 5'-nGTn-3' 또는 5'-nGTt-3'을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 TnsB, TnsC 및 TniQ 구성요소는 각각 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 125, 127, 123, 129, 131, 133, 153 또는 134 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 126, 155, 128, 124, 130, 132 또는 154 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 22 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 125 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 126 또는 155, 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 90의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 94, 112 또는 202 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 23 내지 25 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 26 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 127 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 128 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드 (i) 서열번호 91, 156 또는 209 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 95, 113 또는 203 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 27 내지 29 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 60 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 131 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 132 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 117, 161 또는 214 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 119의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 101 내지 103 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 147 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 153 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 154 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 151, 181 또는 234 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 152 또는 254의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 148 내지 150 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 34 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 129 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 130 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 93, 157 또는 210 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 97, 114 또는 204 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 148 내지 150 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 30 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 123 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 124 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 92의 적어도 약 46개 내지 80개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 111 또는 201의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB, TnsC 및 TniQ 구성요소는 서열번호 31, 32 및 33 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하거나; (f) 상기 PAM 서열은 5'-nGTn-3' 또는 5'-nGTt-3'을 포함한다.
일부 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서, Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산; 클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및 상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsB 및 TnsC 구성요소를 포함하지만 TnsA 및/또는 TniQ 구성요소를 포함하지 않는 Tn7 타입 전위효소 복합체를 포함하는 시스템을 제공한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 비공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 상기 Cas 이펙터 복합체에 공유 결합한다. 일부 실시양태에서, 상기 전위효소 복합체는 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합된다. 일부 실시양태에서, 상기 Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 TnsB 구성요소는 서열번호 40 또는 109에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 TnsC 구성요소는 서열번호 39 또는 110에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 Cas12k 이펙터이다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터는 서열번호 38 또는 서열번호 108에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 실시양태에서, 상기 표적 핵산 부위를 포함하는 상기 이중 가닥 핵산 또는 상기 시스템은 세포 내부에 있다. 일부 실시양태에서, 상기 시스템은 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 실시양태에서, 상기 PAM 서열은 상기 표적 핵산 부위의 5'에 위치한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 실시양태에서, 상기 TnsB 및 TnsC 구성요소는 각각 서열번호 40 및 39 또는 109 및 110에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 115, 116, 205, 206, 261, 235, 260 또는 236 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 좌측 재조합효소 서열은 서열번호 134에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 우측 재조합효소 서열은 서열번호 135 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다. 일부 실시양태에서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체는 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다. 일부 실시양태에서, (a) 상기 클래스 II 타입 V Cas 이펙터는 서열번호 38 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (b) 상기 좌측 재조합효소 서열은 서열번호 134 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나; (c) 상기 우측 재조합효소 서열은 서열번호 135 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (d) 상기 조작된 가이드 폴리뉴클레오타이드는 (i) 서열번호 182 또는 235의 적어도 약 46개 내지 80개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 98, 115, 116, 205 또는 206의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하거나; (e) 상기 TnsB 및 TnsC 구성요소는 서열번호 40 및 39 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다.
일부 측면에서, 본 개시내용은 RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래하고 상기 엔도뉴클레아제는 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 클래스 II 타입 II 엔도뉴클레아제이고, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고 상기 조작된 가이드 폴리뉴클레오타이드는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함한다.
일부 측면에서, 본 개시내용은 RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제는 서열번호 5에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V 엔도뉴클레아제이고, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 측면에서, 본 개시내용은 RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V-K 엔도뉴클레아제이고, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함한다.
일부 측면에서, 본 개시내용은 RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 엔도뉴클레아제는 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제는 서열번호 38 또는 서열번호 108 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V-K 엔도뉴클레아제이고, 상기 조작된 가이드 폴리뉴클레오타이드는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210, 115, 116, 205, 206, 261, 235, 260 또는 236 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함한다.
일부 측면에서, 본 개시내용은 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 하나의 Cas6, Cas7 또는 Cas8 폴리펩티드를 포함하는 클래스 I 타입 I-F Cas 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템을 제공하는 것으로, 이때 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함한다. 일부 실시양태에서, 상기 조작된 가이드 폴리뉴클레오타이드는 서열번호 121, 122, 207 또는 208 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함한다.
본 개시내용의 추가 측면 및 장점은 본 개시내용의 예시적인 실시양태만이 제시되고 기재되어 있는 하기 상세한 설명으로부터 당분야에서 숙련된 자에게 용이하게 명백해질 것이다. 인식될 바와 같이, 본 개시내용은 다른 상이한 실시양태를 가능하게 하고, 이의 여러 세부사항은 모두 본 개시내용을 벗어나지 않으면서 다양한 자명한 관점에서 변형될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로서 간주되어야 하며, 제한적인 것으로서 간주되어서는 안 된다.
참고에 의한 포함
본 명세서에서 언급된 모든 간행물, 특허 및 특허 출원은, 각각의 개별 간행물, 특허 또는 특허 출원이 참고로 포함되는 것으로 구체적 및 개별적으로 표시된 것처럼 동일한 정도로 본원에 참고로 포함된다.
본 발명의 신규 특징은 첨부된 청구범위에 구체적으로 기재되어 있다. 본 발명의 특징 및 장점은 본 발명의 원리가 활용되는 예시적인 실시양태를 설명하는 하기 상세한 설명 및 첨부된 도면(본원에서 "도면" 및 "도"로서도 기재됨)을 참조함으로써 더 잘 이해될 것이다:
도 1은 상이한 클래스 및 타입의 CRISPR/Cas 유전자좌의 전형적인 조직화를 도시한다.
도 2는 crRNA와 tracrRNA가 연결되어 있는 하이브리드 sgRNA에 비해 천연 클래스 II 타입 II crRNA/tracrRNA 쌍의 구조를 도시한다.
도 3은 Tn7 및 Tn7 유사 요소에서 발견되는 2개의 경로를 도시한다.
도 4는 패밀리 MG36의 타입 II Tn7 환원 CAST의 게놈 환경을 도시한다. 도 4A는 MG36-5 CAST 시스템이 CRISPR 어레이(CRISPR 반복부), RuvC 및 HNH 엔도뉴클레아제 도메인을 가진 타입 II 뉴클레아제, 및 4개의 예측된 전위효소 단백질 오픈 리딩 프레임으로 구성됨을 보여준다. 촉매 전위효소 TnsB는 2개의 서브유닛으로서 코딩된다. 도 4B는 MG36-1 CAST 시스템에 대해 2개의 트랜스포존 말단(TIR-1 및 TIR-2)이 예측됨을 보여준다. 도 4C는 주석이 달린 반복부가 화살표로 표시되어 있는, 예측된 타입 II Tn7 환원 CAST 트랜스포존 좌측 말단(LE) 및 우측 말단(RE) 서열의 정렬을 보여준다. 좌측 말단 및 우측 말단은 이들의 배향으로 표지부착되었다.
도 5는 패밀리 MG39의 타입 V Tn7 CAST의 게놈 환경을 보여준다. 도 5A는 MG39-1 CAST 시스템이 타입 V 뉴클레아제, 4개의 예측된 트랜스포존 단백질(TnsABC 및 TniQ) 및 CRISPR 어레이로 구성됨을 보여준다. MG39-1 CAST 시스템(TIR-1)에 대해 트랜스포존 말단이 예측되었다. 도 5B는 주석이 달린 역반복부가 화살표로 표시되어 있는, 예측된 타입 V Tn7 CAST 트랜스포존 좌측 말단(LE) 및 우측 말단(RE) 서열의 정렬을 보여준다.
도 6 및 도 7은 본원에 기재된 CAST 시스템의 상응하는 sgRNA의 예측된 구조(예를 들어, 실시예 3에서 예측됨)를 도시한다.
도 8은 본원에 기재된 시스템인 MG108-1의 게놈 환경을 도시한다. 이 후보는 천연적으로 TniQ를 결여하는 Cas12K CAST이다. 게놈 단편 내의 유전자는 화살표로 표시되어 있다.
도 9는 Cas12k 이펙터 서열의 계통발생학적 유전자 트리(tree)를 도시한다. 이 트리는 여기서 회수된 64개의 Cas12k 서열(주황색 및 흑색 분지)과 공개 데이터베이스로부터의 229개의 기준 Cas12k 서열(회색 분지)의 다중 서열 정렬로부터 유추되었다. 주황색 분지는 CAST 트랜스포존 구성요소와의 연관성이 확인된 Cas12k 이펙터를 표시한다.
도 10은 MG110 캐스케이드 CAST를 도시한다. A) MG110-1 캐스케이드 CAST의 게놈 환경. 완전한 Tn7 스위트(suite)(TnsA, TnsB, TnsC/TniB, TniQ) 및 결함 캐스케이드 스위트(Cas6, Cas7, 융합된 Cas5-Cas8)는 주황색 화살표로 표시되어 있다. CAST 트랜스포존을 플랭킹하는 TIR은 연결된 화살표로 표시되어 있다. B) 반복부 2차 구조는 crRNA의 스템-루프 구조를 표시한다. C) 아스퍼길루스 우다니스(A. wodanis), 비브리오 콜레라(V. cholerae)로부터의 CRISPR 반복부와 MG110 패밀리 CAST의 서열 정렬은 crRNA 스템-루프 2차 구조를 표시하는 보존된 모티프를 표시한다.
도 11a는 MG64-3 CRISPR 유전자좌를 도시한다. tracrRNA는 CRISPR 어레이로부터 업스트림에 코딩되어 있는 반면, 트랜스포존 말단은 다운스트림에 코딩되어 있다(내부 흑색 상자). 부분적 3' CRISPR 반복부 및 부분적 스페이서에 상응하는 서열은 트랜스포존 내부에 코딩되어 있다(바깥쪽 상자). 자가 일치 스페이서는 트랜스포존 말단의 외부에 코딩되어 있다. 도 11b는 본원에서 제공된 다양한 CAST에 대한 tracrRNA 서열 정렬을 도시한다. tracrRNA 서열의 정렬은 보존 영역을 보여준다. 구체적으로, 서열 위치 92 내지 98(상단 상자)에 있는 서열 "TGCTTTC"는 sgRNA 3 차 구조 및 crRNA와의 비-연속 반복부-항-반복부 페어링에 중요한 것으로 제안된다. 본 발명자들은 또한 위치 265 내지 278(하단 상자)에 있는 헤어핀 "CYCC(n6) GGRG"가 기능에 중요하며, 아마도 crRNA 페어링을 위한 다운스트림 서열을 위치시키는 데 중요하다고 제안한다. 도 11c는 예를 들어, MG64-2, MG64-4, MG64-5, MG64-6, MG64-7 및 MG108-1 패밀리에서 다른 중요한 반복부-항-반복부(RAR) 모티브의 존재를 보여준다.
도 12a는 MG64-2 sgRNA의 예측된 구조를 도시한다. 도 12b는 MG64-4 sgRNA의 예측된 구조를 도시한다. 도 12c는 MG64-6 sgRNA의 예측된 구조를 도시한다. 도 12d는 MG64-7 sgRNA의 예측된 구조를 도시한다. 도 12e는 MG108-1 sgRNA의 예측된 구조를 도시한다.
도 13은 MG64-6이 시험관내에서 활성을 나타냄을 입증하는 PCR, PAM 및 생거(Sanger) 시퀀싱 데이터를 도시한다. 시험관내 표적화된 인테그라제(integrase) 활성에 대해 기재된 프로토콜을 이용하여, 이펙터 단백질 및 이의 TnsB, TnsC 및 TniQ 단백질을 시험관내 전사/번역 시스템에서 발현시켰다. 번역 후, 표적 DNA, 카고 DNA 및 sgRNA를 반응 완충제에 첨가하였다. 표적/기증자(donor) 연접부 전체에 걸쳐 PCR로 통합을 어세이하였다. 도 13a는 apo(sgRNA 없음), 및 sgRNA 64-6 sgRNA를 가진 64-6을 보여주는 전위의 PCR의 겔 이미지를 도시한다. PCR 3은 PAM으로부터 먼 RE 연접부를 검출한다. PCR 4는 PAM으로부터 먼 LE 연접부이다. PCR 5는 PAM에 가까운 RE 연접부이다. PCR 6은 PAM에 가까운 LE 연접부이다. PCR은 상이한 가능한 배향에 걸쳐 페어링된다(PCR 3 및 6 대 PCR 4 및 5). LE-PAM 근위 및 RE-PAM 원위 배향이 바람직하다. 도 13b는 시험관내 전위 어세이, 시퀀싱 PCR 5 및 6으로부터의 PAM을 도시한다. 도 13c는 기증자 DNA에서 절제가 일어나는 전위의 연접부를 보여주는 생거 데이터를 도시한다. 첫 번째 패널은 PCR 3 및 5(RE)를 보여준다. 두 번째 패널은 PCR 4 및 6(LE)을 보여준다. 생거 시퀀싱 반응은 기증자-표적 생성물의 생거 시퀀싱 반응이므로, 시퀀싱이 기증자 DNA와 일치하지 않는 시점은 연접이 일어나는 때이다(시퀀싱 피크 아래의 어두운 막대).
도 14는 삽입 부위 선호도를 보여주는, 시험관내 전위 생성물의 차세대 시퀀싱(NGS) 결과를 도시한다. NGS 리드는 위치 60에서 전위를 가진 기준 서열에 비해 CRISPResso2에서 프로세싱되었다. 이것으로부터의 삽입결실(Indel)은 이 임의 기준 서열보다 더 빠르거나 더 늦은 전위에 상응한다.
도 15는 64-2 TnsB 및 이의 RE DNA 서열의 전기영동 이동성 변위 어세이(EMSA) 결과를 도시한다. EMSA 결과는 결합 및 TnsB 인식을 확인시켜준다. TnsB 단백질을 시험관내 전사/번역 시스템에서 발현시키고, RE 서열을 함유하는 FAM 표지부착된 DNA와 함께 인큐베이션한 다음, 천연 5% TBE 겔에서 분리하였다. 결합은 표지부착된 밴드에서 상향변위로서 관찰된다. 다수의 TnsB 결합 부위는 EMSA에서 다수의 변위로 이어진다. 레인 1: FAM 표지부착된 DNA 단독. 레인 2: FAM DNA와 시험관내 전사/번역 시스템(TnsB 단백질 없음). 레인 3: FAM DNA와 TnsB. 레인 3에서 표지부착된 밴드의 상향변위는 TnsB에 의한 RE 서열의 결합을 표시하고, 이는 이 밴드가 활성 RE 전위 서열을 함유함을 표시한다.
서열목록의 간단한 설명
본원과 함께 출원된 서열목록은 본 개시내용에 따른 방법, 조성물 및 시스템에 사용하기 위한 예시적인 폴리뉴클레오타이드 및 폴리펩티드 서열을 제공한다. 서열목록 내의 서열의 예시적인 설명은 이하에 제공된다.
MG36
서열번호 1은 MG36 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 2 내지 5는 MG36 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG36 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -B1, -B2, -T1 및 -C의 추가는 각각 Tn7 유사 시스템의 TnsB1, TnsB2, TnsT1 및 TniC 단백질과의 유사성을 표시한다.
서열번호 11은 MG36 Cas 이펙터와 함께 작용하도록 조작된 sgRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 12는 MG36 Cas 이펙터와 동일한 유전자좌로부터 유래한 MG36 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 17 및 18은 MG36 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 19는 MG36 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG39
서열번호 6은 MG39-1 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 7 내지 10은 MG39-1 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG39-1 전위 단백질의 펩티드 서열을 보여준다.
서열번호 13 내지 16은 MG39 Cas 이펙터와 동일한 유전자좌로부터 유래한 MG39 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 20은 MG39 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 21은 MG39 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG64
서열번호 22, 26, 30, 34, 55 내지 89, 104 및 147은 MG64 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107, 및 148 내지 150은 MG64 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG64 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 90 내지 93, 117, 151, 156 내지 181, 및 209 내지 234는 MG64 이펙터와 동일한 유전자좌로부터 유래한 MG64 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 94 내지 97, 119, 152, 및 184 내지 200은 MG64 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 237 내지 259는 MG64 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 111 내지 114 및 201 내지 204는 MG64 Cas 이펙터와 함께 작용하도록 조작된 단일 가이드 RNA의 뉴클레오타이드 서열을 보여준다.
서열번호 123, 125, 127, 129, 131, 133 및 153은 MG64 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 124, 126, 128, 130, 132, 154 및 155는 MG64 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG108
서열번호 38 및 108은 MG108 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 39, 40, 109 및 110은 MG108 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG108 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 98 및 120은 MG108 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 260 및 261은 MG108 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 115, 116, 205 및 206은 MG108 Cas 이펙터와 함께 작용하도록 조작된 단일 가이드 RNA의 뉴클레오타이드 서열을 보여준다.
서열번호 118, 182, 183, 235 및 236은 MG108 이펙터와 동일한 유전자좌로부터 유래한 MG108 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 134는 MG108 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 135는 MG108 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG110
서열번호 41 내지 43 및 48 내지 50은 MG110 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다. 표지 말단에의 -6, -7 및 -8의 추가는 각각 클래스 I 타입 I-F 시스템의 cas6, cas7 및 cas8 단백질과의 유사성을 표시한다.
서열번호 44 내지 47 및 51 내지 54는 MG110 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG110 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 99 및 100은 MG110 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 121, 122, 207 및 208은 MG110 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 136 및 138은 MG110 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 137 및 139는 MG110 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
다른 서열
서열번호 140 및 141은 핵 국소화 신호의 펩티드 서열을 보여준다.
서열번호 142 및 143은 링커의 펩티드 서열을 보여준다.
서열번호 144 내지 146은 에피토프 태그의 펩티드 서열을 보여준다.
도 1은 상이한 클래스 및 타입의 CRISPR/Cas 유전자좌의 전형적인 조직화를 도시한다.
도 2는 crRNA와 tracrRNA가 연결되어 있는 하이브리드 sgRNA에 비해 천연 클래스 II 타입 II crRNA/tracrRNA 쌍의 구조를 도시한다.
도 3은 Tn7 및 Tn7 유사 요소에서 발견되는 2개의 경로를 도시한다.
도 4는 패밀리 MG36의 타입 II Tn7 환원 CAST의 게놈 환경을 도시한다. 도 4A는 MG36-5 CAST 시스템이 CRISPR 어레이(CRISPR 반복부), RuvC 및 HNH 엔도뉴클레아제 도메인을 가진 타입 II 뉴클레아제, 및 4개의 예측된 전위효소 단백질 오픈 리딩 프레임으로 구성됨을 보여준다. 촉매 전위효소 TnsB는 2개의 서브유닛으로서 코딩된다. 도 4B는 MG36-1 CAST 시스템에 대해 2개의 트랜스포존 말단(TIR-1 및 TIR-2)이 예측됨을 보여준다. 도 4C는 주석이 달린 반복부가 화살표로 표시되어 있는, 예측된 타입 II Tn7 환원 CAST 트랜스포존 좌측 말단(LE) 및 우측 말단(RE) 서열의 정렬을 보여준다. 좌측 말단 및 우측 말단은 이들의 배향으로 표지부착되었다.
도 5는 패밀리 MG39의 타입 V Tn7 CAST의 게놈 환경을 보여준다. 도 5A는 MG39-1 CAST 시스템이 타입 V 뉴클레아제, 4개의 예측된 트랜스포존 단백질(TnsABC 및 TniQ) 및 CRISPR 어레이로 구성됨을 보여준다. MG39-1 CAST 시스템(TIR-1)에 대해 트랜스포존 말단이 예측되었다. 도 5B는 주석이 달린 역반복부가 화살표로 표시되어 있는, 예측된 타입 V Tn7 CAST 트랜스포존 좌측 말단(LE) 및 우측 말단(RE) 서열의 정렬을 보여준다.
도 6 및 도 7은 본원에 기재된 CAST 시스템의 상응하는 sgRNA의 예측된 구조(예를 들어, 실시예 3에서 예측됨)를 도시한다.
도 8은 본원에 기재된 시스템인 MG108-1의 게놈 환경을 도시한다. 이 후보는 천연적으로 TniQ를 결여하는 Cas12K CAST이다. 게놈 단편 내의 유전자는 화살표로 표시되어 있다.
도 9는 Cas12k 이펙터 서열의 계통발생학적 유전자 트리(tree)를 도시한다. 이 트리는 여기서 회수된 64개의 Cas12k 서열(주황색 및 흑색 분지)과 공개 데이터베이스로부터의 229개의 기준 Cas12k 서열(회색 분지)의 다중 서열 정렬로부터 유추되었다. 주황색 분지는 CAST 트랜스포존 구성요소와의 연관성이 확인된 Cas12k 이펙터를 표시한다.
도 10은 MG110 캐스케이드 CAST를 도시한다. A) MG110-1 캐스케이드 CAST의 게놈 환경. 완전한 Tn7 스위트(suite)(TnsA, TnsB, TnsC/TniB, TniQ) 및 결함 캐스케이드 스위트(Cas6, Cas7, 융합된 Cas5-Cas8)는 주황색 화살표로 표시되어 있다. CAST 트랜스포존을 플랭킹하는 TIR은 연결된 화살표로 표시되어 있다. B) 반복부 2차 구조는 crRNA의 스템-루프 구조를 표시한다. C) 아스퍼길루스 우다니스(A. wodanis), 비브리오 콜레라(V. cholerae)로부터의 CRISPR 반복부와 MG110 패밀리 CAST의 서열 정렬은 crRNA 스템-루프 2차 구조를 표시하는 보존된 모티프를 표시한다.
도 11a는 MG64-3 CRISPR 유전자좌를 도시한다. tracrRNA는 CRISPR 어레이로부터 업스트림에 코딩되어 있는 반면, 트랜스포존 말단은 다운스트림에 코딩되어 있다(내부 흑색 상자). 부분적 3' CRISPR 반복부 및 부분적 스페이서에 상응하는 서열은 트랜스포존 내부에 코딩되어 있다(바깥쪽 상자). 자가 일치 스페이서는 트랜스포존 말단의 외부에 코딩되어 있다. 도 11b는 본원에서 제공된 다양한 CAST에 대한 tracrRNA 서열 정렬을 도시한다. tracrRNA 서열의 정렬은 보존 영역을 보여준다. 구체적으로, 서열 위치 92 내지 98(상단 상자)에 있는 서열 "TGCTTTC"는 sgRNA 3 차 구조 및 crRNA와의 비-연속 반복부-항-반복부 페어링에 중요한 것으로 제안된다. 본 발명자들은 또한 위치 265 내지 278(하단 상자)에 있는 헤어핀 "CYCC(n6) GGRG"가 기능에 중요하며, 아마도 crRNA 페어링을 위한 다운스트림 서열을 위치시키는 데 중요하다고 제안한다. 도 11c는 예를 들어, MG64-2, MG64-4, MG64-5, MG64-6, MG64-7 및 MG108-1 패밀리에서 다른 중요한 반복부-항-반복부(RAR) 모티브의 존재를 보여준다.
도 12a는 MG64-2 sgRNA의 예측된 구조를 도시한다. 도 12b는 MG64-4 sgRNA의 예측된 구조를 도시한다. 도 12c는 MG64-6 sgRNA의 예측된 구조를 도시한다. 도 12d는 MG64-7 sgRNA의 예측된 구조를 도시한다. 도 12e는 MG108-1 sgRNA의 예측된 구조를 도시한다.
도 13은 MG64-6이 시험관내에서 활성을 나타냄을 입증하는 PCR, PAM 및 생거(Sanger) 시퀀싱 데이터를 도시한다. 시험관내 표적화된 인테그라제(integrase) 활성에 대해 기재된 프로토콜을 이용하여, 이펙터 단백질 및 이의 TnsB, TnsC 및 TniQ 단백질을 시험관내 전사/번역 시스템에서 발현시켰다. 번역 후, 표적 DNA, 카고 DNA 및 sgRNA를 반응 완충제에 첨가하였다. 표적/기증자(donor) 연접부 전체에 걸쳐 PCR로 통합을 어세이하였다. 도 13a는 apo(sgRNA 없음), 및 sgRNA 64-6 sgRNA를 가진 64-6을 보여주는 전위의 PCR의 겔 이미지를 도시한다. PCR 3은 PAM으로부터 먼 RE 연접부를 검출한다. PCR 4는 PAM으로부터 먼 LE 연접부이다. PCR 5는 PAM에 가까운 RE 연접부이다. PCR 6은 PAM에 가까운 LE 연접부이다. PCR은 상이한 가능한 배향에 걸쳐 페어링된다(PCR 3 및 6 대 PCR 4 및 5). LE-PAM 근위 및 RE-PAM 원위 배향이 바람직하다. 도 13b는 시험관내 전위 어세이, 시퀀싱 PCR 5 및 6으로부터의 PAM을 도시한다. 도 13c는 기증자 DNA에서 절제가 일어나는 전위의 연접부를 보여주는 생거 데이터를 도시한다. 첫 번째 패널은 PCR 3 및 5(RE)를 보여준다. 두 번째 패널은 PCR 4 및 6(LE)을 보여준다. 생거 시퀀싱 반응은 기증자-표적 생성물의 생거 시퀀싱 반응이므로, 시퀀싱이 기증자 DNA와 일치하지 않는 시점은 연접이 일어나는 때이다(시퀀싱 피크 아래의 어두운 막대).
도 14는 삽입 부위 선호도를 보여주는, 시험관내 전위 생성물의 차세대 시퀀싱(NGS) 결과를 도시한다. NGS 리드는 위치 60에서 전위를 가진 기준 서열에 비해 CRISPResso2에서 프로세싱되었다. 이것으로부터의 삽입결실(Indel)은 이 임의 기준 서열보다 더 빠르거나 더 늦은 전위에 상응한다.
도 15는 64-2 TnsB 및 이의 RE DNA 서열의 전기영동 이동성 변위 어세이(EMSA) 결과를 도시한다. EMSA 결과는 결합 및 TnsB 인식을 확인시켜준다. TnsB 단백질을 시험관내 전사/번역 시스템에서 발현시키고, RE 서열을 함유하는 FAM 표지부착된 DNA와 함께 인큐베이션한 다음, 천연 5% TBE 겔에서 분리하였다. 결합은 표지부착된 밴드에서 상향변위로서 관찰된다. 다수의 TnsB 결합 부위는 EMSA에서 다수의 변위로 이어진다. 레인 1: FAM 표지부착된 DNA 단독. 레인 2: FAM DNA와 시험관내 전사/번역 시스템(TnsB 단백질 없음). 레인 3: FAM DNA와 TnsB. 레인 3에서 표지부착된 밴드의 상향변위는 TnsB에 의한 RE 서열의 결합을 표시하고, 이는 이 밴드가 활성 RE 전위 서열을 함유함을 표시한다.
서열목록의 간단한 설명
본원과 함께 출원된 서열목록은 본 개시내용에 따른 방법, 조성물 및 시스템에 사용하기 위한 예시적인 폴리뉴클레오타이드 및 폴리펩티드 서열을 제공한다. 서열목록 내의 서열의 예시적인 설명은 이하에 제공된다.
MG36
서열번호 1은 MG36 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 2 내지 5는 MG36 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG36 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -B1, -B2, -T1 및 -C의 추가는 각각 Tn7 유사 시스템의 TnsB1, TnsB2, TnsT1 및 TniC 단백질과의 유사성을 표시한다.
서열번호 11은 MG36 Cas 이펙터와 함께 작용하도록 조작된 sgRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 12는 MG36 Cas 이펙터와 동일한 유전자좌로부터 유래한 MG36 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 17 및 18은 MG36 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 19는 MG36 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG39
서열번호 6은 MG39-1 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 7 내지 10은 MG39-1 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG39-1 전위 단백질의 펩티드 서열을 보여준다.
서열번호 13 내지 16은 MG39 Cas 이펙터와 동일한 유전자좌로부터 유래한 MG39 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 20은 MG39 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 21은 MG39 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG64
서열번호 22, 26, 30, 34, 55 내지 89, 104 및 147은 MG64 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107, 및 148 내지 150은 MG64 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG64 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 90 내지 93, 117, 151, 156 내지 181, 및 209 내지 234는 MG64 이펙터와 동일한 유전자좌로부터 유래한 MG64 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 94 내지 97, 119, 152, 및 184 내지 200은 MG64 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 237 내지 259는 MG64 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 111 내지 114 및 201 내지 204는 MG64 Cas 이펙터와 함께 작용하도록 조작된 단일 가이드 RNA의 뉴클레오타이드 서열을 보여준다.
서열번호 123, 125, 127, 129, 131, 133 및 153은 MG64 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 124, 126, 128, 130, 132, 154 및 155는 MG64 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG108
서열번호 38 및 108은 MG108 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다.
서열번호 39, 40, 109 및 110은 MG108 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG108 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 98 및 120은 MG108 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 260 및 261은 MG108 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 115, 116, 205 및 206은 MG108 Cas 이펙터와 함께 작용하도록 조작된 단일 가이드 RNA의 뉴클레오타이드 서열을 보여준다.
서열번호 118, 182, 183, 235 및 236은 MG108 이펙터와 동일한 유전자좌로부터 유래한 MG108 tracrRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 134는 MG108 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 135는 MG108 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
MG110
서열번호 41 내지 43 및 48 내지 50은 MG110 Cas 이펙터의 전체 길이 펩티드 서열을 보여준다. 표지 말단에의 -6, -7 및 -8의 추가는 각각 클래스 I 타입 I-F 시스템의 cas6, cas7 및 cas8 단백질과의 유사성을 표시한다.
서열번호 44 내지 47 및 51 내지 54는 MG110 Cas 이펙터와 회합된 재조합효소 또는 전위효소 복합체를 포함할 수 있는 MG110 전위 단백질의 펩티드 서열을 보여준다. 표지 말단에의 -A, -B, -C 및 -Q의 추가는 각각 Tn7 유사 시스템의 TnsA, TnsB, TnsC 및 TniQ 단백질과의 유사성을 표시한다.
서열번호 99 및 100은 MG110 표적 CRISPR 반복부의 뉴클레오타이드 서열을 보여준다.
서열번호 121, 122, 207 및 208은 MG110 crRNA의 뉴클레오타이드 서열을 보여준다.
서열번호 136 및 138은 MG110 시스템과 회합된 좌측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
서열번호 137 및 139는 MG110 시스템과 회합된 우측 전위효소 인식 서열의 뉴클레오타이드 서열을 보여준다.
다른 서열
서열번호 140 및 141은 핵 국소화 신호의 펩티드 서열을 보여준다.
서열번호 142 및 143은 링커의 펩티드 서열을 보여준다.
서열번호 144 내지 146은 에피토프 태그의 펩티드 서열을 보여준다.
본 발명의 다양한 실시양태가 본원에 제시되고 기재되었지만, 이러한 실시양태가 단지 예시로서만 제공된다는 것은 당분야에서 숙련된 자에게 자명할 것이다. 본 발명을 벗어나지 않으면서 수많은 변경, 변화 및 치환이 당분야에서 숙련된 자에게 인식될 수 있다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있다는 것을 이해해야 한다.
달리 표시되지 않는 한, 본원에 개시된 일부 방법의 실시는 면역학, 생화학, 화학, 분자생물학, 미생물학, 세포생물학, 유전체학 및 재조합 DNA의 기법을 이용한다. 예를 들어, 문헌[Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))](이들은 전체적으로 본원에 참고로 포함됨)을 참조한다.
본원에서 사용된 바와 같이, 문맥이 달리 명시하지 않는 한, 단수 형태는 복수 형태도 포함하기 위한 것이다. 더욱이, 용어 "포함하는", "포함한다", "가진", "가진다", "와 함께" 또는 이들의 파생어가 상세한 설명 및/또는 청구범위에서 사용되는 범위에서, 이러한 용어들은 용어 "포함하는"과 유사한 방식으로 포괄하기 위한 것이다.
용어 "약" 또는 "대략"은 부분적으로 값이 측정되거나 결정되는 방법, 즉 측정 시스템의 한계에 의해 좌우될 수 있는, 당분야에서 통상의 기술을 가진 자에 의해 결정된 특정 값에 대한 허용되는 오차 범위 내에 있음을 의미한다. 예를 들어, "약"은 당분야의 관행에 따라 하나 또는 하나 초과의 표준 편차 이내에 있음을 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 15%, 최대 10%, 최대 5% 또는 최대 1%의 범위를 의미할 수 있다.
본원에서 사용된 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본 구조적, 기능적 및/또는 생물학적 유닛일 수 있다. 세포는 하나 이상의 세포를 가진 임의의 유기체로부터 유래할 수 있다. 일부 비제한적 예는 원핵세포, 진핵세포, 박테리아 세포, 고세균 세포, 단세포 진핵생물 유기체의 세포, 원생동물 세포, 식물의 세포(예를 들어, 식물 작물, 과일, 채소, 곡물, 대두, 옥수수, 수수, 밀, 종자, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 목화, 대마초, 담배, 개화 식물, 침엽수, 겉씨식물, 양치류, 클럽모스, 뿔풀, 간풀, 이끼), 조류 세포(예를 들어, 보트리오코커스 브라우니(Botryococcus braunii), 클라미도모나스 레인하르티(Chlamydomonas reinhardtii), 난노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가섬 파텐스 씨. 아가드(Sargassum patens C. Agardh) 등), 해조류(예를 들어, 다시마), 진균 세포(예를 들어, 효모 세포, 버섯의 세포), 동물 세포, 무척추 동물의 세포(예를 들어, 초파리, 자포동물, 극피동물, 선충 등), 척추 동물의 세포(예를 들어, 어류, 양서류, 파충류, 조류, 포유류), 포유류(예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 비인간 영장류, 인간 등)의 세포 등을 포함한다. 종종 세포는 천연 유기체로부터 유래하지 않는다(예를 들어, 세포는 합성에 의해 만들어질 수 있고 종종 인공 세포로서 지칭된다).
본원에서 사용된 바와 같이, 용어 "뉴클레오타이드"는 일반적으로 염기-당-포스페이트 조합을 의미한다. 뉴클레오타이드는 합성 뉴클레오타이드를 포함할 수 있다. 뉴클레오타이드는 합성 뉴클레오타이드 유사체를 포함할 수 있다. 뉴클레오타이드는 핵산 서열(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))의 단량체 유닛일 수 있다. 용어 뉴클레오타이드는 리보뉴클레오사이드 트리포스페이트 아데노신 트리포스페이트(ATP), 우리딘 트리포스페이트(UTP), 사이토신 트리포스페이트(CTP), 구아노신 트리포스페이트(GTP) 및 데옥시리보뉴클레오사이드 트리포스페이트, 예컨대, dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이를 함유하는 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오타이드 유도체를 포함할 수 있다. 본원에서 사용된 용어 뉴클레오타이드는 디데옥시리보뉴클레오사이드 트리포스페이트(ddNTP) 및 이의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오사이드 트리포스페이트의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP 및 ddTTP를 포함될 수 있으나 이들로 제한되지 않는다. 뉴클레오타이드는 표지부착되지 않을 수 있거나, 예컨대, 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)를 포함하는 모이어티를 사용함으로써 검출 가능하게 표지부착될 수 있다. 표지부착은 양자 점을 사용함으로써 수행될 수도 있다. 검출 가능한 표지는 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생체발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오타이드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'-디메틸아미노페닐아조)벤조산(DABCYL), 캐스케이드 블루(Cascade Blue), 오레곤 그린(Oregon Green), 텍사스 레드(Texas Red), 시아닌(Cyanine) 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있으나 이들로 제한되지 않는다. 형광 표지부착된 뉴클레오타이드의 구체적인 예는 퍼킨 엘머(Perkin Elmer)(캘리포니아주 포스터 시티 소재)로부터 입수될 수 있는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP 및 [dROX]ddTTP; 아머샴(Amersham)(일리노이주 알링턴 하이츠 소재)으로부터 입수될 수 있는 플루오로링크(FluoroLink) 데옥시뉴클레오타이드인 플루오로링크 Cy3-dCTP, 플루오로링크 Cy5-dCTP, 플루오로링크 플루오르 X-dCTP, 플루오로링크 Cy3-dUTP 및 플루오로링크 Cy5-dUTP; 뵈링거 만하임(Boehringer Mannheim)(인디애나주 인디애나폴리스 소재)으로부터 입수될 수 있는 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP 및 플루오레세인-15-2'-dATP; 및 몰레큘라 프로브스(Molecular Probes)(오레곤주 유진 소재)로부터 입수될 수 있는 염색체 표지부착된 뉴클레오타이드인 BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP 및 텍사스 레드-12-dUTP를 포함할 수 있다. 뉴클레오타이드는 화학적 변형에 의해 표지부착될 수 있거나 표시될 수도 있다. 화학적으로 변형된 단일 뉴클레오타이드는 바이오틴-dNTP일 수 있다. 바이오티닐화된 dNTP의 일부 비제한적 예는 바이오틴-dATP(예를 들어, 바이오-N6-ddATP, 바이오틴-14-dATP), 바이오틴-dCTP(예를 들어, 바이오틴-11-dCTP, 바이오틴-14-dCTP), 및 바이오틴-dUTP(예를 들어, 바이오틴-11-dUTP, 바이오틴-16-dUTP, 바이오틴-20-dUTP)를 포함할 수 있다.
용어 "폴리뉴클레오타이드", "올리고뉴클레오타이드" 및 "핵산"은 일반적으로 단일, 이중 또는 다중 가닥 형태로 존재하는, 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드인 임의의 길이의 뉴클레오타이드 또는 이의 유사체의 중합체 형태를 지칭하기 위해 상호교환 가능하게 사용된다. 폴리뉴클레오타이드는 세포에 대한 외생성 또는 내생성 폴리뉴클레오타이드일 수 있다. 폴리뉴클레오타이드는 무세포 환경에 존재할 수 있다. 폴리뉴클레오타이드는 유전자 또는 이의 단편일 수 있다. 폴리뉴클레오타이드는 DNA일 수 있다. 폴리뉴클레오타이드는 RNA일 수 있다. 폴리뉴클레오타이드는 임의의 3차원 구조를 가질 수 있고 임의의 기능을 수행할 수 있다. 폴리뉴클레오타이드는 하나 이상의 유사체(예를 들면, 변경된 골격, 당 또는 핵염기)를 포함할 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 중합체의 어셈블리 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적 예는 5-브로모우라실, 펩티드 핵산, 제노(xeno) 핵산, 모르폴리노, 잠긴 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오타이드, 코르디셉핀(cordycepin), 7-데아자-GTP, 형광단(예를 들면, 당에 연결된 로다민 또는 플루오레세인), 티올 함유 뉴클레오타이드, 바이오틴 연결된 뉴클레오타이드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오타이드, 이노신, 티오우리딘, 슈도우리딘, 디하이드로우리딘, 퀴오신 및 와이오신을 포함한다. 폴리뉴클레오타이드의 비제한적 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연관 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보좀 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지된 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오타이드, 핵산 프로브, 및 프라이머를 포함한다. 뉴클레오타이드의 서열은 비-뉴클레오타이드 구성요소에 의해 불연속될 수 있다.
용어 "형질감염" 또는 "형질감염된"은 일반적으로 핵산이 비-바이러스 또는 바이러스 기반 방법에 의해 세포에 도입되는 것을 의미한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 코딩하는 유전자 서열일 수 있다. 예를 들면, 문헌[Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88]을 참조한다.
용어 "펩티드", "폴리펩티드" 및 "단백질"은 일반적으로 펩티드 결합(들)에 의해 연결된 적어도 2개의 아미노산 잔기로 이루어진 중합체를 지칭하기 위해 본원에서 상호교환 가능하게 사용된다. 이 용어들은 특정 길이의 중합체를 의미하지 않으며, 펩티드가 재조합 기법, 화학적 또는 효소적 합성을 이용함으로써 생성되는지 아니면 천연적으로 생성되는지를 암시하거나 구분하기 위한 것도 아니다. 상기 용어들은 천연 생성 아미노산 중합체뿐만 아니라, 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 경우, 중합체는 비-아미노산에 의해 불연속될 수 있다. 상기 용어들은 전체 길이 단백질, 및 2차 및/또는 3차 구조(예를 들어, 도메인)을 갖거나 갖지 않은 단백질을 비롯한 임의의 길이의 아미노산 쇄를 포함한다. 상기 용어들은 예를 들어, 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 산화 및 임의의 다른 조작, 예컨대, 표지부착 구성요소와의 접합에 의해 변형된 아미노산 중합체도 포괄한다. 본원에서 사용된 바와 같이, 용어 "아미노산" 및 "아미노산들"은 일반적으로 변형된 아미노산 및 아미노산 유사체를 포함하나 이들로 제한되지 않는 천연 아미노산 및 비천연 아미노산을 지칭한다. 변형된 아미노산은 천연 아미노산, 및 아미노산에 천연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 비천연 아미노산을 포함할 수 있다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산 및 L-아미노산 둘 다를 포함한다.
본원에서 사용된 바와 같이, "비천연"은 일반적으로 천연 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비천연은 친화성 태그를 지칭할 수 있다. 비천연은 융합을 지칭할 수 있다. 비천연은 돌연변이, 삽입 및/또는 결실을 포함하는 천연 생성 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비천연 서열은 비천연 서열에 융합되어 있는 핵산 및/또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낼 수 있고/있거나 코딩할 수 있다. 비천연 핵산 또는 폴리펩티드 서열은 키메라 핵산 및/또는 폴리펩티드를 코딩하는 키메라 핵산 및/또는 폴리펩티드 서열을 생성하기 위해 유전적 조작에 의해 천연 생성 핵산 또는 폴리펩티드 서열(또는 이의 변이체)에 연결될 수 있다.
본원에서 사용된 바와 같이, 용어 "프로모터"는 일반적으로 유전자의 전사 또는 발현을 조절하고 RNA 전사가 시작되는 뉴클레오타이드 또는 뉴클레오타이드 영역에 인접하거나 중첩되어 위치할 수 있는 조절 DNA 영역을 지칭한다. 프로모터는 유전자 전사로 이어지는, RNA 중합효소와 DNA의 결합을 용이하게 하는, 종종 전사 인자로서도 지칭되는 단백질 인자에 결합하는 특정 DNA 서열을 함유할 수 있다. '코어 프로모터'로서도 지칭되는 '기본 프로모터'는 일반적으로 작동 가능하게 연결된 폴리뉴클레오타이드의 전사 발현을 촉진하는 데 필요한 모든 기본 요소들을 함유하는 프로모터를 지칭할 수 있다. 진핵생물 기본 프로모터는 전형적으로 TATA 박스 및/또는 CAAT 박스를 함유하지만, 반드시 함유하지는 않는다.
본원에서 사용된 바와 같이, 용어 "발현"은 일반적으로 핵산 서열 또는 폴리뉴클레오타이드가 DNA 주형으로부터 (예를 들어, mRNA 또는 다른 RNA 전사체로) 전사되는 과정, 및/또는 전사된 mRNA가 펩티드, 폴리펩티드 또는 단백질로 후속 번역되는 과정을 지칭한다. 전사체 및 코딩된 폴리펩티드는 "유전자 생성물"로서 통칭될 수 있다. 폴리뉴클레오타이드가 게놈 DNA로부터 유래한 경우, 발현은 진핵 세포에서의 mRNA의 스플라이싱을 포함할 수 있다.
본원에서 사용된 바와 같이, "작동 가능하게 연결된", "작동 가능한 연결", "작동 가능하게 연결되어 있는" 또는 이들의 문법적으로 동등한 표현은 일반적으로 유전적 요소, 예를 들어, 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 지칭하고, 이때 상기 요소들은 이들이 예상된 방식으로 작동할 수 있게 하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소는, 조절 요소가 코딩 서열의 전사를 시작하는 데 도움이 되는 경우, 코딩 영역에 작동 가능하게 연결되어 있다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재 잔기가 있을 수 있다.
본원에서 사용된 바와 같이, "벡터"는 일반적으로 폴리뉴클레오타이드를 포함하거나 폴리뉴클레오타이드와 회합하고 세포로의 폴리뉴클레오타이드의 전달을 매개하는 데 사용될 수 있는 거대분자 또는 거대분자의 회합을 의미한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포좀 및 다른 유전자 전달 비히클을 포함한다. 벡터는 일반적으로 표적에서 유전자의 발현을 용이하게 하기 위해 유전자에 작동 가능하게 연결된 유전적 요소, 예를 들어, 조절 요소를 포함한다.
본원에서 사용된 바와 같이, "발현 카세트" 및 "핵산 카세트"는 일반적으로 함께 발현되거나 발현을 위해 작동 가능하게 연결되어 있는 핵산 서열 또는 요소의 조합을 지칭하기 위해 상호교환 가능하게 사용된다. 일부 경우, 발현 카세트는 조절 요소와, 발현을 위해 이 조절 요소에 작동 가능하게 연결되어 있는 유전자 또는 유전자들의 조합을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 일반적으로 전체 길이 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적(기능적 또는 구조적) 활성을 보유하는 단편을 지칭한다. DNA 서열의 생물학적 활성은 전체 길이 서열에 기인하는 것으로 알려져 있는 방식으로 발현에 영향을 미치는 그의 능력일 수 있다.
본원에서 사용된 바와 같이, "조작된" 객체는 일반적으로 객체가 인간 개입에 의해 변형되었음을 표시한다. 비제한적 예에 따르면, 핵산은 그의 서열을 자연계에 존재하지 않는 서열로 변경함으로써 변형될 수 있고; 핵산은 라이게이션된 생성물이 원래 핵산에 존재하지 않는 기능을 갖도록 핵산을 자연계에서 그와 연관되어 있지 않은 핵산에 라이게이션시킴으로써 변형될 수 있고; 조작된 핵산은 자연계에 존재하지 않는 서열을 사용함으로써 시험관내에서 합성될 수 있고; 단백질은 그의 아미노산 서열을 자연계에 존재하지 않는 서열로 변경함으로써 변형될 수 있으며; 조작된 단백질은 새로운 기능 또는 성질을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에서 사용된 바와 같이, "합성" 및 "인공"은 천연 생성 인간 단백질에 대해 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 가진 단백질 또는 이의 도메인을 지칭하기 위해 상호교환 가능하게 사용된다. 예를 들어, VPR 및 VP64 도메인은 합성 트랜스활성화 도메인이다.
본원에서 사용된 바와 같이, 용어 "tracrRNA" 또는 "tracr 서열"은 일반적으로 야생형 예시적인 tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스(S. pyogenes), 스타필로코커스 아우레우스(S. aureus) 등으로부터의 tracrRNA 또는 서열번호 *_*)에 대해 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100% 서열 동일성 및/또는 서열 유사성을 가진 핵산을 지칭할 수 있다. tracrRNA는 야생형 예시적인 tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 등으로부터의 tracrRNA)에 대해 최대 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 서열 동일성 및/또는 서열 유사성을 가진 핵산을 지칭할 수 있다. tracrRNA는 뉴클레오타이드 변화, 예컨대, 결실, 삽입 또는 치환, 변이체, 돌연변이 또는 키메라를 포함할 수 있는 변형된 형태의 tracrRNA를 지칭할 수 있다. tracrRNA는 적어도 6개의 연속 뉴클레오타이드의 스트레치에 걸쳐 야생형 예시적인 tracrRNA(예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 등으로부터의 tracrRNA) 서열과 적어도 약 60% 동일할 수 있는 핵산을 지칭할 수 있다. 예를 들어, tracrRNA 서열은 적어도 6개의 연속 뉴클레오타이드의 스트레치에 걸쳐 야생형 예시적인 tracrRNA(예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 등으로부터의 tracrRNA) 서열과 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일 또는 100% 동일할 수 있다. 인접한 CRISPR 어레이에서 반복부 서열의 일부에 대해 상보성을 가진 영역을 식별함으로써 게놈 서열에서 타입 II tracrRNA 서열을 예측할 수 있다.
본원에서 사용된 바와 같이, "가이드 핵산"은 일반적으로 또 다른 핵산에 하이브리드화할 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 핵산 부위 서열에 특이적으로 결합하도록 프로그래밍될 수 있다. 표적화될 핵산 또는 표적 핵산은 뉴클레오타이드를 포함할 수 있다. 가이드 핵산은 뉴클레오타이드를 포함할 수 있다. 표적 핵산의 일부는 가이드 핵산의 일부에 상보적일 수 있다. 가이드 핵산에 상보적이고 하이브리드화하는 이중 가닥 표적 폴리뉴클레오타이드의 가닥은 상보적 가닥으로서 지칭될 수 있다. 상보적 가닥에 상보적이므로 가이드 핵산에 상보적이지 않을 수 있는 이중 가닥 표적 폴리뉴클레오타이드의 가닥은 비상보적 가닥으로서 지칭될 수 있다. 가이드 핵산은 폴리뉴클레오타이드 쇄를 포함할 수 있으며 "단일 가이드 핵산"으로서 지칭될 수 있다. 가이드 핵산은 2개의 폴리뉴클레오타이드 쇄를 포함될 수 있고 "이중 가이드 핵산"으로서 지칭될 수 있다. 달리 특정되지 않는 한, 용어 "가이드 핵산"은 단일 가이드 핵산 및 이중 가이드 핵산 둘 다를 지칭하는 포괄적인 용어일 수 있다. 가이드 핵산은 "핵산 표적화 분절" 또는 "핵산 표적화 서열"로서 지칭될 수 있는 분절을 포함할 수 있다. 핵산 표적화 분절은 "단백질 결합 분절" 또는 "단백질 결합 서열" 또는 "Cas 단백질 결합 분절"로서 지칭될 수 있는 하위분절을 포함할 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 용어 "서열 동일성" 또는 "퍼센트 동일성"은 일반적으로 서열 비교 알고리즘을 사용하여 측정하였을 때 국소 또는 전체 비교 윈도우에 걸쳐 최대 상응에 대해 비교되고 정렬될 때, 동일하거나 특정된 퍼센트의 동일한 아미노산 잔기 또는 뉴클레오타이드를 가진 2개의(예를 들어, 쌍별 정렬) 또는 더 많은(예를 들어, 다중 서열 정렬) 서열을 의미한다. 폴리펩티드 서열에 적합한 서열 비교 알고리즘은 예를 들어, 30개 잔기보다 더 긴 폴리펩티드 서열에 대해 3의 단어길이(W), 10의 기대치(E), 및 갭 비용을 11의 존재 및 1의 연장으로 설정하는 BLOSUM62 점수화 매트릭스를 파라미터로서 사용하고 조건부 구성 점수 매트릭스 조절을 이용하는 BLASTP; 30개 잔기 미만의 서열에 대해 2의 단어길이(W), 1000000의 기대치(E), 및 갭 비용을 갭 개방에 대해 9 및 갭 연장에 대해 1로 설정하는 PAM30 점수화 매트릭스를 사용하는 BLASTP(이들은 https://blast.ncbi.nlm.nih.gov에서 입수될 수 있는 BLAST 스위트의 BLASTP에 대한 디폴트 파라미터임); 파라미터를 사용하는 CLUSTALW; 2의 일치, -1의 불일치 및 -1의 갭을 파라미터로서 사용하는 스위스-워터만(Smith-Waterman) 상동성 검색 알고리즘; 디폴트 파라미터를 사용하는 MUSCLE; 2의 리트리(retree) 및 1000의 최대화(maxiteration)를 파라미터로서 사용하는 MAFFT; 디폴트 파라미터를 사용하는 Novafold; 디폴트 파라미터를 사용하는 HMMER hmmalign을 포함한다.
본 개시내용은 하나 이상의 보존적 아미노산 치환을 가진, 본원에 기재된 효소들 중 임의의 효소의 변이체를 포함한다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 파괴하지 않으면서 폴리펩티드의 아미노산 서열에서 만들어질 수 있다. 보존적 치환은 유사한 소수성, 극성 및 R 쇄 길이를 가진 아미노산들을 서로 치환함으로써 달성될 수 있다. 추가로 또는 대안적으로, 상이한 종으로부터의 정렬된 상동성 단백질 서열들을 비교함으로써, 코딩된 단백질의 기본 기능을 변경하지 않으면서 종 사이에 돌연변이된 아미노산 잔기(예를 들어, 보존되지 않은 잔기)를 찾아냄으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기재된 시스템들 중 어느 하나(예를 들어, 본원에 기재된 MG36 또는 MG39 시스템)에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 변이체를 포함할 수 있다. 일부 실시양태에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 엔도뉴클레아제의 중요 활성 부위 잔기의 활성이 파괴되지 않도록 치환된 서열을 포함할 수 있다. 일부 실시양태에서, 본원에 기재된 시스템들 중 임의의 시스템의 기능적 변이체는 도 4 및 도 5에 표시된 보존된 또는 기능적 잔기들 중 적어도 하나의 치환을 결여한다. 일부 실시양태에서, 본원에 기재된 시스템들 중 임의의 시스템의 기능적 변이체는 도 4 및 도 5에 표시된 모든 보존된 또는 기능적 잔기들의 치환을 결여한다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참고문헌들(예를 들어, 문헌[Creighton, Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2nd Edition (December1993))] 참조)로부터 입수될 수 있다. 하기 8개의 군은 서로에 대해 보존적 치환인 아미노산을 각각 함유한다:
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 라이신(K);
5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M).
본원에서 사용된 바와 같이, 용어 "RuvC_III 도메인"은 일반적으로 RuvC 엔도뉴클레아제 도메인의 세 번째 불연속 분절을 지칭한다(RuvC 뉴클레아제 도메인은 3개의 불연속 분절인 RuvC_I, RuvC_II 및 RuvC_III으로 구성된다). RuvC 도메인 또는 이의 분절은 일반적으로 알려져 있는 도메인 서열과의 정렬, 주석이 달린 도메인을 가진 단백질과의 구조적 정렬, 또는 알려져 있는 도메인 서열을 기반으로 구축된 히든 마르코브 모델(Hidden Markov Model)(HMM)(예를 들어, RuvC_III의 경우 Pfam HMM PF18541)과의 비교에 의해 식별될 수 있다.
본원에서 사용된 바와 같이, 용어 "HNH 도메인"은 일반적으로 특징적인 히스티딘 및 아스파라긴 잔기를 가진 엔도뉴클레아제 도메인을 지칭한다. HNH 도메인은 일반적으로 알려져 있는 도메인 서열과의 정렬, 주석이 달린 도메인을 가진 단백질과의 구조적 정렬, 또는 알려져 있는 도메인 서열을 기반으로 구축된 히든 마르코브 모델(HMM)(예를 들어, 도메인 HNH의 경우 Pfam HMM PF01844)과의 비교에 의해 식별될 수 있다.
본원에서 사용된 바와 같이, 용어 "재조합효소"는 일반적으로 재조합효소 인식 서열들 사이에 DNA의 재조합을 매개하여, 재조합효소 인식 서열들 사이에 DNA 단편의 절제, 통합, 역위 또는 교환(예컨대, 전위)을 야기하는 부위 특이적 효소를 지칭한다.
본원에서 사용된 바와 같이, 핵산 변형(예를 들어, 게놈 변형)과 관련하여 용어 "재조합한다" 또는 "재조합"은 일반적으로 2개 이상의 핵산 분자, 또는 단일 핵산 분자의 2개 이상의 영역이 재조합효소 단백질의 작용에 의해 변형되는 과정을 지칭한다. 재조합은 특히, 하나 이상의 핵산 분자 내에서 또는 사이에 핵산 서열의 삽입, 역위, 절제 또는 전위를 야기할 수 있다.
본원에서 바와 같이, 용어 "트랜스포존"은 일반적으로 "카고 DNA"를 운반하면서 게놈 안팎으로 이동하는 이동성 요소를 지칭한다. 일부 경우, 이 트랜스포존은 전위될 핵산의 타입, 트랜스포존 말단에 있는 반복부의 타입, 운반될 카고의 타입 또는 전위 방식(즉, 자가 복구 또는 숙주 복구)에 따라 상이할 수 있다. 본원에서 사용된 바와 같이, 용어 "전위효소" 또는 "전위효소들"은 일반적으로 트랜스포존의 말단에 결합하여 이를 게놈의 또 다른 부분으로 이동시키는 것을 촉매하는 효소를 지칭한다. 일부 경우, 이동은 잘라내기 및 붙여넣기 기작 또는 복제적 전위에 의해 달성될 수 있다.
본원에서 사용된 바와 같이, 용어 "Tn7" 또는 "Tn7 유사 전위효소"는 일반적으로 3종의 주요 구성요소들, 즉 헤테로머성 전위효소(TnsA 및/또는 TnsB) 및 조절제 단백질(TnsC)을 포함하는 전위효소 패밀리를 지칭한다. Tn7 요소는 TnsABC 전위 단백질 외에도 전용 표적 부위 선택 단백질인 TnsD 및 TnsE를 코딩할 수 있다. 서열 특이적 DNA 결합 단백질인 TnsD는 TnsABC와 함께 "Tn7 부착 부위"로서 지칭되는 보존된 부위인 attTn7 내로의 전위를 유도한다. TnsD는 TniQ도 포함하는 큰 단백질 패밀리의 구성원이다. TniQ는 플라스미드의 분해 부위 내로의 전위를 표적화하는 것으로 밝혀졌다.
일부 경우, 본원에 기재된 CAST 시스템은 하나 이상의 Tn7 또는 Tn7 유사 전위효소를 포함할 수 있다. 특정 예시적인 실시양태에서, Tn7 또는 Tn7 유사 전위효소는 다량체성 단백질 복합체를 포함한다. 특정 예시적인 실시양태에서, 상기 다량체성 단백질 복합체는 TnsA, TnsB, TnsC 또는 TniQ를 포함한다. 이 조합에서, 전위효소(TnsA, TnsB, TnsC, TniQ)는 서로 복합체 또는 융합 단백질을 형성할 수 있다.
본원에서 사용된 바와 같이, 용어 "Cas12k"(대안적으로, "클래스 II 타입 V-K")는 일반적으로 뉴클레아제 활성에 결함이 있는 것으로 발견된 타입 V CRISPR 시스템의 서브타입을 지칭한다(예를 들어, 이들은 DNA 절단에 중요한 적어도 하나의 촉매 잔기를 결여하는 적어도 하나의 결함 RuvC 도메인을 포함할 수 있다). 이러한 서브타입의 이펙터는 일반적으로 CAST 시스템과 회합된다.
본원에서 사용된 바와 같이, 용어 "타입 I-F"(대안적으로, 클래스 I 타입 I-F CRISPR)는 일반적으로 클래스 I 타입 I CRISPR 시스템의 서브타입을 지칭한다. 이러한 시스템은 일반적으로 Cas8, Cas7 및 Cas6 단백질을 포함하는 다중구성요소 CRISPR 이펙터를 포함한다. 일부 경우, 이러한 시스템은 CAST 시스템과 회합된 상태로 발견된다. 일부 경우, 타입 I-F CRISPR 시스템은 Cas8 및/또는 Cas5 결합을 위한 8-nt 5' 핸들, 표적 인식을 위한 Cas7의 6개 카피에 의해 결합된 32-nt 스페이서, 또는 Cas6 결합 및 전구-crRNA 프로세싱을 위한 20-nt 3' 헤어핀을 포함하는 crRNA를 포함한다. 일부 경우, 타입 F 시스템은 표적 결합을 위해 비-표적 가닥의 5'-CC PAM을 이용한다.
개요
독특한 기능과 구조를 가진 새로운 Cas 효소의 발견은 데옥시리보핵산(DNA) 편집 기술을 더 혁신하여, 속도, 특이성, 기능 및 사용 편의성을 개선할 수 있는 잠재력을 제공할 수 있다. 미생물에서 클러스터링된 규칙적으로 이격된 짧은 팔린드로믹 반복부(CRISPR) 시스템의 예측된 보급률 및 미생물 종의 엄청난 다양성에 비해, 기능적으로 특징규명된 CRISPR/Cas 효소는 문헌에 비교적 적게 존재한다. 이것은 부분적으로는 수많은 미생물 종을 실험실 조건에서 쉽게 배양할 수 없기 때문이다. 수많은 미생물 종을 대표하는 천연 환경 니치(nich)로부터의 메타게놈 시퀀싱은 알려진 새로운 CRISPR/Cas 시스템의 수를 현저히 증가시키고 새로운 올리고뉴클레오타이드 편집 기능의 발견을 가속화할 수 있는 잠재력을 제공할 수 있다. 이러한 접근법의 결실을 보여주는 최근 사례는 2016년에 천연 미생물 군집의 메타게놈 분석으로부터 CasX/CasY CRISPR 시스템을 발견한 것에 의해 입증된다.
CRISPR/Cas 시스템은 미생물에서 적응 면역 시스템으로서 작용하는 것으로 기재된 RNA 유도 뉴클레아제 복합체이다. 그의 천연 환경에서, CRISPR/Cas 시스템은 일반적으로 2개의 부분, 즉 (i) RNA 기반 표적화 요소를 코딩하는, 동등하게 짧은 스페이서 서열에 의해 분리된 짧은 반복 서열(30 내지 40 bp)의 어레이, 및 (ii) 보조 단백질/효소와 함께 RNA 기반 표적화 요소에 의해 유도되는 뉴클레아제 폴리펩티드를 코딩하는 Cas를 코딩하는 ORF를 포함하는 CRISPR(클러스터링된 규칙적으로 이격된 짧은 팔린드로믹 반복부) 오페론 또는 유전자좌에서 생성된다. 특정 표적 핵산 서열의 효율적인 뉴클레아제 표적화는 일반적으로 (i) 표적(표적 시드)의 처음 6개 내지 8개의 핵산과 crRNA 가이드 사이의 상보적 하이브리드화; 및 (ii) 표적 시드의 정의된 근처 내부의 프로토스페이서 인접 모티브(PAM) 서열의 존재 둘 다를 요구한다(PAM은 일반적으로 숙주 게놈 내에서 통상적으로 나타나지 않는 서열이다). 시스템의 정확한 기능과 조직화에 따라, CRISPR-Cas 시스템은 통상적으로 공유된 기능적 특성 및 진화적 유사성을 기반으로 2개의 클래스, 5개의 타입 및 16개의 서브타입으로 분류된다(도 1 참조).
클래스 I CRISPR-Cas 시스템은 큰 다중서브유닛 이펙터 복합체를 갖고, 타입 I, III 및 IV를 포함한다.
타입 I CRISPR-Cas 시스템은 구성요소의 관점에서 중간 정도의 복잡성을 가진 것으로 간주된다. 타입 I CRISPR-Cas 시스템에서, RNA 표적화 요소들의 어레이는 반복부 요소에서 프로세싱되어 짧은 성숙 crRNA를 유리시키는 긴 전구체 crRNA(전구-crRNA)로서 전사되고, 이 짧은 성숙 crRNA는 프로토스페이서 인접 모티프(PAM)로서 지칭되는 적합한 짧은 컨센서스 서열이 핵산 표적을 뒤따를 때 뉴클레아제 복합체를 이 핵산 표적으로 향하게 한다. 이 프로세싱은 crRNA 유도 뉴클레아제 복합체의 뉴클레아제(Cas3) 단백질 구성요소도 포함하는, 캐스케이드(Cascade)로서 지칭되는 큰 엔도뉴클레아제 복합체의 엔도리보뉴클레아제 서브유닛(Cas6)을 통해 일어난다. Cas I 뉴클레아제는 주로 DNA 뉴클레아제로서 작용한다.
타입 III CRISPR 시스템은 Csm 또는 Cmr 단백질 서브유닛을 포함하는 반복부 관련 신비스러운 단백질(RAMP)과 함께 Cas10으로서 알려진 중심 뉴클레아제의 존재를 특징으로 할 수 있다. 타입 I 시스템에서와 마찬가지로, 성숙 crRNA는 Cas6 유사 효소를 사용함으로써 전구-crRNA로부터 프로세싱된다. 타입 I 및 II 시스템과 달리, 타입 III 시스템은 DNA-RNA 이중체를 표적화하고 절단하는 것으로 보인다(예컨대, DNA 가닥은 RNA 중합효소에 대한 주형으로서 사용된다).
타입 IV CRISPR-Cas 시스템은 고도로 환원된 큰 서브유닛 뉴클레아제(csf1), Cas5(csf3) 및 Cas7(csf2) 군의 RAMP 단백질에 대한 2개의 유전자, 및 일부 경우 예측된 작은 서브유닛에 대한 유전자로 구성된 이펙터 복합체를 갖고; 이러한 시스템은 내생성 플라스미드에서 통상적으로 발견된다.
클래스 II CRISPR-Cas 시스템은 일반적으로 단일 폴리펩티드 다중도메인 뉴클레아제 이펙터를 가지며, 타입 II, V 및 VI을 포함한다.
타입 II CRISPR-Cas 시스템은 구성요소의 관점에서 가장 단순한 것으로서 간주된다. 타입 II CRISPR-Cas 시스템에서, CRISPR 어레이를 성숙 crRNA로 프로세싱하는 것은 특별한 엔도뉴클레아제 서브유닛의 존재를 요구하는 것이 아니라, 어레이 반복부 서열에 상보적인 영역을 가진 작은 트랜스 코딩된 crRNA(tracrRNA)를 요구하고; tracrRNA는 그의 상응하는 이펙터 뉴클레아제(예를 들어, Cas9) 및 반복부 서열 둘 다와 상호작용하여 전구체 dsRNA 구조를 형성하고, 전구체 dsRNA 구조는 내생성 RNAse III에 의해 절단되어, tracrRNA 및 crRNA 둘 다가 로딩된 성숙 이펙터 효소를 생성한다. Cas II 뉴클레아제는 DNA 뉴클레아제로서 알려져 있다. 타입 2 이펙터는 일반적으로 RuvC 유사 뉴클레아제 도메인의 폴드(fold) 내에 삽입된 관련 없는 HNH 뉴클레아제 도메인과 함께 RNase H 폴드를 채택하는 RuvC 유사 엔도뉴클레아제 도메인으로 구성된 구조를 나타낸다. RuvC 유사 도메인은 표적(예를 들어, crRNA 상보적) DNA 가닥의 절단을 담당하는 반면, HNH 도메인은 이탈된 DNA 가닥의 절단을 담당한다.
타입 V CRISPR-Cas 시스템은 RuvC 유사 도메인을 포함하는 타입 II 이펙터와 유사한 뉴클레아제 이펙터(예를 들어, Cas12) 구조를 특징으로 한다. 타입 II와 유사하게, (모두는 아니지만) 대다수의 타입 V CRISPR 시스템은 tracrRNA를 사용하여 전구-crRNA를 성숙 crRNA로 프로세싱하나; 전구-crRNA를 다수의 crRNA로 절단하기 위해 RNAse III을 요구하는 타입 II 시스템과 달리, 타입 V 시스템은 이펙터 뉴클레아제 그 자체를 사용하여 전구-crRNA를 절단할 수 있다. 타입 II CRISPR-Cas 시스템처럼, 타입 V CRISPR-Cas 시스템은 DNA 뉴클레아제로서도 알려져 있다. 타입 II CRISPR-Cas 시스템과 달리, 일부 타입 V 효소(예를 들어, Cas12a)는 이중 가닥 표적 서열의 첫 번째 crRNA 유도 절단에 의해 활성화되는 강력한 단일 가닥 비특이적 데옥시리보뉴클레아제 활성을 가진 것으로 보인다.
타입 VI CRIPSR-Cas 시스템은 RNA 가이딩 RNA 엔도뉴클레아제를 가진다. 타입 VI 시스템의 단일 폴리펩티드 이펙터(예를 들어, Cas13)는 RuvC 유사 도메인 대신에 2개의 HEPN 리보뉴클레아제 도메인을 포함한다. 타입 II 및 타입 V 시스템과 달리, 타입 VI 시스템은 또한 전구-crRNA를 crRNA로 프로세싱하기 위해 tracrRNA를 필요로 하지 않는 것으로 보인다. 그러나, 타입 V 시스템과 유사하게, 일부 타입 VI 시스템(예를 들어, C2C2)은 표적 RNA의 첫 번째 crRNA 유도 절단에 의해 활성화되는 강력한 단일 가닥 비특이적 뉴클레아제(리보뉴클레아제) 활성을 가진 것으로 보인다.
클래스 II CRISPR-Cas는 그들의 더 단순한 구조로 인해 설계자 뉴클레아제/게놈 편집 애플리케이션으로서 조작 및 개발을 위해 가장 널리 채택되어 왔다.
시험관내 사용을 위한 이러한 시스템의 초기 개량 중 하나는 지넥 연구진(Jinek et al.)의 문헌(전체적으로 본원에 참고로 포함되는 문헌[Science. 2012 Aug 17;337(6096):816-21])에서 발견될 수 있다. 지넥 연구는 (i) 스트렙토코커스 피오게네스 SF370으로부터 단리된 재조합 발현 정제된 전체 길이 Cas9(예를 들어, 클래스 II 타입 II Cas 효소), (ii) 절단하고자 하는 표적 DNA 서열에 상보적인 약 20 nt 5' 서열에 이어 3' tracr 결합 서열을 가진 정제된 성숙 약 42 nt crRNA(전체 crRNA는 T7 프로모터 서열을 가진 합성 DNA 주형으로부터 시험관내 전사됨), (iii) T7 프로모터 서열을 가진 합성 DNA 주형으로부터 시험관내 전사된 정제된 tracrRNA, 및 (iv) Mg2+을 포함하는 시스템을 처음으로 기술하였다. 그 후, 지넥은 개선되고 조작된 시스템을 기술하였는데, 이 시스템에서 (ii)의 crRNA는 링커(예를 들어, GAAA)에 의해 (iii)의 5' 말단에 연결되어, Cas9를 스스로 표적으로 향하게 할 수 있는 단일 융합된 합성 가이드 RNA(sgRNA)를 형성한다(도 2의 상단과 하단 패널의 비교).
그 후, 말리 연구진(Mali et al.)(전체적으로 본원에 참고로 포함되는 문헌[Science. 2013 Feb 15; 339(6121): 823-826])은 (i) C-말단 핵 국소화 서열(예를 들어, SV40 NLS) 및 적합한 폴리아데닐화 신호(예를 들어, TK pA 신호)를 가진 적합한 포유류 프로모터 하에 코돈 최적화된 Cas9(예를 들어, 클래스 II 타입 II Cas 효소)를 코딩하는 ORF; 및 (ii) 적합한 중합효소 III 프로모터(예를 들어, U6 프로모터) 하에 sgRNA(G로 시작하는 5' 서열에 이어, 3' tracr 결합 서열에 연결된 20 nt의 상보적 표적화 핵산 서열, 링커 및 tracrRNA 서열을 가짐)를 코딩하는 ORF를 코딩하는 DNA 벡터를 제공함으로써 포유류 세포에서 사용하기 위해 이 시스템을 개량하였다.
트랜스포존은 게놈 내의 위치 사이에 이동할 수 있는 이동성 요소이다. 이러한 트랜스포존은 그가 숙주에 발휘하는 부정적인 영향을 제한하도록 진화해 왔다. 다양한 조절 기작을 이용하여 전위를 낮은 빈도로 유지하고 종종 전위를 다양한 세포 과정과 조화시킨다. 일부 원핵생물 트랜스포존은 숙주에 유익하거나 그 요소를 유지하는 데 도움이 되는 기능을 동원할 수도 있다. 특정 트랜스포존은 표적 부위 선택을 엄격하게 제어하는 기작을 진화시켰을 수도 있는데, 가장 주목할 만한 예는 Tn7 패밀리이다.
트랜스포존 Tn7 및 유사한 요소는 임상 환경에서 항생제 내성 및 발병 기능을 위한 저장소일 수 있을 뿐만 아니라, 천연 환경에서 다른 적응 기능을 코딩할 수도 있다. 예를 들어, Tn7 시스템은 중요한 숙주 유전자 내로 통합되는 것을 거의 완전히 피할 뿐만 아니라, 숙주 박테리아 사이에 Tn7을 이동시킬 수 있는 이동성 플라스미드 및 박테리오파지를 인식함으로써 상기 요소의 분산을 최대화하는 기작을 진화시켜 왔다.
박테리아 게놈 내의 단일 보존된 위치 내로의 삽입을 유도하는 하나의 경로 및 박테리아 사이에 요소를 전달할 수 있는 이동성 플라스미드 내로의 표적화를 최대화하도록 적응된 것으로 보이는 제2 경로를 보유하는 Tn7 및 Tn7 유사 요소는 이들이 삽입되는 위치와 시기를 제어할 수 있다(도 3 참조). Tn7 유사 트랜스포존과 CRISPR-Cas 시스템 사이의 연관성은 트랜스포존이 CRISPR 이펙터를 탈취하여 표적 부위에서 R-루프를 생성하고 플라스미드 및 파지를 통한 트랜스포존의 확산을 용이하게 하였을 수 있음을 암시한다.
MG36 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 제1 이중 가닥 핵산을 포함할 수 있다. 제1 이중 가닥 핵산은 카고 뉴클레오타이드 서열을 포함할 수 있으며, 이때 카고 뉴클레오타이드 서열은 재조합효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. 이 Cas 이펙터 복합체는 클래스 II 타입 II Cas 이펙터, 및 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 클래스 II 타입 II Cas 이펙터는 RuvC 도메인 및 HNH 도메인을 포함할 수 있다. 상기 시스템은 재조합효소 또는 전위효소 복합체를 포함할 수 있고, 이때 재조합효소 또는 전위효소 복합체는 카고 뉴클레오타이드 서열을 표적 핵산 부위로 끌어들이도록 구성된다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 Tn7 타입 전위효소 복합체이다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 II 타입 II Cas 이펙터는 서열번호 1 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 폴리펩티드를 포함한다. 일부 경우, 클래스 II 타입 II Cas 이펙터는 서열번호 1과 실질적으로 동일한 폴리펩티드를 포함한다.
일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 상기 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 4개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 4개의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB1 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 2 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB1 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 3 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB2 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 3 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB2 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 4 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsT1 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 4 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsT1 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 5 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsC 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 5 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsC 폴리펩티드를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 11 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 19 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다.
일부 경우, 클래스 II 타입 II Cas 이펙터 및 재조합효소 또는 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 시스템을 발현시키거나 본원에 기재된 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
MG39 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 포함할 수 있다. 이 카고 뉴클레오타이드 서열은 Tn7 타입 전위효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. Cas 이펙터 복합체는 클래스 II 타입 V Cas 이펙터, 및 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 클래스 II 타입 V Cas 이펙터는 RuvC 도메인을 포함할 수 있다. 상기 시스템은 Cas 이펙터 복합체에 결합하도록 구성된 Tn7 타입 전위효소 복합체를 포함할 수 있으며, 이때 Tn7 타입 전위효소 복합체는 TnsA 서브유닛을 포함한다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 5 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 5 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, TnsA 서브유닛은 서열번호 7 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 가진 폴리펩티드를 포함한다. 일부 경우, TnsA 서브유닛은 서열번호 7 또는 이의 변이체와 실질적으로 동일한 서열을 가진 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 7 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsA 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 7 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsA 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 9 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsC 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 9 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsC 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 10 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TniQ 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 10 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TniQ 폴리펩티드를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 20 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 좌측 재조합효소 서열은 서열번호 20 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 우측 재조합효소 서열은 서열번호 21 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 21 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 클래스 II 타입 V Cas 이펙터 및 Tn7 타입 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 시스템을 발현시키거나 본원에 기재된 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서, 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 Cas 이펙터 복합체와 접촉시키는 단계를 포함하는 방법을 제공한다. Cas 이펙터 복합체는 클래스 II 타입 II Cas 이펙터, 및 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 이 방법은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을, 카고 뉴클레오타이드를 표적 핵산 부위로 끌어들이도록 구성된 재조합효소 또는 전위효소 복합체와 접촉시키는 단계를 포함할 수 있다. 이 방법은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을, 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산과 접촉시키는 단계를 포함할 수 있다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, Cas 이펙터 복합체는 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다. 일부 경우, PAM 서열은 표적 핵산 부위의 5'에 위치한다.
MG64 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 포함할 수 있다. 이 카고 뉴클레오타이드 서열은 Tn7 타입 전위효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. Cas 이펙터 복합체는 클래스 II 타입 V Cas 이펙터, 및 표적 뉴클레오타이드 서열에 하이브리드화하록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 상기 시스템은 Cas 이펙터 복합체에 결합하도록 구성된 Tn7 타입 전위효소 복합체를 포함할 수 있다. 클래스 II 타입 V Cas 이펙터는 RuvC 도메인을 포함할 수 있다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다. 일부 경우, PAM 서열은 표적 핵산 부위의 5'에 위치한다. 일부 경우, PAM 서열은 5'-nGTn-3' 또는 5'-nGTt-3'을 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB, TnsC 및 TniQ 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 8 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB, TnsC 및 TniQ 폴리펩티드를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 204 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 111 내지 114 또는 201 내지 204 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 125, 127, 123, 129, 131, 133, 153 또는 134 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 좌측 재조합효소 서열은 서열번호 125, 127, 123, 129, 131, 133, 153 또는 134 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 우측 재조합효소 서열은 서열번호 126, 155, 128, 124, 130, 132 또는 154 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 126, 155, 128, 124, 130, 132 또는 154 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 클래스 II 타입 V Cas 이펙터 및 Tn7 타입 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
MG108 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 포함할 수 있다. 이 카고 뉴클레오타이드 서열은 Tn7 타입 전위효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. Cas 이펙터 복합체는 클래스 II 타입 V Cas 이펙터, 및 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 클래스 II 타입 V Cas 이펙터는 RuvC 도메인을 포함할 수 있다. 상기 시스템은 Cas 이펙터 복합체에 결합하도록 구성된 Tn7 타입 전위효소 복합체를 포함할 수 있다. 일부 경우, Tn7 타입 전위효소 복합체는 TnsB 및 TnsC 구성요소를 포함하지만, TnsA 및/또는 TniQ 구성요소를 포함하지 않는다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다. 일부 경우, PAM 서열은 표적 핵산 부위의 5'에 위치한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 38 또는 서열번호 108, 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, 클래스 II 타입 V Cas 이펙터는 서열번호 38 또는 서열번호 108, 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39, 40, 109 또는 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 40 또는 109 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB 구성요소를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 40 또는 109 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB 구성요소를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 39 또는 110 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsC 구성요소를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 39 또는 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsC 구성요소를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 각각 서열번호 40 및 39 또는 109 및 110, 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsB 및 TnsC 구성요소를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 각각 서열번호 40 및 39 또는 109 및 110 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 TnsB 및 TnsC 구성요소를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 115, 116, 205 또는 206 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 115, 116, 205 또는 206 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 134 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 좌측 재조합효소 서열은 서열번호 134 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 우측 재조합효소 서열은 서열번호 135 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 135 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 클래스 II 타입 V Cas 이펙터 및 Tn7 타입 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
MG110 시스템
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템을 제공한다. 이 시스템은 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을 포함할 수 있다. 이 카고 뉴클레오타이드 서열은 Tn7 타입 전위효소 복합체와 상호작용하도록 구성될 수 있다. 상기 시스템은 Cas 이펙터 복합체를 포함할 수 있다. Cas 이펙터 복합체는 클래스 I 타입 I Cas 이펙터, 및 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함할 수 있다. 상기 시스템은 Cas 이펙터 복합체에 결합하도록 구성된 Tn7 타입 전위효소 복합체를 포함할 수 있다.
일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 카고 뉴클레오타이드 서열은 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹된다. 일부 경우, 상기 시스템은 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함한다. 일부 경우, 상기 시스템은 표적 핵산 부위에 인접한 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함한다. 일부 경우, PAM 서열은 표적 핵산 부위의 3'에 위치한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 I 타입 I Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 I 타입 I Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함한다. 일부 경우, 클래스 I 타입 I Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 폴리펩티드를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 클래스 I 타입 I Cas 이펙터에 결합하도록 구성된다. 일부 경우, 클래스 I 타입 I Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 Cas6, Cas7 및 Cas8 이펙터를 포함한다. 일부 경우, 클래스 I 타입 I Cas 이펙터는 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 Cas6, Cas7 및 Cas8 이펙터를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, 재조합효소 또는 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 하나의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 2개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 적어도 3개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 4개의 폴리펩티드를 포함한다. 일부 경우, Tn7 타입 전위효소 복합체는 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체와 실질적으로 동일한 서열을 포함하는 4개의 폴리펩티드를 포함한다.
일부 경우, Tn7 타입 전위효소 복합체는 각각 서열번호 44 내지 47 또는 51 내지 54 중 어느 하나 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함하는 TnsA, TnsB, TnsC 및 TniQ 구성요소를 포함한다.
일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 121, 122, 207 또는 208 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 조작된 가이드 폴리뉴클레오타이드는 서열번호 121, 122, 207 또는 208 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드와 실질적으로 동일한 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함한다.
일부 경우, 좌측 재조합효소 서열은 서열번호 136 또는 138, 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 좌측 재조합효소 서열은 서열번호 136 또는 138, 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 우측 재조합효소 서열은 서열번호 137 또는 139, 또는 이의 변이체에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가진 서열을 포함한다. 일부 경우, 우측 재조합효소 서열은 서열번호 137 또는 139, 또는 이의 변이체와 실질적으로 동일한 서열을 포함한다.
일부 경우, 클래스 I 타입 I Cas 이펙터 및 Tn7 타입 전위효소 복합체는 약 20 킬로염기 미만, 약 15 킬로염기 미만, 약 10 킬로염기 미만 또는 약 5 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩된다.
한 측면에서, 본 개시내용은 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 본원에 기재된 시스템을 발현시키거나 본원에 기재된 시스템을 세포에 도입하는 단계를 포함하는 방법을 제공한다.
IUPAC 관례에 따라, 하기 약어가 실시예 전체에서 사용된다:
A = 아데닌
C = 사이토신
G = 구아닌
T = 타이민
R = 아데닌 또는 구아닌
Y = 사이토신 또는 타이민
S = 구아닌 또는 사이토신
W = 아데닌 또는 타이민
K = 구아닌 또는 타이민
M = 아데닌 또는 사이토신
B = C, G 또는 T
D = A, G 또는 T
H = A, C 또는 T
V = A, C 또는 G
실시예
실시예 1 - (일반 프로토콜) 본원에 기재된 시스템을 위한 PAM 서열 식별/확인
추정 엔도뉴클레아제를 대장균 용해물 기반 발현 시스템(myTXTL, 아버 바이오사이언스(Arbor Biosciences))에서 발현시켰다. 추정 뉴클레아제에 의해 절단될 수 있는 무작위로 생성된 잠재적 PAM 서열을 함유하는 플라스미드를 시퀀싱하여 PAM 서열을 확인하였다. 이 시스템에서, 추정 뉴클레아제를 코딩하는 대장균 코돈 최적화된 뉴클레오타이드 서열을 T7 프로모터의 제어 하에 시험관내에서 PCR 단편으로부터 전사하고 번역하였다. T7 프로모터 및 이를 뒤따르는 반복부-스페이서-반복부 서열로 구성된 최소 CRISPR 어레이를 가진 제2 PCR 단편을 동일한 반응에서 전사하였다. TXTL 시스템에서의 성공적인 엔도뉴클레아제 및 반복부-스페이서-반복부 서열의 발현에 이은 CRISPR 어레이 프로세싱은 활성 시험관내 CRISPR 뉴클레아제 복합체를 제공하였다.
최소 어레이에서 8N 혼합된 염기(잠재적 PAM 서열) 및 이를 뒤따르는 스페이서 서열 일치를 함유하는 표적 플라스미드의 라이브러리를 TXTL 반응의 결과물과 함께 인큐베이션하였다. 1시간 내지 3시간 후, 반응을 중단하고 DNA 클린업 키트, 예를 들어, Zymo DCC, AMPure XP 비드, QiaQuick 등을 통해 DNA를 회수하였다. 어댑터 서열은 엔도뉴클레아제에 의해 절단된 활성 PAM 서열을 가진 DNA에 블런트-말단 라이게이션된 반면, 절단되지 않은 DNA는 라이게이션을 위해 접근될 수 없다. 그 다음, 활성 PAM 서열을 포함하는 DNA 분절을, 상기 라이브러리 및 어댑터 서열에 특이적인 프라이머를 사용한 PCR로 증폭하였다. PCR 증폭 생성물을 겔에서 해상하여, 절단 사건에 상응하는 앰플리콘을 식별하였다. 절단 반응의 증폭된 분절은 NGS 라이브러리의 제조를 위한 주형, 또는 생거 시퀀싱을 위한 기질로서도 사용되었다. 출발 8N 라이브러리의 서브세트인 이 생성된 라이브러리의 시퀀싱은 CRISPR 복합체와 호환되는 PAM 활성을 가진 서열을 보여주었다. 프로세싱된 RNA 구축물을 사용한 PAM 시험을 위해, 시험관내 전사된 RNA를 플라스미드 라이브러리와 함께 첨가하고 최소 CRISPR 어레이 주형을 생략한다는 점을 제외하고 상기 절차를 반복하였다.
결합 능력을 갖지만 뉴클레아제가 결핍된 엔도뉴클레아제의 경우, 상기 절차의 변형을 통해 PAM을 확인하였다. TXTL에서 발현시킨 후, sgRNA 또는 crRNA 및 PAM 라이브러리를 첨가하였다. 이펙터가 sgRNA 의존적 방식으로 스페이서 서열에 결합하였을 때, 스페이서 서열은 이펙터 단백질 내에서 격리되었다. 스페이서 서열 내부를 표적화하는 적절한 제한 효소를 첨가하였고 라이브러리 내의 모든 보호되지 않은 플라스미드를 절단하였다. 밴드의 PCR 및 후속 NGS 라이브러리 제조를 통해 PAM을 함유하는 라이브러리의 절단되지 않은(엔도뉴클레아제 결합된) 구성원을 식별하였다.
실시예 2 - 시험관내 표적화된 인테그라제 활성
이전에 식별된 PAM을 사용하여 인테그라제 활성을 우선적으로 어세이하였지만, PAM 라이브러리 기질을 대신 사용하여 수행할 수 있고, 이때 효율은 감소된다. 시험관내 시험을 위한 구성요소의 한 배열은 기증자 서열을 함유하는 플라스미드 이외의 3개의 플라스미드를 포함하였다: (1) T7 프로모터 하에 이펙터(또는 이펙터들)를 가진 발현 플라스미드; (2) T7 프로모터 하에 인테그라제 유전자를 가진 발현 플라스미드; sgRNA 또는 crRNA 및 tracrRNA; (3) 스페이서 부위 및 적절한 PAM을 함유하는 표적 플라스미드; 및 (4) 카고 유전자(예를 들어, Tet 내성 유전자와 같은 선택 마커) 주변에서의 전위에 필요한 좌측 말단(LE) 및 우측 말단(RE) DNA 서열을 함유하는 기증자 플라스미드. 시험관내 전사/번역(TXTL) 시스템(예를 들어, 대장균 용해물 또는 망상적혈구 용해물 기반 시스템)을 사용하여 이펙터 및 인테그라제 유전자를 발현시켰다. 발현 후, 전위가 일어날 수 있도록 RNA, 표적 DNA 및 기증자 DNA를 첨가하고 인큐베이션하였다. 표적 DNA에 대한 하나의 프라이머 및 기증자 DNA에 대한 하나의 프라이머를 사용하여 인테그라제 부위의 연접부에 걸쳐 PCR을 통해 전위를 검출하였다. 생성된 PCR 생성물을, NGS를 통해 시퀀싱하여 sgRNA/crRNA 표적화된 부위에 대한 정확한 삽입 토폴로지(topology)를 확인하였다. 상기 프라이머들은 다양한 삽입 부위가 수용되고 검출될 수 있도록 다운스트림에 위치하였다. 처음에 삽입 방향도 알지 못했기 때문에, 카고의 어느 한 배향 또는 스페이서의 어느 한 측면에서 통합이 검출되도록 프라이머를 설계하였다.
통합된 카고를 가진 표적 DNA의 실험 결과물의 정량적 PCR(qPCR) 측정을 통해 통합 효율을 측정하였고, 마찬가지로 qPCR을 통해 측정된 비변형 표적 DNA의 양으로 정규화하였다.
이 어세이는 용해물 기반 발현보다는 정제된 단백질 구성요소의 사용을 통해 수행될 수 있다. 이 경우, T7 유도성 프로모터 하에 대장균 프로테아제 결핍 B 균주에서 단백질을 발현시켰고, 초음파처리를 이용하여 세포를 용해시켰으며, AKTA 아반트(Avant) FPLC(지이 라이프사이언스(GE Lifescience))에서 HisTrap FF(지이 라이프사이언스) Ni-NTA 친화성 크로마토그래피를 이용하여 관심 있는 His-태그부착된 단백질을 정제하였다. SDS-PAGE 및 인스탄트블루 울트라패스트(InstantBlue Ultrafast)(시그마-알드리치(Sigma-Aldrich)) 쿠마시(coomassie) 염색된 아크릴아미드 겔(바이오-라드(Bio-Rad))에서 해상된 단백질 밴드의 순도를, 이미지랩(ImageLab) 소프트웨어(바이오-라드)에서 밀도측정을 이용하여 측정하였다. 50 mM Tris-HCl, 300 mM NaCl, 1 mM TCEP 및 5% 글리세롤로 구성된 저장 완충제(pH 7.5)(또는 최대 안정성에 대해 확인된 다른 완충제)에서 단백질을 탈염하고 -80℃에서 저장하였다. 정제 후 이펙터(들) 및 인테그라제(들)를, 예를 들어, 26 mM HEPES pH 7.5, 4.2 mM TRIS pH 8, 50 ㎍/㎖ BSA, 2 mM ATP, 2.1 mM DTT, 0.05 mM EDTA, 0.2 mM MgCl2, 28 mM NaCl, 21 mM KCl 및 1.35% 글리세롤로 구성되고 15 mM Mg(OAc)2로 보충된 반응 완충제(최종 pH 7.5) 중의 전술된 sgRNA, 표적 DNA 및 기증자 DNA에 첨가하였다.
실시예 3 - 예측된 RNA 폴딩
안드로네스쿠(Andronescu) 2007의 방법을 이용하여 활성 단일 RNA 서열의 예측된 RNA 폴딩을 37˚에서 계산하였다. 모든 헤어핀-루프 2차 구조를 구조로부터 단독으로 삭제하고 더 작은 단일 가이드로 반복적으로 컴파일링하였다. 제2 접근법에서, MG64-1의 tracrRNA를 알려져 있는 타입 V-k tracrRNA에 정렬하고 단일 가이드로부터 고유 삽입 영역을 돌연변이시키고 57개 염기까지 최소화하였다. 도 12a는 MG64-2 sgRNA(서열번호 202)의 예측된 구조를 도시한다. 도 12b는 MG64-4 sgRNA(서열번호 203)의 예측된 구조를 도시한다. 도 12c는 MG64-6 sgRNA(서열번호 201)의 예측된 구조를 도시한다. 도 12d는 MG64-7 sgRNA(서열번호 204)의 예측된 구조를 도시한다. 도 12e는 MG108-1 sgRNA(서열번호 206)의 예측된 구조를 도시한다. 염기의 음영은 그 염기의 염기 페어링 확률에 상응한다.
실시예 4 - 겔 변위를 통한 트랜스포존 말단 검증
전기영동 이동성 변위 어세이(EMSA)를 통해 TnsB 결합에 대해 트랜스포존 말단을 시험하였다. 이 경우, 잠재적 LE 또는 RE를 DNA 단편(100 내지 500 bp)으로서 합성하고 FAM-표지부착된 프라이머를 사용한 PCR을 통해 FAM으로 말단-표지부착하였다. 시험관내 전사/번역 시스템(예를 들어, PURExpress)에서 TnsB 단백질을 합성하였다. 합성 후, 1 ㎕의 TnsB 단백질을 결합 완충제(20 mM HEPES pH 7.5, 2.5 mM Tris pH 7.5, 10 mM NaCl, 0.0625 mM EDTA, 5 mM TCEP, 0.005% BSA, 1 ㎍/㎖ 폴리(dI-dC) 및 5% 글리세롤)에서 10 ㎕ 반응물 중의 50 nM의 표지부착된 RE 또는 LE에 첨가하였다. 결합을 40분 동안 30˚에서 인큐베이션한 다음, 2 ㎕의 6X 로딩 완충제(60 mM KCl, 10 mM Tris pH 7,6, 50% 글리세롤)를 첨가하였다. 결합 반응물을 5% TBE 겔에서 분리하고 시각화하였다. TnsB의 존재 하에 LE 또는 RE의 변위는 성공적인 결합에 기인하였고 전위효소 활성을 표시하였다.
도 15는 이 실험의 예를 보여주는데, 이때 MG64-2에 대한 RE DNA 서열(예를 들어, 서열번호 155)을 상기 절차를 통해 FAM으로 말단-표지부착하고 상응하는 MG64-2 TnsB 유사 구성요소(예를 들어, 서열번호 23)와 함께 인큐베이션하였다. 레인 3에서 표지부착된 밴드의 상향변위는 이것이 활성 RE 전위 서열을 함유함을 표시하는, TnsB에 의한 RE 서열의 결합을 표시한다.
실시예 5 - 대장균에서의 인테그라제 활성(예측)
대장균은 게놈 이중 가닥 DNA 절단을 효율적으로 복구하는 능력을 결여하기 때문에, 대장균 게놈에서 이중 가닥 절단을 야기할 수 있는 작용제에 의한 대장균의 형질전환은 세포 사멸을 야기한다. 이 현상을 이용하여, 스페이서/표적 및 PAM 서열이 게놈 DNA 내로 통합되어 있는 표적 균주에서 엔도뉴클레아제 또는 이펙터 보조 인테그라제 및 가이드 RNA(예를 들어, 실시예 3에서와 같이 확인됨)를 재조합적으로 발현시킴으로써 대장균에서 엔도뉴클레아제 또는 이펙터 보조 인테그라제 활성을 시험한다.
그 다음, 단일 가이드 RNA와 함께 뉴클레아제 또는 이펙터를 함유하는 플라스미드, 인테그라제 및 보조 유전자를 발현하는 플라스미드, 및 통합을 위해 좌측 말단(LE) 및 우측 말단(RE) 트랜스포존 모티프에 의해 플랭킹된 선택 마커와 함께 온도 민감성 복제 기점을 함유하는 플라스미드를 사용하여 조작된 균주를 형질전환시킨다. 이어서, 플라스미드 복제를 위한 제한 온도에서 선택함으로써, 이 유전자들의 발현을 위해 유도된 형질전환체를, 게놈 표적으로의 상기 마커의 전달에 대해 스크리닝하고, 게놈 내로의 마커 통합을 PCR로 확인한다.
비편향 접근법을 이용하여 오프-표적 통합을 스크리닝한다. 요약하면, 정제된 gDNA를 Tn5 인테그라제 또는 전단으로 단편화한 다음, 라이게이션된 어댑터 및 선택 마커에 특이적인 프라이머를 사용하여 관심 있는 DNA를 PCR 증폭한다. 그 후, NGS 시퀀싱을 위해 앰플리콘을 준비한다. 생성된 서열의 분석을 통해 트랜스포존 서열을 트리밍하고, 플랭킹 서열을 게놈에 맵핑하여 삽입 위치를 확인하고, 오프-표적 삽입률을 측정한다.
실시예 6 - 전위효소 활성의 콜로니 PCR 스크린(예측)
박테리아 세포에서 뉴클레아제 또는 이펙터 보조 인테그라제 활성을 시험하기 위해, MG64_1에 특이적인 표적 및 상응하는 PAM 서열을 함유하도록 조작된 BL21(DE3) 대장균 세포로부터 균주 MGB0032를 구축한다. 그 다음, pJL56(MG64_1 이펙터 및 헬퍼 스위트를 발현하는 플라스미드, 암피실린 내성), 및 T7 프로모터에 의해 유도되는 관심 있는 조작된 표적에 대한 단일 가이드 RNA 서열을 발현하는 클로람페니콜 내성 플라스미드인 pTCM 64_1 sg로 MGB0032 대장균 세포를 형질전환시킨다.
이어서, 상기 두 플라스미드를 함유하는 MGB0032 배양물을 포화 상태까지 생장시키고, 적절한 항생제를 가진 생장 배지에 적어도 1:10으로 희석하고, 대략 1의 OD까지 37℃에서 인큐베이션한다. 이 생장 단계의 세포를 전기적격(electrocompetent) 세포로 만들고, 통합을 위해 좌측 말단(LE) 및 우측 말단(RE) 트랜스포존 모티프에 의해 플랭킹된 테트라사이클린 내성 마커를 가진 플라스미드인 간소화된 64_1 pDonor로 형질전환시킨다. 그 다음, 전기천공된 세포를 최종 농도 100 μM의 IPTG의 존재 또는 부재 하에 LB 배지에서 2시간 동안 회복시킨 후, LB-한천-암피실린-클로람페니콜-테트라사이클린에 플레이트하고 37℃에서 4일 동안 인큐베이션한다. 멸균 이쑤시개를 이용하여 각각의 생성된 CFU를 샘플링하고, 이를 물에 혼합한다. 이 용액에 Q5 고충실도(High Fidelity) PCR 마스터믹스(뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 프라이머 LA155(5'-GCTCTTCCGATCTNNNNGATGAGCGCATTGTTAGATTTCAT-3') 및 oJL50(5'-AAACCGACATCGCAGGCTTC-3')을 첨가한다. 이 프라이머들은 예측된 삽입 연접부를 플랭킹한다. 예측된 생성물 크기는 609 bp이다. DNA 증폭 PCR 생성물을 2% 아가로스 겔에서 시각화한다. PCR 생성물의 생거 시퀀싱은 전위 사건을 확인시켜준다.
실시예 7 - 세포내 발현/시험관내 어세이(예측)
생리학적으로 적절한 환경에서 NLS 구축물의 기능을 시험하기 위해, 렌티바이러스 형질도입을 이용하여 활성 NLS-태그부착된 CAST 구성요소를 가진 클로닝된 구축물을 K562 세포 내로 통합한다. 요약하건대, 렌티바이러스 전달 플라스미드 내로 클로닝된 구축물을 외피 및 팩키징 플라스미드와 함께 293T 세포 내로 형질감염시키고, 72시간 인큐베이션 후 배지로부터 바이러스 함유 상청액을 수거한다. 이어서, 바이러스를 함유하는 배지를 8 ㎍/㎖의 폴리브렌과 함께 K562 세포주와 72시간 동안 인큐베이션한 다음, 통합을 위해 4일 동안 1 ㎍/㎖의 푸로마이신을 사용하여 형질감염된 세포를 대량으로 선택한다. 선택된 세포주를 4일 기간의 말기에 수거하고 핵 분획 및 세포질 분획을 위해 차등적으로 용해시킨다. 그 다음, 시험관내 발현된 구성요소의 상보적 세트를 사용하여 전위 능력에 대해 후속 분획을 시험한다.
1,000만 개의 세포를 원심분리하고 1xPBS(pH 7.4)로 한 번 세척한다. 상청액 세척제를 완전히 흡인하여 세포 펠릿을 얻고 -80℃에서 16시간 동안 급속 냉동한다. 얼음 위에서 해동한 후, 세포 펠릿 크기를 질량으로 측정하고, 적절한 추출 부피의 세포 분획화 및 핵 추출 시약(NE-PER)을 사용하여 세포 분획에서 단백질을 천연적으로 추출한다. 요약하면, 세포질 추출 시약을 1:10의 세포 질량 대 추출 시약 부피로 사용한다. 세포 현탁액을 볼텍싱으로 혼합하고 비이온성 세제로 용해시킨다. 이어서, 세포를 4℃에서 5분 동안 16,000xg로 원심분리한다. 그 다음, 세포질 추출 상청액을 기울여 따라내고 시험관내 시험을 위해 보관한다. 그 후, 핵 추출 시약을 1:2의 원래 세포 질량 대 핵 추출 시약으로 첨가하고 간헐적으로 볼텍싱하면서 얼음 위에서 1시간 동안 인큐베이션한다. 이어서, 핵 현탁액을 4℃에서 10분 동안 16,000xg로 원심분리하고 상청액 핵 추출물을 기울여 따라내고 시험관내 전위 활성에 대해 시험한다. 본 발명자들은 시험관내 발현된 단백질, 기증자 DNA, pTarget 및 완충제의 상보적 세트와 함께 각각의 조건에 대해 각각의 세포 및 핵 추출물 4 ㎕를 사용하여 시험관내 전위 반응을 수행한다. 전위 활성의 증거는 기증자-표적 연접부의 PCR 증폭에 의해 어세이된다.
실시예 8 - 포유류 세포에서의 활성(예측)
포유류 세포에서 표적화 및 절단 활성을 보여주기 위해, 핵 국소화 서열을 각각의 뉴클레아제 또는 이펙터 단백질 및 인테그라제 단백질의 C 말단에 융합시키고, 융합 단백질을 정제한다. 관심 있는 게놈 유전자좌를 표적화하는 단일 가이드 RNA를 합성하고 뉴클레아제/이펙터 단백질과 함께 인큐베이션하여 리보핵단백질 복합체를 형성한다. 좌측 말단(LE) 및 우측 말단(RE) 모티프에 의해 플랭킹된 선택 네오마이신 내성 마커(NeoR) 또는 형광 마커를 함유하는 플라스미드로 세포를 형질감염시키고 4시간 내지 6시간 동안 회복시킨 후, 뉴클레아제 RNP 및 인테그라제 단백질로 전기천공시킨다. G418 내성 콜로니의 계수 또는 형광 활성화된 세포 세포분석법으로 게놈 내로의 플라스미드의 통합을 정량한다. 게놈 DNA를 전기천공 후 72시간에서 추출하고 NGS 라이브러리의 제조에 사용한다. 게놈을 단편화하고 NGS 라이브러리 제조를 위해 트랜스포존 마커 및 플랭킹 DNA의 앰플리콘을 제조함으로써 오프-표적 빈도를 어세이한다. 각각의 표적화 시스템의 활성을 시험하기 위해 적어도 40개의 상이한 표적 부위를 선택한다.
실시예 9 - 표적화된 뉴클레아제의 활성
제자리 발현 및 단백질 서열 분석은 일부 RNA 가이딩 이펙터가 활성 뉴클레아제임을 암시한다. 이들은 예측된 엔도뉴클레아제 관련 도메인(일치하는 RuvC 및 HNH_엔도뉴클레아제 도메인) 및 예측된 HNH와 RuvC 촉매 잔기를 함유한다(예를 들어, MG36-5 이펙터의 예측된 촉매 잔기를 보여주는 도 4A 참조).
myTXTL 시스템 및 시험관내 전사된 RNA를 사용하여 조작된 단일 가이드 RNA 서열로 후보 활성을 시험한다. 활성 단백질은 라이브러리를 성공적으로 절단하여 아가로스 겔 전기영동에서 약 170 bp의 밴드를 생성하는 단백질로서 식별된다.
실시예 10 - 트랜스포존의 식별
트랜스포존은 트랜스포존의 좌측 말단과 우측 말단 사이에 인테그라제 및/또는 인테그라제 기능을 가진 하나 이상의 단백질 서열을 함유할 때 활성을 나타낼 것으로 예측된다. 전형적인 Tn7 트랜스포존은 일반적으로 촉매 인테그라제 TnsB를 포함하지만, TnsA, TnsC, TnsD, TnsE, TniQ 및/또는 다른 인테그라제 또는 인테그라제를 함유할 수도 있다. 트랜스포존 말단은 인테그라제 단백질 및 다른 '카고' 유전자를 플랭킹하는 15 bp 내지 150 bp 길이의 직접 반복부 및/또는 역반복부를 함유하는 예측된 인테그라제 결합 부위를 포함한다. 단백질 서열 분석은 인테그라제가 인테그라제 도메인, 인테그라제 도메인 및/또는 인테그라제 촉매 잔기를 함유함을 표시하였는데, 이는 인테그라제가 활성 상태임을 암시한다(예를 들어, TnsB 요소를 함유하는 예시적인 MG36-5 이펙터 기반 CAST 시스템에 대한 유전자좌 도표를 보여주는 도 4A; 및 TnsA, TnsB, TnsC 및 TniQ 요소를 함유하는 예시적인 MG39-1 이펙터 기반 CAST 시스템에 대한 유전자좌 도표를 보여주는 도 5A).
실시예 11 - CRISPR 관련 트랜스포존의 식별
추정 CRISPR 관련 트랜스포존(CAST)은 DNA 및/또는 RNA 표적화 CRISPR 이펙터, 및 CRISPR 어레이의 근처에서 예측된 인테그라제 기능을 가진 단백질을 함유한다. 일부 시스템에서, 이펙터는 엔도뉴클레아제 관련 촉매 도메인 및/또는 촉매 잔기의 존재를 기반으로 뉴클레아제 활성을 가질 것으로 예측된다(예를 들어, TnsB 요소를 함유하는 CAST 시스템 유전자좌와 관련하여 MG36-5 이펙터의 예측된 촉매 잔기를 보여주는 도 4A). 인테그라제는 CRISPR 유전자좌(CRISPR 뉴클레아제 및 어레이) 및 인테그라제 단백질이 예측된 트랜스포존 좌측 말단과 우측 말단 사이에 위치할 때 활성 뉴클레아제와 회합될 것으로 예측되었다(예를 들어, 도 4B 및 4C). 이 경우, 이펙터는 가이드 RNA를 기반으로 특정 게놈 위치로의 DNA 통합을 유도할 것으로 예측되었다.
일부 시스템에서, 이펙터는 알려져 있는 CRISPR 이펙터 단백질과 상동성을 갖지만, 엔도뉴클레아제 도메인 및/또는 촉매 잔기의 부재를 기반으로 비활성 상태일 것으로 예측되었다(도 5A). 인테그라제는 CRISPR 유전자좌(비활성 CRISPR 뉴클레아제 및 어레이) 및 인테그라제 단백질이 예측된 트랜스포존 좌측 말단 및 우측 말단 내에 위치할 때 이펙터와 회합될 것으로 예측된다(도 5A 및 5B).
실시예 12 - CAST 발견
CRISPR 관련 트랜스포존(CAST)은 DNA 카고의 표적화된 통합을 촉진하기 위해 CRISPR 시스템과 상호작용하도록 진화된 트랜스포존을 포함하는 시스템이다.
CAST는 트랜스포존의 시그니처 좌측 말단 및 우측 말단 내에서의 DNA 전위에 관여하는 하나 이상의 단백질 서열을 코딩하는 게놈 서열이다. 전형적인 Tn7 트랜스포존은 일반적으로 촉매 전위효소 TnsB를 포함하지만, 촉매 전위효소 TnsA, 로더(loader) 단백질 TnsC 또는 TniB, 및 표적 인식 단백질 TnsD, TnsE, TniQ 및/또는 다른 트랜스포존 관련 구성요소도 함유할 수 있다. 트랜스포존 말단은 트랜스포존 기구 및 다른 '카고' 유전자를 플랭킹하는 15 bp 내지 150 bp 길이의 직접 반복부 및/또는 역반복부를 함유하는 예측된 전위효소 결합 부위를 포함한다.
또한, CAST는 CRISPR 어레이의 근처에서 DNA 및/또는 RNA 표적화 CRISPR 뉴클레아제 또는 이펙터도 코딩한다. 일부 시스템에서, 이펙터는 엔도뉴클레아제 관련 촉매 도메인 및/또는 촉매 잔기의 존재를 기반으로 활성 뉴클레아제일 것으로 예측된다. 일부 시스템에서, 이펙터는 알려져 있는 CRISPR 이펙터 단백질과 서열 유사성을 갖지만, 엔도뉴클레아제 도메인 및/또는 촉매 잔기의 부재를 기반으로 비활성 상태일 것으로 예측되었다. CRISPR 유전자좌 및 트랜스포존 관련 단백질이 예측된 트랜스포존 좌측 말단 및 우측 말단 내에 위치할 때, 트랜스포존은 이펙터와 회합될 것으로 예측된다. 이 경우, 이펙터는 가이드 RNA를 기반으로 특정 게놈 위치로의 DNA 통합을 유도할 것으로 예측된다.
실시예 13a - Cas12k CAST
Cas12k CAST 시스템은 뉴클레아제 결함 CRISPR Cas12k 이펙터, CRISPR 어레이, tracrRNA 및 Tn7 유사 전위 단백질을 코딩한다(예를 들어, Cas12k를 함유하는 MG108-1 CAST 시스템에 대한 유전자좌 조직화 도표를 보여주는 도 8 참조). Cas12k 이펙터는 계통발생학적으로 다양하며 이들과 CAST의 회합을 확인시켜주는 특징은 여러 경우에서 확인되었다(예를 들어, MG64-1, MG64-2, MG64-3, MG64-5, MG64-6, MG64-7, MG64-13, MG64-54, MG64-56, MG108-1 및 MG108-2 이펙터가 어떻게 이 군의 일부인지를 보여주는 도 9 참조). 이러한 특징적인 특징 중 하나는 MG64-3 CRISPR 유전자좌와 관련하여 확인된 트랜스포존 말단이었고; 트랜스포존 좌측 말단은 말단 역반복부 및 자가 일치 스페이서 서열에 의해 표시된 바와 같이 MG64-3 CRISPR 유전자좌로부터 다운스트림에서 식별되었다(도 11a). 식별된 또 다른 이러한 특징은 보존된 모티프 5'-GNNGGNNTGAAAG-3'을 함유하는 Cas12k CAST CRISPR 반복부(crRNA)를 포함한다(예를 들어, MG64-2, MG64-4, MG64-5, MG64-6, MG64-7 및 MG108-1, 및 도 11b 참조). crRNA 모티프 내의 짧은 반복부-항-반복부(RAR)는 tracrRNA의 상이한 영역들과 정렬되었고, RAR 모티프는 tracrRNA의 시작 및 말단을 정의하는 것으로 보였다. 도 13c는 예를 들어, MG64-2, MG64-4, MG64-5, MG64-6, MG64-7 및 MG108-1 패밀리에서 이러한 RAR 모티프의 존재를 보여준다.
실시예 13b - 클래스 I 타입 I-F CAST
일부 CAST는 뉴클레아제 결함 CRISPR 타입 I-F 캐스케이드 이펙터 단백질, CRISPR 어레이 및 Tn7 유사 전위 단백질을 코딩한다(예를 들어, MG110-1 이펙터 기반 타입 I-F CAST 시스템의 유전자좌 조직화 도표를 보여주는 도 10A 참조). 타입 I-F 캐스케이드 CAST는 스템-루프 구조의 형성에 관여할 가능성이 있는 보존된 모티프 5'-CTGCCGNTAGGNAGC-3'를 함유하는, crRNA에 의해 코딩된 단일 가이드 RNA를 사용하여 작용할 것으로 예측되었다(예를 들어, MG110-1 및 MG110-2 패밀리 crRNA(서열번호 207 및 208)에서 이 특징의 정렬을 보여주는 도 10B 및 10C 참조). 부분적으로 이 동일한 특징을 가진다는 점을 기반으로, MG110-2 이펙터 함유 패밀리도 타입 I-F CAST 시스템으로서 식별되었다.
실시예 14 - 트랜스포존 말단 예측
이펙터 및 트랜스포존 기구를 플랭킹하는 유전자간 영역으로부터 트랜스포존 말단을 추정하였다. 예를 들어, Cas12k CAST의 경우, TnsB로부터 바로 업스트림에 위치하며 CRISPR 유전자좌로부터 바로 다운스트림에 위치한 유전자간 영역은 Tn7 트랜스포존 좌측 말단 및 우측 말단(LE 및 RE)을 함유하는 것으로서 예측되었다(예를 들어, MG64-3 패밀리 CAST 유전자좌 도표와 관련하여 LE 및 RE 분석을 보여주는 도 11a 참조).
최대 2개의 불일치가 있는 약 12 bp의 직접 반복부 및 역반복부(DR/IR)를 콘티그(contig)에서 예측하였다. 또한, 도트플롯(Dotplot) 알고리즘을 이용하여 CAST 트랜스포존을 플랭킹하는 짧은(약 10 내지 20 bp) DR/IR을 찾았다. CAST 이펙터 및 트랜스포존 유전자를 플랭킹하는 유전자간 영역에 위치한 일치하는 DR/IR은 트랜스포존 결합 부위를 코딩할 것으로 예측되었다. 추정 트랜스포존 결합 부위를 코딩하는, 유전자간 영역으로부터 추출된 LE 및 RE를 정렬하여 트랜스포존 말단 경계를 정의하였다. 추정 트랜스포존 LE 및 RE 말단은 a) 첫 번째로 예측된 트랜스포존 코딩 유전자 및 마지막 예측된 트랜스포존 코딩 유전자로부터 400 bp 업스트림 및 다운스트림 내에 위치하고; b) 다수의 짧은 역반복부를 공유하고; c) 65% 초과의 뉴클레오타이드 동일성을 공유하는 영역으로서 식별된다. 이 과정을 반복하여, MG36-5(서열번호 17 및 18), MG39-1(서열번호 20 및 21), MG64-2(서열번호 125 및 126), MG64-4(서열번호 127 및 128), MG64-6(서열번호 123 및 124), MG64-7(서열번호 129 및 130), MG64-13(서열번호 131 및 132), MG64-54(서열번호 133), MG108-1(서열번호 134 및 135), MG110-1(서열번호 136 및 137) 및 MG110-2(서열번호 138 및 139)에 대한 추정 LE/RE 서열을 식별하였다.
실시예 15 - 클래스 II 타입 V CAST 시스템을 위한 단일 가이드 설계
MG64 서브패밀리에 대한 Cas 이펙터 및 CRISPR 어레이를 둘러싼 유전자간 영역의 분석은 잠재적 항-반복부 서열, 및 tracrRNA의 서열에 상응하는 항-반복부에 인접하는 보존된 "CYCC(N6)GGRG" 스템-루프 구조를 식별하였다(도 11b). sgRNA를 생성하기 위해, 테트라루프 서열인 GAAA를 추가하여 crRNA-tracrRNA 상보적 서열의 스템-루프 영역을 유지하면서, tracrRNA 및 crRNA 반복부를 폴딩하고 트리밍하였다. 이 서열들은 아래 표 1에 요약되어 있다.
실시예 16 - 표적화된 뉴클레아제를 사용한 시험관내 통합 활성
제자리 발현 및 단백질 서열 분석은 일부 RNA 가이딩 이펙터들이 활성 뉴클레아제임을 시사하였다. 이 이펙터들은 예측된 엔도뉴클레아제 관련 도메인(일치하는 RuvC 및 HNH_엔도뉴클레아제 도메인), 및/또는 예측된 HNH 및 RuvC 촉매 잔기를 함유한다. myTXTL 시스템 및 시험관내 전사된 RNA를 사용하여 조작된 단일 가이드 RNA 서열로 후보 활성을 시험하였다. 활성 단백질은 라이브러리를 성공적으로 절단하여 아가로스 겔 전기영동에서 약 170 bp의 밴드를 생성하는 단백질로서 식별되었다.
실시예 17 - 프로그래밍 가능한 DNA 통합
단일 반응에서 5종의 구성요소들을 조합하여 CAST 활성을 시험하였다: (1) myTXTL 또는 PURExpress에 의해 발현된 Cas 이펙터 단백질; (2) Cas 효소에상응하는 표적 서열 및 PAM을 함유하는 표적 DNA 단편 또는 플라스미드; (3) DNA 단편 또는 플라스미드에서 전위효소 시스템의 예측된 LE 및 RE에 의해 플랭킹된 DNA 마커 또는 단편을 함유하는 기증자 DNA 단편; (4) myTXTL 또는 PURExpress를 사용함으로써 발현된 어레이의 일부인 것으로 예측된 추가 전위효소 단백질의 임의의 조합; 및 (5) 조작된 시험관내 전사된 단일 가이드 RNA 서열. 기증자 단편을 성공적으로 전위시킨 활성 시스템을 기증자-표적 연접부의 PCR 증폭으로 어세이하였다.
도 13은 예측된 LE/RE 기증자 서열(서열번호 123 및 124) 및 인실리코(in silico) 설계된 sgRNA(서열번호 201)를 사용하여 MG64-6 이펙터, TnsB, TnsC 및 TniQ 단백질(서열번호 30 내지 33)을 포함하는 MG64-6 시스템이 활성을 나타냄을 입증하는 예시적인 데이터를 보여준다. 모든 MG64-6 구성요소들을 조합하여 전위 반응을 수행한 후, 연접부의 PCR 증폭은 적절한 기증자-표적 형성이 일어났고 전위 반응이 sg 의존적이었음을 보여주었다(도 13a). (각각 LE/RE가 PAM에 원위로 삽입될 때 LE/RE 연접부에 걸쳐 있는) PCR 반응 #3 및 #4에서 증폭된 밴드의 존재는 표적에 대한 기증자의 두 가지 배향, 즉 LE가 PAM에 더 가까운 배향, 및 RE가 PAM에 더 가까운 배향이 만들어짐을 시사하였다. 두 가지 전위 배향이 만들어졌지만, LE가 PAM에 더 가까운 경우 표적 내로의 기증자 통합에 대한 선호가 있었고, 이는 (각각 PAM에 원위 삽입된 LE 연접부 및 PAM에 근위 삽입된 RE 연접부에 걸쳐 있는) 반응 #4 및 #5의 경우 존재하는 강한 밴드에 의해 표시된다.
바람직한 배향 생성물의 생거 시퀀싱을 수행하였다. LE가 PAM에 더 가까운 경우 일어나는 통합 중에서, 표적/기증자 연접부에 걸쳐 정방향 또는 역방향으로부터 시퀀싱 크로마토그램 신호의 분명한 저하가 있었다(도 13c). 이것은 LE가 PAM에 더 가까운 경우 배향된 생성물의 통합이 다양한 뉴클레오타이드에 걸쳐 일어났고, 이때 LE가 PAM에 더 가까운 경우 생성물들 중 주요 생성물은 PAM으로부터의 61 bp 통합이었다(도 14). 기증자-표적 연접부에 걸쳐 기증자로부터 유래한 시퀀싱은 LE 및 RE 서열의 필수 외부 경계의 조성을 정의하였다. LE 및 RE 도메인의 추가 조사는 LE 및 RE 서열의 내부 한계를 확인함으로써, 전위에 필수적인 최소 LE/RE를 확인할 것이다. LE가 PAM에 더 가까운 경우 생성물에 대한 RE의 시퀀싱은 기증자 RE의 다운스트림에서 3 bp 중복을 보여주었다. 이것은 부분적으로 엇갈린(staggered) 절단 부위에서 기증자 단편을 절단하고 라이게이션하는 Tn7 전위효소 통합 사건에 기인한다. 3 bp 중복은 다른 Tn7 전위효소로부터 예상된 5 bp의 중복보다 더 작다.
표적 플라스미드의 8N 라이브러리에 대한 PCR 증폭 생성물의 생거 시퀀싱은 또한 스페이서의 5' 말단에서 MG64-6 이펙터의 PAM 선호가 nGTn/nGTt임을 밝혔다. PAM 라이브러리 표적의 NGS 분석은 5' 말단에서 nGTn 모티프 선호를 확인시켜주었다(도 13b).
실시예 18 - 통합 윈도우 확인
상기 실시예 17에서 증폭된 PAM의 PCR 연접부를 NGS 라이브러리에 대해 인덱싱하고, V2 300 판독 키트를 사용하여 MiSeq에서 시퀀싱하였다. PAM으로부터 60 bp 통합 거리를 가진 추정 전위 서열의 앰플리콘 서열을 사용하는 CRISPResso를 사용하여 리드를 맵핑하고 정량하였다(guideseq = LE 또는 RE의 20 bp 3' 말단, 윈도우의 중심 = 0, 윈도우 크기 = 20). 삽입결실 히스토그램을 검출된 총 삽입결실 리드로 정규화하였고, 빈도를 60 bp 기준 서열과 비교하여 플롯팅하였다(도 14).
PCR 반응 5(PAM에 인접한 LE, 도 13a) 및 PCR 4(PAM으로부터 먼 RE, 도 13b) 둘 다를 MG64-6에 대한 서열 및 PAM으로부터의 거리에 대해 플롯팅하였다(도 14). 통합 윈도우의 분석은 스페이서 PAM 부위에서 일어난 통합의 95%가 PAM으로부터 58개 내지 68개의 뉴클레오타이드만큼 떨어진 10 bp 윈도우 내에 있음을 표시하였다. 원위 빈도와 근위 빈도 사이의 통합 거리의 차이는 통합 시 전위효소의 엇갈린 뉴클레아제 활성의 결과로서 3개 내지 5개의 염기쌍 중복인 통합 부위 중복을 반영하였다.
실시예 19 - 겔 변위를 통한 트랜스포존 말단 검증
예측된 트랜스포존 말단 서열에 대한 TnsB의 활성을 검증하기 위해, FAM 표지부착된 올리고를 사용하여 MG64-6의 RE를 증폭하였다. 무세포 전사/번역 시스템을 사용하여 MG64-6 TnsB 단백질을 발현시키고 RE FAM 표지부착된 생성물과 함께 인큐베이션하였다. 30분 동안 인큐베이션한 후, 천연 5% TBE 겔에서 결합을 관찰하였다(도 15). 함께 인큐베이션된 레인(도 15, 레인 3) 내의 형광 생성물의 다수의 밴드는 최소 3개의 TnsB 결합 부위를 표시하였다.
실시예 20 - 전위효소 활성의 콜로니 PCR 스크린(예측)
콜로니 PCR 스크린을 통해 전위 활성을 어세이한다. 대장균을 pDonor 플라스미드로 형질전환시킨 후, 암피실린, 클로람페니콜 및 테트라사이클린을 함유하는 LB 한천에 플레이트한다. 선택된 CFU를, PCR 시약 및 삽입 연접부를 플랭킹하는 프라이머를 함유하는 용액에 첨가한다.
실시예 22 - LE-RE 최소화(예측)
표적-전위 연접부의 시퀀싱은 표적 반응 내로 혼입되는 기증자 플라스미드로부터 가장 바깥쪽 서열을 식별함으로써 말단 역반복부를 식별하는 데 도움을 준다. 10%의 가변성으로 14 bp의 반복부 분석을 수행함으로써, 말단 내에 함유된 짧은 반복부를 식별하고; 불필요한 서열을 결실시키면서 반복부를 보존하는 이들의 절두(truncation)에 포함될 최소 서열을 식별한다. 예측 및 클로닝은 다회 반복을 통해 수행되고, 이때 각각의 상호작용을 시험관내 전위로 시험한다. 전위는 96 bp의 RE 영역과 조합된 68 bp의 LE 영역에 이르기까지 활성을 띨 것으로 예측된다.
실시예 23 - 전위의 오버행(overhang) 영향(예측)
TnsB 결합 모티프 외부의 불필요한 서열이 전위에 필요한지를 시험하기 위해, LE 및 RE 둘 다의 TGTACA 또는 TGTCGA 모티프용으로 설계된 올리고를, 0, 1, 2, 3, 5 및 10 bp 추가 염기쌍을 갖도록 설계하고 합성한다. 이 합성된 올리고를 사용하여 오버행을 가진 기증자 PCR 단편을 생성하고, 표적 부위 내로 전위하는 그의 능력에 대해 시험한다.
실시예 24 - CAST NLS 설계(예측)
치료 목적용 진핵생물 게놈 편집은 편집 효소를 핵 내로 가져오는 것에 의존한다. 더 큰 단백질의 작은 폴리펩티드 스트레치는 핵막을 가로질러 단백질을 가져오도록 세포 구성요소에 신호를 보낸다. 이 NLS 태그는 그 자신에 융합된 단백질의 기능도 유지하면서 가져오는 기능을 제공할 필요가 있기 때문에, 이 태그의 배치는 최적화를 요구할 수 있다. CAST 복합체의 각각의 구성요소에 대한 NLS의 기능적 배향을 시험하기 위해, 뉴클레오플라스민(Nucleoplasmin) NLS를 MG CAST의 각각의 구성요소의 N-말단에 융합시키고 SV40 NLS를 MG CAST의 각각의 구성요소의 C-말단에 융합시키는 구축물을 합성한다. 이러한 구축물의 단백질을 무세포 시험관내 전사/번역 반응에서 발현시키고, 태그부착되지 않은 구성요소의 상보적 세트를 사용하여 시험관내 전위 활성에 대해 시험한다. PCR 4(RE 원위 전위 평가) 및 동족 전위 사건인 PCR 5(LE 근위 전위 평가)를 사용하여 기증자-표적 연접부의 PCR을 통해 활성의 유지에 대해 NLS 태그부착된 구축물을 평가한다.
실시예 25 - Cas12k 및 TniQ 단백질 융합 구축물 설계 및 시험(예측)
단백질 구성요소의 발현을 단순화/최소화하고 이 구성요소를 세포 내로 전달하는 것을 용이하게 하기 위해, 다양한 링커, 링커 길이 및 도메인 경계를 사용하여 Cas12k 이펙터와 TniQ 단백질 사이의 융합 구축물을 설계하고 합성하고 시험한다. Cas12k에 융합된 TniQ의 두 가지 배향, 즉 C-말단 융합인 Cas-TniQ, 및 N-말단 융합인 TniQ-Cas를 설계하고 합성한다.
2개의 다른 링커도 사용하여 이펙터와 TniQ 유전자를 융합시킨다. 자가 중단 번역 서열인 P2A는 Cas-NLS-P2A-NLS-TniQ 구축물에서 활성을 띠고, MCV 내부 리보좀 진입 서열(IRES) mRNA 기반 링커는 세포에서 상기 두 구성요소들의 독립적인 번역을 가능하게 한다.
실시예 26 - 시험관내 전위 시험과 커플링된 세포내 발현(예측)
생리학적으로 적절한 환경에서 NLS 구축물의 기능을 시험하기 위해, 렌티바이러스 형질도입을 이용하여 활성 NLS 태그부착된 CAST 구성요소를 가진 클로닝된 구축물을 K562 세포 내로 통합한다. 요약하면, 렌티바이러스 전달 플라스미드 내로 클로닝된 구축물을 외피 및 팩키징 플라스미드와 함께 293T 세포 내로 형질감염시키고 72시간 인큐베이션 후 배지로부터 바이러스 함유 상청액을 수거한다. 그 다음, 바이러스를 함유하는 배지를 8 ㎍/㎖의 폴리브렌과 함께 72시간 동안 K562 세포주와 인큐베이션한 후, 4일 동안 1 ㎍/㎖의 푸로마이신을 사용하여 형질감염된 세포를 대량으로 통합을 위해 선택한다. 선택된 세포주를 4일 기간의 말기에 수거하고 핵 및 세포질 분획을 위해 차등적으로 용해시킨다. 그 다음, 시험관내 발현된 구성요소의 상보적 세트를 사용하여 전위 능력에 대해 후속 분획을 시험한다.
NLS-TnsB 및 TnsB-NLS 둘 다를 세포 분획화 및 시험관내 전위로 시험하고, 세포질 분획 및 핵 분획 둘 다에 대해 전위를 검출한다.
세포 내의 Cas12k 융합체를 유사하게 분획화하고 전위에 대해 시험한다. Cas-NLS Cas-NLS-P2A-NLS-TniQ를 세포 내로 형질도입하고, 분획화하고, 시험관내에서 하위세포 활성에 대해 시험한다. Cas-NLS-P2A-NLS-TniQ는 단일 가이드를 반응물에 첨가하였을 때 세포질에서 전위할 수 있다. 본 발명자들은 홀로(holo) Cas 단백질(+sgRNA) 또는 추가 TniQ를 sgRNA로 보충함으로써, 핵 분획에서 Cas-NLS-P2A-NLS-TniQ 구축물을 보완할 수 있었다.
본 개시내용의 시스템은 다양한 응용분야, 예를 들어, 핵산 편집(예를 들어, 유전자 편집) 또는 핵산 분자와의 결합(예를 들어, 서열 특이적 결합)에 사용될 수 있다. 이러한 시스템은 예를 들어, 대상체에서 질환을 야기할 수 있는 유전적으로 유전된 돌연변이의 교정(예를 들어, 제거 또는 대체)에 사용될 수 있고/있거나; 세포에서 유전자의 기능을 확인하기 위해 그 유전자를 비활성화시키는 데 사용될 수 있고/있거나; (예를 들어, 역전사된 바이러스 RNA 또는 질환 야기 돌연변이를 코딩하는 증폭된 DNA 서열의 절단을 통해) 질환 야기 유전적 요소를 검출하는 진단 수단으로서 사용될 수 있고/있거나; 특정 뉴클레오타이드 서열(예를 들어, 박테리아에 대한 항생제 내성을 코딩하는 서열)을 표적화하고 검출하기 위해 프로브와 함께 비활성화된 효소로서 사용될 수 있고/있거나; 바이러스 게놈을 표적화하여 바이러스를 비활성 상태로 만들거나 숙주 세포를 감염시킬 수 없게 만드는 데 사용될 수 있고/있거나; 유전자를 추가하거나 대사 경로를 수정함으로써, 유기체가 귀중한 소분자, 거대분자 또는 2차 대사산물을 생성하도록 조작하는 데 사용될 수 있고/있거나; 진화적 선택을 위한 유전자 유도 요소를 확립하는 데 사용될 수 있고/있거나; 바이오센서로서 외래 소분자 및 뉴클레오타이드에 의한 세포 교란을 검출하는 데 사용될 수 있다.
본 발명의 바람직한 실시양태들이 본원에 제시되고 설명되었지만, 이러한 실시양태들이 단지 예시로서만 제공된다는 것은 당분야에서 숙련된 자에게 자명할 것이다. 본 발명은 본 명세서에서 제공된 특정 실시예에 의해 제한되지 않는다. 본 발명이 상기 언급된 본 명세서를 참조함으로써 설명되었지만, 본원에서 실시양태의 설명 및 예시는 제한적인 의미로 해석되어서는 안 된다. 본 발명을 벗어나지 않으면서 수많은 변경, 변화 및 치환이 당분야에서 숙련된 자에게 인식될 것이다. 나아가, 본 발명의 모든 측면은 다양한 조건 및 변수에 의해 좌우되는, 본원에 기재된 특정 묘사, 구성 또는 상대적 비율로 제한되지 않음을 이해해야 한다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 본 발명의 실시에 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변형, 변경 또는 등가물도 커버하는 것으로 생각된다. 하기 청구범위는 본 발명의 범위를 정의하고, 이 청구범위 내의 방법과 구조 및 이들의 등가물도 이에 의해 커버된다.
SEQUENCE LISTING
<110> METAGENOMI IP TECHNOLOGIES, LLC
<120> SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES
<130> 55921-714.601
<140>
<141>
<150> 63/232,593
<151> 2021-08-12
<150> 63/186,698
<151> 2021-05-18
<150> 63/069,703
<151> 2020-08-24
<160> 261
<170> PatentIn version 3.5
<210> 1
<211> 1424
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG36 effector sequence
<220>
<223> MG36-5 effector
<400> 1
Met Lys Arg Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile Gly Trp
1 5 10 15
Ala Leu Val Asn Glu Ala Glu Thr Asp Glu Glu Val Ser Ser Ile Ile
20 25 30
Arg Leu Gly Val Arg Val Asn Pro Leu Thr Val Asp Glu Thr Gln Asn
35 40 45
Phe Glu Lys Gly Lys Ser Ile Thr Thr Asn Ala Glu Arg Thr Leu Lys
50 55 60
Arg Ser Met Arg Arg Asn Leu Gln Arg Tyr Lys Leu Arg Arg Asp Ala
65 70 75 80
Leu Val Glu Phe Leu Lys Glu Leu Gly Phe Ile Thr Asp Glu Thr Ile
85 90 95
Leu Ser Glu Gln Gly Asn Arg Thr Thr Phe Glu Thr Cys Arg Leu Arg
100 105 110
Ala Lys Ala Ala Glu Glu Glu Ile Ser Leu Glu Glu Leu Ser Arg Val
115 120 125
Leu Leu Met Ile Asn Lys Lys Arg Gly Tyr Lys Ser Ser Arg Lys Val
130 135 140
Lys Lys Glu Glu Asp Gly Val Leu Ile Asp Gly Met Glu Ile Ala Lys
145 150 155 160
Lys Leu Tyr Glu Glu Asp Leu Thr Pro Gly Gln Leu Cys Ser Gln Leu
165 170 175
Leu Glu Ser Gly Lys Lys Val Leu Pro Asp Phe Tyr Arg Ser Asp Leu
180 185 190
Gln Glu Glu Leu Asp Arg Ile Trp Ser Val Gln Lys Gln Phe His Pro
195 200 205
Asp Val Phe Cys Asp Ala Ala Lys Glu Glu Ile Lys Gly Lys Asn Arg
210 215 220
Ser Gln Thr Trp Ala Ile Leu Ala Asn Tyr Phe Val Trp Lys Glu Glu
225 230 235 240
Val Val Gly Trp Asn Asp Arg Glu Ala Lys Asn Glu Thr Ile Glu Lys
245 250 255
Glu Cys Lys Leu Val Gly Leu Lys Arg Thr Thr Lys Gly Tyr Glu Leu
260 265 270
Lys Lys Glu Asn Tyr Arg Trp Arg Ala Gln Ala Leu Thr Glu Gln Leu
275 280 285
Gly Leu Glu Glu Ile Ala Val Val Leu Gln Glu Ile Asn Gly Gln Ile
290 295 300
Asn Ala Ser Ser Gly Tyr Leu Gly Ala Ile Ser Asp Arg Ser Lys Val
305 310 315 320
Leu Tyr Phe Asn His Gln Thr Val Gly Gln Tyr Gln Met Ala Glu Leu
325 330 335
Asp Lys Asn Pro His Ala Ser Leu Arg Asn Met Val Phe Tyr Arg Gln
340 345 350
Asp Tyr Leu Asp Glu Phe Asp Arg Ile Trp Glu Lys Gln Ala Glu Phe
355 360 365
His Lys Glu Leu Thr Ala Glu Leu Lys Lys Glu Ile Arg Asp Met Ile
370 375 380
Ile Phe Tyr Gln Arg Arg Leu Lys Ser Gln Lys Gly Leu Ile Ser Phe
385 390 395 400
Cys Glu Phe Glu Arg Leu Glu Ile Val Val Glu Lys Asp Gly Lys Lys
405 410 415
Gln Thr Lys Val Ile Gly Cys Lys Val Ile Pro Arg Ser His Pro Leu
420 425 430
Phe Gln Glu Phe Lys Val Trp Gln Thr Leu Asn Asp Ile Lys Val Leu
435 440 445
Gly Arg Glu Lys Lys Arg Asn Ala Leu Ser Ala Ser Glu Ser Arg Ala
450 455 460
Leu Tyr Pro Glu Glu Lys Glu Ile Leu Ala Arg Glu Leu Ala Ile Lys
465 470 475 480
Glu Asn Met Lys Lys Ala Asp Val Leu Lys Leu Leu Phe Glu Asn Pro
485 490 495
Gln Glu Leu Asp Leu Asn Phe Lys Gln Ile Asp Gly Asn Arg Thr Gly
500 505 510
Phe Ser Leu Phe Ser Ala Tyr Ser Lys Met Ile Glu Lys Tyr Gly Tyr
515 520 525
Glu Pro Leu Asp Phe Lys Lys Pro Ala Asp Glu Ile Ile Gly Gln Leu
530 535 540
Arg Thr Ile Phe Thr Asp Leu Gly Trp Asn Thr Asn Leu Phe Thr Ile
545 550 555 560
Asp Leu Thr Lys Glu Gly Lys Glu Leu Glu Met Gln Pro Tyr Phe Arg
565 570 575
Leu Trp His Leu Leu Tyr Ser Phe Glu Gly Asp Asn Thr Ser Thr Gly
580 585 590
Asn Gly Lys Leu Ile Glu Lys Ile Met Gln Leu Cys Gly Val Glu Lys
595 600 605
Glu Tyr Ala Val Glu Leu Ala Ser Leu Ser Phe Gln Asp Asp Tyr Gly
610 615 620
Ser Leu Ser Ala Lys Ala Ile Lys Arg Ile Leu Pro Tyr Leu Lys Glu
625 630 635 640
Gly Asn Leu Tyr Asp Val Ala Cys Glu Tyr Ala Gly Tyr Arg His Ser
645 650 655
Lys Ser Ser Leu Thr Lys Glu Glu Ile Glu Asn Lys Val Leu Lys Gly
660 665 670
Lys Leu Glu Val Leu Pro Lys Asn Ser Leu Arg Asn Pro Val Val Glu
675 680 685
Lys Ile Leu Ser Gln Met Val Asn Val Ile Asn Thr Ile Ile Asp Thr
690 695 700
Tyr Gly Lys Pro Asp Glu Ile Arg Val Glu Leu Ala Arg Glu Leu Lys
705 710 715 720
Lys Ser Ala Lys Glu Arg Glu Glu Leu Thr Lys Ala Ile Ala Lys Ser
725 730 735
Thr Arg Glu His Glu Glu Ile Arg Lys Leu Leu Gln Asp Glu Phe Gly
740 745 750
Met Met Asn Val Ser Arg Asn Asp Ile Ile Arg Tyr Lys Leu Tyr Glu
755 760 765
Glu Leu Lys Asp Asn Gly Tyr Lys Thr Leu Tyr Ser Asn Gln Tyr Ile
770 775 780
Pro Lys Glu Lys Ile Phe Ser Lys Glu Ile Asp Ile Glu His Ile Ile
785 790 795 800
Pro Gln Ser Arg Leu Phe Asp Asp Ser Leu Ser Asn Lys Thr Leu Glu
805 810 815
Tyr Lys Ala Ile Asn Ile Glu Lys Gly Asn Lys Thr Ala Tyr Asp Phe
820 825 830
Val Lys Glu Lys Tyr Gly Glu Glu Gly Leu Gln Gln Tyr Ile Asn Arg
835 840 845
Cys Glu Ser Leu Phe Asn Asp Lys Lys Ala Lys Leu Arg Lys Leu Lys
850 855 860
Met Glu Gln Lys Asp Ile Pro Asp Gly Phe Ile Asp Arg Asp Leu Arg
865 870 875 880
Asn Thr Gln Tyr Ile Ala Lys Lys Ala Leu Ala Met Leu Asn Glu Ile
885 890 895
Cys Arg Arg Val Val Ala Thr Thr Gly Ser Ile Thr Asp Gln Leu Arg
900 905 910
Glu Asp Trp Gln Leu Val Asp Val Met Lys Glu Leu Asn Leu Pro Lys
915 920 925
Tyr Glu Ala Leu Gly Phe Val Glu Thr Tyr Glu Asp Lys Asp Gly Arg
930 935 940
Lys Ile Lys Arg Ile Lys Asp Trp Thr Lys Arg Asn Asp His Arg His
945 950 955 960
His Ala Met Asp Ala Leu Thr Val Ala Phe Thr Lys Asp Ala Phe Ile
965 970 975
Gln Tyr Phe Asn Asn Lys Asn Ala Ala Gln Asp Ser Gly Asn Arg Asn
980 985 990
His Thr Asn Ile Ile Gly Ile Lys Thr Arg Tyr Phe Asp Lys Gly Arg
995 1000 1005
Ala Leu Pro Pro Ile Pro Leu Glu Gln Phe Arg Ile Glu Ala Lys
1010 1015 1020
Gln His Leu Glu Lys Leu Leu Val Ser Ile Lys Ala Lys Asn Lys
1025 1030 1035
Val Val Thr Val Asn Val Asn Arg Thr Lys Lys Arg Lys Gly Glu
1040 1045 1050
Asn Thr Lys Ile Gln Gln Thr Pro Arg Gly Gln Leu His Leu Glu
1055 1060 1065
Thr Val Tyr Gly Ser His Lys Gln Tyr Val Thr Lys Ile Glu Lys
1070 1075 1080
Val Asn Ala Ser Phe Asp Ala Ala Lys Ile Ala Thr Val Ser Lys
1085 1090 1095
Arg Ala Tyr Arg Asn Ala Leu Leu Lys Arg Leu Glu Thr Phe Gly
1100 1105 1110
Asn Asp Pro Lys Lys Ala Phe Thr Gly Lys Asn Ala Leu Glu Lys
1115 1120 1125
Asn Pro Leu Tyr Ala Asp Lys Tyr Gln Thr Ile Arg Val Pro Glu
1130 1135 1140
Lys Val Gln Thr Val Glu Phe Glu Thr Ile Tyr Thr Ile Arg Lys
1145 1150 1155
Pro Val Asp Pro Ala Leu Asn Val Asp Lys Val Val Asp Val Lys
1160 1165 1170
Val Arg Ala Ile Leu Glu Arg Arg Leu Lys Glu Tyr Gly Gly Asp
1175 1180 1185
Pro Lys Lys Ala Phe Val Asn Phe Trp Glu Asn Pro Ile Trp Leu
1190 1195 1200
Asn Lys Glu Lys Gly Ile Ser Ile Lys Arg Val Ser Ile Arg Gly
1205 1210 1215
Ile Asn Asn Ala Gln Ser Ile His Val Lys Lys Asp Lys Asn Gly
1220 1225 1230
Asn Pro Ile Trp Asp Glu Asn Gly Lys Gln Ile Pro Val Asp Phe
1235 1240 1245
Val Asn Thr Gly Asn Asn His His Val Ala Ile Tyr Arg Lys Pro
1250 1255 1260
Val Leu Asp Lys Lys Gly Gln Val Thr Phe Asp Glu Asp Gly Asn
1265 1270 1275
Leu Met Tyr Glu Leu Asp Glu Val Val Val Pro Phe Phe Glu Ala
1280 1285 1290
Val Thr Arg Ala Asn Leu Gly Leu Pro Ile Ile Asp Lys Asp Tyr
1295 1300 1305
Arg Lys Ser Glu Gly Trp Gln Phe Leu Phe Ser Met Lys Gln Asn
1310 1315 1320
Glu Tyr Phe Val Phe Pro Asn Glu Lys Thr Gly Phe Asn Pro Lys
1325 1330 1335
Glu Val Asp Leu Leu Asn Pro Asp Asn Tyr Ala Met Ile Ser Pro
1340 1345 1350
Asn Leu Phe Arg Val Gln Thr Met Ser Lys Val Met Tyr Gly Asn
1355 1360 1365
Asn Val Val Arg Asp Tyr Lys Phe Arg His His Leu Glu Thr Thr
1370 1375 1380
Val Lys Asp Met Lys Glu Leu Lys Asp Ile Ala Tyr Lys Gln Tyr
1385 1390 1395
Lys Thr Leu Ser Phe Gly Asn Ser Val Val Lys Ile Arg Ile Asn
1400 1405 1410
His Ile Gly Gln Ile Val Ser Val Gly Glu Tyr
1415 1420
<210> 2
<211> 264
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG36 transposition protein sequence
<220>
<223> MG36-5-B1 transposition protein
<400> 2
Met Lys Ala Asp Val Ser Glu Arg Gln Arg Val Lys Leu Leu Ala Asp
1 5 10 15
Met Ile Gly Tyr Tyr Arg Leu Cys Cys Pro Arg Ile Gly Gly Phe Lys
20 25 30
Leu Phe His Leu Leu Glu Lys Asp Leu Gly His Ala Val Thr Leu Gly
35 40 45
Arg Asp Ser Phe Leu Lys Val Tyr Glu Ser Lys Gly Phe Lys Leu Asn
50 55 60
Pro Asn Lys Arg Arg Arg Thr Thr Asp Ser Asn His Val Tyr Lys Arg
65 70 75 80
Tyr Pro Asn Leu Ile Lys Gly Lys Asp Ala Arg Tyr Ser Asn His Ile
85 90 95
Trp Val Ser Asp Ile Thr Tyr Val Trp Ile Leu Gly Asp Val Leu Tyr
100 105 110
Leu His Leu Val Thr Asp Ala Tyr Ser His Ala Val Leu Gly Trp Cys
115 120 125
Leu Ser Asp Ser Leu Ser Ala Ser His Thr Thr Glu Ala Leu Arg Met
130 135 140
Ala Ile Arg Ile Ala Gly Gly Gly Asn Leu Cys Gly Thr Ile His His
145 150 155 160
Ser Asp Arg Gly Ser Gln Tyr Ala Ser Glu Ala Tyr Val Ser Cys Leu
165 170 175
Met Glu His His Ile Arg Ile Ser Met Thr Glu Gly Tyr Glu Pro Thr
180 185 190
Asp Asn Ala Met Ala Glu Arg Gln Asn Gly Ile Phe Lys Val Glu Trp
195 200 205
Ile Tyr Glu Gln Glu Met Tyr Arg Asp Lys Glu Gln Ala Ile Asn Glu
210 215 220
Ile Asn Arg Met Ile Asp Phe Tyr Asn Asn Arg Arg Pro His Met Ser
225 230 235 240
Ile Gly Met Glu Cys Pro Met Glu Val Tyr Lys Gly Lys Leu Pro Gly
245 250 255
Lys Asn Leu Trp Arg Lys Arg Pro
260
<210> 3
<211> 126
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG36 transposition protein sequence
<220>
<223> MG36-5-B2 transposition protein
<400> 3
Met Ile Lys Arg Lys Pro Lys Arg Val Phe Thr Glu Pro Phe Lys Leu
1 5 10 15
Ser Val Leu Arg Glu Tyr Tyr Ser Ser Gly Met Ser Lys Tyr Ala Ile
20 25 30
Thr Lys Lys Tyr Ser Leu Ser Pro Pro Cys Ile Tyr Arg Trp Leu Lys
35 40 45
Glu Tyr Pro Val Gly Ser Asp Gln Leu Pro Leu Pro Ser Glu Thr Lys
50 55 60
Glu Arg Leu Gln Met Val Pro Lys Gln Ser Asp Leu Thr Asp Met Glu
65 70 75 80
Ser Leu Gln Lys Arg Ile Glu Glu Leu Arg Arg Ser Leu Glu Leu Glu
85 90 95
Lys Met Arg Ser Arg Ala Phe Glu Lys Met Ile Glu Ile Ala Glu Glu
100 105 110
Glu Glu Gly Ile Ser Ile Phe Arg Lys Asp Gly Ala Lys Gln
115 120 125
<210> 4
<211> 286
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG36 transposition protein sequence
<220>
<223> MG36-5-T1 transposition protein
<400> 4
Met Ala Arg Pro Asn Lys Glu Gly Leu Asp Tyr Phe Pro Phe Asp Val
1 5 10 15
Asp Phe Phe Ser Asp Glu Lys Ile Gly Ser Ile Ser Gly Glu Phe Gly
20 25 30
Ile Lys Gly Glu Ile Thr Ala Ile Lys Leu Leu Cys Ala Ile Tyr Arg
35 40 45
Asn Gly Tyr Phe Ile Leu Trp Asn Asp Ala Leu Lys Met Ser Leu Leu
50 55 60
Arg Gly Leu Pro Gly Ile Ser Leu Glu Leu Leu Glu Gln Ile Val Thr
65 70 75 80
Arg Leu Val Arg Trp Gly Phe Phe Glu Gln Thr Leu Phe Ser Thr Val
85 90 95
Ser Val Leu Thr Ser Lys Gly Ile Gln Glu Arg Tyr Phe Lys Ala Ile
100 105 110
Lys Arg Arg Lys Asp Ser Ser Asn Tyr Pro Tyr Leu Leu Val Asn Val
115 120 125
Asp Asn Asn Lys Val Asn Val Ser Asn Asn Asp Ile Asn Val Asn Thr
130 135 140
Asn Pro Ile Lys Glu Arg Lys Gly Asn Lys Asn Arg Glu Ser Leu Asn
145 150 155 160
Thr Arg Glu Thr Leu Phe Asp Asn Phe Lys Asn Glu Leu Leu Arg Asp
165 170 175
Glu Glu Trp Arg Arg Tyr Ala Cys Gln Ile Ser Gly Leu Ser Val Ala
180 185 190
Phe Asn Asp Leu Ile Pro Gly Glu Leu Asp Asn Phe Leu Ala Trp Met
195 200 205
Val Ser Thr Gly Glu Gly Asp Thr Leu Lys Thr Ile Asp Asp Val Lys
210 215 220
Arg Arg Phe Thr Tyr Trp Trp Gln Gly Thr Gly Leu Arg Ala Tyr Asn
225 230 235 240
Gln Arg Tyr Gly Gly Thr Arg Lys Glu Thr Phe Gly Gly Tyr Thr Ser
245 250 255
His Ala Gly Ala Tyr Gly Lys Arg Glu Ala Pro Ala Lys Thr Gly Val
260 265 270
Gln Pro Ser Glu Glu Ala Arg Lys Asp Tyr Thr Glu Arg Phe
275 280 285
<210> 5
<211> 203
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG36 transposition protein sequence
<220>
<223> MG36-5-C transposition protein
<400> 5
Met Ile Lys Ala Leu Gly Cys Asn Tyr Leu Gly Ile Glu Arg Arg Gln
1 5 10 15
Phe Glu Thr Asp Arg Gly Asn Asp Lys Val Leu Arg Phe Leu Leu Tyr
20 25 30
Tyr Phe Asn Asp Cys Pro Leu Ala Glu Ser Val Phe Pro Glu Glu Asn
35 40 45
Tyr Lys Leu His Lys Asn Leu Leu Ile Val Gly Asp Pro Gly Thr Gly
50 55 60
Lys Thr Leu Met Met Gln Ile Phe Ala Asp Tyr Leu Lys Leu Thr Asp
65 70 75 80
Asn Pro Lys Arg Phe Val Asn Leu Ser Val Thr Gln Met Met Asn Tyr
85 90 95
Tyr Lys Ile His Gly His Ile Asp Arg Phe Thr Tyr Asn Glu Glu Ala
100 105 110
Gly Lys Gly Ser Met Glu Gly Asn Pro Phe Asp Ile Cys Leu Asn Asp
115 120 125
Ile Gly Leu Glu Thr Glu Asn Gln Lys Ser Tyr Gly Thr Ser Leu Asn
130 135 140
Ser Val Ile Asp Glu Phe Leu Tyr Ala Arg Tyr Glu Ile Tyr Gln Ser
145 150 155 160
His Gln Lys Lys Tyr His Ile Thr Ser Asn Leu Ser Val Thr Asp Phe
165 170 175
Lys Asn Arg Phe Gly Thr Arg Leu Val Asp Arg Phe Lys Ser Phe Asn
180 185 190
Val Ile Ile Leu Asn Gly Glu Ser Arg Arg Arg
195 200
<210> 6
<211> 724
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG39 effector sequence
<220>
<223> MG39-1 effector
<400> 6
Val Lys Ile Ile Lys Arg Ser Gly Ala Glu Asn Thr Phe Asp Lys Glu
1 5 10 15
Lys Ile Glu Asn Ala Val Ala Lys Ala Asn Ile Thr Val Glu Glu Lys
20 25 30
Asp Arg Leu Ser Glu Gly Glu Ile Gly Glu Ile Ala Gln Asn Ile Glu
35 40 45
Asp Lys Cys Ser Glu Met Asn Arg Ala Met Asp Val Glu Thr Ile Gln
50 55 60
Asp Trp Val Glu Ala Asp Ile Met Arg His Gly Lys Tyr Thr Val Ala
65 70 75 80
Lys His Tyr Ile Thr Tyr Arg Tyr Glu Arg Ser Ile Val Arg Gln Ala
85 90 95
Asn Thr Thr Asp Lys Gln Ile Leu Ser Leu Leu Asn Phe Glu Asn Glu
100 105 110
Glu Val Lys Gln Glu Asn Ser Asn Lys Asn Pro Thr Val Asn Ser Val
115 120 125
Gln Arg Asp Tyr Met Ala Gly Glu Val Ser Lys Asp Ile Thr Arg Arg
130 135 140
Phe Leu Leu Pro Asp Asp Ile Val Glu Ala His Glu Lys Gly Leu Ile
145 150 155 160
His Phe His Asp Ala Asp Tyr Phe Ala Gln His Met His Asn Cys Cys
165 170 175
Leu Val Asn Leu Glu Asp Met Leu Gln Asn Gly Thr Val Ile Ser Glu
180 185 190
Val Met Ile Glu Lys Pro His Ser Phe Ser Thr Ala Cys Asn Ile Ala
195 200 205
Thr Gln Ser Ile Ala Gln Ile Ala Ser Ser Gln Tyr Gly Gly Gln Ser
210 215 220
Ile Thr Leu Ser His Leu Ala Pro Phe Val Gln Ile Ser Arg Asp Lys
225 230 235 240
Tyr Arg Arg Glu Val Lys Lys Glu Phe Ala Glu Leu Asn Ile Pro Ala
245 250 255
Asp Glu Asp Thr Ile Asn Lys Val Ala Glu Met Arg Val Lys Ala Glu
260 265 270
Ile Val Gln Gly Val Gln Met Ile Gln Tyr Gln Val Ile Thr Leu Met
275 280 285
Thr Thr Asn Gly Gln Ala Pro Phe Val Thr Val Phe Met Tyr Leu Asp
290 295 300
Glu Val Pro Glu Gly Gln Thr Arg Asp Asp Leu Ala Ala Ile Ile Glu
305 310 315 320
Glu Met Leu Arg Gln Arg Ile Gln Gly Val Lys Asn Glu Lys Gly Val
325 330 335
Tyr Ile Thr Pro Ala Phe Pro Lys Leu Ile Tyr Val Leu Glu Glu Asp
340 345 350
Asn Ile Arg Glu Gly Ser Lys Tyr Trp Glu Leu Thr Lys Leu Ala Ala
355 360 365
Lys Cys Thr Ala Lys Arg Met Val Pro Asp Tyr Ile Ser Glu Lys Lys
370 375 380
Met Lys Glu Leu Lys Val Asp Lys Asn Gly Asn Gly Gln Cys Tyr Pro
385 390 395 400
Cys Met Gly Cys Arg Ser Phe Leu Thr Thr Tyr Leu Asp Glu Asn Gly
405 410 415
Lys Pro Lys Tyr Tyr Gly Arg Phe Asn Gln Gly Val Val Thr Ile Asn
420 425 430
Leu Val Asp Val Ala Cys Ser Ser Tyr Lys Asp Met Asp Lys Phe Trp
435 440 445
Leu Ile Phe Asp Glu Arg Leu Glu Leu Cys Arg Arg Ala Leu Met Leu
450 455 460
Arg His Glu Arg Leu Lys Gly Thr Pro Ser Asp Val Ala Pro Ile Leu
465 470 475 480
Trp Gln Asn Gly Ala Leu Ala Arg Leu Lys Lys Gly Glu Thr Ile Asp
485 490 495
Lys Leu Leu Phe Gly Gly Tyr Ser Thr Ile Ser Leu Gly Tyr Ala Gly
500 505 510
Leu Cys Glu Cys Val Arg Tyr Met Thr Gly Lys Ser His Thr Asp Pro
515 520 525
Ser Ala Thr Pro Phe Ala Leu Glu Val Met Gln His Leu Asn Asp Ala
530 535 540
Cys Ala Lys Trp Arg Ala Glu Thr Asn Ile Asp Phe Ser Leu Tyr Gly
545 550 555 560
Thr Pro Leu Glu Ser Thr Thr Tyr Lys Phe Ala Arg Cys Leu Gln Lys
565 570 575
Arg Phe Gly Val Ile Glu Gly Val Thr Asp Arg Asn Tyr Ile Thr Asn
580 585 590
Ser Tyr His Ile His Val Thr Glu Asn Ile Asp Ala Phe Asp Lys Leu
595 600 605
Thr Phe Glu Ser Gln Phe Gln Ala Leu Ser Pro Gly Gly Ala Ile Ser
610 615 620
Tyr Val Glu Val Pro Asn Met Gln Asn Asn Ile Glu Ala Val Leu Ala
625 630 635 640
Val Met Gln His Ile Tyr Asp Asn Ile Met Tyr Ala Glu Leu Asn Thr
645 650 655
Lys Ser Asp Tyr Cys Gln Lys Cys Gly Phe Asp Gly Glu Ile Lys Ile
660 665 670
Val Glu Asp Asp Gly Lys Leu Val Trp Glu Cys Pro Asn Cys Gly Asn
675 680 685
Arg Asp Gln Asn Thr Leu Asn Val Ala Arg Arg Thr Cys Gly Tyr Ile
690 695 700
Gly Thr Gln Phe Trp Asn Gln Gly Arg Thr Gln Glu Ile Lys Glu Arg
705 710 715 720
Val Leu His Leu
<210> 7
<211> 214
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG39 transposition protein sequence
<220>
<223> MG39-1-A transposition protein
<400> 7
Met Ser Lys Arg Ile Ser Arg Ala Thr Lys Leu Ala Arg Gly Gln Gly
1 5 10 15
Ser Gly Glu Gly Ala Lys Tyr Lys Ser Tyr Val Met Thr Asn Glu Phe
20 25 30
Asn Ser Leu Gly Thr Thr Ser Val Ile Lys Asp Trp Lys Thr Gly Arg
35 40 45
Gly Val His Cys Leu Ser Gln Ala Glu Ala Leu Trp Phe Tyr Ile Leu
50 55 60
Arg Trp Asp Asp Asn Asn Ile Asp Ile Arg Glu Gln Tyr Pro Leu Asp
65 70 75 80
Arg Asn Ile Thr Ser Arg Ile Ala Asp Lys Tyr Gly Phe Lys His Pro
85 90 95
Gly Asn Ser Asp His Ile Met Thr Thr Asp Phe Leu Val Thr Lys Lys
100 105 110
Asn Asn Lys Leu His Ala Tyr Ser Val Lys Pro Asp Arg Asp Leu Ser
115 120 125
Lys Arg Thr Leu Glu Ile Leu Cys Ile Glu Lys Leu Tyr Trp Glu His
130 135 140
Asn Asn Ile Glu Phe Asp Met Leu Phe Lys Glu Asp Val Asn Thr Ile
145 150 155 160
Leu Ala Ser Asn Ile Arg Leu Val Thr Glu Tyr Tyr Asp Glu Ser Arg
165 170 175
Val Phe Asp Arg Tyr Ser Asn Ile Arg His Asn Ile Ala Thr Lys Lys
180 185 190
Ile Arg Cys Asp Met Glu His Lys Ile Leu Thr Asn Asp Asp Leu Asp
195 200 205
Arg Ile Trp Gly Glu Tyr
210
<210> 8
<211> 716
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG39 transposition protein sequence
<220>
<223> MG39-1-B transposition protein
<400> 8
Met Thr Ile Leu Ile Glu Tyr Gly Val Asn Thr Glu Met Asn Asp Tyr
1 5 10 15
Val Leu Ala Ile Gly Asp Ile Leu Tyr Asp Lys Asp Asn Gln Asn Ser
20 25 30
Tyr Arg Ile Ile Ser Leu Ile Asp Asp His Leu Ile Leu Cys Glu Met
35 40 45
Glu Thr Thr Lys Leu Glu Leu Gln Gln Ile Lys Tyr Thr Ile Ile Ala
50 55 60
Asp Leu Val Leu Ser Asn Lys Ile Glu Ile Lys Lys Asp Gln Ala Leu
65 70 75 80
Val Tyr Asp Ile Asp Gln Leu Ser Glu Ser Val Arg Asn Arg Tyr Ile
85 90 95
Leu Lys Val His Ile Met Asn Asp Val Lys Ile Ala Tyr Gly Pro Ser
100 105 110
Tyr Leu Gly Leu Met Gly Lys Ser Ser Lys Ile Glu Leu Gln Lys Ile
115 120 125
Leu Ala Lys Tyr Asn Tyr Pro Ile Ser Ser Phe Trp Arg Met Cys Thr
130 135 140
Thr Tyr Phe Gln Ser Gly Met Lys Asn Tyr Ser Leu Ile Asn Ala Lys
145 150 155 160
Ser Phe Lys Ser Asn Glu Val Lys Thr Tyr Thr Tyr Lys Ala Arg Pro
165 170 175
Gly Ala Lys Ser Thr Tyr Asn Leu Asp Asn Val Val Lys Pro Asn Glu
180 185 190
Tyr Val Ile Tyr Phe Glu Glu Ala Leu Asn Glu Tyr Lys Ala Gly Arg
195 200 205
Glu Lys Thr Leu Lys Asn Ala Phe Ser Arg Met Asn Ile Leu His Phe
210 215 220
Thr Gln Ala Glu Ile Ile Asp Gly Val Ala Thr Arg Leu Leu Leu Pro
225 230 235 240
Glu Cys Gln Arg Pro Thr Tyr Lys Gln Phe Tyr Tyr Tyr Ala Gln Lys
245 250 255
His Leu Thr Lys Glu Glu Lys Asp Leu Ile Lys Thr Ser Ala Ala Glu
260 265 270
Gln Arg Asn Asn Lys Arg Leu Leu Ile Ser Asp Ser Leu Lys Asp Val
275 280 285
Tyr Gly Pro Ala Asp Met Val Glu Ile Asp Ala Cys Glu Ala Asp Val
290 295 300
Ser Leu Val Ser Glu Leu Asp Pro Asp Gln Ala Ile Gly Arg Pro Ile
305 310 315 320
Val Tyr Phe Met Ile Asp Val Tyr Ser Arg Ile Ile Leu Ala Val Ser
325 330 335
Val Ala Phe Asp Asn Asn Ser Ile Leu Gly Ile Thr Asn Leu Phe Leu
340 345 350
Asn Leu Ala Asp Asp Lys Gln Glu Tyr Cys Lys Lys Tyr Gly Ile Glu
355 360 365
Phe Asn Asp Lys Arg Leu Trp Pro Ser Gly Val Ile Pro Lys Arg Ile
370 375 380
Arg Val Asp Arg Gly Ser Glu Phe Lys Ser Tyr Glu Phe Asp Arg Ile
385 390 395 400
Cys Asn Glu Leu Gly Ile Glu Lys Gln Ile Val Ser Gly Ala Ser Gly
405 410 415
Ser Leu Lys Gly Val Val Glu Gln Ala Phe His Gln Met His Ala Lys
420 425 430
Gln Asn Val His Leu Glu Asn His Gly Leu Ile Glu Lys Arg Tyr Asp
435 440 445
Ser Leu His His Lys Glu Ala Ser Leu Thr Ile His Asp Tyr Thr Arg
450 455 460
Met Val Ile Asn Phe Val Leu Ala His Asn Gln Gln His Leu Glu Thr
465 470 475 480
Tyr Pro Leu Thr Lys Glu Met Ile Glu Lys Asn Ile Ala Pro Val Pro
485 490 495
Ala Ile Leu Trp Glu Tyr Gly Ser Lys Lys Tyr Gly Met Pro Gln Pro
500 505 510
Ile Pro Val Leu Glu Gln Tyr Leu Phe Ser Leu Met Thr Pro Ile Lys
515 520 525
Ala Lys Ile Ser Lys Arg Gly Ile Ser Tyr Lys Gly Leu Trp Tyr Phe
530 535 540
Ala Pro Asn Asp Lys Arg Leu Met Ser Glu Met Tyr Ala Ala Gly Thr
545 550 555 560
Arg Arg Met Pro Phe Glu Val Arg Met Asp Met Arg Asp Val Gly Ala
565 570 575
Ile Tyr Tyr Ile Arg Asn Ser Lys Leu Val Lys Ile Pro Leu Asn Val
580 585 590
Leu Ile Thr Gly Asn Ser Asp Tyr Lys Gly Leu Thr Met Lys Gln Tyr
595 600 605
Glu Glu Tyr Tyr Ser Ala Lys Lys Lys Met Gln Ala Lys Gly Arg Ile
610 615 620
Asp Asn Glu Lys Ile Asp Thr Ala Val Tyr Ala Asn Asn Glu Ser Ile
625 630 635 640
Val Lys Ser Ala Lys Lys Asn Val His Ser Arg Thr Lys Asp Ile Arg
645 650 655
Ser Ser Arg Glu Ile Asp Lys Gln Lys Val Ser Tyr Glu Gly Lys Ile
660 665 670
Ser Ala Arg Leu Glu Asn Lys Asp Glu Thr Ser Lys Asn Ile Ser Ser
675 680 685
Asp Glu Gln Lys Glu Asn Gly Val Thr Glu Tyr Arg Asp Tyr Ala Ser
690 695 700
Phe Glu Glu Ala Leu Gln Asp Phe Tyr Asp Asn Asn
705 710 715
<210> 9
<211> 534
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG39 transposition protein sequence
<220>
<223> MG39-1-C transposition protein
<400> 9
Met Ala Lys Tyr Asn Tyr Val Thr Cys Glu Glu Val Val Ser Gln Tyr
1 5 10 15
Asp Asp Tyr Asp Leu Lys Glu Gln Arg Ile Val Pro Ala Arg Tyr Val
20 25 30
Glu Ala Lys Leu Ala Ile Asp Thr Gly Asn Pro Tyr Ile Glu Ala Leu
35 40 45
Pro Tyr Pro Arg Thr Gly Arg Asn Ile Ile Ser Ser Tyr Ser Gln Thr
50 55 60
Met Ala Asp Phe Asp Tyr Asp Lys Ile Lys Ser Met Ser Thr Ile Asp
65 70 75 80
Lys Ile Leu Gln Ile Arg Ser Leu Arg Ser Ile Arg Phe Pro Leu Pro
85 90 95
Phe His Ala Glu Leu Glu Leu Ser Phe Tyr Asn Ala Leu Ile Thr Ser
100 105 110
Tyr Arg Ser Arg His Ile Leu His Ser Asp Asn Asp Lys Val Ser Tyr
115 120 125
Ser Val Glu Asn Gln Glu Tyr Ala Ala Ser Asn Ile Leu Val Gly Asp
130 135 140
Ser Ser Ala Ser Thr Asp Ala Gly Phe Ser Leu Ile Gly Tyr Ser Gly
145 150 155 160
Cys Gly Lys Ser Ser Ala Ile Gln Met Leu Val Ser Tyr Tyr Pro Gln
165 170 175
Val Ile Met His Thr Thr Glu Asn Gly Glu Tyr Phe Pro Gln Ile Thr
180 185 190
Tyr Leu Val Val Asn Cys Ile Pro Asn Ser Asn Phe Ser Ala Leu Tyr
195 200 205
Asp Gly Ile Gly Asp Ala Ile Asp Lys Ala Leu Gly Asn Ile Lys Pro
210 215 220
Ile Tyr Ser Ala Glu Ile Met Lys Ile Arg Thr Leu Gly Ala Lys Ala
225 230 235 240
Glu Arg Ile Arg Glu Tyr Val Glu Lys Phe Ala Ile Gly Ile Ile Ile
245 250 255
Phe Asp Glu Ile Gln Leu Ile Asp Phe Ser His Thr Arg Glu Asn Ser
260 265 270
Phe Asp Ser Leu Leu Thr Leu Ser Asn Arg Thr Lys Val Ala Thr Ala
275 280 285
Ile Val Gly Thr Glu Asp Ala Lys Ala Lys Met Phe Lys Thr Leu Arg
290 295 300
Thr Ala Arg Arg Val Gly Asn Val Ile Asn Gly Asn Met Tyr Cys Met
305 310 315 320
Asp Lys Lys Phe Phe Tyr Phe Leu Val Asn Glu Leu Phe Arg Tyr Gln
325 330 335
Trp Phe Asp Lys Pro Val Thr Val Ser Glu Glu Ile Thr Asp Ala Leu
340 345 350
Tyr Asp Val Thr Lys Gly Ile Val Asp Gln Leu Ile Gly Ile Tyr Ile
355 360 365
Tyr Met Asn Ile Asp Tyr Leu Asn Lys Lys Lys Lys Pro Glu Ile Asn
370 375 380
Ser Lys Tyr Ile Tyr Ala Val Thr Asn Lys His Phe Ala Gly Leu Arg
385 390 395 400
Asp Val Leu Glu Asn Leu Asp Ser Asp Phe Asn Asn Glu Leu Met Gln
405 410 415
Glu Ile Asn Asp Asn Ala Lys Leu Glu Leu Asp Lys Ile Glu Asp Glu
420 425 430
Ala Lys Gln Leu Lys Glu Ala Glu Lys Ile Leu Asn Asn Asn Ser Ser
435 440 445
Glu Glu Lys Val Gln Ile Lys Asn Val Val Ala Asn Ile Thr Ala Ile
450 455 460
Tyr Asp Glu Tyr Thr Pro Thr Gln Ile Glu Asp Ala Phe Lys Lys Val
465 470 475 480
Ile Arg Lys Lys Ser Ser Val Gly Lys Ala Glu Arg Glu Ile Ser Lys
485 490 495
Leu Val Ile Glu Gln Leu Thr Lys Gln Gln Arg Thr Arg Ser Asp Leu
500 505 510
Cys Lys Lys Asn Thr Pro Ser Val Ile Gln Met Gln Asn Phe Leu Gly
515 520 525
Ile Asp Lys Glu Asp Lys
530
<210> 10
<211> 641
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG39 transposition protein sequence
<220>
<223> MG39-1-Q transposition protein
<400> 10
Met Pro Val Ile Pro Val Tyr Ile Asn Pro Tyr Pro Asp Glu Leu Met
1 5 10 15
Tyr Ser Trp Ile His Arg Leu Ala Lys Lys Asn Gly Leu Pro Ile Thr
20 25 30
Thr Phe Ala Asp Ser Tyr Leu Asn Lys Phe Asn Ser Lys Ile Gly Ser
35 40 45
Leu Glu Tyr Asp Ile Arg Tyr Gly Leu Leu Cys Leu Asn Glu Ser Phe
50 55 60
Phe Ile Gln Lys Asp Leu Lys Glu Met Phe Leu Ser Met Ser Ile Phe
65 70 75 80
Pro Phe Glu Ala Met Phe Phe Ser Val Gly Gln Gln Thr Arg Tyr Val
85 90 95
Asn Asn Met Phe Arg Lys Pro Asp Pro Leu Asn Ala Pro Val Asn Thr
100 105 110
Met Ile Arg Glu Ile His Ile Cys Pro Gln Cys Ile Glu Asn Asp Ile
115 120 125
Glu Ile Phe Gly Glu Pro Tyr Ile His Arg Ala His Gln Leu Ser Gly
130 135 140
Val Cys Thr Cys His Lys His Lys Ala Pro Leu Tyr Lys Tyr Thr Gly
145 150 155 160
Ile Lys Gly His Glu Cys Glu Tyr Asp Leu Ser His Tyr Thr Glu Leu
165 170 175
Glu Ile Lys Asp Ile Ala Ile Glu Asn Glu Tyr Thr Asp Tyr Ala Gln
180 185 190
Ala Leu Phe Asn Ser Asn Thr Asn Cys Asn Ile Ala Asp Leu Lys His
195 200 205
Met Ile Tyr Asn Lys Leu Lys Glu Leu Gly His Lys Ala Thr Asn Gly
210 215 220
Tyr Glu Asp Phe Ile Ser Ala Phe Asn Asp Ser Lys Leu Val Thr Leu
225 230 235 240
Phe Asp Ala Asp Leu Lys Asn Phe Leu Leu Val Ser Ile Ile Ser Thr
245 250 255
Gln Ser Thr Ser Ala Arg Ser Met Leu Pro Leu Leu Met Tyr Leu Phe
260 265 270
Pro Asn Val Gln Glu Ile Ile His Arg Phe Glu Asn Ala Pro Pro Ile
275 280 285
Ile Gln Lys Tyr His Cys Ala Glu Cys Gly Lys Asn Phe Tyr Ala Thr
290 295 300
Pro Thr Ser Leu Thr Glu Gly Trp Gly Cys Thr Tyr Cys Asp Ala Asn
305 310 315 320
Lys Ser Ile Asp Glu Arg Tyr Lys Lys Leu Ile Asp Phe Ala Gly Lys
325 330 335
Gly Asn Tyr Glu Pro Leu Glu Pro Phe Arg Ser Leu Asn Ile Lys Ser
340 345 350
Lys Ile His His Lys Ile Cys Gly Glu Thr Ile Gln Ile Lys Pro Arg
355 360 365
Lys Phe Ile Phe Asp His Val Arg Cys Ile Cys Glu Ser Leu Leu Asn
370 375 380
Glu Trp Asp Val Arg Gln Lys Leu Glu Lys Phe Glu Asp Tyr Glu Phe
385 390 395 400
Ile Ser Tyr Asp Ser Glu Ser Ser Lys Ile Thr Met Arg Ser Lys Ala
405 410 415
Cys Gly His Val Phe Ser Cys Arg Phe His Lys Phe Ile Lys Tyr Pro
420 425 430
Ser Cys Arg Val Cys Arg Pro Lys Asn Met Thr Thr Glu Leu Tyr Thr
435 440 445
Glu Arg Val Tyr Asp Leu Val Gly Asp Asp Tyr Thr Val Leu Ser Glu
450 455 460
Phe Val Asp Gln Arg Thr Lys Ile Ala Ile Lys His Asn Lys Cys Gly
465 470 475 480
Gly Ile Gln Glu Tyr Lys Pro Ser Ala Phe Leu Asp Gly Gln Arg Cys
485 490 495
Asn Ala Cys Asn Ser Leu Ile Val Lys Lys Ala Asn Asp Ser Trp Glu
500 505 510
Lys Gly Tyr Ala Leu Leu Cys Glu Tyr Lys Glu Glu Cys Gly Thr Ala
515 520 525
Asn Ile Pro Lys Arg Asp His Tyr Lys Gly Val Phe Leu Gly Asn Trp
530 535 540
Leu Gln Ser Gln Arg Asp Lys Tyr Lys Ala Gly Lys Leu Thr Arg Ser
545 550 555 560
Gln Glu Asp Ala Leu Val Ser Leu Gly Ile Thr Leu Asp Pro Leu Ala
565 570 575
Ala Glu Trp Glu Arg Arg Tyr Glu Gln Tyr Lys Arg Tyr Ile Gln Gln
580 585 590
Asn Asn Gly Ser Ser Asp Ile Thr Lys Arg Thr Ile Phe Glu Gly Glu
595 600 605
Lys Leu Gly Val Trp Val Val Leu Gln Arg Arg Asn Tyr Asn Ile Gly
610 615 620
Lys Leu Ser Glu Glu Arg Tyr Lys Lys Leu Cys Asp Ile Asn Met Lys
625 630 635 640
Phe
<210> 11
<211> 118
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG36-5 effector tested sgRNA sequence
<220>
<221> modified_base
<222> (1)..(24)
<223> a, c, u, g, unknown or other
<400> 11
nnnnnnnnnn nnnnnnnnnn nnnnguugug auuugcuuuc agaaaaugaa gcaaaucaca 60
auaaggauua uuccguugug aaaacauuag guucccucgc ccuucugcgg gggauuuu 118
<210> 12
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG36-5 effector tracrRNA sequence
<400> 12
uacuaaaaug aagcaaauca caauaaggau uauuccguug ugaaaacauu agguucccuc 60
gcccuucugc gggggauuuu 80
<210> 13
<211> 46
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG39-1 effector tracrRNA sequence 1
<400> 13
uuuuuguaaa aucauuuugu aaaauuacaa uucauaauga gauaug 46
<210> 14
<211> 66
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG39-1 effector tracrRNA sequence 2
<400> 14
uuuuuguaaa aucauuuugu aaaauuacaa uucauaauga gauaugacaa uucauaauga 60
gauauu 66
<210> 15
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG39-1 effector tracrRNA sequence 3
<400> 15
aaaauauagg auauuaaugu cagagauauc ucauuauaau uguaauuuug uuuuguguac 60
aagcuguuaa uaucucauua ugaauuguca uaucucauua ugaauugua 109
<210> 16
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG39-1 effector tracrRNA sequence 4
<400> 16
aaaauauagg auauuaaugu cagagauauc ucauuauaau uguaauuuug uuuuguguac 60
aagcuguuaa uaucucauua ugaauugu 88
<210> 17
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> putative MG36-5 transposon end LE1
<400> 17
ttaattgaaa attgaaaatt gagaattgaa aattaa 36
<210> 18
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> putative MG36-5 transposon end LE2
<400> 18
tgagaattga aaattgagaa ttgggaattg agaatt 36
<210> 19
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> putative MG36-5 transposon end RE1
<400> 19
ttaattttca attctcaatt ttcaatta 28
<210> 20
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> putative MG39-1 transposon end LE1
<400> 20
aaaagtattg acaaattgac aaaatggtgg tataat 36
<210> 21
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> putative MG39-1 transposon end RE1
<400> 21
attataacct atatttttga ttttgtcaat agtttt 36
<210> 22
<211> 637
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-2 effector
<400> 22
Met Ser Gln Ile Thr Ile Gln Cys Gln Leu Val Ala Ser Ala Ser Thr
1 5 10 15
Arg Gln Gln Leu Trp Leu Leu Met Thr Gln Lys Asn Thr Pro Leu Ile
20 25 30
Asn Glu Leu Leu Gln Gln Val Gly Gln His Pro Glu Phe Glu Thr Trp
35 40 45
Arg Gln Lys Gly Lys Leu Gln Ala Gly Ile Val Lys Ala Leu Cys Gln
50 55 60
Pro Leu Lys Ala Asp Pro Arg Phe Met Gly Gln Pro Ala Arg Phe Tyr
65 70 75 80
Ala Ser Ala Ile Ala Val Val Asp Tyr Ile Tyr Arg Ser Trp Leu Ala
85 90 95
Leu Gln Lys Arg Leu Gln Tyr Gln Leu Glu Gly Gln Thr Arg Trp Tyr
100 105 110
Gln Met Leu Arg Ser Asp Ala Glu Leu Ile Glu Leu Tyr Gly Gly Ser
115 120 125
Leu Glu Thr Leu Arg Ser Lys Ala Ala Glu Ile Leu Ala Gln Phe Ala
130 135 140
Pro Glu Ser Ala Ser Val Asn Pro Gln Pro Thr Lys Gly Lys Lys Ser
145 150 155 160
Lys Lys Arg Lys Asn Ser Ser Asn Asn Pro Asn Leu Ser Thr Ala Leu
165 170 175
Phe Glu Ala Tyr Arg Gln Thr Glu Asp Ile Leu Ser Ser Cys Ala Ile
180 185 190
Asn Tyr Leu Leu Lys Asn Gly Cys Lys Val Ser Glu Lys Glu Glu Asp
195 200 205
Pro Glu Lys Phe Ala Lys Arg Arg Arg Ser Val Glu Ile Arg Ile Glu
210 215 220
Arg Leu Lys Glu Lys Leu Ala Ser Arg Met Pro Lys Gly Arg Asp Leu
225 230 235 240
Thr Asp Glu Lys Trp Leu Glu Thr Leu Met Val Ala Ser Thr Thr Val
245 250 255
Pro Ser Ser Glu Phe Gln Ala Lys Ser Trp Gln Asp Asn Leu Leu Arg
260 265 270
Lys Ser Ser Ala Ile Pro Phe Pro Val Ala Tyr Glu Thr Asn Glu Asp
275 280 285
Met Thr Trp Phe Lys Asn Ser Lys Gly Arg Ile Cys Val Lys Phe Asn
290 295 300
Gly Leu Ser Glu Gln Thr Phe Glu Val Tyr Cys Asp Ser Arg Gln Leu
305 310 315 320
Tyr Trp Phe Gln Arg Phe Leu Glu Asp Gln Gln Ile Lys Arg Asn Ser
325 330 335
Lys Asp Gln His Ser Ser Ser Leu Phe Thr Leu Arg Ser Gly Arg Ile
340 345 350
Ala Trp Ser Glu Gly Glu Gly Lys Gly Asp Pro Trp Asn Ile His Arg
355 360 365
Leu Thr Leu Tyr Cys Cys Val Asp Thr Arg Leu Trp Thr Ser Glu Gly
370 375 380
Thr Glu Gln Val Arg His Glu Lys Ala Asp Glu Ile Thr Gln Ile Ile
385 390 395 400
Thr Lys Thr Lys Gln Lys Thr Asp Leu Asn Glu Lys Gln Gln Ala Phe
405 410 415
Ile Lys Arg Lys Thr Ser Thr Leu Ala Arg Ile Asn Asn Pro Phe Pro
420 425 430
Arg Pro Ser Lys Pro Val Tyr Gln Gly His Ser His Ile Leu Val Gly
435 440 445
Val Ser Leu Gly Leu Asp Lys Pro Ala Thr Leu Ala Val Ile Asp Ala
450 455 460
Ile Ala Asn Lys Val Ile Thr Tyr Arg Ser Ile Arg Gln Leu Leu Gly
465 470 475 480
Asp Asn Tyr Gln Leu Leu Asn Arg Gln Arg Gln Gln Gln His Gln Asn
485 490 495
Ala His Lys Arg Gln Thr Ala Gln Arg Gln Asp Ala Pro His Gln Phe
500 505 510
Ser Glu Ser Glu Leu Gly Gln Tyr Ile Asp Arg Leu Leu Ala Lys Ala
515 520 525
Ile Val Ala Val Ala Lys Thr Tyr Gln Ala Gly Ser Ile Val Leu Pro
530 535 540
Gln Leu Gly Asp Val Arg Glu Ser Ile Glu Ser Glu Ile Lys Ala Arg
545 550 555 560
Ala Glu Gln Lys Cys Pro Asp Leu Val Glu Val Gln Lys Gln Tyr Ala
565 570 575
Lys Gln Tyr Arg Ser Ser Ile His Arg Trp Ser Tyr Ala Arg Leu Ile
580 585 590
Asp Ser Ile Lys Ser Gln Ala Ser Gln Val Gly Ile Phe Ile Glu Glu
595 600 605
Gly Lys Gln Pro Val Arg Gly Ser Pro Gln Asp Lys Ala Lys Asp Leu
610 615 620
Ala Ile Ala Val Tyr His Ser Arg Leu Asn Thr Lys Ser
625 630 635
<210> 23
<211> 560
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-2-B transposition protein
<400> 23
Met Gln Asp Asp Arg Glu Ser Glu Val Pro Ile Pro Ala Glu Val Asn
1 5 10 15
Glu Ile Val Thr Asp Phe Ser Glu Asp Ala Lys Leu Met Gln Glu Val
20 25 30
Ile Gln Ser Leu Leu Glu Pro Cys Asp Arg Ile Thr Tyr Gly Gln Arg
35 40 45
Gln Arg Glu Ala Ala Ala Lys Leu Gly Lys Ser Val Arg Thr Ile Arg
50 55 60
Arg Leu Val Lys Lys Trp Glu Thr Glu Gly Leu Ser Ala Leu Gln Pro
65 70 75 80
Asn Lys Arg Thr Asp Lys Gly Lys His Arg Ile Asp Gln Glu Trp Gln
85 90 95
Glu Phe Ile Ile Lys Thr Tyr Lys Glu Gly Asn Lys Gly Ser Lys Arg
100 105 110
Ile Thr Pro Gln Gln Val Ala Val Arg Val Ala Ala Lys Ala Ala Asp
115 120 125
Leu Gly Gln Glu Lys Tyr Pro Ser Tyr Arg Thr Val Tyr Arg Val Leu
130 135 140
Gln Pro Ile Ile Glu Lys Gln Glu Lys Thr Gln Ser Val Arg Ser Arg
145 150 155 160
Gly Trp Arg Gly Ser Arg Leu Ser Val Lys Thr Arg Asp Gly Gln Asp
165 170 175
Leu Ser Val Glu Tyr Ser Asn His Val Trp Gln Cys Asp His Thr Arg
180 185 190
Ala Asp Ile Leu Leu Val Asp Gln Asp Gly Gln Leu Leu Gly Arg Pro
195 200 205
Trp Leu Thr Thr Val Ile Asp Thr Tyr Ser Arg Cys Ile Ile Gly Ile
210 215 220
Asn Leu Gly Tyr Asp Ala Pro Ser Ala Tyr Val Val Ala Leu Ala Leu
225 230 235 240
Arg His Ala Ile Leu Pro Lys Gln Tyr Ser Ser Glu Tyr Lys Leu His
245 250 255
Cys Gln Trp Gly Thr Tyr Gly Lys Pro Glu His Phe Tyr Thr Asp Gly
260 265 270
Gly Lys Asp Phe Arg Ser Asn His Leu Gln Gln Ile Gly Val Gln Leu
275 280 285
Gly Phe Val Cys His Leu Arg Asp Arg Pro Ser Glu Gly Gly Ile Val
290 295 300
Glu Arg Pro Phe Gly Thr Phe Asn Thr Asp Leu Phe Ser Thr Leu Pro
305 310 315 320
Gly Tyr Thr Gly Ser Asn Val Gln Glu Arg Pro Glu Glu Ala Glu Lys
325 330 335
Glu Ala Ser Leu Thr Leu Arg Glu Leu Glu Gln Leu Leu Val Arg Tyr
340 345 350
Ile Val Asp Lys Tyr Asn Gln Ser Ile Asp Ala Arg Met Gly Asp Gln
355 360 365
Thr Arg Phe Gln Arg Trp Glu Ala Gly Leu Ile Ala Ala Pro Asn Leu
370 375 380
Ile Ser Glu Arg Asp Leu Asp Ile Cys Leu Met Lys Gln Thr Arg Arg
385 390 395 400
Thr Ile Tyr Arg Gly Gly Tyr Leu Gln Phe Glu Asn Leu Thr Tyr Arg
405 410 415
Gly Asp Tyr Leu Glu Gly Tyr Ser Gly Glu Ser Val Val Leu Arg Tyr
420 425 430
Asp Pro Lys Asp Ile Thr Thr Ile Leu Val Tyr Arg Lys Glu Gly Asp
435 440 445
Lys Glu Val Phe Leu Ala Arg Ala Tyr Glu Gln Asp Leu Gln Thr Glu
450 455 460
Gln Leu Ser Phe Asp Glu Val Lys Ala Ile Ser Arg Lys Leu Arg Glu
465 470 475 480
Ala Lys Lys Ala Val Asn Ser Arg Ser Ile Leu Ala Glu Val Arg Asp
485 490 495
Arg Glu Thr Phe Leu Thr Gln Lys Lys Ser Lys Lys Gln Arg Gln Lys
500 505 510
Ser Glu Gln Ala Gln Ile His Arg Lys Lys Glu Leu Phe Pro Ile Glu
515 520 525
Ala Glu Ala Thr Glu Phe Glu Ser Pro Val Asn Glu Leu Glu Thr Glu
530 535 540
Ile Ile Glu Val Phe Asp Tyr Glu Gln Met Arg Glu Asp Tyr Gly Phe
545 550 555 560
<210> 24
<211> 287
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-2-C transposition protein
<400> 24
Met Met Asn Gln Glu Lys Glu Ala Lys Ala Ile Ala Gln Lys Leu Gly
1 5 10 15
Asn Ile Pro Leu Asn Asp Glu Lys Ile Gln Ala Glu Ile Gln Arg Leu
20 25 30
Asn Arg Lys Asn Phe Val Pro Leu Glu Gln Val Lys Ala Leu His Asp
35 40 45
Trp Leu Glu Ser Lys Arg Gln Ala Arg Gln Cys Cys Arg Val Ile Gly
50 55 60
Glu Ser Arg Thr Gly Lys Thr Met Ala Cys Asn Ala Tyr Arg Leu Arg
65 70 75 80
Asn Lys Ala Ile Gln Ser Leu Gly Gln Pro Pro Thr Val Pro Val Val
85 90 95
Tyr Ile Gln Ile Pro Gln Glu Cys Thr Pro Lys Glu Leu Phe Ser Val
100 105 110
Leu Leu Glu His Leu Asn His Gln Met Thr Lys Gly Thr Thr Ala Glu
115 120 125
Met Arg Asn Arg Thr Leu Arg Val Leu Lys Ala Cys Arg Val Glu Met
130 135 140
Leu Ile Ile Asp Glu Ala Asp Arg Leu Lys Pro Lys Thr Phe Ala Asp
145 150 155 160
Val Arg Asp Ile Phe Asp Asn Leu Glu Ile Ser Val Val Leu Val Gly
165 170 175
Thr Val Arg Leu Glu Lys Val Met Thr Asp Asp Glu Gln Val Cys Asn
180 185 190
Arg Phe Ser Ala Cys Tyr Arg Tyr Gly Lys Leu Ser Val Glu Glu Phe
195 200 205
Lys Lys Thr Val Asn Ile Trp Glu Asn Gln Val Leu Lys Leu Pro Val
210 215 220
Ser Ser Asn Leu Thr Gln Ser Lys Met Leu Asp Ile Leu Lys Asp Lys
225 230 235 240
Thr Gln Cys Tyr Ile Gly Leu Met Asp Met Ile Leu Arg Asp Ala Ala
245 250 255
Ile Arg Ala Leu Asn Lys Gly Met Pro Lys Ile Asp Leu Glu Thr Leu
260 265 270
Lys Glu Val Thr Asn Glu Tyr Thr Ala Pro Pro Lys Arg Ser Lys
275 280 285
<210> 25
<211> 168
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-2-Q transposition protein
<400> 25
Met Lys Ala Ser Asp Ile Gln Pro Trp Leu Phe Arg Val Glu Pro Phe
1 5 10 15
Glu Gly Glu Ser Ile Ser His Phe Leu Gly Arg Phe Gln Arg Ala Asn
20 25 30
Glu Leu Thr Pro Ser Gly Leu Ala Lys Ala Ala Gly Leu Gly Gly Ala
35 40 45
Ile Ala Arg Trp Glu Lys Phe Arg Phe Asn Pro Pro Pro Ser Pro Gln
50 55 60
Gln Leu Glu Ala Leu Ala Leu Val Val Glu Val Glu Ala Glu Arg Leu
65 70 75 80
Val Gln Met Leu Pro Pro Ala Gly Val Gly Met Lys Met Glu Pro Ile
85 90 95
Arg Leu Cys Gly Ala Cys Tyr Ala Glu Val Pro Cys His Lys Ile Glu
100 105 110
Trp Gln Phe Lys Thr Thr Gln Gly Cys Asp Arg His Gln Leu Ser Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Gly Ala Arg Tyr Lys Val Pro Ala Leu
130 135 140
Trp Pro Asp Gly Trp Cys Ser Arg Cys Phe Leu Pro Phe Ala Asp Met
145 150 155 160
Val Lys Trp Gln Lys Leu Ile Val
165
<210> 26
<211> 637
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-4 effector
<400> 26
Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Cys Cys Glu Ser Thr
1 5 10 15
Arg Ala Ser Leu Trp Lys Leu Met Ala Glu Lys Asn Thr Pro Leu Thr
20 25 30
Asn Glu Leu Leu His Gln Val Gly His His Cys Glu Phe Glu Ser Trp
35 40 45
Arg Lys Lys Gly Lys Ile Pro Ser Gly Ile Val Lys Glu Leu Cys Gln
50 55 60
Pro Leu Lys Thr Asp Pro Arg Phe Thr Gly Gln Pro Gly Arg Phe Tyr
65 70 75 80
Thr Ser Ala Ile Ala Leu Val Ser Tyr Ile Tyr Lys Ser Trp Leu Val
85 90 95
Leu Met Lys Arg Ser His Tyr Lys Leu Glu Gly Lys Thr Arg Trp Leu
100 105 110
Glu Met Leu Ser Ser Asp Ala Glu Leu Val Glu Arg Cys Gly Ile Ser
115 120 125
Val Asp Gly Ile Arg Ala Arg Ala Ser Glu Ile Leu Ala Gln Leu Ala
130 135 140
Leu Pro Asp Ser Ala Asp Thr Gly Gln Val Lys Gly Arg Lys Ala Lys
145 150 155 160
Lys Ser Lys Lys Phe Gln Gln Gln Gln Asp Arg Asp Arg Asn Leu Ser
165 170 175
Arg Thr Leu Phe Glu Ala Tyr Arg Asp Thr Glu Asp Ile Leu Thr Arg
180 185 190
Cys Ala Ile Cys Tyr Leu Leu Lys Asn Gly Cys Gln Val Ser Asp Arg
195 200 205
Glu Glu Asn Ser Glu Lys Phe Thr Gln Arg Arg Arg Gln Val Glu Ile
210 215 220
Gln Ile Glu Arg Leu Lys Glu Lys Leu Ala Ala Arg Ile Pro Lys Gly
225 230 235 240
Arg Asp Leu Thr Asp Ala Lys Trp Leu Glu Thr Leu Phe Leu Ala Thr
245 250 255
Ser His Ala Pro Glu Ser Glu Ala Glu Ala Lys Leu Trp Gln Asp Cys
260 265 270
Leu Leu Arg Gln Pro Ser Ser Val Pro Phe Pro Val Ala Tyr Glu Thr
275 280 285
Ser Glu Asp Met Thr Trp Phe Lys Asn His Lys Gly Arg Ile Ser Val
290 295 300
Lys Phe Asn Gly Leu Ser Glu His Thr Phe Glu Val Tyr Cys Asp Ser
305 310 315 320
Arg Gln Leu His Trp Phe Glu Arg Phe Leu Glu Asp Gln Gln Ile Lys
325 330 335
Arg Asn Asn Gln Asn Gln Tyr Ser Ser Ser Leu Phe Thr Leu Arg Ser
340 345 350
Ser Arg Ile Ala Trp Gln Glu Gly Lys Gly Lys Gly Glu Pro Trp Asn
355 360 365
Phe Asn His Leu Thr Leu Tyr Cys Ser Val Asp Thr Arg Leu Trp Thr
370 375 380
Ala Glu Gly Thr Gln Leu Val Ile Glu Glu Lys Val Glu Glu Ile Val
385 390 395 400
Lys Asn Ile Thr Asn Thr Lys Asp Lys Gly Asn Leu Asn Glu Lys Gln
405 410 415
Leu Ala His Ile Gln Arg Lys Asn Ser Thr Leu Ala Arg Ile Thr Asn
420 425 430
Pro Phe Pro Arg Pro Ser Lys Ser Ile Tyr Arg Gly Gln Ser His Ile
435 440 445
Leu Val Gly Val Ser Leu Gly Leu Glu Lys Pro Ala Thr Val Ala Val
450 455 460
Val Asp Ala Thr Thr Ser Asn Val Ile Ala Tyr Arg Ser Ile Lys Gln
465 470 475 480
Leu Leu Gly Asp Asn Tyr Arg Leu Leu Asn Arg Gln Arg Gln Gln Lys
485 490 495
Gln Val Leu Ser His Gln Arg His Leu Ala Gln Arg Leu Asp Ala Leu
500 505 510
Asn Ser Leu Gly Glu Ser Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu
515 520 525
Ala Lys Glu Ile Val Ala Ile Ala Gln Thr Tyr Cys Ala Gly Ser Ile
530 535 540
Val Leu Pro Ser Leu Gly Asp Met Arg Glu Gln Val Gln Ser Glu Ile
545 550 555 560
Gln Ala Lys Ala Glu Gln Lys Ser Asp Leu Ile Glu Val Gln Gln Lys
565 570 575
Tyr Ala Lys Gln Tyr Arg Ala Ser Val His Gln Trp Ser Tyr Gly Arg
580 585 590
Leu Ile Ser Ser Ile Gln Ser Gln Ala Lys Lys Ala Gly Ile Ala Ile
595 600 605
Glu Glu Ala Lys Gln Pro Ile Arg Gly Ser Pro Gln Gln Lys Ala Lys
610 615 620
Glu Leu Val Ile Ala Ala Tyr Asn Ala Arg Lys Thr Ser
625 630 635
<210> 27
<211> 563
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-4-B transposition protein
<400> 27
Met Ser Lys Leu Ser Glu Asp Asn His Ile Asp Asn Gln Lys Pro Ala
1 5 10 15
Val Gly Glu Ile Val Pro Glu Ile Ala Asp Asp Asn Lys Gln Leu Leu
20 25 30
Glu Val Ile Gln Lys Leu Leu Glu Pro Cys Asp Arg Ile Thr Tyr Gly
35 40 45
Gln Arg Gln Arg Glu Ala Ala Ala Gln Leu Gly Lys Ser Val Arg Thr
50 55 60
Val Arg Arg Leu Val Lys Lys Trp Glu Glu Glu Gly Leu Ala Ala Leu
65 70 75 80
Ser Gln Thr Thr Arg Ala Asp Lys Gly Lys His Arg Ile Glu Gln Asp
85 90 95
Trp Gln Asp Phe Ile Ile Lys Thr Tyr Lys Glu Gly Asn Lys Gly Ser
100 105 110
Lys Arg Ile Thr Pro Lys Gln Val Ala Val Arg Val Gln Ala Lys Ala
115 120 125
Ala Glu Leu Gly Gln Asp Arg Tyr Pro Ser Tyr Arg Thr Val Tyr Arg
130 135 140
Val Leu Gln Pro Ile Ile Glu Arg Gln Glu Gln Gln Ala Ser Val Arg
145 150 155 160
Ser Arg Gly Trp Arg Gly Ser Arg Leu Ser Val Lys Thr Arg Asp Gly
165 170 175
Lys Asp Leu Ser Val Glu Tyr Ser Asn His Val Trp Gln Cys Asp His
180 185 190
Thr Arg Val Asp Val Leu Leu Val Asp Arg Asn Gly Ala Ile Leu Ser
195 200 205
Arg Pro Trp Leu Thr Thr Val Val Asp Thr Tyr Ser Arg Cys Ile Met
210 215 220
Gly Phe Asn Leu Gly Tyr Asp Ala Pro Ser Ser Gln Val Val Ala Leu
225 230 235 240
Ala Leu Arg His Ala Ile Leu Pro Lys Gln Tyr Asp Trp Glu Tyr Gln
245 250 255
Leu Asp Cys Asp Trp Gly Thr Tyr Gly Lys Pro Glu His Phe Tyr Thr
260 265 270
Asp Gly Gly Lys Asp Phe Arg Ser Asn His Leu Gln Gln Ile Gly Val
275 280 285
Gln Leu Gly Phe Ala Ser His Leu Arg Asp Arg Pro Ser Glu Gly Gly
290 295 300
Ile Val Glu Arg Pro Phe Gly Thr Phe Asn Thr Glu Phe Phe Ser Thr
305 310 315 320
Leu Pro Gly Tyr Thr Gly Ser Asn Val Gln Glu Arg Pro Glu Gln Ala
325 330 335
Glu Lys Glu Ala Arg Leu Thr Leu Arg Glu Leu Glu Arg Leu Leu Val
340 345 350
Arg Tyr Ile Val Asp Lys Tyr Asn Gln Ser Ile Asp Ala Arg Leu Gly
355 360 365
Asp Gln Thr Arg Phe Gln Arg Trp Glu Ala Gly Leu Ile Ala Ala Pro
370 375 380
Asn Pro Ile Ala Glu Arg Asp Leu Asp Ile Cys Leu Met Lys Gln Thr
385 390 395 400
Arg Arg Ser Ile Tyr Arg Gly Gly Tyr Leu Gln Phe Glu Asn Leu Thr
405 410 415
Tyr Arg Gly Glu Asn Leu Ala Gly Tyr Ala Gly Glu Ser Val Val Leu
420 425 430
Arg Tyr Asp Pro Arg Asp Ile Thr Thr Val Leu Val Tyr Arg Gln Glu
435 440 445
Ala Gly Lys Glu Val Phe Leu Ala Arg Ala Phe Ala Gln Asp Leu Glu
450 455 460
Thr Glu Gln Met Ser Leu Asp Glu Ala Lys Ala Ser Ser Arg Lys Leu
465 470 475 480
Arg Glu Thr Gly Lys Thr Ile Ser Asn Arg Ser Ile Leu Ala Glu Val
485 490 495
Arg Asp Arg Glu Thr Phe Leu Thr Gln Lys Lys Thr Lys Lys Glu Arg
500 505 510
Gln Lys Ala Glu Gln Ala Glu Val Lys Arg Ala Lys Gln Pro Phe Ser
515 520 525
Val Glu Arg Glu Glu Glu Ile Glu Ala Ala Ser Ile Pro Asn Gln Pro
530 535 540
Glu Pro Glu Met Pro Asp Val Phe Asp Tyr Glu Gln Met Arg Glu Asp
545 550 555 560
Tyr Gly Phe
<210> 28
<211> 278
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-4-C transposition protein
<400> 28
Met Ser Leu Lys Asp Ala Gln Ala Ile Ala Gln Gln Leu Gly Asn Ile
1 5 10 15
Gln Pro Asn Asp Ala Arg Leu Gln Thr Glu Ile Gln Arg Leu Asn Gly
20 25 30
Lys Ser Phe Val Pro Leu Glu Gln Val Lys Ile Leu His Asp Trp Leu
35 40 45
Asp Gly Lys Arg Gln Ala Arg Gln Gly Cys Arg Val Val Gly Glu Ser
50 55 60
Arg Thr Gly Lys Thr Ile Ala Cys Asp Ala Tyr Arg Leu Arg His Lys
65 70 75 80
Pro Ile Gln Glu Leu Gly Lys Pro Pro Ile Val Pro Val Ala Tyr Ile
85 90 95
Leu Val Pro Pro Asp Cys Gly Ser Lys Asp Leu Phe Gly Leu Ile Val
100 105 110
Glu His Leu Lys Tyr Gln Met Thr Lys Gly Thr Val Ala Glu Ile Arg
115 120 125
Glu Arg Thr Arg Arg Val Leu Lys Gly Cys Gly Val Glu Met Leu Ile
130 135 140
Ile Asp Glu Ala Asp Arg Leu Lys Pro Asn Thr Phe Arg Asp Val Arg
145 150 155 160
Asp Ile Gly Glu Asn Leu Gly Ile Thr Val Val Leu Val Gly Thr Asp
165 170 175
Arg Leu Asp Ala Val Ile Lys Lys Asp Pro Gln Val Tyr Asn Arg Phe
180 185 190
Arg Ala Cys His Arg Phe Gly Asn Leu Ser Gly Asp Asp Phe Lys Arg
195 200 205
Thr Val Glu Ile Trp Glu Lys Lys Val Leu Gln Leu Pro Val Ala Ser
210 215 220
Asn Leu Ser Gly Lys Thr Met Leu Lys Thr Leu Gly Glu Ala Thr Gly
225 230 235 240
Gly Tyr Ile Gly Leu Leu Asp Met Ile Leu Arg Glu Ala Ala Ile Arg
245 250 255
Ala Leu Lys Lys Gly Leu Gln Lys Ile Asp Leu Glu Thr Leu Lys Glu
260 265 270
Val Ala Gly Glu Tyr Arg
275
<210> 29
<211> 167
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-4-Q transposition protein
<400> 29
Met Glu Ala Ser Asp Ile Gln Pro Trp Leu Phe Arg Ala Glu Pro Tyr
1 5 10 15
Glu Gly Glu Ser Ile Ser His Tyr Leu Gly Arg Phe Arg Arg Ala Asn
20 25 30
Asp Leu Thr Pro Thr Gly Leu Gly Lys Ala Thr Gly Leu Gly Gly Ala
35 40 45
Ile Ala Arg Trp Glu Lys Phe Arg Phe Asn Pro Pro Pro Ser Arg Lys
50 55 60
Gln Leu Glu Ala Leu Ala Val Val Val Gly Val Glu Ala Asp Arg Leu
65 70 75 80
Ala Gln Met Ile Pro Pro Ala Gly Val Gly Met Lys Leu Glu Pro Ile
85 90 95
Arg Leu Cys Ala Ala Cys Tyr Ala Gln Ala Pro Tyr His Arg Ile Glu
100 105 110
Trp Gln Phe Lys Val Thr Ala Gly Cys Asp His His Gln Leu Arg Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Lys Ala Arg Phe Lys Ile Pro Ala Leu
130 135 140
Trp Val Asp Gly Trp Cys Gln Arg Cys Phe Thr Lys Phe Glu Glu Met
145 150 155 160
Thr Ser Asn Gln Ala Ala Leu
165
<210> 30
<211> 632
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-6 effector
<400> 30
Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Ile Ala Lys Glu Ser Ser
1 5 10 15
Arg Gln Ala Leu Trp Arg Leu Met Ala Glu Leu Asn Thr Pro Leu Ile
20 25 30
Asn Asp Ile Leu Asn Gln Ile Ala Asn His Pro Asp Phe Glu Thr Trp
35 40 45
Arg Glu Lys Gly Lys Leu Pro Ala Gly Ile Val Lys Gln Leu Ser Asp
50 55 60
Ser Leu Lys Thr Asp Pro Arg Tyr Ile Gly Gln Pro Gly Arg Phe Tyr
65 70 75 80
Thr Ser Ala Ile Thr Leu Ile Ser Tyr Ile Tyr Lys Ser Trp Phe Lys
85 90 95
Val Gln Gln Arg Leu Gln Gln Arg Leu Val Gly Gln Thr Arg Trp Leu
100 105 110
Gly Ile Leu Lys Ser Asp Glu Glu Leu Val Ala Glu Ser Asp Arg Thr
115 120 125
Leu Glu Glu Ile Arg Ala Lys Ala Ile Gly Leu Leu Ala Ser Leu Thr
130 135 140
Pro Glu Asn Pro Ser Pro Glu Pro Lys Pro Ala Lys Lys Thr Lys Lys
145 150 155 160
Ala Lys Thr Ser Thr Asn Lys Pro Leu Leu Gly Ile Leu Phe Asp Asn
165 170 175
Tyr Glu Lys Thr Glu Asp Ile Leu Thr His Ala Ala Ile Cys Tyr Leu
180 185 190
Leu Lys Asn Gly Cys Lys Ile Pro Thr Lys Leu Glu Glu Pro Gln Glu
195 200 205
Phe Ala Lys Lys Arg Arg Lys Ala Glu Ile Lys Val Glu Arg Leu Gln
210 215 220
Glu Gln Leu Asn Ser Arg Lys Pro Lys Gly Arg Asp Leu Thr Gly Glu
225 230 235 240
Lys Trp Leu Gln Thr Leu Ile Thr Ala Ser Thr Thr Ala Pro Glu Asn
245 250 255
Glu Ala Gln Ala Lys Ser Trp Gln Asn Ile Leu Leu Thr Lys Ser Lys
260 265 270
Ser Ile Pro Phe Pro Val Ala Tyr Glu Thr Asn Glu Asp Leu Thr Trp
275 280 285
Ser Lys Asn Asp Lys Gly Arg Leu Cys Val His Phe Asn Gly Leu Gly
290 295 300
Glu His Glu Phe Glu Ile Tyr Cys Asp Gln Arg Gln Leu Lys Trp Leu
305 310 315 320
Gln Arg Phe Tyr Glu Asp Gln Glu Thr Lys Arg Ala Ser Lys Asp Gln
325 330 335
His Ser Ser Ala Leu Phe Thr Leu Arg Ser Gly Arg Ile Gly Trp Gln
340 345 350
Glu Gly Lys Gly Lys Gly Glu Pro Trp Asn Ile His Arg Leu Asn Leu
355 360 365
Phe Cys Thr Ile Asp Thr Arg Phe Trp Thr Ala Glu Gly Thr Glu Gln
370 375 380
Val Arg Gln Glu Lys Ala Thr Glu Ile Ala Gln Thr Ile Thr Lys Met
385 390 395 400
Glu Gln Lys Gly Asp Leu Asn Asp Lys Gln Gln Ala Phe Ile His Arg
405 410 415
Lys His Ser Thr Leu Ala Arg Ile Asn Asn Pro Phe Pro Arg Pro Ser
420 425 430
Gln Pro Leu Tyr Gln Gly Lys Ser His Ile Leu Ile Gly Ile Ala Met
435 440 445
Gly Leu Glu Asn Pro Ala Thr Ala Ala Ile Ile Asn Gly Thr Thr Gly
450 455 460
Glu Ala Leu Ala Tyr Arg Ser Ile Lys Gln Leu Leu Gly Asp Asn Tyr
465 470 475 480
Gln Leu Leu Thr Arg Gln Gln Lys Gln Lys Gln Arg Gln Ser His Gln
485 490 495
Arg His Lys Ala Gln Lys Asn Ala Ala Pro Asn Gln Phe Gly Glu Ser
500 505 510
Glu Leu Gly Glu Tyr Val Asp Arg Leu Leu Ala Lys Ala Ile Val Ala
515 520 525
Leu Ala Lys Thr Tyr Gln Ala Gly Ser Ile Val Val Pro Glu Leu Gly
530 535 540
Asp Met Arg Glu Leu Val Gln Ala Glu Val Lys Ala Lys Ala Glu Ala
545 550 555 560
Lys Ile Pro Gly Cys Ile Glu Ala Gln Glu Lys Tyr Ala Lys Gln Tyr
565 570 575
Arg Val Asn Thr His Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile
580 585 590
Gln Ala Gln Ala Ser Lys Ile Gly Ile Val Ile Glu Gln Gly Gln Gln
595 600 605
Pro Ile Arg Gly Ser Pro Gln Glu Lys Ala Lys Glu Met Ala Leu Leu
610 615 620
Ala Tyr His Ser Arg Ser Lys Ser
625 630
<210> 31
<211> 578
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-6-B transposition protein
<400> 31
Met Lys Lys Leu Phe Ala Gln Asp Val Asn Ile Asp Thr Glu Val Ile
1 5 10 15
Ser Asn Gln Ile Pro Thr Ser Asp Pro Ser Gln Ser Asn Leu Ile Ala
20 25 30
Ser Glu Leu Pro Glu Glu Ala Arg Pro Lys Leu Glu Val Ile Gln Ser
35 40 45
Leu Leu Glu Pro Cys Asp Arg Val Thr Tyr Gly Glu Arg Leu Arg Glu
50 55 60
Gly Ala Glu Lys Leu Gly Leu Ser Val Arg Ser Val Gln Arg Leu Phe
65 70 75 80
Lys Lys Tyr Gln Glu Lys Gly Leu Ile Ala Leu Leu Ser Gly Ser Arg
85 90 95
Thr Asp Lys Gly Glu His Arg Ile Ser Glu Leu Trp Gln Asn Phe Ile
100 105 110
Val Lys Thr Tyr Gln Glu Gly Asn Lys Gly Ser Lys Arg Met Ser Pro
115 120 125
Lys Gln Val Ala Leu Lys Val Gln Ala Lys Ala Gly Ala Ile Ala Asp
130 135 140
Asp Asn Pro Pro Ser Tyr Arg Thr Val Leu Arg Val Leu Lys Pro Ile
145 150 155 160
Leu Glu Lys Gln Glu Lys Ala Lys Ser Ile Arg Ser Pro Gly Trp Arg
165 170 175
Gly Ser Thr Leu Ser Val Lys Thr Arg Asp Gly Asp Asp Leu Asp Ile
180 185 190
Ser Tyr Ser Asn Gln Val Trp Gln Cys Asp His Thr Arg Ala Asp Val
195 200 205
Leu Leu Val Asp Gln His Gly Lys Leu Leu Val Arg Pro Trp Leu Thr
210 215 220
Thr Val Ile Asp Ser Tyr Ser Arg Cys Ile Met Gly Ile Asn Leu Gly
225 230 235 240
Phe Asp Ala Pro Ser Ser Gln Val Val Ala Leu Ala Leu Arg His Ala
245 250 255
Ile Leu Pro Lys Arg Tyr Gly Thr Glu Tyr Lys Leu Asn Cys Asp Trp
260 265 270
Gly Thr Tyr Gly Thr Pro Glu Tyr Leu Phe Thr Asp Gly Gly Lys Asp
275 280 285
Phe Arg Ser Asn His Leu Ala Glu Ile Gly Leu Gln Leu Gly Phe Val
290 295 300
Cys Lys Leu Arg Asp Arg Pro Ser Glu Gly Gly Ile Val Glu Arg Pro
305 310 315 320
Phe Lys Thr Leu Asn Gln Ser Leu Phe Ser Thr Leu Pro Gly Tyr Thr
325 330 335
Gly Ser Asn Val Gln Glu Arg Pro Glu Asp Ala Glu Lys Asp Ala Gln
340 345 350
Leu Thr Leu Arg Asp Leu Glu Gln Leu Ile Val Arg Phe Ile Val Asp
355 360 365
Arg Tyr Asn Gln Ser Ile Asp Ala Arg Met Gly Asp Gln Thr Arg Tyr
370 375 380
Gln Arg Trp Glu Ala Gly Leu Gln Lys Glu Pro Asp Val Ile Ser Glu
385 390 395 400
Arg Asp Leu Asp Ile Cys Leu Met Lys Met Ser Arg Arg Thr Val Gln
405 410 415
Arg Gly Gly His Leu Gln Phe Glu Asn Val Met Tyr Leu Gly Glu Tyr
420 425 430
Leu Ala Gly Tyr Ala Gly Glu Val Val Ser Phe Arg Tyr Asp Pro Arg
435 440 445
Asp Ile Thr Thr Ile Trp Val Tyr Arg Gln Glu Asn Asp Arg Glu Val
450 455 460
Phe Leu Thr Arg Ala His Ala Gln Gly Leu Glu Thr Glu Gln Leu Ser
465 470 475 480
Val Asp Asp Ala Lys Ala Ser Ala Lys Arg Leu Arg Ala Ala Gly Lys
485 490 495
Thr Ile Ser Asn Gln Ser Ile Leu Gln Glu Thr Ile Glu Arg Glu Val
500 505 510
Leu Ala Glu Arg Thr Lys Ser Arg Lys His Arg Gln Lys Glu Glu Gln
515 520 525
Ser Tyr Lys Arg Ser Pro Ser Ala Ala Val Met Val Glu Val Glu Ser
530 535 540
Glu Gln Leu Glu Ile Glu Ser Ser Asn Glu Ala Asn Ala Asn Ser Val
545 550 555 560
Ser Ala Asp Ile Glu Val Trp Asp Tyr Asp Glu Met Arg Glu Gly Leu
565 570 575
Gly Trp
<210> 32
<211> 284
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-6-C transposition protein
<400> 32
Met Ile Lys Glu Asn Ser Ser Gln Glu Lys Pro Ala Ser Gln Ile Ala
1 5 10 15
Glu Glu Leu Gly Asp Phe Lys Val Asp Ser Gln Leu Leu Gln Ile Glu
20 25 30
Ile Ala Arg Leu Asn Lys Lys Ser Ile Val Pro Leu Glu His Ile Lys
35 40 45
Asp Leu His Asp Trp Leu Asp Glu Lys Arg Lys Ala Arg Gln Ser Cys
50 55 60
Arg Leu Val Gly Glu Ser Arg Thr Gly Lys Thr Val Ala Cys Glu Ala
65 70 75 80
Tyr Thr Phe Arg Asn Lys Pro Lys Gln Glu Gly Lys Gln Ala Pro Thr
85 90 95
Val Pro Val Val Tyr Ile Met Pro Pro Ala Lys Cys Gly Ala Lys Glu
100 105 110
Leu Phe Arg Glu Ile Ile Glu Tyr Leu Lys Tyr Arg Ala Val Arg Gly
115 120 125
Thr Val Ala Asp Phe Arg Ser Arg Ala Met Glu Val Leu Lys Gly Cys
130 135 140
Glu Val Glu Met Ile Ile Ile Asp Glu Ala Asp Arg Leu Lys Pro Glu
145 150 155 160
Thr Phe Ser Asp Val Arg Asp Ile Asn Asp Lys Leu Gly Ile Ala Val
165 170 175
Val Leu Val Gly Thr Asp Arg Leu Asp Ala Val Ile Lys Arg Asp Glu
180 185 190
Gln Val Tyr Asn Arg Phe Arg Ala Ser Arg Arg Phe Gly Lys Leu Thr
195 200 205
Gly Glu Asp Phe Lys Arg Thr Val Glu Ile Trp Glu Asp Lys Val Leu
210 215 220
Lys Met Pro Val Ala Ser Asn Leu Thr Asn Lys Glu Met Leu Lys Ile
225 230 235 240
Leu Leu Lys Ala Thr Glu Gly Tyr Ile Gly Arg Leu Asp Glu Ile Leu
245 250 255
Arg Glu Ala Ala Ile Lys Ser Leu Ser Arg Gly Phe Arg Lys Val Glu
260 265 270
Lys Ala Val Leu Gln Glu Val Ala Arg Glu Tyr Ser
275 280
<210> 33
<211> 167
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-6-Q transposition protein
<400> 33
Met Thr Glu Asn Asp Ile Gln Pro Trp Leu Phe Ala Ile Ala Pro Leu
1 5 10 15
Pro Gly Glu Ser Leu Ser His Phe Leu Gly Arg Phe Arg Arg Arg Asn
20 25 30
His Leu Thr Pro Ser Ser Leu Gly Gln Ile Ala Lys Ile Gly Ala Val
35 40 45
Val Ala Arg Trp Glu Arg Phe His Phe Asn Pro Tyr Pro Thr Gln Gln
50 55 60
Glu Phe Glu Ala Leu Ala Glu Val Val Gly Val Glu Val Glu Arg Val
65 70 75 80
Trp Glu Met Leu Pro Pro Met Gly Glu Gly Met Lys Cys Glu Pro Ile
85 90 95
Arg Leu Cys Cys Ala Cys Tyr Ala Glu Ser Pro Cys His Arg Ile Glu
100 105 110
Trp Gln Phe Lys Ser Val Trp Lys Cys Asp Arg His Gln Leu Lys Leu
115 120 125
Leu Ala Lys Cys Pro Gln Cys Glu Ala Arg Phe Lys Ile Pro Ala Leu
130 135 140
Trp Glu Asn Gly Arg Cys Asp Arg Cys Gln Ile Thr Phe Gly Glu Leu
145 150 155 160
Ala Ala Tyr Gln Lys Ser Ala
165
<210> 34
<211> 713
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-7 effector
<400> 34
Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Ser Ala Ser Thr
1 5 10 15
Arg Gln Lys Leu Trp Lys Leu Met Ala Glu Phe Asn Thr Pro Leu Ile
20 25 30
Asn Glu Leu Leu Ile Leu Ala Tyr Gln His Pro Asp Phe Lys Thr Trp
35 40 45
Gln His Lys Gly Ala Ile Pro Ala Gly Ile Ile Lys Gln Leu Cys Glu
50 55 60
Pro Leu Lys Thr Asp Ala Arg Phe Val Gly Gln Pro Gly Arg Phe Phe
65 70 75 80
Ala Ser Ala Ile Ala Thr Val Ser Tyr Ile Tyr Lys Ser Trp Val Lys
85 90 95
Val Gln Lys Arg Leu Gln Leu Gln Ile Asp Gly Lys Thr Arg Trp Leu
100 105 110
Glu Met Leu Asn Ser Asp Thr Glu Leu Val Glu Met Ala Gly Val Ala
115 120 125
Leu Asp Thr Leu Arg Ala Thr Ala Thr Glu Leu Leu Asn Gln Leu Asn
130 135 140
Pro Gln Pro Thr Thr Glu Glu Ser Pro Lys Lys Lys Gly Lys Lys Ala
145 150 155 160
Lys Lys Thr Gln Gln Pro Gln Gly Glu Arg Ser Leu Ser Lys Ile Leu
165 170 175
Phe Asp Thr Tyr Arg Asp Ala Glu Asp Ile Gln Thr Arg Cys Ala Ile
180 185 190
Ser Tyr Leu Leu Lys Asn Gly Cys Lys Ile Arg Ser Gln Glu Glu Asp
195 200 205
Ser Lys Lys Phe Ala Gln Arg Arg Arg Lys Val Glu Ile Gln Ile Gln
210 215 220
Arg Leu Thr Asp Gln Leu Ala Ser Arg Val Pro Lys Gly Arg Asp Leu
225 230 235 240
Thr Ala Thr Lys Trp Leu Glu Ser Leu Leu Glu Ala Thr Arg Lys Val
245 250 255
Pro Lys Asn Glu Ala Glu Ala Lys Ser Trp Gln Asp Ser Leu Asn Arg
260 265 270
Gln Ser Ser Thr Leu Pro Phe Pro Val Ala Phe Glu Ser Ser Glu Asp
275 280 285
Met Ile Trp Phe Arg Lys Leu Lys Leu Asn Asn Ile Pro Ile Lys Leu
290 295 300
Trp Thr Ile Leu Leu Tyr Ile Asp Tyr Leu Ile Val Ile Leu Phe Val
305 310 315 320
Arg Asp Ser Leu Gln Asn Glu Ala Leu Trp Phe Lys Asn Phe Lys Ile
325 330 335
Asn Asn Ile His Val Leu Thr Lys Leu Trp Met Ile Leu Leu Asn Ile
340 345 350
Asn Ser Phe Ala Gly Val Leu Tyr Leu Gly Gly Val Leu Lys Lys Tyr
355 360 365
Gln Gln Arg Ile Tyr Val His Phe Asn Gly Leu Ser Asp Cys Thr Phe
370 375 380
Glu Ile Tyr Cys Asp Ser Arg His Ile His Trp Phe Lys Arg Phe Leu
385 390 395 400
Glu Asp Gln Gln Ile Lys Arg Ser Ser Lys Asn Gln His Ser Ser Ser
405 410 415
Leu Phe Thr Ile Arg Ser Gly Arg Ile Ala Trp Lys Ser Ala Gln Gly
420 425 430
Lys Gly Lys Pro Trp Asn Val Asn Arg Leu Met Leu Tyr Cys Cys Val
435 440 445
Asp Thr Arg Leu Trp Thr Ala Glu Gly Thr Lys Leu Val Val Glu Glu
450 455 460
Lys Ala Glu Glu Ile Ala Lys Thr Ile Thr Arg Thr Lys Glu Lys Glu
465 470 475 480
Thr Lys Glu Lys Val Gln Leu Asn Asp Lys Gln Leu Ala Tyr Ile Lys
485 490 495
Arg Lys Asn Ala Thr Leu Thr Arg Ile Asn Asn Pro Phe Pro Arg Pro
500 505 510
Ser Lys Pro Leu Tyr Asn Gly Gln Ser His Ile Leu Val Ser Val Ser
515 520 525
Leu Gly Leu Glu Lys Pro Ala Thr Leu Ala Val Leu Asn Ala Met Thr
530 535 540
Gly Lys Ile Ile Ala Tyr Arg Ser Val Lys Gln Leu Leu Gly Lys Asn
545 550 555 560
Tyr Lys Leu Leu Asn Gln Gln Arg His Gln Lys Gln Ala Leu Ser His
565 570 575
Gln Arg Lys Ile Ala Gln Thr Leu Ala Ala Pro Asn Gln Phe Gly Asp
580 585 590
Ser Glu Leu Gly Glu His Ile Asp Arg Leu Leu Ala Lys Glu Ile Ile
595 600 605
Ala Val Ala Gln Lys Phe Asn Ala Gly Ser Ile Val Val Pro Asn Leu
610 615 620
Asp Asn Met Arg Glu Gln Val Asn Ser Glu Ile Gln Ala Lys Ala Glu
625 630 635 640
Glu Lys Cys Pro Glu Ser Ile Glu Ala Gln Lys Lys Tyr Ala Ser Ser
645 650 655
Tyr Arg Arg Ser Val Asn Gln Trp Ser Tyr Arg Arg Leu Ile Asp Cys
660 665 670
Ile Thr Asn Gln Ala Ala Lys Ala Gly Ile Val Ile Glu Glu Asn Lys
675 680 685
Gln Pro Ile Arg Ala Ser Pro Gln Asp Lys Ala Lys Gln Leu Ala Leu
690 695 700
Ser Ala Tyr His Ala Arg Lys Lys Ser
705 710
<210> 35
<211> 587
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-7-B transposition protein
<400> 35
Met Lys Asp Ala Glu Ser Ala Thr Asn Ser Pro Met Thr His Ala Ser
1 5 10 15
Ile Ala Asp Ala Glu Asn Gly Lys Ala Glu Ala Asn Ile Ile Val Ser
20 25 30
Glu Leu Ser Asp Glu Ala Leu Leu Lys Met Glu Val Ile Gln Ser Leu
35 40 45
Leu Lys Asn Ser Asp Arg Ser Thr Tyr Gly Glu Leu Leu Lys Gln Ser
50 55 60
Ala Glu Lys Leu Gly Lys Ser Val Arg Thr Val Arg Arg Leu Val Asp
65 70 75 80
Lys Trp Glu Lys Glu Gly Leu Ala Gly Leu Val Gln Asn Gln Arg Asp
85 90 95
Asp Lys Gly Lys His Arg Val Asp Lys Tyr Trp Gln Glu Phe Val Leu
100 105 110
Thr Thr Tyr Lys Glu Asn Asn Lys Gly Ser Lys Arg Met Thr Arg Gln
115 120 125
Gln Val Phe Ile Arg Ala Lys Ala Arg Ala Asp Glu Leu Glu Ile Glu
130 135 140
Pro Pro Ser Arg Met Thr Val Tyr Arg Ile Leu Lys Pro Ile Ile Asp
145 150 155 160
Lys Gln Glu Gln Ala Lys Ser Ile Arg Ser Pro Gly Trp Arg Gly Ser
165 170 175
Arg Leu Ser Val Lys Thr Arg Asp Gly Lys Asp Leu Gln Val Glu His
180 185 190
Ser Asn Gln Val Trp Gln Cys Asp His Thr Arg Val Asp Val Leu Leu
195 200 205
Val Asp Gln His Gly Lys Ile Leu Ser Arg Pro Trp Leu Thr Thr Val
210 215 220
Ile Asp Ser Tyr Ser Arg Cys Ile Met Gly Ile Asn Leu Gly Tyr Asp
225 230 235 240
Thr Pro Ser Ser Thr Val Val Ala Leu Ala Leu Arg His Ala Ile Leu
245 250 255
Pro Lys Gln Tyr Ser Leu Glu Tyr Gly Leu His Glu Glu Trp Gly Thr
260 265 270
Ser Gly Leu Pro Gln Asn Phe Tyr Thr Asp Gly Gly Lys Asp Phe Arg
275 280 285
Ser Asn His Leu Gln Gln Ile Gly Val Gln Leu Gly Phe Val Cys His
290 295 300
Leu Arg Asp Arg Pro Ser Glu Gly Gly Ser Val Glu Arg Pro Phe Lys
305 310 315 320
Thr Leu Asn Thr Glu Leu Phe Ser Thr Leu Ala Gly Tyr Thr Gly Ser
325 330 335
Asn Val Gln Glu Arg Pro Glu Glu Ala Glu Lys Glu Ala Ser Phe Thr
340 345 350
Leu Arg Gln Leu Glu Lys Met Leu Val Arg Tyr Ile Val Asp Asn Tyr
355 360 365
Asn Gln Arg Ile Asp Ala Arg Met Gly Asp Gln Thr Arg Phe Gln Arg
370 375 380
Trp Glu Ser Gly Leu Ile Ala Met Pro Asp Leu Leu Ser Glu Arg Asp
385 390 395 400
Leu Asp Ile Cys Leu Met Lys Gln Thr Arg Arg Gln Val Gln Arg Gly
405 410 415
Gly Tyr Leu Gln Phe Glu Asn Leu Met Tyr Arg Gly Glu Leu Leu Ala
420 425 430
Gly Tyr Ala Gly Glu Ser Val Val Leu Arg Tyr Asp Pro Lys Asp Ile
435 440 445
Thr Thr Ile Leu Val Tyr Arg Ile Glu Glu Gly Lys Glu Ile Phe Leu
450 455 460
Ala Arg Ala Tyr Ala Gln Asp Leu Glu Thr Glu Glu Leu Ser Leu Asp
465 470 475 480
Glu Ala Lys Ala Ser Ser Arg Lys Val Arg Glu Ala Gly Lys Ala Ile
485 490 495
Ser Asn Arg Ser Ile Leu Ala Glu Ile Arg Glu Arg Glu Thr Phe Pro
500 505 510
Thr Gln Lys Lys Thr Arg Lys Glu Arg Gln Lys Leu Glu Gln Ala Glu
515 520 525
Val Lys Lys Ala Lys Gln Leu Thr Pro Ala Glu Thr Glu Glu Glu Ile
530 535 540
Ile Val Val Ser Ile Asp Ala Lys Pro Thr Ala Lys Asn Pro Leu Glu
545 550 555 560
Ser Glu Leu Cys Thr Glu Ser Gly Glu Pro Asp Met Pro Glu Val Leu
565 570 575
Asp Tyr Glu Gln Met Arg Glu Asp Tyr Gly Trp
580 585
<210> 36
<211> 278
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-7-C transposition protein
<400> 36
Met Val Ala Lys Glu Ala Gln Glu Val Ala Lys Gln Leu Gly Asp Ile
1 5 10 15
Pro Val Asn Asp Glu Lys Leu Gln Ala Glu Ile His Arg Leu Asn Arg
20 25 30
Lys Gly Phe Val Pro Leu Glu Gln Val Gln Thr Leu His Asp Trp Leu
35 40 45
Glu Gly Lys Arg Gln Ser Arg Gln Ser Gly Arg Val Val Gly Glu Ser
50 55 60
Arg Thr Gly Lys Thr Met Gly Cys Asp Ala Tyr Arg Leu Arg Asn Lys
65 70 75 80
Pro Lys Gln Glu Ala Gly Lys Pro Pro Thr Val Pro Ile Ala Tyr Ile
85 90 95
Gln Ile Pro Gln Glu Cys Gly Ala Lys Glu Phe Phe Gly Val Ile Leu
100 105 110
Glu His Leu Lys Tyr Gln Val Thr Lys Gly Thr Val Ala Glu Val Arg
115 120 125
Asp Arg Ala Leu Arg Val Leu Lys Gly Cys Gly Val Glu Met Leu Ile
130 135 140
Ile Asp Glu Ala Asp Arg Phe Lys Pro Lys Thr Phe Ala Glu Val Arg
145 150 155 160
Asp Ile Phe Asp Lys Leu Glu Ile Pro Val Ile Leu Val Gly Thr Asp
165 170 175
Arg Leu Asp Ala Val Ile Lys Arg Asp Glu Gln Val Tyr Asn Arg Phe
180 185 190
Arg Ser Cys His Arg Phe Gly Lys Leu Ser Gly Glu Glu Phe Lys Arg
195 200 205
Thr Val Asp Ile Trp Glu Lys Lys Val Leu Gln Leu Pro Val Thr Ser
210 215 220
Asn Leu Ser Ser Lys Thr Met Leu Lys Thr Leu Gly Glu Ala Thr Gly
225 230 235 240
Gly Tyr Ile Gly Leu Met Asp Met Ile Leu Arg Glu Ser Ala Ile Arg
245 250 255
Ala Leu Lys Lys Gly Leu Gln Lys Ile Asp Leu Asn Thr Leu Lys Glu
260 265 270
Val Thr Ala Glu Tyr Arg
275
<210> 37
<211> 167
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-7-Q transposition protein
<400> 37
Met Glu Ser Glu His Ile Lys Ala Trp Leu Phe Gln Val Glu Pro Phe
1 5 10 15
Glu Gly Glu Ser Leu Ser His Phe Leu Gly Arg Phe Arg Arg Ala Asn
20 25 30
Asp Leu Thr Pro Gly Gly Leu Gly Ser Gln Ala Gly Leu Gly Gly Ala
35 40 45
Ile Ala Arg Trp Glu Lys Phe Arg Phe Asn Pro Pro Pro Ser His Gln
50 55 60
Gln Leu Glu Lys Leu Ala Val Val Ala Gly Ile Asp Ala Gly Arg Leu
65 70 75 80
Val Gln Met Leu Ala Pro Ala Gly Val Ser Ile Lys Leu Glu Pro Ile
85 90 95
Arg Leu Cys Ala Ala Cys Tyr Ala Glu Ser Pro Cys His Lys Ile Glu
100 105 110
Trp Gln Phe Lys Glu Thr Arg Gly Cys Lys His His Lys Leu Arg Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Gly Ala Ser Phe Lys Ile Pro Ala Leu
130 135 140
Trp Val Asp Gly Trp Cys His Arg Cys Phe Thr Leu Phe Gly Glu Met
145 150 155 160
Val Asn His Gln Lys Pro Cys
165
<210> 38
<211> 739
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG108 effector sequence
<220>
<223> MG108-1 effector
<400> 38
Met Ser Phe Gln Thr Val Arg Cys Val Leu Cys Ala Ser Glu Glu Met
1 5 10 15
Arg Gln Lys Val Trp Leu Trp Thr Glu Lys Tyr Thr Leu Leu Val Asn
20 25 30
Glu Leu Leu Asp Gln Val Ala Ser His Glu Lys Phe Ser Glu Trp Gln
35 40 45
Ala Gln Gly Ser Ile Ala Arg Lys Glu Val Glu Ile Leu Leu Lys Ser
50 55 60
Leu Lys Ala Ser Asp Gln Phe Lys Gly Leu Pro Gly Arg Phe Tyr Thr
65 70 75 80
Ser Ala Val Leu Met Val Gln Tyr Thr Tyr Leu Ala Trp Leu Ala Leu
85 90 95
Gln Lys Lys Arg His Phe Lys Ile Ile Gly Lys Gln Arg Trp Leu Glu
100 105 110
Val Leu Glu Ala Asp Leu Glu Met Ala Ser Asn Thr Asp Phe Glu Trp
115 120 125
Gln Glu Ile Gln Ser Arg Ala Phe Glu Leu Leu Ala Gln Thr Lys Lys
130 135 140
Ser Ser Asp Thr Val Ser Ala Lys Pro Val Lys Lys Gly Ala Val Asn
145 150 155 160
Gln Glu Ala Ala Lys Ile Gln Lys Gln Thr Pro Phe Asn Ala Leu Leu
165 170 175
Glu Arg Phe Ser Ser Glu Lys Asp Leu Leu Asn Arg Arg Ala Ile Ala
180 185 190
His Leu Leu Arg Asn Asn Leu Gln Val Glu Glu Asn Glu Glu Ser Leu
195 200 205
Asp Lys Leu Leu Phe Arg Phe Glu Lys Lys Arg Ile Glu Ile Glu Arg
210 215 220
Ile Glu Lys Gln Leu Glu Ser Arg Arg Pro Lys Gly Arg Asp Pro Val
225 230 235 240
Gly Thr Arg Phe Met Glu Ser Leu Glu Glu Ala Thr Ala Leu Pro Glu
245 250 255
His Thr Lys Ser Glu Glu Ile Glu Ala Glu Leu Asn Gly Trp Lys His
260 265 270
Gln Lys Gln Val Arg Ser Leu Asn Asn Leu Pro Tyr Pro Val Leu Phe
275 280 285
Val Ser Ile Thr Asp Leu Ile Trp Ser Leu Gln Ser Asn Glu Asn Glu
290 295 300
Gln Glu Ser Val Lys Gly Asn Gln Val Gln Pro Ala Arg Arg Gly Lys
305 310 315 320
Cys Lys Lys Lys Gln Lys Arg Ser Ser Asp Arg Ile Cys Val Asn Phe
325 330 335
Asn Gly Phe Lys Lys Phe Leu Gly Glu Thr Gln Gly Val Phe Lys Ile
340 345 350
Gln Cys Asp Arg Arg Gln Leu Pro Ile Phe Arg Gln Ile Val Ser Asp
355 360 365
Trp Arg Ala Tyr Gln Gln Leu Pro Asp Asp Glu Lys Phe Gly Leu Gly
370 375 380
Leu Met Leu Leu Lys Ser Ala Gln Leu Ile Trp Lys Lys Asp Gln Gln
385 390 395 400
Lys Leu Tyr Lys Lys Lys Ala Lys Asn Asn Ser Thr Gln His Glu Thr
405 410 415
Ala Ser Gly Gly Gln Leu Val His Pro Trp Gln Thr His Arg Leu Tyr
420 425 430
Leu His Cys Cys Ile Asn Pro Asp Leu Leu Thr Ala Glu Gly Thr Glu
435 440 445
Val Val Arg Gln Lys Lys Leu Pro Ala Thr Ala Lys Lys Leu Glu Gly
450 455 460
Ser Lys Lys Arg Gln Ala Glu Val Ala Glu Arg Ile Gln Thr Ser Asp
465 470 475 480
Leu Gly Glu Asp Ser Thr Met Leu Lys Lys Leu His Thr Asn Leu Val
485 490 495
Asn Arg Ile Ser Ala Asn Ala Thr Ser Leu Asn Arg Leu Glu Asn Ala
500 505 510
Thr Pro Gln Arg Pro Ser Lys Pro Ala Tyr His Gly Gln Pro His Ile
515 520 525
Ile Val Gly Val Ser Phe Ser Arg Glu Gln Leu Val Gly Val Ala Val
530 535 540
Val Asp Thr Arg Thr Gly Arg Val Ile Glu Tyr Gln Ser Thr Arg Leu
545 550 555 560
Leu Leu Ser Asn Pro Ala Val Lys Ala Lys Arg Gly Gly Arg Thr Val
565 570 575
Thr Gln Leu Arg Leu Glu Lys Tyr Arg Leu Val Asn Arg Arg Gln Arg
580 585 590
Gln Gln Gln Gln Asn Ala Ile Arg Arg Ser Lys Glu Gln Lys Gln Asn
595 600 605
Arg Tyr Ala Arg Ser Lys Ser Glu Ser Asn Leu Gly Gln Tyr Leu Asp
610 615 620
Arg Leu Ile Ala Ser Lys Val Ile Lys Leu Ala Ile Lys Trp Gln Ala
625 630 635 640
Ser Ser Ile Val Val Pro Asn Leu Gly Asp Ile Arg Glu Ser Val Glu
645 650 655
Ala Ser Leu Lys Ala Glu Ala Glu Arg Lys Phe Pro Asn Glu Phe Glu
660 665 670
Arg Gln Lys Lys Tyr Ala Lys His Ile Arg Thr Ser Phe His Thr Trp
675 680 685
Ser Tyr Gly Arg Leu Thr Glu Cys Ile Arg Ser Cys Ala Ala Lys Ala
690 695 700
Gln Ile Pro Ile Glu Gln Gly His Gln Pro Ala Gln Gly Asp Leu Lys
705 710 715 720
Glu Lys Ala Met Gln Val Ala Leu His Ala Tyr Tyr Thr Arg Gln Ser
725 730 735
Pro Lys Gly
<210> 39
<211> 302
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG108 transposition protein sequence
<220>
<223> MG108-1-C transposition protein
<400> 39
Met Ser Gln Leu Gln Phe Ala Glu Pro Asp Arg Pro His Ser Ser Asn
1 5 10 15
Glu Glu Thr Leu Phe Leu Glu Glu Pro Arg Arg Ser Ile Glu Ala Gln
20 25 30
Ala Glu Val Glu Arg Ile Gly Lys Ala Asp Thr Tyr Leu Val Leu Asp
35 40 45
Arg Asp Ile Ala Leu Phe Asp Trp Leu Asp Asp Gln Arg Asp Thr Lys
50 55 60
Leu Cys Gly Tyr Ile Ile Gly Ser Gln Gly Ser Gly Leu Pro Lys Ala
65 70 75 80
Cys Gln Phe Tyr Arg Met Lys His Val Lys Arg Arg Gly Arg Leu Leu
85 90 95
Gln Val Pro Ala Ser Val Ile Tyr Ala Glu Val Lys Gln His Gly Gly
100 105 110
Pro Thr Asp Leu Tyr His Ala Ile Leu Glu Glu Ile Gly His Pro Leu
115 120 125
Ala Lys Ala Gly Ala Leu Arg Asp Leu Arg Ser Arg Ala Trp Gly Thr
130 135 140
Leu Lys Asp Tyr Gly Val Lys Leu Leu Ile Val Gly Asn Ala Asp Tyr
145 150 155 160
Leu Lys Leu Glu Ser Phe Asn Glu Leu Ile Asp Leu Phe Gly Lys Leu
165 170 175
Arg Ile Ala Ile Ala Leu Val Gly Thr Asp Thr Leu Ala Glu Thr Leu
180 185 190
Asp Arg Arg Gly Ser Ala Tyr Arg Arg Ile His Asp Ala Phe Leu Glu
195 200 205
Ser Phe Asp Phe Leu Asn Leu Thr Pro Glu Asp Ile Arg Glu Val Ile
210 215 220
Glu His Trp Glu Asn Gln Phe Leu Pro Thr His Ser Arg Leu Asn Phe
225 230 235 240
Ala Arg Ile Pro Asp Val Arg Lys Phe Leu Glu Leu Lys Ser Lys Gly
245 250 255
Arg Ile Glu Pro Leu Tyr Asp Leu Leu Arg Lys Ile Ala Ile Leu Lys
260 265 270
Ile Asp Glu Pro Lys Leu Glu Leu Asn Ser Thr Asn Leu Ala Asp Arg
275 280 285
Leu Gly Lys Arg Asn Ala Pro Lys Asp Arg Ile Ser Thr Arg
290 295 300
<210> 40
<211> 650
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG108 transposition protein sequence
<220>
<223> MG108-1-B transposition protein
<400> 40
Met Phe Arg Thr Ser Ala Asp Ser Asn Glu Asn Ser Ala Ser Ser Pro
1 5 10 15
Ile Ser Glu Leu Ser Ser Pro Gly Leu Val Glu Ala Gly Ser Phe Lys
20 25 30
Leu Leu Gln Asp Ile Ser Pro Glu Val Gln Gln Glu Met Asp Leu Ile
35 40 45
Asp Ala Ile Val Gln Ala Ser Asn Lys Cys Asp Arg Lys Ala Ala Ile
50 55 60
Asp Arg Ala Cys Ala Val Leu Asn Arg His Pro Arg Ser Ile Met Arg
65 70 75 80
Lys Val Gln Arg Leu Arg Gln Glu Gly Ile Thr Ser Leu Ala Lys Gly
85 90 95
Arg Lys Asp Asn Gly Gln Phe Arg Val Ser Glu Gln Trp Val Asn Phe
100 105 110
Ile Thr Lys Met Tyr Ala Arg Gly Gln Lys Asp Ser Leu Arg Phe Ser
115 120 125
Pro His Lys Val Phe Val Arg Leu Thr Val Phe Ala Ala Gln Gly Asn
130 135 140
Arg Leu Arg Glu Ser Lys Tyr Ser Asp Leu Phe Lys Asp Tyr Pro Glu
145 150 155 160
Val Leu Lys Asp Leu Ile Gln Gly Lys His Pro Ser His Pro Thr Val
165 170 175
Tyr Lys Ile Ile Asp Asn Tyr Leu Leu Gln Lys Asn Thr Lys Ala Arg
180 185 190
His Pro Gly Ala Phe Pro Gly Lys Leu Val Leu Gln Thr Thr Glu Gly
195 200 205
Leu Ile Ser Leu Thr His Ser Asn Gln Val Trp Gln Ile Asp His Thr
210 215 220
Lys Leu Asp Ile Leu Leu Val Ile Lys Val Glu Glu Asp Asp Lys Val
225 230 235 240
Glu His Glu Gly Lys Lys Ile Thr Ala Arg Pro Tyr Leu Thr Leu Val
245 250 255
Val Asp Ser Tyr Ser Ser Cys Val Ala Gly Tyr Tyr Leu Gly Phe Glu
260 265 270
Pro Ala Gly Ser His Glu Val Ser Leu Ala Leu Arg Asn Ala Ile Leu
275 280 285
Pro Lys Gln Tyr Gly Gln Glu Tyr Lys Leu Gln Ala Lys Trp Asn Ile
290 295 300
Tyr Gly Val Pro Asp Tyr Val Met Thr Asp Arg Ala Lys Glu Phe Lys
305 310 315 320
Ser Glu His Leu Lys Gln Ile Ser Phe Gln Leu Gly Phe Gln Arg Arg
325 330 335
Leu Arg Ala Phe Pro Ser Ala Gly Gly Leu Val Glu Ser His Phe Asp
340 345 350
Lys Ile Asn Lys Glu Tyr Leu Ser Glu Lys Pro Gly Tyr Thr Gly Ser
355 360 365
Ser Val Glu Glu Arg Pro Lys Glu Ala Glu Asn Ala Ala Cys Leu Thr
370 375 380
Leu Asp Asp Leu Glu Arg Glu Leu Val Arg Tyr Phe Val Asp His Asn
385 390 395 400
Asn Gln His Phe Tyr Ser Glu Asp Lys Leu Thr Val Ser Glu Arg Met
405 410 415
Ser Lys Pro Lys Arg Phe Glu Arg Trp Gln Asp Gly Leu Leu Val Glu
420 425 430
Pro Glu Ile Leu Asn Glu Arg Glu Leu Asp Ile Cys Leu Met Lys Ser
435 440 445
Ile Pro Arg Lys Val Glu Lys Tyr Gly Cys Val Arg Phe Glu Thr Leu
450 455 460
Arg Tyr Gln Gly Glu Cys Leu Ala Asn Lys Ala Phe Ile Gly Arg Asp
465 470 475 480
Ile Thr Leu Arg Tyr Asp Gln Arg Asn Ile Ala Thr Leu Leu Val Tyr
485 490 495
Ser Tyr Ser Thr Thr Ser Gln Ile Gln Glu Phe Ile Gly Thr Val Gln
500 505 510
Ala Ile Gly Leu Glu Arg Glu Arg Phe Ser Leu Gly Glu Trp Glu Ala
515 520 525
Leu Lys Gln Lys Met Arg Asp Arg Asp Lys Glu Ile Asp Asn Ser Ile
530 535 540
Leu Met Ala Glu Arg Met Gly Leu Ile Glu Ser Thr Lys Glu Gln Ile
545 550 555 560
Lys Ser Ser Arg Ser Lys Arg Gln Arg Ile Lys Lys Ala His Thr Glu
565 570 575
Gln Glu Arg Lys Ala Asn Arg Ser Lys Val Val Glu Leu Tyr Pro Glu
580 585 590
Arg Ala Ile Glu Asp Thr Thr Val Ile Gln Glu Asn Val Glu Ser Thr
595 600 605
Pro Asn Ser Ser Ile Gln Lys Arg Val Glu Ser Thr Gln Glu Gln Gln
610 615 620
Ile Gln Gln Ala Ala Pro Lys Thr Arg Arg Val Arg Thr Val Ala Pro
625 630 635 640
Asp Trp Asn Gln Ile Lys Gln Asp Asn Trp
645 650
<210> 41
<211> 200
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 effector sequence
<220>
<223> MG110-1-6 effector
<400> 41
Met Lys Leu Phe Ser Val Lys Ile Thr Tyr Leu Pro Glu Lys Cys Asp
1 5 10 15
His Ala Leu Leu Ala Gly Arg Cys Ile Lys Val Leu His Ala Phe Met
20 25 30
Ser Arg Asn Gly Gln Phe Asn Ile Ala Val Ala Phe Pro Arg Trp Ser
35 40 45
Glu Asn Thr Ile Gly Asn Gln Leu Val Phe Val Ser Pro Asp Tyr Lys
50 55 60
Phe Leu Asp Met Leu Leu Glu Gln Pro Tyr Phe Arg Met Met Ile Glu
65 70 75 80
Asn Gly Leu Phe Glu Thr Gly Thr Val Val Asp Leu Pro Val Ser Asp
85 90 95
Ser Tyr Val Lys Phe Val Arg Asn Gln Ser Ile Asp Lys Met Thr Pro
100 105 110
Ala Ala Lys Ala Arg Arg Leu Arg Arg Ala Lys Lys Arg Ala Leu Ala
115 120 125
Arg Gly Glu Val Phe Asp Pro Ile Ala Pro Arg Ser Lys Asp Val Asp
130 135 140
Phe Phe His Ser Ile Pro Met Glu Ser Ser Glu Ser Glu Met Ser Tyr
145 150 155 160
Leu Leu Arg Val Gln Arg Tyr Glu Val Gln Gln Ala Asn Pro Val Ala
165 170 175
Ser Phe Glu Val Cys Ser Tyr Gly Leu Ser Thr Asn Glu Ser His Gln
180 185 190
Ala Leu Ile Pro Ser Ser Val Thr
195 200
<210> 42
<211> 342
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 effector sequence
<220>
<223> MG110-1-7 effector
<400> 42
Met Gln Leu Pro Asn Gln Leu Ser Tyr Lys Arg Ser Ile Asn Pro Ser
1 5 10 15
Lys Ala Ile Phe Tyr Tyr Arg Arg Asp Glu Asp Leu Tyr Pro Leu Pro
20 25 30
Val Glu Arg Ile Lys Ile Arg Gly Ser Lys Ser Gly Phe Ser Glu Ala
35 40 45
Tyr Thr Ala Lys Gly Ile Lys Glu Ser Ala Thr Ile His Ser Leu Ala
50 55 60
Thr Gly Asn Pro His Thr Ile Asp Thr Cys Tyr Leu Pro Pro Ala Ala
65 70 75 80
Asp Ser Leu Val Cys Arg Phe Ser Leu Arg Val Ser Ala Asn Ser Leu
85 90 95
Phe Pro Asp Arg Cys Ser Glu Ile Ala Phe Lys Asp Thr Val Ser Gln
100 105 110
Phe Leu Asn Ser Tyr Ile Ala Lys Asp Gly Phe Lys Glu Leu Ala Ile
115 120 125
Arg Tyr Ser Lys Asn Ile Ala Met Gly Thr Trp Leu Trp Arg Asn Lys
130 135 140
Glu Gly Asn Thr Phe Asp Val Leu Val Arg Thr Ser Gln Gly Asn Glu
145 150 155 160
Tyr Lys Phe Lys Asn Ala His Met Leu Phe Trp Asp Ser Val Trp Pro
165 170 175
Asp Glu Ser Ser Glu Leu Leu Ala Leu Leu Ser Asp Glu Leu Ala Val
180 185 190
Ala Leu Thr Lys Pro Arg Tyr Val Trp His Cys Asp Val Trp Ala Glu
195 200 205
Val Lys Met Pro Phe Cys Ser Glu Val Phe Pro Ser Gln Cys Phe Val
210 215 220
Asp His Asp Asp Lys Gln Ser Ala Ser Lys Val Leu Leu Thr Thr Asp
225 230 235 240
Ile Asp Gly Val Met Thr Ala Cys Tyr Asn Ala Asp Lys Val Gly Ala
245 250 255
Ala Ile Gln Met Ile Asp Asp Trp Trp Asp Glu Ser Cys Asp Phe Pro
260 265 270
Leu Arg Val Asn Glu Tyr Ala Ala Asp His Glu Asn Leu Ile Ala Arg
275 280 285
Arg His Pro Ser Thr Glu Arg Asp Phe Tyr Gln Cys Leu Gln Asn Leu
290 295 300
Arg Gly Tyr Thr Asp Lys Leu Asn Lys Val Lys Ser Val Asp Asp Ile
305 310 315 320
Glu Pro Asp Ala His Phe Val Ala Ser Val Leu Val Lys Gly Gly Met
325 330 335
Phe Gln Gly Gly Lys Ser
340
<210> 43
<211> 682
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 effector sequence
<220>
<223> MG110-1-8 effector
<400> 43
Met Ser Leu Gln Asp Thr Leu Gln Ala Val Lys Ala Leu Lys Ala Lys
1 5 10 15
Glu Arg Tyr Asp Ala Leu Lys Lys Ser Phe Glu Leu Tyr Ser Glu His
20 25 30
Val Asp Val Thr Gly Ser Glu Leu Ala Cys Leu Thr Ile Leu Val Asn
35 40 45
Leu Val Ser Lys Asp Ala Val Glu Leu Glu Gly Leu Arg His Ala Lys
50 55 60
His Val Leu Lys Ser Asp Glu Phe Trp Gly Lys Phe Ser Lys Val Ala
65 70 75 80
Ser Gln Leu His Thr His Asn Leu Lys Trp Pro Asp Ser Arg Val Asn
85 90 95
Leu Lys His His Ile Arg Ala Leu Pro Glu Ile Gly Val Leu Pro Lys
100 105 110
Phe Gly Trp Ser Gly Asn Ser Gly Asp Tyr Arg Phe Gly Arg Leu Leu
115 120 125
Thr Ser Thr Phe Ile Trp Gln Gly Leu Glu His Ser Leu Ile Ser Val
130 135 140
Trp Leu Gly Asp Phe Val Ala Trp Arg Lys Ala Ala Tyr Lys Leu Gly
145 150 155 160
Ile Thr Lys Val Phe Trp Tyr Gln Ile Lys Arg Asp Leu Glu Asp Leu
165 170 175
Phe Gln Glu Ser His Phe Pro Asp Val Val Asp Ser Tyr Ser Pro Glu
180 185 190
Leu Gln Phe Pro Tyr Lys Asp Gln Tyr Leu Ser Val Thr Pro Val Ala
195 200 205
Ser His Glu Thr Gln Leu Ala Ile Gln His Val Thr Gly Leu Pro Met
210 215 220
His Ser Leu Ser Phe Pro His Pro Ser Ala Leu Gly Val Leu Cys Gly
225 230 235 240
Ser Leu Gly Gly His Val Arg Leu Ile Arg Leu Ser Pro Leu Gly Asn
245 250 255
Gln Asn Val Gln Arg Ser Ser Leu Gly Ser Leu Ser Leu Lys Asn Tyr
260 265 270
Leu Asn Pro Tyr Val Leu Thr Ala Ile Pro Ala Ile Asn Leu Tyr Arg
275 280 285
Arg Ile Val Asp Val Arg Thr Tyr Ser Ser Leu Arg Leu Lys Arg Arg
290 295 300
Ala Arg Leu Asn Ala Leu Ser Thr Leu Asp Gly Ile Leu Ala Glu Trp
305 310 315 320
Val Ala Pro Leu Val Gln Val Lys Leu Ser Ser Asn Val Asp Gly Arg
325 330 335
Ile Asp Gly Leu Gly Ala Glu Glu Gln Glu Phe Val Glu Ser Ser Ser
340 345 350
Val Asp Ile Glu Glu Phe Ser Arg Tyr Leu Asn Arg Lys Leu His Gly
355 360 365
Met Leu Glu Leu Gly Lys Tyr Ser Arg Lys Phe Ser Tyr His Gln Arg
370 375 380
Leu Val Gly Val Thr Gln Lys Arg Leu Ala Ser Leu Leu Arg Arg Leu
385 390 395 400
Leu Leu Ala Glu Thr Gln Ser Glu Ser Asn Asn Thr Thr Phe Ile Ile
405 410 415
Leu Lys Ser Leu Arg Ile Asn Glu Ala Asn Gly Leu Asn Asn Pro Tyr
420 425 430
Val Val Gly Met Pro Ser Ile Ile Gly Leu Tyr Gly Phe Leu His Arg
435 440 445
Phe Glu Cys Gln Leu Arg Glu Ile Tyr Ala Asp Ile Ser Val Asp Ser
450 455 460
Phe Ala Leu His Cys Gly Glu Tyr Ser Tyr His Ala Ser Asn Asn Leu
465 470 475 480
Pro Ala Pro Ser Ile Pro Asp Lys Glu Met Arg Ile Lys Arg Ser Gly
485 490 495
Ile Thr Pro Glu Phe Lys Phe Asp Gly Lys Phe Ser Ile Ile Val Lys
500 505 510
Leu His Cys Leu Thr Asp Asn Ala Val Leu Asp Val Glu Gln Ile Lys
515 520 525
Ala Ala Val Pro Glu Arg Leu Trp Gly Gly Ser Val His Pro Pro Tyr
530 535 540
Leu Tyr Glu Asn Thr Glu Trp Ala Ala Ile Ala Tyr Gly Ser Ala Asp
545 550 555 560
Leu Glu Arg Tyr Leu Ile Arg Asn Leu Phe Phe Gly Asn Trp Ile Thr
565 570 575
Pro Glu Glu Glu Asp Gly Phe Glu Leu Arg Lys His Ile Glu Lys Leu
580 585 590
Asn Gly Lys Asn Glu Leu Ser Leu Cys Leu Val Gly Tyr Lys Leu Leu
595 600 605
Glu Lys Val Lys Pro Arg Ser Val Val Ser Gly Ile His Ala Phe Cys
610 615 620
Glu Pro Val Val Asp Leu Cys Cys Leu Lys Gln Thr His Lys Val Ile
625 630 635 640
Lys Pro Thr Lys Ser Ile Glu Gln Glu Leu Phe Trp Arg Tyr Val Pro
645 650 655
Val Ser Gln Asn Cys Thr Thr Leu Arg Val Ser Pro Val Cys Gly Glu
660 665 670
Thr His Ala Ala Ser Gln Ser Ala Glu Leu
675 680
<210> 44
<211> 383
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 transposition protein sequence
<220>
<223> MG110-1-Q transposition protein
<400> 44
Met Gly Phe Leu Pro Asn Ser Ile His Leu Tyr Pro Asp Glu Thr Val
1 5 10 15
Glu Ser Ala Leu Leu Arg Leu Cys Lys Ala Asn His Phe Glu Arg Tyr
20 25 30
Ile Asp Leu Ser Ile Glu Ile Arg Ser Trp Leu Glu Glu His His Pro
35 40 45
Thr Ile Ala Gly Ala Phe Pro Val Ala Leu Asp Ala Val Asn Val Tyr
50 55 60
His Ala Lys Gln Ser Ser Ala Lys Arg Val Gln Ser Leu Gln Leu Leu
65 70 75 80
Glu Gln Leu Val Gly Leu Pro Arg Phe Ser Leu Leu Asp Ile Ser Phe
85 90 95
Lys His Thr Asn Ala Val Asp Ala Gly His Phe Ala Glu Val Arg Tyr
100 105 110
Lys Gln Ile Thr Ile Pro Lys Ser Phe Val Arg Ala Ser Ser Val Pro
115 120 125
Val Cys Ile Ala Cys Leu Arg Glu Ser Asn Tyr Val Arg Phe Asp Trp
130 135 140
His Ile Ser Lys Val Thr Cys Cys Glu Lys His Lys Val Lys Leu Leu
145 150 155 160
Ser Asn Cys Pro Ala Cys Asn Ala Pro Leu Asn Tyr Met Ile Ser Glu
165 170 175
Asp Pro Ser His Cys Val Cys Gly Phe Asn Leu Leu Glu Thr Thr Asn
180 185 190
Ser Glu Lys Gly Ala Asp Asp Trp Arg Arg Arg Ile Ser Phe Asp Gln
195 200 205
Gln Gly Ser Leu Ser Ile Ser Glu Gln Leu Ala Leu Leu Leu Phe Leu
210 215 220
Glu Arg Tyr Phe Ser His Val Glu Leu Gly Asp Phe Ile Gly Asn Tyr
225 230 235 240
Lys Ser Leu Ile Asp Lys His Leu Gln Ile Leu Thr Ser Lys Asn Ile
245 250 255
Leu Leu Ala Thr Glu Lys Ile Asn Arg Val Ser Phe Ser Ser Leu Thr
260 265 270
Asp Asn Phe Leu Gly Asp Val Ala Gln Ile Gly Ser Leu Pro Asn Phe
275 280 285
Ile Lys Gln His Ile Ala Asn Val Val Ile Glu Leu Ala Leu Glu Thr
290 295 300
Pro Arg Ser Thr Ile Ala Asn Leu Gly Asp Ser Leu Val Ser Met Arg
305 310 315 320
Asp Ala Ala Leu Ile Thr Gly Ser Thr Ile Asp Asp Ile Phe Arg Leu
325 330 335
Tyr Glu Ser Gly Ile Leu Val Val Gly Lys Arg Ile Arg Asn Glu Gly
340 345 350
Arg Ile Glu Ser Phe Asn Pro Leu Phe Arg Leu Arg Asp Val Ala Ala
355 360 365
Ile Ala Leu Ser Tyr Ser Arg Tyr Gly Tyr Ser Gln Ser Ala Trp
370 375 380
<210> 45
<211> 334
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 transposition protein sequence
<220>
<223> MG110-1-C transposition protein
<400> 45
Met Gly Leu Thr Asp Ala Asp Lys Ala Lys Leu Arg Glu Phe Lys Asp
1 5 10 15
Cys Phe Cys Pro Tyr Thr Pro Val Thr Thr Val Leu Asn Asp Leu Glu
20 25 30
Ser Leu Tyr Gln Ser Ser Glu Ile Gly Gly Glu Gln Leu Ser Met Leu
35 40 45
Leu Arg Gly Asp Thr Gly Thr Gly Lys Ser Ala Ile Ile His His Phe
50 55 60
Cys Asn Ile Lys Asn Gly Ile Asn Leu Glu Ser Ile Pro Val Leu Leu
65 70 75 80
Ser Arg Val Pro Ser Lys Leu Thr Val Glu Asp Met Thr Arg Gln Leu
85 90 95
Leu Ser Asp Leu Gly Val Phe Gly Ser Ser Thr His Arg Ala Lys Asn
100 105 110
Ala Gln Ser Asp Ala His Leu Thr Asn Arg Leu Leu Asp Ala Leu Lys
115 120 125
Val Lys Asn Thr Lys Met Ile Ile Ile Asn Glu Phe Gln Glu Leu Ile
130 135 140
Glu Phe Lys Gly Ala Arg Asp Arg Gln Ala Ile Gly Asn Arg Leu Lys
145 150 155 160
Leu Ile Ser Glu Glu Ala Ala Val Pro Ile Val Leu Val Gly Met Pro
165 170 175
Trp Ile Asp Glu Ile Leu Asn Asp Ser Gln Trp Ala Ser Arg Leu Ala
180 185 190
Thr Arg Thr His Thr Leu Gln Tyr Phe Ser Leu Ser Lys Arg Ile Arg
195 200 205
Glu Tyr Phe Glu Phe Leu Glu Ala Ile Glu Thr Tyr Val Pro Cys Glu
210 215 220
Ile Glu Thr Ser Ile Ile Asp Phe Glu Ile Ser Ile Ala Leu Phe Ala
225 230 235 240
Ala Ser Cys Gly Glu Met Arg Gln Leu Lys Ala Ile Leu Thr Glu Ala
245 250 255
Ile Lys Leu Cys Leu Ile Ser Gly Glu Pro Phe Ser Lys Gln Ala Leu
260 265 270
Ser His Ser Phe Ala Asn Leu Tyr Ala Gly Ile Glu Asn Pro Phe Asp
275 280 285
Met Pro Lys Glu Lys Ile Lys Val Arg Glu Val Glu Met His Ser Arg
290 295 300
Tyr Ile Arg Gly Asp Ser Thr His Arg Ala Ala Ile Glu Pro Arg Arg
305 310 315 320
Leu Ser Asp Phe Met Ser Leu Thr Gln Ile Leu Ser Lys Lys
325 330
<210> 46
<211> 601
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 transposition protein sequence
<220>
<223> MG110-1-B transposition protein
<400> 46
Met Phe Asp Asp Glu Phe Asp His Asp Pro Leu Lys Glu Asp Val Glu
1 5 10 15
Ser Ser Asn Arg Gln Ser Asp Glu Ala Ser Tyr Leu Ser Pro Asp Leu
20 25 30
Asp Ser Tyr Pro Ile Lys Ser Ser Glu Glu Ala Leu Val Arg Tyr Glu
35 40 45
Leu Val Gln Phe Ile Arg Glu Arg Thr Ser Lys Gly Trp Thr Gln Arg
50 55 60
Asn Leu Asn Pro Leu Ile Ser Glu Tyr Phe Ser Thr His Arg Ser Leu
65 70 75 80
Glu Arg Pro Ser Trp Arg Thr Val Val Arg Trp His Lys Lys Leu Leu
85 90 95
Glu Gln Gly Asp Thr Pro Val Ser Leu Ile Glu Arg His His Asn Lys
100 105 110
Gly Asn Arg Asn Arg Lys Leu Leu Leu Asp His Glu Arg Phe Phe Glu
115 120 125
Ala Ala Ile Asp Ser Phe Leu Lys Ala Lys Arg Pro Ser Val Ala Thr
130 135 140
Ala Tyr Arg Tyr Tyr Lys Asp Gln Cys Leu Leu Gln Gly Asn Asn Ile
145 150 155 160
Asn Pro Met Ser Gln Arg Ala Phe Tyr Asp Arg Ile Asp Lys Leu Asn
165 170 175
Ser Tyr Glu Val Ala Val Lys Arg Phe Gly Lys Tyr Lys Ala Asp Ile
180 185 190
Met Tyr Gly His Lys Gly Ser Thr Leu Lys Pro Glu Arg Val Met Gln
195 200 205
Arg Val Glu Ile Asp His Thr Val Leu Asp Ile Thr Leu Leu Asp Asp
210 215 220
Asp Thr Gly Met Pro Ile Gly Lys Pro Ser Leu Thr Leu Leu Lys Cys
225 230 235 240
Ala Leu Ser Gly Cys Ile Val Gly Tyr Asn Leu Thr Phe Lys Ala Pro
245 250 255
Cys Phe Ala Ser Val Ala Lys Ala Ile Cys His Thr Leu Leu Pro Lys
260 265 270
Thr Ser Ser Leu Asp Ile Trp Gly Ile Asp Trp Pro Cys Tyr Gly Lys
275 280 285
Ile Glu Val Leu Val Val Asp Asn Gly Val Glu Phe Trp Ile Pro Ser
290 295 300
Met Glu Lys Met Cys Phe Glu Leu Gly Ile Asn Val Gln Tyr Asn Pro
305 310 315 320
Val Lys Lys Pro Trp Leu Lys Pro Phe Ile Glu Arg Asn Phe Lys Thr
325 330 335
Ile Asn Ser Leu Leu Leu Asp Glu Leu Ser Gly Lys Thr Phe Gly Asn
340 345 350
Ile Tyr Val Arg Gly Asp Tyr Asp Ser Val Lys Asn Ala Glu Ile Pro
355 360 365
Phe Gly Val Phe Val Tyr Val Phe Glu Lys Trp Ala Ala Glu Val Tyr
370 375 380
Asn Cys Ser Pro Asp Ser Gln Gly Met Lys Val Pro Ser Ile Ile Trp
385 390 395 400
Gln Asp Gly Ile Glu Lys Phe Pro Pro Ala Arg Leu Ser Asp Ser Asp
405 410 415
Ile Arg Glu Leu Pro Lys Ile Thr Gly Phe Lys Glu Ser Arg Lys Ile
420 425 430
Gln Ser Ser Gly Ile Thr Tyr Lys His Leu Arg Tyr Asp Ser Thr Asp
435 440 445
Leu Ala Glu Tyr Arg Lys Gln Tyr Trp Ser Asn Thr Arg Lys Glu Leu
450 455 460
Val Thr Ile Lys Ile Asp Val Asp Asp Leu Ser Lys Ile Phe Val Tyr
465 470 475 480
Leu Pro Glu Ile Glu Lys Tyr Leu Thr Val Pro Cys Val Asp Gln Glu
485 490 495
Tyr Thr Lys Asn Leu Ser Leu Asp Gln His Leu Ile Thr Arg Thr Tyr
500 505 510
Thr Lys Lys Arg Asn Lys Leu Leu Gly Lys Ser Glu Leu Glu Leu Ala
515 520 525
Lys Ser Arg Asp Glu Ile Arg Asp Ala Val Glu Gln His Asp Lys Lys
530 535 540
Ala Ala Thr Ser Lys Lys Val Thr Thr Ser Lys Lys Val Ala Gln Phe
545 550 555 560
Lys Gly Tyr Ser Asn Glu Ser Val Lys Asn Lys Val Ala Lys Pro Ile
565 570 575
Ser Ser Asp Asp Lys Ser Arg Ala Glu His Ala Glu Met Ser Glu Leu
580 585 590
Glu Ala Leu Trp Asn Ser Phe Arg Lys
595 600
<210> 47
<211> 207
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 transposition protein sequence
<220>
<223> MG110-1-A transposition protein
<400> 47
Met Tyr Asn Arg Asn Leu Arg Lys Pro Ser Pro Asn Lys Asn Leu Tyr
1 5 10 15
Lys Phe Val Ser Arg Lys Asn His Ser Thr Val Met Cys Glu Ser Gly
20 25 30
Leu Glu Phe Asp Ala Cys Phe His Leu Glu Phe Ser Pro Ser Ile Ala
35 40 45
Ser Phe Glu Ser Gln Pro Thr Gly Ile Glu Tyr Gln Ala Asp Asn Lys
50 55 60
Ile Arg Arg Tyr Thr Pro Asp Phe Lys Ile Val Lys Asn Thr Gly Glu
65 70 75 80
Ile Glu Tyr Ile Glu Val Lys Pro Glu Arg Ile His Ser Thr Lys Lys
85 90 95
Phe Arg Asp Glu Phe Glu Tyr Lys Arg Ala Ala Tyr Arg Ala Leu Gly
100 105 110
Phe Lys Leu Ile Leu Val Ser Glu Lys Gln Ile Arg Ser Glu Lys Leu
115 120 125
Leu Ser Asn Leu Lys Ile Leu His Arg Tyr Ala Ser Thr Asn Phe Ser
130 135 140
Glu Leu His Lys Leu Ala Leu Thr His Ile Lys Lys Phe Lys Ser Leu
145 150 155 160
Ser Ile Arg Glu Leu Ala Ile Lys Leu Gly Ile Arg Ile Cys Asp Cys
165 170 175
Ile Ala Ala Cys Ala Leu Leu Ile Gly Ile Gly Ala Val Lys Ala Asp
180 185 190
Leu Glu Ser Asp Phe Leu Cys Glu His Ser Leu Leu Asn Glu Ala
195 200 205
<210> 48
<211> 215
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 effector sequence
<220>
<223> MG110-2-6 effector
<400> 48
Met Thr Asp Lys Arg Tyr Phe Phe Ala Ile His Tyr Val Pro Ala Lys
1 5 10 15
Ala Asp Cys Gly Leu Leu Ala Gly Arg Cys Ile Ser Thr Leu His Gly
20 25 30
Tyr Leu Leu Asn His Ala Val Thr Gln Ile Gly Val Ala Phe Pro Cys
35 40 45
Trp Ser Asn Lys Ser Ile Gly Arg Thr Ile Ala Phe Val Ser Glu His
50 55 60
Ser Ser His Leu Thr Gln Phe Arg Glu Arg Thr Tyr Phe Gln Thr Met
65 70 75 80
Gln Gly Asp Gly Leu Phe Glu Leu Ser Pro Val Leu Glu Val Pro Asp
85 90 95
Asp Cys Ala Glu Val Arg Phe Ile Arg Asn Gln Asn Leu Ala Lys Leu
100 105 110
Phe Val Gly Glu Arg Arg Arg Arg Leu Leu Arg Ser Lys Arg Arg Val
115 120 125
Ala Glu Arg Gly Glu Leu Phe Val Pro Lys Ala Pro Ala Ile Asn Gln
130 135 140
Glu Ile Ala Pro Phe His Cys Ala Leu Ile Gln Ser Ala Ser Asn Ala
145 150 155 160
Gln Ser Tyr Val Leu His Ile Gln Lys Gln Ser Cys Asp Ser Glu Asp
165 170 175
Ser Thr Asn Thr Tyr Ser Arg Tyr Gly Leu Ala Ser Pro Asn Ser Tyr
180 185 190
Arg Gly Ser Val Pro Glu Leu Ser Ser Ser Ile Ser Thr Leu Phe Pro
195 200 205
Asp Ser Leu Tyr Leu Lys Arg
210 215
<210> 49
<211> 345
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 effector sequence
<220>
<223> MG110-2-7 effector
<400> 49
Met Glu Leu Cys Lys His Leu Ser Tyr Ser Arg Ser Leu Ser Pro Gly
1 5 10 15
Lys Ala Val Phe Phe Tyr Lys Thr Ala Asp Ser Asp Phe Val Pro Leu
20 25 30
Arg Val Glu Thr Ala Arg Val Val Gly Gln Lys Ser Gly Tyr Ser Glu
35 40 45
Gly Phe Asp Ala Asn Phe Gln Pro Lys Asn Val Glu Arg Tyr Glu Leu
50 55 60
Ala Tyr Gly Asn Pro Gln Thr Ile Glu Ala Cys Tyr Val Pro Pro Asn
65 70 75 80
Ile Val Glu Leu Tyr Cys Arg Phe Ser Leu Arg Ile Glu Ala Asn Ser
85 90 95
Leu Ser Pro Asp Leu Cys Ser Asp Pro Gly Val Val Lys Thr Leu Lys
100 105 110
Gln Leu Ala Gly Leu Tyr Gln Glu His Gly Gly Tyr Ile Glu Leu Ala
115 120 125
Arg Arg Tyr Ser Arg Asn Leu Leu Met Gly Thr Trp Leu Trp Arg Asn
130 135 140
Arg His Asn Gln Gly Thr Arg Ile Glu Val Lys Thr Ser Gln Gly Ser
145 150 155 160
His Phe Ala Ile Asp Asp Val Arg His Leu Asp Trp Phe Ser Glu Trp
165 170 175
Pro Ala Leu Ala Glu Ala Gln Leu Asn Gln Leu Ala Ala Glu Met Ala
180 185 190
Ile Ala Leu Ser Arg Arg Asp Met Phe Trp Phe Ala Asp Ile Thr Ala
195 200 205
Val Met Lys Thr Gly Phe Cys Gln Glu Ile Phe Pro Ser Gln Arg Phe
210 215 220
Thr Glu Arg Pro Asp Asn His Asp Glu Pro Ser Lys Lys Leu Ala Thr
225 230 235 240
Val Glu Cys Leu Asp Gly Gln Leu Ala Ala Cys Leu His Ala Gln Lys
245 250 255
Val Gly Ala Ala Leu Gln Gln Ile Asp Asp Trp Trp Ala Glu Asp Ala
260 265 270
Asp Gln Pro Leu Arg Val His Gln Tyr Gly Ala Asp Ser Lys Asn Leu
275 280 285
Thr Ser Met Arg His Pro Val Ser Gly Leu Asp Phe Tyr His Leu Leu
290 295 300
Gly Arg Ala Asp Glu Phe Leu Glu Leu Met Arg Ser Ser Pro Ala Ser
305 310 315 320
Ser Pro Leu Pro Gly Glu Ile His Tyr Leu Met Ala Val Leu Thr Lys
325 330 335
Gly Gly Leu Phe Gln Lys Gly Lys Gly
340 345
<210> 50
<211> 710
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 effector sequence
<220>
<223> MG110-2-8 effector
<400> 50
Met Pro Leu His Glu Leu Met Asn Leu His Asp Gln Ala Glu Gln Asp
1 5 10 15
Lys Ala Leu Arg Arg Ala Phe Ala Pro Tyr Thr Pro Asp Ile Glu Leu
20 25 30
Glu Gly Glu Glu Tyr Arg Ala Leu Val Val Leu Val Asn Leu Thr Leu
35 40 45
Lys Arg Asp Gln Ala Val Asp Leu Cys Asp Glu Ser Gln Ala Gln Arg
50 55 60
Leu Val Asn Asp Asp Lys His Leu Glu His Cys Val His Pro Val Ala
65 70 75 80
Trp Leu His Ser His Asn Leu Lys Tyr Pro Asp Thr Arg Val Ser Gly
85 90 95
Gln Arg Leu Val Ile Asp Ala Pro Pro Leu Ile Pro Gly Val Val Thr
100 105 110
Ser Ala Gly Leu Gln Asn Arg Leu Gly Trp Ala Asn Asn Ser Ala Asp
115 120 125
Ile Asn Tyr Ala Lys Leu Phe Cys Ser Ser Phe Leu Tyr Gln Gly Leu
130 135 140
Ser Ser Asn Leu Ala Leu Gln Leu Val Ala Asp Val Pro Ala Trp Thr
145 150 155 160
Gly Ala Phe Arg Gln Leu Gly Val Ala Asn Thr Ala Ile Ala Ala Leu
165 170 175
Gln Ala Gln Leu Ala His His Leu Ala Ala Thr Ala Ile Pro Ser Glu
180 185 190
Val Ser Val Tyr Ser Lys Gln Val Arg Phe Trp Tyr Gln Gly Asp Tyr
195 200 205
Cys Ala Ile Thr Pro Val Val Ser His Ala Leu Met Ala His Leu Gln
210 215 220
His Met Ile Tyr Glu Lys Arg Cys Ser His Leu Thr Ile Ser His Asp
225 230 235 240
His Pro Ser Ser Val Gly Asn Leu Val Gly Ala Val Gly Gly Lys Ile
245 250 255
Ser Val Leu Asn Tyr Pro Pro Pro Ile Ser Ile Pro Lys Arg Arg His
260 265 270
Phe Ser Gln Ser Arg Thr Gln Arg Leu Asn Glu Gly Arg Ser Leu Phe
275 280 285
Asp Arg Gly Met Leu Tyr Asp Arg Ile Phe Pro Gln Ala Leu Glu His
290 295 300
Leu Ile Thr Pro Ala Gly Leu Thr Arg Arg Gln Arg Lys Gln Ser Arg
305 310 315 320
Leu Ser Ala Met Arg Tyr Leu Arg Arg Gln Leu Val Ala Trp Ile Gly
325 330 335
Pro Val Ile Glu Trp Arg Asp Glu Ile Gln Leu Leu Pro Asn Ile Glu
340 345 350
Leu Pro Ile Thr Pro Glu Arg Leu Glu Trp Lys Ile Val Thr Ser Pro
355 360 365
Val Ala Glu Leu Pro Asp Leu Ala Thr Glu Leu Ala Gly Val Phe His
370 375 380
Leu Glu Leu Gln Thr His His Ala Thr Arg Arg Phe Ala Tyr His Pro
385 390 395 400
Glu Leu Leu Ile Pro Ile Lys Ser Gln Leu Arg Trp Leu Leu Asn Lys
405 410 415
Leu Ala Asp Asp Glu Asn Arg Pro Ser Pro Gln His Ala Ala Thr Ser
420 425 430
Cys Tyr Leu His Leu Ser Gly Leu Arg Val Tyr Asp Ala Leu Ala Leu
435 440 445
Ala Asn Pro Tyr Leu Cys Gly Ile Pro Ser Leu Ser Ala Leu Ala Gly
450 455 460
Phe Cys His Asp Tyr Glu Arg Arg Leu Thr Ala Leu Leu Lys Arg Pro
465 470 475 480
Val Arg Phe Thr Gly Val Ser Trp Tyr Leu Ser His Tyr His Leu Leu
485 490 495
Ser Gly Lys Ser Leu Gln Glu Pro Leu Ser Pro Met His Ala Arg Glu
500 505 510
Val Ser Ala Ile Arg Arg Pro Gly Leu Ile Asp Ser Lys Tyr Cys Asp
515 520 525
Leu Gly Met Asp Leu Val Ile Ala Leu Gln Val Asp Asp Glu His Pro
530 535 540
Leu Pro Ser Ala Asn Glu Gln Asp Leu Leu Gln Ala Ala Phe Pro Ser
545 550 555 560
Arg Phe Ala Gly Gly Cys Leu His Pro Pro Ser Leu Tyr Glu Gly Lys
565 570 575
Pro Trp Cys Ser Leu Tyr Thr Asn Arg Asn Glu Leu Phe Asn Thr Leu
580 585 590
Ser Arg Leu Pro Arg Thr Gly Cys Trp Val Tyr Pro Tyr Gln Ser Arg
595 600 605
Ile Ser Asn Leu Asp Asp Leu Ile Asp Thr Leu Ser Met Asp Arg Arg
610 615 620
Val Arg Pro Val Ser Thr Gly Tyr Val Phe Leu Asp Glu Pro Arg Val
625 630 635 640
Arg Ala Gly Ser Val Glu Lys Cys His Val Tyr Ala Glu Ser Ala Leu
645 650 655
Gly Leu Ala Leu Cys Val Asn Pro Val Glu Met Arg Leu Tyr Gly Asn
660 665 670
Asn His Phe Phe Asn His Gly Val Trp Gln Leu Thr Ala Ile Asn Arg
675 680 685
Ala Ile Leu Met Thr Gly Ala Gly Asn Met Glu Gln Arg His Gly Ala
690 695 700
Met Gln Thr Ser Glu Leu
705 710
<210> 51
<211> 409
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 transposition protein sequence
<220>
<223> MG110-2-Q transposition protein
<400> 51
Met Arg Leu Leu Ile Arg Pro Glu Pro Tyr Pro Asp Glu Ser Leu Glu
1 5 10 15
Ser Tyr Leu Leu Arg Leu Ser Gln Glu Asn Gly Phe Glu Arg Tyr Thr
20 25 30
Leu Leu Ser Gly Ala Ile Arg Asp Ser Leu Leu Val Gln Asp His Glu
35 40 45
Ala Ser Gly Ala Phe Pro Leu Glu Leu Ala Arg Val Asn Val Phe His
50 55 60
Ala Gln Arg Ser Ser Gly Leu Arg Val Arg Ala Leu Gln Leu Phe Ala
65 70 75 80
Gln Leu Thr Asp Leu Asp Pro Ala Cys Leu Leu Gln Leu Ser Leu Met
85 90 95
His Ser Gly Leu His Phe Gly Ser Gly His Ala Cys Val His Arg Ala
100 105 110
Gly Val Asp Thr Pro Leu Gly Phe Ile Arg Thr Gly Pro Ile Pro Val
115 120 125
Cys Pro Ala Cys Leu Arg Glu Ser Ala Tyr Ile Arg Gln His Trp His
130 135 140
Tyr Ser Pro Tyr Leu Ala Cys His Gln His Gly Ser Gln Leu Leu His
145 150 155 160
Leu Cys Pro Ser Cys Gly Glu Ala Leu Asp Tyr Gln His Ser Glu Ser
165 170 175
Phe Thr His Cys Arg Cys Gly Phe Asp Leu Arg Thr Ala Ile Thr Gln
180 185 190
Pro Ala Ser Ala Glu Ala Gln Gln Leu Ser Thr Leu Ile Cys Gly Ala
195 200 205
Arg Phe Glu Ser Thr Asn Pro Leu Leu Ser Ser Glu His Pro Ser Leu
210 215 220
Met Phe Gly Ala Leu Tyr Trp Tyr Trp Leu Arg Asn Lys Arg Ala Asp
225 230 235 240
Ala Gly Gln Pro Glu Phe Gly Thr Leu Thr Met Ala Ile Asp Tyr Phe
245 250 255
Ser Ala Trp Pro Ala Asn Phe His His Glu Leu Gln Gln Met Ala Gln
260 265 270
Lys Ala Leu Gln Thr Gln Thr Arg Leu Leu Asn His Thr Ala Phe Arg
275 280 285
Glu Val Phe Gly Ser Val Leu Thr Asp Cys Arg Gln Leu Pro Thr Arg
290 295 300
Asp Ser His Arg Asn Phe Ile Leu Arg Gly Leu Leu Asp Tyr Leu Thr
305 310 315 320
Glu Leu Val Cys Ala Asn Pro Lys Thr Arg Val Ala Asn Leu Ala Asp
325 330 335
Ile Gln Leu Ser Ala Ile Glu Ala Ala Ala Leu Leu Gly Thr Ser Val
340 345 350
Glu Gln Val Phe Arg Leu Leu Gln Asp Gly Tyr Leu Thr Pro Ala His
355 360 365
Arg Arg Ile His Gly Gly Leu Lys Pro His Glu Pro Leu Phe His Leu
370 375 380
Arg His Val Ile Glu Cys Arg Gln Ala His Arg Ser Thr Phe Asn Asp
385 390 395 400
Ala Tyr His Pro Tyr Leu Pro Ala Trp
405
<210> 52
<211> 335
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 transposition protein sequence
<220>
<223> MG110-2-C transposition protein
<400> 52
Met Glu Leu Ser Ser Thr Asp Ala Asp Lys Leu Lys Ser Phe Ile Asp
1 5 10 15
Cys Tyr Val Glu Thr Pro Leu Leu Arg Ile Ile Gln Asp Asp Phe Asp
20 25 30
Arg Leu Arg Tyr Asp Lys Gln Phe Ala Gly Glu Pro Ile Cys Met Leu
35 40 45
Leu Thr Gly Asp Ala Gly Thr Gly Lys Ser Ser Leu Leu Arg His Tyr
50 55 60
Met Ala Gln Ser Pro Glu Gln Ser Gly Gln Gly Phe Val Arg Lys Pro
65 70 75 80
Leu Leu Val Ser Arg Ile Pro Ser Lys Pro Thr Leu Glu Ser Thr Met
85 90 95
Val Glu Leu Leu Lys Asp Leu Gly Gln Trp Gly Ser Glu Tyr Arg Leu
100 105 110
His Arg Ser Ser Ala Glu Ser Leu Thr Glu Ala Leu Ile Lys Cys Leu
115 120 125
Lys Arg Cys Glu Thr Glu Leu Ile Ile Ile Asp Glu Phe Gln Glu Leu
130 135 140
Ile Glu Asn Lys Thr Arg Glu Lys Arg Asn Gln Ile Ala Asn Arg Leu
145 150 155 160
Lys Tyr Ile Ser Glu Thr Ala Lys Ile Pro Ile Val Leu Val Gly Met
165 170 175
Pro Trp Ala Ala Lys Ile Ala Glu Glu Pro Gln Trp Ala Ser Arg Leu
180 185 190
Met Val Arg Arg Thr Ile Pro Phe Phe Lys Leu Ser Glu Asp Ala Glu
195 200 205
Ser Phe Val Arg Phe Val Met Gly Leu Ala Arg Arg Met Pro Phe Ala
210 215 220
Thr Pro Pro Lys Leu Glu Ala Lys His Thr Ile Phe Ala Leu Phe Ala
225 230 235 240
Ser Cys His Gly Ser Ile Arg Arg Leu Lys His Leu Leu Asp Glu Ser
245 250 255
Val Lys Gln Ala Leu Ala Ala His Ser Glu Thr Leu Gln His Glu His
260 265 270
Ile Ala Val Ala Phe Ala Leu Phe Tyr Pro Asp Gln Ile Asn Pro Phe
275 280 285
Leu Gln Pro Ile Asp Glu Ile Gln Thr Cys Glu Val Lys Gln Tyr Ser
290 295 300
Arg Tyr Glu Ile Asp Ala Ala Gly Lys Asp Glu Val Leu Ile Pro Thr
305 310 315 320
Gln Phe Thr Asp Lys Ile Pro Ile Ser Gln Leu Leu Lys Lys Arg
325 330 335
<210> 53
<211> 630
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 transposition protein sequence
<220>
<223> MG110-2-B transposition protein
<400> 53
Met Met Cys Ala Gln Gln Ser Ser Glu His Pro Ser Gly Leu Phe Glu
1 5 10 15
Asp Glu Phe Ala Leu Pro Glu Pro Ala Ala Ser Ser Thr Pro Ser Glu
20 25 30
Ser Thr Val Thr Gly Ile Ser Ala Thr Phe Asp Ser Phe Pro Asp Glu
35 40 45
Leu Lys Asn Glu Ala Leu His Arg Leu Lys Tyr Leu Gln Trp Ile Glu
50 55 60
Ala Arg Leu Ile Gly Gly Trp Thr Glu Lys Asn Ile Ser Pro Leu Leu
65 70 75 80
Val Glu Ala Ala Ser Ile Leu Pro Pro Pro Val Pro Asn Trp Arg Thr
85 90 95
Leu Ala Arg Trp Arg Lys Asn Tyr Ile Gln Gln Gly Lys Lys Ile Ile
100 105 110
Ala Leu Ile Pro Arg His Gln Ala Lys Gly Asn Ser Gln Ser Arg Leu
115 120 125
Pro Leu Ser Asp Glu Ile Phe Phe Glu Glu Ala Val His Lys Tyr Leu
130 135 140
Val Asp Glu Glu Pro Ser Ile Ala Ser Ser Tyr Gln Leu Tyr Lys Ser
145 150 155 160
Lys Val Glu Leu Glu Asn Lys Thr Ile Val Gln Asn Pro Ile Lys Ile
165 170 175
Leu Ser Tyr Lys Ala Phe Tyr Asp Arg Ile Lys Met Leu Pro Ala Tyr
180 185 190
Gln Val Met Lys Cys Arg Lys Gly Leu His Leu Ala Asn Ala Gln Phe
195 200 205
Lys Ala Ile Gly Ser His Lys Arg Pro Thr Arg Ile Met Glu Arg Val
210 215 220
Glu Ile Asp His Thr Pro Leu Asp Leu Ile Leu Leu Asp Asp Glu Leu
225 230 235 240
Leu Val Pro Leu Gly Arg Pro Cys Leu Thr Leu Leu Ile Asp Cys Tyr
245 250 255
Ser His Cys Val Val Gly Phe Asn Leu Asn Phe Asn Gln Pro Gly Tyr
260 265 270
Glu Ser Val Arg Asn Ala Leu Leu Asn Ser Ile Pro Gln Lys Asn Tyr
275 280 285
Ile Lys Asp Lys Tyr Pro Val Ile Glu His Glu Trp Pro Cys Tyr Gly
290 295 300
Lys Pro Glu Thr Leu Val Val Asp Asn Gly Val Glu Phe Trp Ser Asn
305 310 315 320
Ser Leu Glu Gln Ala Cys Leu Glu Leu Gly Ile Asn Ile Gln Tyr Asn
325 330 335
Pro Val Arg Lys Pro Trp Leu Lys Pro Met Ile Glu Arg Met Phe Arg
340 345 350
Thr Ile Asn Cys Lys Leu Ile Asp Pro Ile Pro Gly Lys Thr Phe Ser
355 360 365
Asn Tyr Leu Glu Lys Gly Glu Tyr Asn Pro Glu Lys Asp Ala Val Met
370 375 380
Arg Phe Ser Val Phe Leu Glu Ile Phe His Gln Trp Ile Ile Asp Ile
385 390 395 400
Tyr His Tyr Glu Pro Asp Ser Arg His Arg Tyr Ile Pro Ile Leu Ser
405 410 415
Trp Gln Tyr Gly Phe Asp Arg Leu Pro Pro Ala Lys Val Thr Gly Glu
420 425 430
Asp Met Ala Lys Leu Glu Val Ile Leu Ser Leu Cys Ile Arg Cys Lys
435 440 445
His Thr Arg Gly Gly Val Glu His Leu Tyr Leu Arg Tyr Asp Ser Glu
450 455 460
Glu Phe Ala Ser Tyr Arg Met Lys Tyr Pro Ser Lys Thr Asp Gly Lys
465 470 475 480
Gln Tyr Val Leu Val Lys Leu Asn Pro Arg Asp Ile Ser Tyr Val Tyr
485 490 495
Val Phe Ile Asp Lys Ile Gly Glu Tyr Ile Arg Val Pro Cys Val Asp
500 505 510
Ser Glu Gly Tyr Thr Arg Gly Leu Ser Leu Gln Ala His Lys Ile Asn
515 520 525
Val Lys Leu His Arg Asp Phe Ile Gly Lys Lys Ile Asp Val Val Ser
530 535 540
Leu Ala Ile Ser Arg Ala Lys Ile Glu Ser Arg Ile Ile Lys Glu Leu
545 550 555 560
Thr Glu Val Arg Gln Thr Leu Lys Lys His Asn Ile Lys Gly Ile Asn
565 570 575
Lys Ile Ala Lys Tyr Arg Asp Ile Gly Ser Gln Thr Ala Ala Asn Leu
580 585 590
Leu Ser Ser Thr Gln Thr Pro Glu Asn Thr Asn Asp Asn Pro Val Gln
595 600 605
Pro Lys Thr Asp Gln Leu Pro Leu Glu Asp Asp Trp Asp Ser Phe Thr
610 615 620
Ser Glu Leu Glu Pro Tyr
625 630
<210> 54
<211> 207
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG110 transposition protein sequence
<220>
<223> MG110-2-A transposition protein
<400> 54
Met Tyr Arg Arg His Leu Lys His Ser Arg Val Lys Asn Leu Phe Lys
1 5 10 15
Phe Val Ser Ala Lys Met Asn Thr Val Phe Thr Val Glu Ser Ser Leu
20 25 30
Glu Phe Asp Thr Cys Phe His Leu Glu Tyr Ser Pro Ala Val Lys Thr
35 40 45
Phe Glu Ala Gln Pro Glu Gly Tyr Tyr Tyr Ile Phe Glu Asp Arg Glu
50 55 60
Cys Pro Tyr Thr Pro Asp Phe Arg Val Val Asp Glu Arg Gly Asn Pro
65 70 75 80
Tyr Phe Ile Glu Val Lys Pro Ser Ala Lys Val Ala Thr Pro Asp Phe
85 90 95
Leu Gln Arg Phe Pro Ile Lys Gln Gln Lys Ala Ile Glu Leu Arg Ser
100 105 110
Pro Leu Lys Leu Val Thr Glu Arg Gln Ile Arg Val Asp Pro Ile Leu
115 120 125
Gly Asn Leu Lys Leu Leu His Arg Tyr Ser Gly Phe Gln Ser Phe Thr
130 135 140
Pro Leu His Ile Gln Leu Leu Gly Leu Val Arg Gln Leu Gly Arg Val
145 150 155 160
Ser Leu Ala Lys Leu Ser Gly Ser Thr Gly Ala Pro Pro Glu Glu Ile
165 170 175
Leu Ala Thr Thr Leu Ser Leu Met Ala Arg Gly Leu Ile His Ser Asp
180 185 190
Leu Thr Glu Arg Glu Met Gly Leu Ser Ser Val Val Trp Ala Ile
195 200 205
<210> 55
<211> 400
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-8 effector
<400> 55
Gln Phe Asn Ile Glu Asn Glu Thr Gly Ser Ala Pro Asn Ala Lys Lys
1 5 10 15
Arg Lys Lys Ser Lys Ser Ala Asn Asp Pro Asn Leu Met Ser Tyr Leu
20 25 30
Phe Lys Ala His Lys Ala Thr Glu Asp Ile Leu Ser His Cys Ser Ile
35 40 45
Ser His Leu Leu Lys Asn Asp Cys Lys Val Ser Glu Thr Glu Glu Asp
50 55 60
Pro Asp Lys Phe Ala His Arg Ile His Arg Lys Gln Lys Gln Ile Glu
65 70 75 80
Gln Leu Asp Ala Lys Leu Asn Ala Arg Leu Pro Lys Gly Arg Asp Leu
85 90 95
Thr Gly Glu Glu Phe Phe Arg Thr Leu Glu Thr Ala Thr His Gln Ile
100 105 110
Ser Asp Asn Val Ile Gln Ala Arg Glu Trp Asp Ala Lys Leu Leu Thr
115 120 125
Arg Pro Ala Thr Leu Pro Tyr Pro Ile Ile Tyr Gly Ser Ser Thr Asp
130 135 140
Leu Arg Trp Gly Lys Thr Lys Thr Gly Arg Ile Thr Val Asn Phe Asn
145 150 155 160
Gly Ile Asp Lys Tyr Leu Asn Ala Ala Asp Pro Asn Leu Lys Glu Trp
165 170 175
Phe Lys Thr His Glu Glu His Pro Phe Gln Leu Tyr Cys Asp Arg Arg
180 185 190
Gln Leu His Phe Phe Gln Arg Phe Leu Glu Asp Trp Gln Ala Tyr Gln
195 200 205
Ala Asn Lys Asp Thr Tyr Pro Ala Gly Leu Leu Thr Leu Ser Ser Ala
210 215 220
Ile Leu Ile Trp Thr Glu Cys Glu Gly Lys Gly Asp Pro Trp Asn Val
225 230 235 240
Asn His Leu Ser Leu His Cys Thr Tyr Asp Thr Arg Leu Met Thr Ala
245 250 255
Glu Gly Thr Leu Val Val Gln Gln Glu Lys Ser Ala Lys Ala Ala Lys
260 265 270
Asn Leu Glu Arg Glu Lys Ser Asp Pro Arg Asn Gln Ser Thr Leu Asn
275 280 285
Arg Leu Asn Asn Leu Pro Ala Arg Pro Ser Lys Gln Pro Tyr Gln Gly
290 295 300
Asn Pro Glu Ile Ser Val Gly Leu Ser Ile Gly Leu Thr Asn Pro Ile
305 310 315 320
Thr Ala Ala Val Val Asn Val Thr Thr Gly Glu Val Leu Thr Tyr Arg
325 330 335
Thr Pro Lys Thr Leu Leu Gly Glu Gln Tyr Arg Leu Leu Asn Arg His
340 345 350
Arg Asp Arg Gln Gln Gln Asn Thr Leu Gln Arg Gln Lys Asn Gln Lys
355 360 365
Arg Cys Val Arg Tyr Gln Pro Ser Glu Ser Glu Leu Gly Glu Tyr Val
370 375 380
Asp Arg Leu Leu Ala Asn Lys Ile Ile Gln Leu Ala Gln Gln Tyr Gln
385 390 395 400
<210> 56
<211> 748
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-9 effector
<400> 56
Met Gly Met Lys Thr Ile Gln Ser Asp Leu Ile Val Arg Leu Asp Pro
1 5 10 15
Asn Pro Arg Arg Gly Lys Lys Asn Leu Asp Asp Leu Ser Glu Phe Asp
20 25 30
Ala Val Ala Trp Cys Arg Leu Cys Glu Arg Ala Tyr Gln His Thr Leu
35 40 45
Leu Ile Asp Gln Ile Ser Glu Gln Ile Lys Leu Asn Pro Asp Val Ile
50 55 60
Ala Trp Ile Tyr Ala Val Gln Asn Ser Glu Asp Gln Asn Ser Ala Asp
65 70 75 80
Met Asp Thr Asp Thr Asp Ser Glu Gln Gly Tyr Ser Trp Leu Pro Asp
85 90 95
Gly Leu Ile Asn Gly Leu Cys Ala Leu Leu Lys Asn Thr Pro Gln Phe
100 105 110
Glu Gly Met Ser Gly Arg Ala Tyr Thr Ser Ala Thr Asp Arg Val Glu
115 120 125
Glu Asn Phe Lys Gly Trp Phe Ala Asn His Gln Lys Leu Ile Arg Gln
130 135 140
Ile Lys Gly Lys Gln His Trp Leu Thr Val Leu Glu Ser Asp Ala Glu
145 150 155 160
Leu Ala Glu Asn Ser Asn Phe Asn Gln Ser Glu Ile Glu Asn Gln Ala
165 170 175
Lys Gln Ile Leu Asn Glu Ile Glu Ala Asp Asn Glu Ser Lys Asp Glu
180 185 190
Ser Val Asn Asp Asn Arg Arg Val Phe Ser Ile Leu Phe Asp Arg Phe
195 200 205
Glu Ala Thr Glu Asp Val Leu Asn Arg Arg Ala Ile Ile His Leu Leu
210 215 220
Lys Asn Gly Gly Lys Val Arg Trp Glu Pro Lys Lys Ser Arg Asn Arg
225 230 235 240
Lys Ser Gln Lys His Pro Ser Lys Pro Met Thr Phe Glu Glu Arg Leu
245 250 255
Val Ala Lys Arg Ile Glu Ile Ala Arg Leu Glu Lys Gln Leu Leu Ser
260 265 270
Gln Leu Pro Arg Ala Arg Asn Leu Phe Pro Asp Ile Ala Phe Glu Glu
275 280 285
Ser Leu Ala Glu Val Val Ala Leu Pro Lys Leu Ser Asp Glu Glu Gln
290 295 300
Val Glu Ala Glu Gln Val Glu Ser Glu Phe Tyr Asn Trp His Glu Ser
305 310 315 320
Ile Thr Phe Lys Leu Leu Glu Phe Leu Arg Glu Pro Lys Ser Leu Pro
325 330 335
Tyr Pro Ile Ser Phe Gly Tyr Glu Asp Val Arg Ser Trp Gln Ile Asn
340 345 350
Gln Ala Gly Lys Ile Phe Phe Lys Leu Asn Gly Trp Gly Asp Leu Ile
355 360 365
Phe Glu Val Arg Cys His Arg Arg Gln Leu Pro Leu Ile Lys Ser Phe
370 375 380
Leu Lys Asp Trp Gln Thr Lys Glu Gln Cys Gln Glu Gly Asp Gln Tyr
385 390 395 400
Ser Gly Ser Leu Met Leu Leu Arg Ser Ile Glu Leu Val Trp Lys Pro
405 410 415
Lys Pro Val Asn Glu Gln Asn Asp Ile Gln Leu Cys Ser Gln Cys Glu
420 425 430
Val Phe Gln Gln Tyr Pro Ser Lys Gly Phe Trp Ser Glu Cys Lys Leu
435 440 445
Ser Ile His Trp Ser Tyr Asp Ser Asp Ala Leu Ser Lys Gln Gly Leu
450 455 460
Glu Lys Val Arg Gln Arg Lys Leu Glu Pro Gln Leu Glu Lys Leu Arg
465 470 475 480
Lys Lys Gln Glu Glu Leu Glu Glu Lys Gln Gln Leu Leu Gln Ser Ile
485 490 495
Glu Glu Val Pro Glu Ala Leu Arg Ser Lys Ala Gln Ser Lys Lys Met
500 505 510
Arg Ser Leu Thr Lys Ala Ile Gln Glu Leu Gln Asp Asp Leu Ala Lys
515 520 525
Pro Arg Pro Lys Leu Asp Cys Leu Gln Asn Ser Leu Leu Phe Asp Arg
530 535 540
Pro Asp Arg Pro Leu His Glu Gly Val Pro Asn Ile Phe Val Gly Val
545 550 555 560
Leu Leu Asp Leu Asp Lys His Leu Val Val Thr Val Val Asp Ala Met
565 570 575
Arg Arg Lys Ile Leu Ala Ile Arg Asn Ala Arg Ser Ile Ser Lys Glu
580 585 590
Gly Tyr Asp Leu Leu Gln Ser Tyr Phe Arg Gln Arg Arg Glu His Ser
595 600 605
Lys Glu Arg Gln Ile Asp Gln Lys Ala His Arg His Val His Gln Thr
610 615 620
Glu Ser Asn Leu Gly Gln His Val Ala Arg Leu Phe Ala Lys Gly Ile
625 630 635 640
Val Glu Leu Gly Gln Lys Tyr Lys Ala Ser Thr Ile Val Ile Pro Glu
645 650 655
Thr Asp Gly Trp Arg Asp Arg Leu Tyr Ser Gln Leu Val Ala Ser Ala
660 665 670
Ala Ile Lys Cys Lys Gly Val Lys Lys Ala Met Thr Leu Tyr Thr Lys
675 680 685
Gln His Gly Glu Lys Leu His Gln Trp Asp Tyr Asn Arg Leu Ser Gln
690 695 700
Ala Ile Ser Asp Arg Ala Ala Thr Asp Gly Leu Lys Val Met Arg Gln
705 710 715 720
Asn Thr Val Tyr Glu Glu Asp Ala Phe Gln Gln Ala Ala Asn Leu Ala
725 730 735
Ile Ala Ala Tyr Asp Ser Leu Asn Ser Val Glu Lys
740 745
<210> 57
<211> 422
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-10 effector
<400> 57
Ser Trp Gln Leu Asn Gln Glu Gly Lys Ile Cys Phe Lys Leu Asn Gly
1 5 10 15
Leu Gly Asp Tyr Leu Phe Glu Val Arg Cys Asp Arg Arg Gln Leu Gly
20 25 30
Ile Val Lys Tyr Phe Leu Gln Asp Trp Gln Thr Gln Asn Lys Asn Lys
35 40 45
Asn Glu Tyr Ser Gly Gly Leu Thr Leu Leu Arg Ser Ala Glu Leu Leu
50 55 60
Val Lys Pro Lys Leu Gly Lys Gln Asn Ala Lys Leu Pro Pro Ile His
65 70 75 80
Asp Arg Gln Ala Val Val Thr Ala Tyr Lys Leu Ser Leu His Cys Thr
85 90 95
Tyr Asp Thr Asp Tyr Leu Thr His Gln Gly Leu Glu Cys Val Arg Gln
100 105 110
Arg Lys Ile Ala Asn Gln Leu Lys Gly Leu Thr Asp Lys Lys Ala Lys
115 120 125
Leu Thr Lys Gln Gln Glu Gln Leu Gln Gln Leu Glu Gln Glu Met Gln
130 135 140
Gln Glu Gln Ile Gly Thr Ser Ala Lys Arg Ser Lys Arg His Ala Gln
145 150 155 160
Arg Leu Lys Gln Ile Glu Gln Leu Lys Gln Ser Ile Ser Lys Leu Gln
165 170 175
Ala Ala Ile Gln Ala Glu Leu Glu Arg Pro Arg Pro Lys Leu Glu Arg
180 185 190
Leu Gln Gln Ser Gln Leu Phe Gln Arg Ala Asp Arg Pro Leu Tyr Ala
195 200 205
Gly Val Ala His Leu Phe Val Gly Val Cys Leu Asp Leu Asp Gln His
210 215 220
Leu Val Val Thr Ile Val Asp Ala Met Arg His Lys Val Leu Thr Lys
225 230 235 240
Arg Thr Val Lys Gln Ile Met Gly Glu His Tyr Pro Leu Leu Gln Arg
245 250 255
Tyr Arg Arg Leu Lys Gln Gln His Pro Lys Gln Arg Arg Gln Asp Gln
260 265 270
Lys Val Gly Arg His Asn His Leu Ser Glu Thr Gly Leu Gly Glu Gln
275 280 285
Val Ala Cys Ala Ile Ala Asn Gly Leu Leu Ser Leu Ala Gln Gln Tyr
290 295 300
Lys Val Ser Thr Ile Val Leu Pro Glu Thr Lys Gly Trp Arg Glu Arg
305 310 315 320
Leu Tyr Ser Gln Leu Val Ala Arg Ala Lys Ile Lys Cys Asn Gly Ser
325 330 335
Lys Lys Ala Met Ala Arg Tyr Thr Lys Ala Tyr Gly Lys Arg Leu His
340 345 350
Gln Trp Asp Tyr Asn Arg Leu Ser Arg Ala Ile Glu Thr Glu Ala Gln
355 360 365
Thr Val Gly Val Thr Val Ile Phe Gln Arg Leu Glu Phe Gln Ala Asn
370 375 380
Ala Glu Gln Asp Asn Gln Pro Ala Asp Glu Ala Asp Glu Gln Asp Asn
385 390 395 400
Gln Arg Val Asn Pro Phe Glu Leu Ala Leu Gln Ile Ala Ile Ala Ala
405 410 415
Tyr Asp Ser Leu Gln Ala
420
<210> 58
<211> 404
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-11 effector
<400> 58
Met Ala Glu Ser Thr Leu Trp Glu Lys Ser Glu Pro Glu Pro Leu Ala
1 5 10 15
Gln Leu Pro Thr Leu Pro His Thr Leu Pro Tyr Gln Ile Arg Phe Glu
20 25 30
Ser Ser Asp Asp Leu Tyr Trp Ser Leu Leu Pro Lys Gly Lys Gln Glu
35 40 45
Asp Ala Glu Lys Asn Glu Gly Lys Phe Glu Gln Ala Glu Pro Leu Pro
50 55 60
Arg Pro Ala Pro Lys Arg Lys Arg Arg Lys Arg Arg Lys Ile His Tyr
65 70 75 80
Gln Ala Ser Ile Cys Val Arg Phe Lys Gly Leu Ala Glu His Ser Phe
85 90 95
Arg Val Gln Cys Ser His Arg Gln Leu Pro Ile Phe Gln Gln Cys Leu
100 105 110
Asp Glu Trp Gln Leu Leu Asn Ala Leu Ser Asp Asp Val Lys Phe Ser
115 120 125
Leu Ala Val Phe Pro Leu Arg Ser Ala Arg Leu Val Trp Cys Lys Asp
130 135 140
Lys Gln Ala Ser Lys His Ser Lys Asn Pro Lys Ala Glu Trp Asn Gln
145 150 155 160
Tyr Arg Leu Tyr Leu His Cys Thr Ile Asp Arg Arg Thr Leu Thr Ala
165 170 175
Glu Gly Thr Glu Glu Leu Arg Gln Gln Lys Leu Val Glu Ala Gln Lys
180 185 190
Gln Lys Glu Ala Ser Val Lys Lys Gln Lys Pro Pro Lys Ile Pro Ala
195 200 205
Pro Leu Thr Glu Glu Gln Arg Gln Ala Lys Asn Gln Ala Glu Ala Leu
210 215 220
Lys Arg Asn His Ser Thr Leu Leu Arg Leu Gln Asn Pro Ser Pro Pro
225 230 235 240
Arg Leu Ser Lys Pro Cys Tyr Val Gly Gln Pro His Leu Val Val Gly
245 250 255
Val Cys Phe Ser Arg Arg Asp Arg Ala Ser Ala Ile Val Tyr Asp Ile
260 265 270
Gln Gln His Gln Glu Ile Glu Tyr Val Gly Val Arg Glu Leu Leu Thr
275 280 285
Asp Glu Ser Ala Glu Glu His Tyr Arg His Phe Ser Ser Asn Pro Gln
290 295 300
Arg Lys Gly Lys Arg Ser Leu Glu Gln Met Arg Leu Glu Gln Tyr Arg
305 310 315 320
Leu Val Glu Arg Phe Tyr Arg Glu Gln Glu Lys Tyr Gln Gln Arg Arg
325 330 335
Ala Glu Ala Gln Glu Cys Gly Leu Glu Leu Glu Asp Glu Ser Val Ser
340 345 350
Asn Leu Gly Glu Tyr Leu Asp Arg Leu Leu Ala Ala Arg Ile Val Glu
355 360 365
Phe Ala Val Lys Gln Gln Ala Ser Ser Ile Val Ile Pro Glu Leu Gly
370 375 380
Asn Ile Arg Glu Ser Ile Glu Cys Glu Val Gln Met Gln Met Glu Asn
385 390 395 400
Arg Gly Phe Glu
<210> 59
<211> 731
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-12 effector
<400> 59
Met Ala Ser Gly Ile Leu Arg Thr Ile Gln Ala Arg Leu Val Pro Ser
1 5 10 15
Glu Trp Met Pro Leu Asp Gln Lys Ala Ser Glu Asp Ser Gly Glu Ser
20 25 30
Gln Pro Val Pro Ile Ala Val Val Ser Ser Phe Val Glu Asp Cys Thr
35 40 45
Leu Gln Leu Gly Leu Thr Ser Thr Arg Leu Cys Arg Ala Leu Asn Glu
50 55 60
Cys Ile Asn Gln His Ser Asp Phe Glu Val Trp Lys Glu Gly Gly Ser
65 70 75 80
Ile Pro Pro Lys Ala Leu Lys Glu Ile Trp Asn Ser Ile Arg Thr Met
85 90 95
Pro Pro Tyr Gln Asp Leu Pro Glu Arg Phe Leu Arg Ser Ala Trp Leu
100 105 110
Arg Val Glu Gly Ile Tyr Ala Ser Trp Phe Ala Ile Arg Thr Arg Leu
115 120 125
Ala Ala Lys Gln Asp Gly Leu Asn Arg Trp Leu Ser Ile Val Arg Ser
130 135 140
Asp Glu Tyr Leu Thr Lys Thr Cys Asp Cys Ser Leu Glu Glu Met Gln
145 150 155 160
Ala Arg Ala Thr Gln Leu Leu Thr Glu Pro Ser Gly Ser Ser Leu Ser
165 170 175
Ala Leu Phe Asp Ala Tyr Phe Ala Leu Val Lys Ala Asp Gly Ser Leu
180 185 190
Leu Asp Arg Cys Ala Ile Val His Leu Ile Lys Asn Gly Cys Ala Val
195 200 205
Ala Ser Lys Pro Glu Asp Leu Lys Lys Phe Ala Ala Thr Cys Gln Lys
210 215 220
Lys Arg Gln Gln Val Glu Arg Ile Thr Lys Gln Leu Ala Ala Pro Ala
225 230 235 240
Pro Gln Val Arg Asp Leu Gly Glu Ala Ala Glu Ala Ala Leu Thr Asp
245 250 255
Ser Val Glu Arg Ile Pro Ser Asn Asn Ala Asp Phe Val Ala Gln Leu
260 265 270
Ala Ala Leu Gln Arg Lys Pro Ile Pro Leu Pro Tyr Ala Val Val Phe
275 280 285
Tyr Ser Asn Asp Asp Leu Glu Trp His Gln Ile Lys Arg Arg Asn Ser
290 295 300
Ala Thr Glu Lys Ile Glu Glu Arg Ile Phe Val Lys Phe Lys Gly Leu
305 310 315 320
Asn Lys Tyr Leu Arg Asn Arg Val Lys Tyr Asn Leu Glu Ala Gln Leu
325 330 335
Ala Gln Ile Leu Glu Ser Ser Gly Leu Lys Leu Asp Asp Ile Ser Trp
340 345 350
Lys Ile Ile Arg Arg Lys Thr Ala Gln Ser Thr Val Lys Tyr Ile Ser
355 360 365
Phe Lys Leu Lys Thr Pro Asp Pro Thr Leu Lys Gln His Leu Lys Glu
370 375 380
Gln Phe Glu Gln Ile Asp Leu Glu Asp Lys Tyr Asn Leu Gln Lys Glu
385 390 395 400
Tyr Gly Phe Glu Leu Cys Cys Gly Tyr Arg Gln Leu Ala Asp Phe Gln
405 410 415
Thr Phe Leu Ser Asp Trp Gln Leu Tyr Cys Thr Asn Arg Asp Arg Tyr
420 425 430
Ser Val Ser Pro Phe Ala Leu Arg Ser Ala Ala Leu Asp Trp Gln Lys
435 440 445
Glu Val Lys Gln Gly Lys Ser Lys Leu Gln Val Tyr Leu Arg Cys Thr
450 455 460
Leu Asp Gln Gln Glu Leu Thr Ala Glu Gly Ala Glu Arg Ala Arg Ala
465 470 475 480
Lys Ala Ala Thr Glu Leu Asn Lys Lys Ile Ala Lys Leu Glu Ala Ala
485 490 495
Gln Glu Gln Gly Glu Val Leu Ser Glu Glu Gln Gln Arg Asp Leu Glu
500 505 510
Arg Ala Arg Ser Gln Leu Arg Gly Ala Glu His Pro Tyr Pro Arg Pro
515 520 525
Ser Gln Pro Leu Tyr Glu Gly Asn Pro Asp Ile Leu Val Gly Val Cys
530 535 540
Leu Ser Trp Glu Gln Val Ala Thr Val Ala Val Val Asn Trp Ser Thr
545 550 555 560
Arg Gln Val Leu Val Tyr Arg Thr Ile His Gln Leu Met Gly Glu Asp
565 570 575
Tyr Pro Leu Leu Ser Ser Tyr Arg His Glu Gln Pro Arg Asn Ala Asn
580 585 590
Lys Arg His Lys Arg Gln Lys Arg Gly Gln Ser Ser Asn Ile Ser Glu
595 600 605
Ala Ser Lys Gly Lys His Ile Asp Arg Val Ile Ala Lys Arg Leu Val
610 615 620
Glu Val Val Val Glu Phe Asn Ala Gly Cys Leu Val Leu Pro Asn Leu
625 630 635 640
Asn Gly Leu Arg Glu Asn Leu Gln Ala Glu Leu Met Ala Lys Ala Ala
645 650 655
Trp Lys His Pro Gly Asp Val Ala Lys Gln Lys Ala Tyr Leu Lys Gln
660 665 670
Tyr Lys Lys Asn Leu His Cys Trp Pro Tyr Arg Arg Leu Ala Gln Phe
675 680 685
Val Lys Glu Arg Ala Asp Lys Ile Gly Val Pro Ile Glu Leu Gly Gln
690 695 700
Gln Pro Arg Glu Gly Asp Phe Lys Glu Gln Ala Val Gln Val Ala Trp
705 710 715 720
Ser Phe His Glu Ala Gln Gln Ala Asp Glu Gly
725 730
<210> 60
<211> 741
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-13 effector
<400> 60
Met Ala Ile Lys Thr Leu Arg Ser Gln Leu Cys Ala Thr Glu Glu Thr
1 5 10 15
Arg Glu Tyr Leu Trp His Leu Phe Ile Thr Tyr Thr Leu Leu Ile Asn
20 25 30
Gln Leu Leu Glu Arg Leu Pro Lys Asp Ala Lys Phe Ser Asp Trp Arg
35 40 45
Lys Glu Gly Arg Val Pro Arg Lys Ala Val Ala Ala Leu Cys Asn Lys
50 55 60
Val Leu Glu Glu Asp Gly Ser Leu Lys Gly Leu Pro Ala Arg Phe Tyr
65 70 75 80
Thr Ser Ala Val Leu Cys Thr Ser Tyr Thr Phe Ala Ser Ile Phe Ala
85 90 95
Ile Gln Asn Lys Leu Arg Ala Arg Cys Glu Gly Lys Gln Arg Trp Leu
100 105 110
Asn Val Ala Glu His Asp Leu Glu Leu Ala Glu Thr Thr Ala Phe Ser
115 120 125
Leu Glu Glu Ile Arg Glu Arg Ala Ala Gln Val Leu Gly Gln Ala Glu
130 135 140
Ser Glu Arg Gln Glu Cys Leu Asp Glu Glu Glu Glu Pro Ser Asn Ile
145 150 155 160
Pro Ser Ile Met Ser Leu Leu Phe Lys Leu Leu Asp Lys Ser Asn Asp
165 170 175
Leu Leu Ser Tyr Arg Ala Ile Ala His Leu Leu Arg Asn Asp Cys Lys
180 185 190
Val Ser Tyr Glu Glu Glu Asp Pro Glu Lys Leu Ala Leu Arg Leu Ser
195 200 205
Lys Lys Arg Ile Gln Ile Glu Arg Leu Gln Glu Gln Leu Asn Ser Gln
210 215 220
Leu Pro Ile Gly Pro Asp Pro Thr Gly Glu Arg Thr Asn Gln Phe Ile
225 230 235 240
Glu Glu Ala Ile Phe Leu Pro Arg Asp Ser Asp Ser Ser Glu Asn Arg
245 250 255
Ile Lys Glu Phe Glu Thr Trp Glu Asp Leu Leu Pro Glu Arg Ile Ala
260 265 270
Asn Leu Ser Thr Gln Leu Glu Thr Leu Pro Tyr Pro Leu Leu Leu Gly
275 280 285
Ser Asn Asp Asp Val Ser Trp Ser Trp Glu Thr Ile Ser Thr Ala Ala
290 295 300
Ser Ser Ser Ser Thr Ser Pro Asn Pro Ser Pro Lys Arg Thr Arg Thr
305 310 315 320
Arg Arg Arg Arg Arg Lys Ala Lys Lys Arg Ile Cys Val Ser Phe Lys
325 330 335
Gly Lys Gly Leu Ser Gln Ile Arg Leu Arg Leu Tyr Cys Asp Arg Arg
340 345 350
Gln Leu Pro Ile Phe Arg Gln Phe Val Glu Asp Ser Lys Ala Asn Lys
355 360 365
Ala Arg Asn Lys Lys Glu Lys Phe Ser Leu Ala Leu Tyr Pro Leu Arg
370 375 380
Ser Ala Thr Leu Leu Trp Ala Glu Asp Pro Lys Leu Ser Thr Glu Lys
385 390 395 400
Asn Arg Asp Lys Pro Trp Asn Ser His Arg Leu Tyr Leu His Val Thr
405 410 415
Val Asp Thr Arg Leu Leu Thr Ala Glu Gly Thr Glu Gln Val Arg Gln
420 425 430
Glu Lys Ile Glu Leu Met His Lys Phe Leu Lys Gly Leu Val Glu Ala
435 440 445
Glu Glu Thr Gln Glu Ala Asn Glu Asp Glu Glu Ala Phe Leu Val Ala
450 455 460
Gln Lys Asn Arg Ser Arg Ala Thr Lys Lys Asn Gln Thr Thr Leu Lys
465 470 475 480
Leu Leu Glu Ser Asn Pro Pro Pro Pro Arg Pro Arg Gln Ser Ala Tyr
485 490 495
Arg Gly Asn Ala Glu Ile Ala Val Lys Val Ala Phe Ser Arg Glu His
500 505 510
Val Val Gly Val Ala Val Ser Asp Gly Gln Gln Pro Ile Leu Asp Tyr
515 520 525
Arg Asp Val Glu Thr Leu Leu Ile Asp Ser His Leu Glu Leu Leu Glu
530 535 540
Gln Arg Ser His Lys Leu Arg Asn Gln Pro Glu Arg Leu Arg Lys Val
545 550 555 560
Lys Leu Gly Asp Ser Lys Lys Ala Lys Lys Ala Lys Arg Thr Arg Tyr
565 570 575
Lys Pro Lys Ile Ser Thr Arg Gln Leu Gln Leu Gln Pro Tyr Arg Leu
580 585 590
Leu Lys Arg Trp His Arg Leu Lys Arg Lys Asn Val Thr Glu Arg Arg
595 600 605
Ala Glu Gln Lys His Gly Leu Tyr Arg Gln Ser Gln Ala Glu Thr Asn
610 615 620
Leu Ala His Gln Ile Asn His Ile Leu Ala Arg Asn Ile Val Asp Leu
625 630 635 640
Cys Gln Lys Trp Ser Ala Gly Thr Ile Ile Leu Pro Glu Phe Gly Asp
645 650 655
Leu Arg Glu Ser Ile Glu Ser Glu Ile Gln Ala Lys Ala Arg Arg Lys
660 665 670
Tyr Pro Asp Asp Asn Val Glu Arg Gln Lys Gln Tyr Ala Lys Glu Phe
675 680 685
Arg Met Gln Phe His Arg Trp Asn Tyr Lys His Leu Ser Glu Cys Ile
690 695 700
Arg Leu Arg Ala Ala Lys Val Gly Ile Ala Cys Ile Ala Gly Gln Gln
705 710 715 720
Pro Arg Leu Gly Thr Leu Arg Glu Lys Ala Ile Ala Val Thr Ala Ile
725 730 735
Pro Pro Lys Pro Lys
740
<210> 61
<211> 642
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-14 effector
<400> 61
Met Ser Ile Ile Thr Ile His Cys Arg Leu Ile Ala Ser Glu Pro Ile
1 5 10 15
Arg Arg His Leu Trp Gln Leu Met Ser Arg Ser Asn Thr Pro Leu Ile
20 25 30
Asn Asp Leu Leu Lys Gln Val Ser His His Ala Asp Phe Glu Thr Trp
35 40 45
Gln Thr Arg Gly Thr Val Pro Ser Asn Ala Ile Arg Asp Leu Cys Glu
50 55 60
Pro Leu Lys Glu Val Tyr Pro Gly Gln Pro Ala Arg Phe Tyr Ala Ser
65 70 75 80
Ala Ile Leu Met Val Thr Tyr Thr Tyr Glu Ser Trp Leu Ala Leu Gln
85 90 95
Gln Thr Arg Arg Arg Arg Leu His Gly Lys Gln Arg Trp Leu Asn Val
100 105 110
Val Lys Ser Asp Ala Glu Leu Leu Gly Leu Ser Gly Ser Thr Leu Glu
115 120 125
Ser Ile Arg Gln Arg Ala Gln Asp Ile Leu Ser Gln Leu Ser Thr Glu
130 135 140
Met Glu Thr Gln Ser Ala Pro Asn Pro Lys Lys Arg Ser Gln Arg Gln
145 150 155 160
Gly Gln Thr His Ser Ser Asn Asp Ala Ser Leu Met Pro Arg Leu Phe
165 170 175
Thr Ala Tyr Asp Thr Ala Asp Asp Ile Leu Ser Gln Cys Ala Ile Val
180 185 190
His Leu Ile Lys Asn Gly Cys Lys Ile Ser Glu Thr Glu Glu Asp Ser
195 200 205
Glu Lys Phe Ala His Arg Ile His Arg Lys Gln Lys Glu Ile Asp Gln
210 215 220
Ile Glu Ala Gln Leu Gln Ala Arg Leu Pro Lys Gly Arg Asp Leu Thr
225 230 235 240
Gly Asp Val Phe Leu Glu Thr Leu Ala Ile Ala Thr Gln Gln Ile Pro
245 250 255
Glu Thr Val Ile Gln Ala Arg Glu Trp Gln Ala Lys Leu Leu Ser Arg
260 265 270
Pro Ala Ser Leu Pro Tyr Pro Met Ile Tyr Gly Ser Ser Thr Asp Val
275 280 285
Arg Trp Gly Lys Thr Ala Asn Asp Arg Ile Ala Val Ser Phe Asn Gly
290 295 300
Ile Asp Lys Tyr Leu Lys Glu Ala Asp Pro Glu Ile Gln Glu Trp Phe
305 310 315 320
Lys Leu His Lys Glu Tyr Pro Phe Arg Val Tyr Cys Asp Gln Arg Gln
325 330 335
Leu Pro Phe Phe Gln Arg Phe Leu Glu Asp Trp Gln Ala Tyr Gln Ala
340 345 350
Asn Lys Asp Thr Tyr Pro Ala Gly Leu Leu Thr Leu Ser Ser Ala Thr
355 360 365
Leu Ala Trp Arg Glu Gly Glu Gly Lys Gly Glu Pro Trp Glu Ala Asn
370 375 380
His Leu Ala Leu Tyr Cys Ala Phe Asp Thr Arg Leu Met Ser Ala Glu
385 390 395 400
Gly Thr Leu Glu Ile Gln Gln Glu Lys Ser Thr Lys Ala Leu Lys Asn
405 410 415
Leu Thr His Asp Asn Pro Asp Pro Arg Asn Gln Ser Thr Leu Asn Arg
420 425 430
Leu Lys Asn Val Pro Asp Arg Pro Ser Arg Lys Pro Tyr Arg Gly Asn
435 440 445
Pro Glu Ile Leu Val Gly Leu Ser Ile Gly Leu Ala Asp Pro Val Thr
450 455 460
Ala Ala Val Val Asn Gly Arg Thr Gly Glu Val Leu Thr Tyr Arg Ser
465 470 475 480
Pro Arg Thr Leu Leu Ala Glu His Tyr His Leu Leu Asn Arg Tyr Arg
485 490 495
Gln Gln Gln Gln Gln Asn Ala Leu Gln Arg His Arg Asn Gln Lys Arg
500 505 510
Gly Val Thr Tyr Gln Pro Ser Glu Ser Glu Leu Gly Gln Tyr Val Asp
515 520 525
Arg Leu Leu Ala Asn Ser Ile Ile Gln Leu Ala Gln Thr His Gln Ala
530 535 540
Gly Ser Ile Val Ile Pro Ser Leu Thr His Val Arg Glu Leu Leu Ala
545 550 555 560
Ser Glu Ile Thr Ala Lys Ala Glu Arg Lys Ser Arg Ile Val Glu Val
565 570 575
Gln Asp Lys Tyr Ala Lys Glu Tyr Arg Ile Ala Ile His Arg Trp Ser
580 585 590
Tyr Asn Arg Leu Ile Asn Ala Val Cys Ser Lys Ala Gln Gln Phe Gly
595 600 605
Met Thr Val Glu Ser Gly Phe Gln Pro Leu Gln Gly Asn Pro Gln Glu
610 615 620
Gln Ala Lys Asp Ile Ala Ile Ala Ala Tyr Tyr Ala Arg Thr Ile Ala
625 630 635 640
Ile Lys
<210> 62
<211> 828
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-15 effector
<400> 62
Met Ser Phe Lys Thr Ile Arg Ser Leu Leu Cys Ala Thr Glu Glu Thr
1 5 10 15
Arg Glu Tyr Leu Trp His Leu Phe Leu Asn His Thr Leu Leu Ile Asn
20 25 30
Gln Leu Leu Glu Lys Leu Pro Gln Lys Thr Ala Phe Ala Lys Trp Arg
35 40 45
Lys Ser Gly Arg Ile Pro Arg Lys Ala Ile Val Ala Ala Cys Asn Thr
50 55 60
Ser Leu Gln Glu Asp Glu Ser Leu Glu Gly Leu Pro Ala Arg Phe Tyr
65 70 75 80
Thr Ser Ala Val Leu Ser Val Ser Tyr Thr Phe Ala Phe Ile Phe Ala
85 90 95
Ile Gln Asn Gly Leu Arg Ala Lys Val Glu Gly Lys Gln Arg Trp Leu
100 105 110
Asn Val Ala Glu Lys Asp Leu Glu Leu Ala Gln Thr Thr Ser Phe Ser
115 120 125
Pro Glu Ala Ile Arg Ala Val Ala Ala Gln Val Val Asp Gln Ala Glu
130 135 140
Ala Glu Arg Gln Arg Glu Phe Glu Ala Arg Glu Asn Arg Thr Gly Gln
145 150 155 160
Pro Leu Pro Leu Met Thr Val Leu Phe Lys Phe Trp Asn Lys Thr Lys
165 170 175
Lys Pro Leu Arg Arg Arg Ala Ile Ala His Leu Leu Arg Asn Asp Cys
180 185 190
Gln Val Asn Ser Glu Ala Glu Asp Pro Asp Lys Leu Thr Leu Arg Leu
195 200 205
Ser Lys Lys Arg Ile Gln Ile Glu Arg Leu Gln Lys Gln Leu Asp Ser
210 215 220
Gln Leu Pro Thr Gly Arg Asp Pro Leu Gly Asp Arg Ile Glu Lys Phe
225 230 235 240
Ile Glu Asp Ala Ile Ala Phe Ala Glu His Ser Thr Phe Val Pro Thr
245 250 255
Gln Phe Trp Leu Lys Trp His Arg Leu Leu Leu Asp Val Gln Ser Ser
260 265 270
Glu Pro Met Leu Asp Leu Trp Phe Phe Gly Trp Thr Tyr Tyr Arg Leu
275 280 285
Asn Ala Ile Ala Glu Phe Glu Ala Trp Glu Gln Ser Leu Ser Glu Arg
290 295 300
Thr Ala Asn Leu Ser Thr Gln Leu Lys Ser Leu Pro Tyr Pro Leu Leu
305 310 315 320
Phe Gly Ser Thr Asp Asp Leu Tyr Trp Ser Trp Glu Lys Gln Val Gln
325 330 335
Pro Lys Thr Pro Gln Pro Ala Pro Ala His Pro Gln Ala Ser Ala Asp
340 345 350
Pro Thr Ile Lys Arg Lys Pro Lys Arg Cys Arg Thr Arg Lys Arg Lys
355 360 365
Lys Lys Ser Thr Pro Arg Ile Cys Val Ser Phe Lys Ser Arg Gly Leu
370 375 380
Ser His Leu Cys Leu Arg Leu Tyr Cys Asp Arg Arg Gln Leu Pro Val
385 390 395 400
Phe Arg Gln Leu Val Glu Glu Ser Glu Ala Asn Lys Ala Arg Lys Lys
405 410 415
Pro Asp Arg Phe Ser Leu Ala Leu Ser Pro Leu Arg Ser Ala Gly Leu
420 425 430
Met Trp Val Glu Asp Pro Gln Gln Leu His Lys Lys Lys His Trp Lys
435 440 445
Leu Lys Asn Leu Trp Leu Lys Trp Phe Cys Glu Met Ser Ser Gln Ala
450 455 460
Phe Pro Asp Glu Ile Arg Glu Gln Trp Phe Gln Ser Leu Val Tyr Leu
465 470 475 480
Cys Leu Ser Leu Pro Trp Gln Thr Ala Ala Ile Asp Pro Arg Leu Leu
485 490 495
Thr Ala Glu Gly Thr Glu Val Val Arg Gln Glu Lys Ile Thr Leu Met
500 505 510
Gly Lys Phe Leu Glu Gly Ser Lys Lys Ala Asp Glu Lys Gln Ala Ile
515 520 525
Glu Glu Leu Ser Lys Lys Lys Gln Ala Lys Leu Leu Thr Ala Glu Lys
530 535 540
Asn Arg Cys Lys Val Thr Lys Lys Asn Gln Thr Thr Leu Thr Leu Leu
545 550 555 560
Gln Ser Asn Ser Pro Leu Pro Arg Pro Ser Arg Val Ala Tyr Gln Gly
565 570 575
Asn Pro Asp Ile Ala Val Lys Val Ala Phe Ser Arg Glu His Ile Ala
580 585 590
Gly Val Ala Val Ser Asp Gly Cys Gln Pro Val Leu Asp Tyr His Asp
595 600 605
Ile Lys Ser Leu Leu Val Asp Pro Arg Val Asp Leu Leu Glu Glu Arg
610 615 620
Ser His Lys Leu Arg Asn Gln Pro Glu Arg Leu Trp Lys Ala Thr Leu
625 630 635 640
Ala Thr Gln Lys Ser Lys Pro Ser Lys Ser Lys Tyr Pro Arg Ser Lys
645 650 655
Pro Lys Ile Ser Thr Arg Gln Leu Gln Leu Gln Pro Tyr Arg Leu Leu
660 665 670
Lys Arg Trp Arg Arg Leu Lys Arg Glu Asn Gly Ala Lys Arg Gln Leu
675 680 685
Glu Gln Arg His Gly Leu Tyr Arg Pro Ser Gln Ala Glu Ser Asn Leu
690 695 700
Ala Gln Tyr Ile Asn His Leu Leu Ala Arg Asn Ile Val Asp Leu Cys
705 710 715 720
Gln Arg Trp Ser Ala Gly Ser Ile Ile Leu Pro Lys Phe Gly Asp Leu
725 730 735
Arg Glu Ser Ile Glu Ser Glu Ile Gln Ala Lys Ala Lys Arg Lys Tyr
740 745 750
Pro Asp Asp Asn Val Glu Arg Gln Lys Gln Tyr Ala Lys Glu Phe Arg
755 760 765
Met Glu Phe His Arg Trp Asn Tyr Gln His Leu Thr Gln Cys Ile Arg
770 775 780
Ser Arg Ala Ala Thr Val Gly Val Lys Cys Val Ala Gly Gln Gln Pro
785 790 795 800
Arg Leu Gly Thr Leu Arg Glu Lys Ala Thr Leu Ala Val Ser Ala Glu
805 810 815
Gln Arg Val Val Thr Ala Ile Pro Pro Lys Pro Lys
820 825
<210> 63
<211> 601
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-16 effector
<400> 63
Met Thr Lys Leu Thr Ile His Cys Arg Leu Val Ala Glu Glu Glu Thr
1 5 10 15
Arg Arg Gln Val Trp Glu Met Met Ala Gly Arg Tyr Ala Pro Leu Ile
20 25 30
Ala Thr Thr Leu Glu Gln Val Ser Gln His Lys Asp Phe Pro Gln Trp
35 40 45
Val Ala Thr Gly Glu Leu Pro Thr Gln Val Val Lys Asn Leu Val Asn
50 55 60
Gln Ala Gln Ser Gly Leu Pro Ala Arg Trp Cys Ala Ser Ala Gln Arg
65 70 75 80
Gln Val Gln Glu Thr Tyr Lys Ala Trp Leu Thr Lys Arg Arg Lys Leu
85 90 95
Gln Gln Lys Leu Gln Gly Gln Gln Thr Trp Leu Ser Val Leu Arg Pro
100 105 110
Asp Ala Glu Leu Ala Lys Asn Ala Gly Leu Ser Leu Glu Glu Met Lys
115 120 125
Ile Arg Ala Gln Ala Leu Leu His Arg Glu Ile Asn Asn Trp Phe Gln
130 135 140
Val Tyr Gln Gln Cys Gln Asp Val Val Glu Arg Ser Ile Phe Ala Tyr
145 150 155 160
Leu Leu Lys His Arg Leu Thr Val Pro Ala Glu Pro Glu Asn Thr Asp
165 170 175
Lys Leu Arg Gln Lys Arg Arg Gln Val Glu Ile Lys Ile Glu Arg Leu
180 185 190
Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln Gly Arg Asp Leu Thr Gly
195 200 205
Ser Arg Tyr Ala Thr Ala Leu Asn Asp Gly Glu Gln Cys Asp Trp Glu
210 215 220
Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala Glu Ile Leu Ser Arg Pro
225 230 235 240
Asp Ser Leu Pro Pro Pro Val Glu Tyr Ala Thr Asn Thr Asp Met Thr
245 250 255
Trp His Lys Asp Glu Gln Gly Arg Leu Ala Val Thr Phe Asn Gly Leu
260 265 270
Gly Lys Leu Lys Phe Lys Ile Ala Cys Asp Gln Arg Gln Leu His Trp
275 280 285
Phe Gln Arg Phe Tyr Gln Asp Gln Glu Gln Phe Lys Ala Gln Lys Gly
290 295 300
Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg Ser Ala Glu Leu Leu Trp
305 310 315 320
Lys Pro Gly Asn Arg Ser Gly Asp Pro Trp Gln Ala Asn Phe Leu Tyr
325 330 335
Leu His Cys Thr Val Asp Ser Arg Leu Trp Thr Gln Glu Gly Thr Ala
340 345 350
Met Val Gln Gln Glu Lys Ala Lys Lys Ser Gln Ala Ile Val Lys Lys
355 360 365
Leu Ser Glu Arg Ser Asp Leu Thr Ala Gln Gln Lys Asp Cys Leu Gln
370 375 380
Arg His Gln Ser Thr Leu Ala Arg Leu His Met Gly Tyr Asp Arg Pro
385 390 395 400
Gln Arg Arg Met Tyr Gln Gly Lys Ser His Leu Val Val Gly Ile Ser
405 410 415
Leu Asp Met Glu Asn Leu Val Thr Val Ala Leu Val Asp Val Val Lys
420 425 430
Gln Lys Val Ile Thr Gly Cys Thr Met Lys Ser Leu Leu Gly Gln Asp
435 440 445
Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu Lys Arg Gln Asn Ser His
450 455 460
Leu Arg Lys Val Ala Gln Glu Arg Gly Ser Lys Ile Val Asn Tyr Glu
465 470 475 480
Ala Asn Leu Ala Ile His Val Glu Arg Leu Leu Val Lys Ala Ile Ile
485 490 495
His Phe Ala Gln Gln His Leu Ala Gly Ser Leu Cys Val Pro Thr Leu
500 505 510
Lys Asp Ile Arg Glu Thr Ile Gln Ala His Leu Gln Cys Arg Ala Glu
515 520 525
Glu Arg Phe Pro Asp Ser Lys Glu Leu Gln Arg Arg Tyr Ala Lys Glu
530 535 540
Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr Asn Arg Leu Leu Lys Leu
545 550 555 560
Leu Asn Gln Gln Ala Lys Phe Ala Gly Leu Val Val Glu Gln Gly Val
565 570 575
Gln Ser Ala Gly Glu Thr Ala Leu Glu Arg Ala Leu Gly Val Ala Leu
580 585 590
Ser Ala Tyr Tyr Gln Arg Ser Ala Ala
595 600
<210> 64
<211> 605
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-17 effector
<400> 64
Met Thr Lys Leu Thr Ile Gln Cys Arg Leu Val Ala Glu Glu Glu Thr
1 5 10 15
Arg Arg Gln Val Trp Glu Met Met Ala Gly Arg Tyr Ala Pro Leu Ile
20 25 30
Ala Thr Thr Leu Glu Gln Val Ser Arg His Lys Asp Phe Pro Gln Trp
35 40 45
Val Ser Ala Gly Glu Ile Pro Ala Gln Val Val Lys Ser Leu Leu His
50 55 60
Ser Ala Lys Thr Ser Tyr Gly Gly Leu Pro Ala Arg Trp Tyr Ala Ser
65 70 75 80
Ala Gln Arg Gln Val Gln Glu Ile Tyr Lys Gly Trp Leu Lys Arg Arg
85 90 95
Arg Gln Leu Gln His Lys Leu Gln Gly Gln Gln Thr Trp Leu Ser Val
100 105 110
Leu Gln Pro Asp Ala Glu Leu Ala Gln Ser Ala Gly Leu Ser Leu Pro
115 120 125
Glu Leu Gln Gln Arg Ala Gln Ala Leu Leu Ala Gly Asp Thr Val Thr
130 135 140
Asn Trp Tyr His Ala Tyr Gln Gln Cys Gln Asp Ala Val Glu Arg Ser
145 150 155 160
Ile Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val Pro Thr Glu Pro
165 170 175
Glu Asp Thr Asp Lys Leu Lys Arg Lys Arg Arg Arg Val Glu Ile Arg
180 185 190
Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln Gly Arg
195 200 205
Asp Leu Thr Gly Ile Arg Tyr Ala Thr Ala Leu His Glu Gly Glu Gln
210 215 220
Cys Tyr Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala Glu Ile
225 230 235 240
Leu Ser Cys Pro Asp Ser Val Pro Pro Pro Val Glu Tyr Ala Thr Asn
245 250 255
Thr Asp Met Thr Trp His Lys Asp Glu Gln Ser Arg Leu Trp Val Thr
260 265 270
Phe Asn Gly Leu Gly Lys His Lys Phe Lys Ile Ala Cys Asp Gln Arg
275 280 285
Gln Leu His Trp Phe Glu Arg Phe Tyr Lys Asp Gln Glu Leu Phe Lys
290 295 300
Ala Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg Ser Cys
305 310 315 320
Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Glu Leu Trp Gln Val
325 330 335
Asn Cys Leu Tyr Leu His Cys Thr Val Asp Pro Arg Leu Trp Thr Gln
340 345 350
Glu Gly Thr Ala Ile Val Gln Gln Glu Lys Ala Gln Lys Ser Gln Ala
355 360 365
Ile Val Lys Glu Leu Ser Glu Arg Ser Asp Leu Thr Pro Gly Gln Glu
370 375 380
Asp Tyr Leu Arg Arg His Gln Ser Thr Leu Ala Arg Leu His Thr Gly
385 390 395 400
Tyr Ser Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys Ser His Leu Ser
405 410 415
Val Gly Ile Ser Leu Asp Met Asp Asn Leu Val Thr Val Ala Leu Val
420 425 430
Asp Val Val Glu Gln Arg Ile Ile Thr Gly Thr Thr Met Lys Asn Leu
435 440 445
Leu Gly Ser Gly Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu Lys Arg
450 455 460
Arg Asn Ala His Leu Arg Lys Val Ala Gln Gln Arg Gly Ser Lys Ile
465 470 475 480
Val Asn His Glu Ala Asn Leu Ala Thr His Ile Glu Arg Leu Leu Ala
485 490 495
Lys Ala Ile Ile Asn Phe Ala Gln Gln His Leu Ala Gly Ser Leu Cys
500 505 510
Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln Ala His Ile Gln
515 520 525
Ser Arg Ala Glu Glu Arg His Pro Asn Ser Lys Glu Leu Gln Arg Arg
530 535 540
Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr Asn Arg
545 550 555 560
Leu Leu Glu Leu Ile Ser Gln Gln Ala Ile Val Ala Gly Leu Leu Val
565 570 575
Glu Gln Gly Leu Gln Gly Ser Gly Gly Thr Ala Ile Lys Arg Ala Leu
580 585 590
Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala Ala
595 600 605
<210> 65
<211> 613
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-18 effector
<400> 65
Met Ser Ile Lys Thr Ile Arg Cys Arg Leu Val Ala Ser Glu Ser Thr
1 5 10 15
Arg Lys Ala Leu Trp Glu Leu Met Ala Gly Lys Asn Thr Pro Leu Met
20 25 30
Asn His Val Leu Ala Leu Val Ser Ser Asp Thr Asn Phe Asp Ser Trp
35 40 45
Arg Gln Lys Gly Glu Ile Pro Ala Ser Ile Ile Lys Asn Tyr Ile Asn
50 55 60
Thr Leu Lys His Glu Pro Gln Phe Ala Gly Gln Pro Trp Trp Cys Tyr
65 70 75 80
Ala Ser Ser Glu Lys Gln Ala Thr Arg Ile Phe Asp Asn Trp Leu Ala
85 90 95
Thr Gln Lys Gln Leu Gln Ser Lys Leu Asn Gly Lys Glu Gln Trp Leu
100 105 110
Ser Val Leu Gln Pro Asp Ser Glu Leu Ala Ser Gln Ala Ser Cys Thr
115 120 125
Leu Ala Ala Leu Arg Arg Leu Ala Ser Gln Ile Asn Lys Gln Gly Leu
130 135 140
Thr Phe Asn Gln Leu Phe Asn Leu Tyr Thr Thr Val Gln Val Leu Lys
145 150 155 160
Gln Arg Ala Ala Ile Ala Tyr Leu Leu Lys Arg Gln Gly Lys Leu Glu
165 170 175
Pro Asn Glu Glu Asp Pro Glu Gln Ile Ala Arg Lys Arg Arg Lys Thr
180 185 190
Glu Ile Ser Ile Gln Arg Leu Lys Lys Gln Ile Gln Ala Arg Val Pro
195 200 205
Lys Gly Arg Asp Leu Thr Gly Ser Glu Tyr Thr Ala Ala Leu Asp Glu
210 215 220
Cys Ile Gln Thr Ala Ile Thr Thr Asp Glu Glu Tyr Glu Ala Trp Gln
225 230 235 240
Gly Lys Leu Thr Ala Lys Thr Val Ser Val Pro Phe Pro Leu Ile Cys
245 250 255
Glu Ser Ser Glu Val Leu Lys Trp Ser Gln Thr Ser Ser Gly Arg Ile
260 265 270
Val Val Lys Phe Ser Gly Leu His Gly Leu Ser Phe Asp Ile Tyr Cys
275 280 285
Asp Lys Thr His Leu Arg Trp Phe Ser Arg Phe Leu Ala Asp Gln Glu
290 295 300
Val Lys Lys Ala Ser Gly Gly Lys His Ser Ala Ala Leu Phe Thr Leu
305 310 315 320
Arg Ser Ala Thr Leu Leu Trp Arg Pro Asn Lys His Pro Ser Lys Gly
325 330 335
Asp Pro Trp Ser Thr Asn Tyr Leu Glu Leu His Cys Thr Val Asp Thr
340 345 350
Arg Leu Trp Thr Ala Glu Gly Thr Glu Gln Val Arg Arg Glu Lys Ser
355 360 365
Thr Glu Val Glu Lys Ile Leu Thr Glu Ile Gly Ser Lys Asp Ser Leu
370 375 380
Ser Asn Asn Gln Leu Val Tyr Ile Lys Arg Lys Gln Ala Thr Leu Thr
385 390 395 400
Arg Leu Gln Gly Asn Phe Asp Arg Pro His Gln Ser Pro Tyr Cys Gly
405 410 415
Asp Pro Asp Ile Ser Val Gly Ile Ser Met Gly Leu Asp Lys Pro Val
420 425 430
Thr Leu Ala Ile Val Asn Leu Lys Thr Gly Gln Val Ser Ala Tyr Arg
435 440 445
Thr Thr Arg Gln Leu Leu Gly Ser Asn Tyr Cys Leu Leu Gly Arg Arg
450 455 460
Arg Lys Glu Gln Glu Arg Ala Ser His Arg Ala His Ile Asn Arg Ala
465 470 475 480
Arg His Arg Ser Asp Tyr His Thr Tyr Lys Glu Ser Gln Val Gly Thr
485 490 495
Gln Ile Asp His Leu Leu Ala Cys Ser Ile Ile Glu Val Ala Met Gln
500 505 510
Tyr Lys Ala Ser Ser Ile Val Leu Pro Asp Leu Glu Tyr Ile Arg Glu
515 520 525
Val Val Glu Ala Glu Ile Lys Glu Arg Ala Glu Arg Arg Ile Pro Asp
530 535 540
Tyr Ser Glu Gly Gln Lys Arg Tyr Ala Lys Glu Tyr Arg Lys Lys Val
545 550 555 560
His Ser Trp Ser Tyr Arg Arg Leu His Asn Phe Ile Lys Asn Lys Cys
565 570 575
Glu Ala Val Gly Ile Ala Ile Glu Val Gln Arg Gln Glu Thr Ile Gly
580 585 590
Thr Pro Gln Gln Lys Ala Arg Lys Leu Val Glu Lys Ala Tyr Ala Asn
595 600 605
Arg Cys Phe Val Ala
610
<210> 66
<211> 543
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-19 effector
<400> 66
Lys Asn Leu Val Asn Gln Ala Gln Ser Gly Leu Pro Ala Arg Trp Cys
1 5 10 15
Ala Ser Ala Gln Arg Gln Val Gln Glu Thr Tyr Lys Ala Trp Leu Thr
20 25 30
Lys Arg Arg Lys Leu Gln Gln Lys Leu Gln Ala Gln Gln Thr Trp Leu
35 40 45
Ser Val Leu Arg Pro Asp Ala Glu Leu Ala Gln Glu Ala Gly Leu Ser
50 55 60
Leu Pro Glu Leu Gln Gln Arg Ala Gln Ala Leu Leu Ala Gly Asp Thr
65 70 75 80
Ile Thr Asn Trp Tyr Gln Ala Tyr Gln Glu Cys Gln Asp Val Val Gln
85 90 95
Arg Ser Val Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val Pro Asn
100 105 110
Glu Pro Glu Asp Thr Asp Lys Leu Lys Arg Lys Arg Arg Gln Val Glu
115 120 125
Ile Lys Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln
130 135 140
Gly Arg Asp Leu Thr Gly Ser Arg Tyr Ala Thr Ala Leu Asn Asp Gly
145 150 155 160
Glu Gln Cys Asp Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala
165 170 175
Glu Ile Leu Ser Arg Pro Asp Ser Leu Pro Pro Pro Val Glu Tyr Ala
180 185 190
Thr Asn Thr Asp Met Thr Trp His Lys Asp Glu Gln Gly Arg Leu Ala
195 200 205
Val Thr Phe Asn Gly Leu Gly Lys Leu Lys Phe Lys Ile Ala Cys Asp
210 215 220
Gln Arg Gln Leu His Trp Phe Gln Arg Phe Tyr Gln Asp Gln Glu Gln
225 230 235 240
Phe Lys Ser Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg
245 250 255
Ser Ala Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Asp Pro Trp
260 265 270
Gln Ala Asn Phe Leu Tyr Leu His Cys Thr Val Asp Ser Arg Leu Trp
275 280 285
Thr Gln Glu Gly Thr Ala Met Val Gln Gln Glu Lys Ala Lys Lys Ser
290 295 300
Gln Ala Ile Val Lys Lys Leu Ser Glu Arg Ser Asp Leu Thr Ala Gln
305 310 315 320
Gln Lys Asp Cys Leu Gln Arg His Gln Ser Thr Leu Ala Arg Leu His
325 330 335
Met Gly Tyr Asp Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys Ser His
340 345 350
Leu Val Val Gly Ile Ser Leu Asp Met Glu Asn Leu Val Thr Val Ala
355 360 365
Leu Val Asp Val Val Lys Gln Lys Val Ile Thr Gly Cys Thr Met Lys
370 375 380
Ser Leu Leu Gly Gln Asp Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu
385 390 395 400
Lys Arg Gln Asn Ser His Leu Arg Lys Val Ala Gln Glu Arg Gly Ser
405 410 415
Lys Ile Val Asn Tyr Glu Ala Asn Leu Ala Ile His Val Glu Arg Leu
420 425 430
Leu Val Lys Ala Ile Ile His Phe Ala Gln Gln His Leu Ala Gly Ser
435 440 445
Leu Cys Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln Ala His
450 455 460
Leu Gln Cys Arg Ala Glu Glu Arg Phe Pro Asp Ser Lys Glu Leu Gln
465 470 475 480
Arg Arg Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr
485 490 495
Asn Arg Leu Leu Lys Leu Leu Asn Gln Gln Ala Lys Phe Ala Gly Leu
500 505 510
Val Val Glu Gln Gly Val Gln Ser Ala Gly Glu Thr Ala Leu Glu Arg
515 520 525
Ala Leu Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala Ala
530 535 540
<210> 67
<211> 605
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-20 effector
<400> 67
Met Ser Lys Leu Thr Ile Gln Cys Arg Leu Val Ala Cys Glu Asp Thr
1 5 10 15
Arg Arg Gln Val Trp Glu Met Met Ala Gly Arg Tyr Ala Pro Leu Ile
20 25 30
Ala Thr Thr Leu Glu Gln Val Ser Gln His Lys Asp Phe Pro Gln Trp
35 40 45
Val Ser Ala Gly Glu Ile Pro Ala Gln Val Val Lys Ser Leu Leu His
50 55 60
Ser Ala Lys Thr Ser Tyr Gly Gly Leu Pro Ala Arg Trp Tyr Ala Ser
65 70 75 80
Ala Gln Arg Gln Val Gln Glu Ile Tyr Lys Gly Trp Leu Lys Arg Arg
85 90 95
Arg Gln Leu Gln His Lys Leu Gln Gly Gln Gln Thr Trp Leu Ser Val
100 105 110
Leu Gln Pro Asp Ala Glu Leu Ala Gln Ser Ala Gly Leu Ser Leu Pro
115 120 125
Glu Leu Gln Gln Arg Ala Gln Ala Leu Leu Ala Gly Asp Thr Val Thr
130 135 140
Asn Trp Tyr His Ala Tyr Gln Gln Cys Gln Asp Ala Val Glu Arg Ser
145 150 155 160
Ile Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val Pro Thr Glu Pro
165 170 175
Glu Asp Thr Asp Lys Leu Lys Arg Lys Arg Arg Arg Val Glu Ile Arg
180 185 190
Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln Gly Arg
195 200 205
Asp Leu Thr Gly Ile Arg Tyr Ala Thr Ala Leu His Glu Gly Glu Gln
210 215 220
Cys Tyr Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala Glu Ile
225 230 235 240
Leu Ser Cys Pro Asp Ser Val Pro Pro Pro Val Glu Tyr Ala Thr Asn
245 250 255
Thr Asp Met Thr Trp His Lys Asp Glu Gln Ser Arg Leu Trp Val Thr
260 265 270
Phe Asn Gly Leu Gly Lys His Lys Phe Lys Ile Ala Cys Asp Gln Arg
275 280 285
Gln Leu His Trp Phe Glu Arg Phe Tyr Lys Asp Gln Glu Leu Phe Lys
290 295 300
Ala Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg Ser Gly
305 310 315 320
Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Glu Leu Trp Gln Val
325 330 335
Asn Cys Leu Tyr Leu His Cys Thr Val Asp Pro Arg Leu Trp Thr Gln
340 345 350
Glu Gly Thr Ala Ile Val Gln Gln Glu Lys Ala Gln Lys Ser Gln Ala
355 360 365
Ile Val Lys Glu Leu Ser Glu Arg Ser Asp Leu Thr Pro Gly Gln Glu
370 375 380
Asp Tyr Leu Arg Arg His Gln Ser Thr Leu Ala Arg Leu His Thr Gly
385 390 395 400
Tyr Ser Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys Ser His Leu Ser
405 410 415
Val Gly Ile Ser Leu Asp Met Asp Asn Leu Val Thr Val Ala Leu Val
420 425 430
Asp Val Val Glu Gln Arg Ile Ile Thr Gly Thr Thr Met Lys Asn Leu
435 440 445
Leu Gly Ser Gly Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu Lys Arg
450 455 460
Arg Asn Ala His Leu Arg Lys Val Ala Gln Gln Arg Gly Ser Lys Ile
465 470 475 480
Val Asn His Glu Ala Asn Leu Ala Thr His Ile Glu Arg Leu Leu Ala
485 490 495
Lys Ala Ile Ile Asn Phe Ala Gln Gln His Leu Ala Gly Ser Leu Cys
500 505 510
Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln Ala His Ile Gln
515 520 525
Ser Arg Ala Glu Glu Arg His Pro Asn Ser Lys Glu Leu Gln Arg Arg
530 535 540
Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr Asn Arg
545 550 555 560
Leu Leu Glu Leu Ile Ser Gln Gln Ala Ile Val Ala Gly Leu Leu Val
565 570 575
Glu Gln Gly Leu Gln Gly Ser Gly Gly Thr Ala Ile Lys Arg Ala Leu
580 585 590
Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala Ala
595 600 605
<210> 68
<211> 638
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-21 effector
<400> 68
Met Gly Gln Ile Thr Ile Gln Ser Arg Leu Val Ala Ser Glu Ala Thr
1 5 10 15
Arg Gln His Leu Trp Met Leu Met Ala Asp Arg Asn Thr Pro Leu Ile
20 25 30
Asn Gln Leu Leu Glu Gln Ile Asn Gln His Pro Asp Phe Leu Thr Trp
35 40 45
Arg Gln Lys Gly Lys Ile Pro Val Gly Thr Val Lys Gln Leu Cys Gln
50 55 60
Pro Leu Arg Ser Asp Pro Arg Phe Ser Gly Gln Pro Gly Arg Phe Tyr
65 70 75 80
Thr Ser Ala Ile Ala Leu Val Asp Tyr Ile Tyr Lys Ser Trp Leu Thr
85 90 95
Leu Gln Gln Arg Leu Gln His Lys Leu Asn Gly Gln Gln Arg Trp Leu
100 105 110
Glu Met Leu Lys Ser Asp Glu Glu Leu Ala Glu Ile Ser Gly Cys Ser
115 120 125
Leu Asp Thr Leu Arg Gln Arg Ala Ala Asn Leu Leu Gln Ala Asp Asn
130 135 140
Pro Ile His Pro Glu Pro Ser Thr Leu Pro Lys Ser Gly Lys Arg Arg
145 150 155 160
Lys Pro Lys Gln Thr Glu Thr Ser Ala Leu Ser Pro Asn Ile Ser Gln
165 170 175
Ala Leu Phe Phe Ala Tyr Arg Glu Thr Glu Asp Val Lys Ile Arg Ala
180 185 190
Ala Ile Ala Tyr Leu Leu Lys Asn Gly Cys Thr Leu Pro Glu Lys Pro
195 200 205
Glu Asp Pro Gln Lys Phe Ala Lys Arg Arg Arg Lys Val Glu Ile Gln
210 215 220
Ile Gln Arg Leu Thr Glu Gln Leu Glu Gly Arg Val Pro Lys Gly Arg
225 230 235 240
Asp Leu Thr Asn Thr Gln Trp Leu Ala Ala Leu Glu Thr Ala Thr Thr
245 250 255
Thr Ala Pro Gln Ser Glu Ala Glu Ala Lys Ser Trp Gln Asp Ser Leu
260 265 270
Leu Arg Glu Ser Ser Asn Leu Pro Phe Pro Val Ala Tyr Glu Thr Asn
275 280 285
Thr Asp Leu Thr Trp Phe Arg Asn Gln Gln Gly Arg Leu Cys Val Arg
290 295 300
Phe Asn Gly Leu Gly Asp His Ile Phe Gln Ile Tyr Cys Asp Arg Arg
305 310 315 320
Gln Leu His Trp Phe Glu Arg Phe Leu Asp Asp Gln Gln Val Gln Lys
325 330 335
Asp Ser Lys Asp Gln His Ser Ser Ala Leu Phe Thr Leu Arg Ser Val
340 345 350
Arg Ile Ser Trp Gln Glu Gly Lys Gly Lys Gly Thr Pro Trp Gln Ile
355 360 365
His Arg Leu Ala Leu Gln Cys Ser Leu Asp Thr Arg Leu Trp Thr Gln
370 375 380
Glu Gly Thr Glu Gln Val Arg Asn Glu Lys Ala Ala Asp Ile Ala Lys
385 390 395 400
Ile Leu Thr Lys Met Glu Asp Lys Gly Asn Leu Asn Asp Lys Gln Glu
405 410 415
Ala Phe Ile Lys Arg Lys Gln Ser Thr Leu Asp Arg Ile Asn His Thr
420 425 430
Phe Pro Arg Pro Ser Lys Pro Leu Tyr Gln Gly Gln Ser Gln Ile Ile
435 440 445
Val Gly Val Ser Ile Gly Leu Glu Lys Leu Ala Thr Ala Ala Val Val
450 455 460
Asp Ala Ser Thr Gly Lys Ile Leu Thr Tyr Arg Ser Ile Arg Gln Leu
465 470 475 480
Leu Gly Asn Asn Tyr Arg Leu Leu Asn Arg Gln Arg Gln Gln Gln His
485 490 495
His Asn Thr His Gln Arg Gln Ile Ala Gln Arg Gln Gly Lys Arg Gly
500 505 510
Leu Leu Ser Glu Ser Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu Ala
515 520 525
Asp Ala Ile Val Asp Leu Ala Lys Thr Tyr Tyr Ala Gly Ser Ile Val
530 535 540
Val Pro Lys Leu Gly Asp Val Arg Glu Arg Val Gln Ser Glu Ile Gln
545 550 555 560
Ala Arg Ala Glu Gln Val Cys Pro Asp Leu Leu Ser Gly Gln Gln Asn
565 570 575
Tyr Ala Lys Gln His Arg Ser Ala Ile His Arg Trp Ser Tyr Gly Arg
580 585 590
Leu Ile Asp Gln Ile Gln Ser Asn Ala Lys Arg Thr Gly Ile Val Val
595 600 605
Glu Asp Ala Gln Gln Pro Ile Gln Gly Thr Pro Gln Glu Ile Ala Arg
610 615 620
Ala Leu Ala Ile Thr Ala Tyr Gln Asp Arg Leu Lys Met Ile
625 630 635
<210> 69
<211> 502
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-22 effector
<400> 69
Ala Asn Leu Leu Gln Ala Asp Asn Pro Ile His Pro Glu Pro Ser Thr
1 5 10 15
Leu Pro Lys Ser Ser Lys Arg Arg Lys Pro Lys Gln Thr Glu Thr Ser
20 25 30
Val Leu Ser Pro Asn Ile Ser Gln Ser Leu Phe Val Ala Tyr Arg Glu
35 40 45
Thr Glu Asp Val Lys Thr Arg Ala Ala Ile Ala Tyr Leu Leu Lys Asn
50 55 60
Gly Cys Thr Leu Pro Glu Lys Pro Glu Asp Pro Gln Lys Phe Ala Lys
65 70 75 80
Arg Arg Arg Lys Val Glu Ile Gln Ile Gln Arg Leu Thr Glu Gln Leu
85 90 95
Glu Gly Arg Val Pro Lys Gly Arg Asp Leu Thr Asn Thr Gln Trp Leu
100 105 110
Ala Ala Leu Glu Thr Ala Thr Thr Thr Ala Pro Gln Ser Glu Ala Glu
115 120 125
Ala Lys Ser Trp Gln Asp Ser Leu Leu Arg Glu Ser Ser Asn Leu Pro
130 135 140
Phe Pro Val Ala Tyr Glu Thr Asn Thr Asp Leu Thr Trp Phe Arg Asn
145 150 155 160
Gln Gln Gly Arg Leu Cys Val Arg Phe Asn Gly Leu Gly Asp His Ile
165 170 175
Phe Gln Ile Tyr Cys Asp Arg Arg Gln Leu His Trp Phe Glu Arg Phe
180 185 190
Leu Asp Asp Gln Gln Val Gln Lys Asp Ser Lys Asp Gln His Ser Ser
195 200 205
Ala Leu Phe Thr Leu Arg Ser Val Arg Ile Ser Trp Gln Glu Gly Lys
210 215 220
Gly Lys Gly Thr Pro Trp Gln Ile His Arg Leu Ala Leu Gln Cys Ser
225 230 235 240
Leu Asp Thr Arg Leu Trp Thr Gln Glu Gly Thr Glu Gln Val Arg Asn
245 250 255
Glu Lys Ala Ala Asp Ile Ala Lys Ile Leu Thr Lys Met Glu Asp Lys
260 265 270
Gly Asn Leu Asn Asp Lys Gln Glu Ala Phe Ile Lys Arg Lys Gln Ser
275 280 285
Thr Leu Asp Arg Ile Asn His Thr Phe Pro Arg Pro Ser Lys Pro Leu
290 295 300
Tyr Gln Gly Gln Ser Gln Ile Ile Val Gly Val Ser Ile Gly Leu Glu
305 310 315 320
Lys Leu Ala Thr Ala Ala Val Val Asp Ala Ser Thr Gly Lys Ile Leu
325 330 335
Thr Tyr Arg Ser Ile Arg Gln Leu Leu Gly Asn Asn Tyr Arg Leu Leu
340 345 350
Asn Arg Gln Arg Gln Gln Gln His His Asn Thr His Gln Arg Gln Ile
355 360 365
Ala Gln Arg Gln Gly Lys Arg Gly Leu Leu Ser Glu Ser Glu Leu Gly
370 375 380
Gln Tyr Val Asp Arg Leu Leu Ala Asp Ala Ile Val Asp Leu Ala Lys
385 390 395 400
Thr Tyr Tyr Ala Gly Ser Ile Val Val Pro Lys Leu Gly Asp Val Arg
405 410 415
Glu Arg Val Gln Ser Glu Ile Gln Ala Arg Ala Glu Gln Val Cys Pro
420 425 430
Asp Leu Leu Ser Gly Gln Gln Asn Tyr Ala Lys Gln His Arg Ser Ala
435 440 445
Ile His Arg Trp Ser Tyr Gly Arg Leu Ile Asp Gln Thr Gln Ser Asn
450 455 460
Ala Lys Arg Thr Gly Ile Val Val Glu Asp Ala Gln Gln Pro Ile Gln
465 470 475 480
Gly Thr Pro Gln Glu Ile Ala Arg Ala Leu Ala Ile Thr Ala Tyr Gln
485 490 495
Asp Arg Leu Lys Met Ile
500
<210> 70
<211> 541
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-23 effector
<400> 70
Ala Asp Ser Leu Arg Ser Asp Pro Arg Phe Lys Ser His Pro Gln Arg
1 5 10 15
Leu Val Ala Ser Ala Gly Arg Val Val Asn Ser Met Phe Glu Ser Trp
20 25 30
Leu Ala Ile Gln Lys Gly Asn Phe Ala Arg Leu Lys Gly Lys Gln Arg
35 40 45
Trp Leu Ala Met Leu Lys Ser Asp Glu Glu Leu Val Glu Tyr Ser Asp
50 55 60
Cys Asp Leu Tyr Gln Ile Arg Asn His Ala Ala Gln Ile Leu Glu Ser
65 70 75 80
Val Ala Ala Ser Val Pro Ser Gln Thr Ser Asn Pro Ala Asn Lys Lys
85 90 95
Ser Lys Gln Gln Lys Ser Asp Arg Lys Lys Ser Lys Gln Lys Asp Asn
100 105 110
Asn Ile Pro Lys Ala Leu His Gly Leu Tyr Asp Ser Thr Asp Asn Val
115 120 125
Leu Thr Gln Ala Ala Ile Ile Tyr Leu Leu Lys Asn Gly Ser Lys Val
130 135 140
Ser Asp Cys Glu Glu Asp Pro Glu Lys Phe Thr Gln Lys Tyr Arg Lys
145 150 155 160
Thr Glu Leu Gln Val Glu Arg Leu Gln Lys Gln Ile Asp Ala Asn Met
165 170 175
Pro Lys Gly Arg Asp Leu Thr Gly Gln Val Trp Glu Glu Thr Leu Glu
180 185 190
Ile Ala Thr Leu Thr Ala Pro Arg Asn Gly Asp Glu Ala Lys Glu Trp
195 200 205
Gln Asn Thr Leu Leu Arg Lys Pro Lys Asn Thr Pro Tyr Pro Ile Phe
210 215 220
Tyr Arg Asn Lys Glu Asp Leu Arg Trp Tyr Glu Ile Glu Ile Asn Gly
225 230 235 240
Lys Ala Arg Arg Arg Gly Lys Asn His Asn Ser Pro Lys Lys Gln Leu
245 250 255
Cys Val Thr Leu Ser Gly Phe Gly Gly His Ala Leu Lys Val Ser Cys
260 265 270
Asp Arg Arg Gln Leu His Trp Phe Lys Arg Phe Leu Glu Asp Gln Gln
275 280 285
Thr Lys Lys Asn Ser Asp Gly Gln Cys Ser Ser Ser Leu Phe Thr Leu
290 295 300
Arg Ser Ala Gln Leu Leu Trp His Glu Gln Lys Gly Asn Gly Asn Ser
305 310 315 320
Trp Asp Val His His Leu His Leu His Cys Thr Val Glu Thr Pro Arg
325 330 335
Trp Thr Ala Glu Gly Thr Glu Lys Ile Arg Gln Ala Glu Arg Gln Glu
340 345 350
Val Ala Lys Arg Ile Glu Ser Leu Asn Gln Lys Glu Ala Leu Ser Pro
355 360 365
Ser Gln Gln Lys Tyr Leu Gln Arg Leu Asp Ser Gln Leu Lys Gly Leu
370 375 380
Asp Tyr Pro Phe Asp Arg Pro Ser Arg Pro Leu Tyr Thr Pro Gln Pro
385 390 395 400
Asp Ile Ile Ala Ala Val Ser Met Gly Leu Gln Tyr Pro Ala Thr Leu
405 410 415
Ile Ile Met Asn Ser Ser Thr Gln Glu Val Leu Ala Thr Arg Thr Ile
420 425 430
Arg Glu Leu Leu Gly Ser Asn Tyr Gly Leu Leu Leu Arg Arg Arg Arg
435 440 445
Gln Gln Gln Lys Asn Ala His Gln Arg His Lys Ala Gln Lys Arg Ser
450 455 460
Ala Ser Asp Gln Phe Gly Glu Ser Asn Leu Gly Glu Tyr Leu Asp Arg
465 470 475 480
Leu Ile Ala Lys Glu Ile Val Ala Ile Ala Lys Val His Lys Ala Gln
485 490 495
Ser Val Val Ile Pro Lys Leu Ala Arg Ile Arg Glu Ile Leu Asn Cys
500 505 510
Glu Val Met Ser Arg Ala Glu Gln Arg Cys Pro Gly Ser Val Glu Ile
515 520 525
Gln Lys Arg Tyr Ala Lys Glu Tyr Arg Thr Lys Ile His
530 535 540
<210> 71
<211> 614
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-24 effector
<400> 71
Met Ser Gln Lys Thr Val Arg Cys Arg Leu Ile Ser Thr Glu Glu Asn
1 5 10 15
Arg Lys Ala Leu Trp Leu Leu Met Ala Glu Arg Asn Thr Pro Leu Ile
20 25 30
Asn Glu Ala Leu Arg Gln Leu Pro Ser His Ser Asp Phe Pro Lys Trp
35 40 45
Arg Gln Lys Gly Lys Leu Pro Asp Ile Ala Ala Lys Cys Leu Ile Asp
50 55 60
Arg Leu Lys Thr Asp Ala Arg Phe Ala Asn Gln Pro Val Trp Tyr Cys
65 70 75 80
Ile Ser Ala Gln Lys His Val Thr Tyr Ile Phe Arg Ser Trp Leu Ala
85 90 95
Ile Gln Arg Arg Lys Gln Trp Lys Leu Glu Gly Lys Arg Arg Trp Leu
100 105 110
Glu Ile Leu Gln Pro Asp Thr Ala Leu Ala Glu Lys Ala Gly Cys Ser
115 120 125
Ile Glu Ala Leu Arg Glu Glu Ala Gly Glu Ile Ile Ala Glu Ala Glu
130 135 140
Ile Val Asp Pro Phe Arg His Leu Leu Ala Lys Tyr Arg Glu Thr Glu
145 150 155 160
Asp Val Arg Glu Gln Cys Ala Ile Ala Tyr Leu Leu Lys Arg Lys Ala
165 170 175
Glu Leu Glu Pro Glu Glu Glu Asn Leu Ala Lys Leu Val Glu Arg His
180 185 190
Arg Lys Thr Glu Ile Phe Ile Gln Arg Leu Glu Ala Gln Leu Asp Ala
195 200 205
Ser Leu Pro Lys Gly Arg Asp Leu Thr Gly His Leu Gln Ala Glu Ala
210 215 220
Leu Ile Gln Ser Ile His Ser Pro Leu Leu Asp Asp Ser Asn Tyr Asn
225 230 235 240
Thr Trp Lys Asp Ala Leu Thr Thr Glu Pro Ala Lys Phe Pro Phe Pro
245 250 255
Ile Met Tyr Glu Thr Thr Glu Ser Leu Val Leu Ser Arg Asp Asp Arg
260 265 270
Gly Arg Ile Leu Leu Arg Phe Ser Gly Leu Ser Gln Gln Thr Tyr Lys
275 280 285
Ile Tyr Cys Asp Lys Pro His Gln His Trp Phe Glu Arg Phe Phe Glu
290 295 300
Asp Gln Glu Thr Lys Arg Val Gly Gly Asp Gln His Ser Ala Ala Ala
305 310 315 320
Phe Thr Leu Arg Ser Ala Gln Leu Met Trp Val Pro Ser Glu Lys His
325 330 335
Arg Asp Glu Pro Asp Pro Trp Asn Arg Tyr Tyr Leu Asn Leu Ser Cys
340 345 350
Thr Val Asp Thr Arg Leu Trp Thr Gln Glu Gly Thr Lys Val Val Val
355 360 365
Gln Glu Lys Ala Val Lys Thr Ala Gln Lys Leu Thr Ser Met Gln Glu
370 375 380
Lys Lys Ser Leu Thr Gln Thr Gln Arg Gly Tyr Ile Arg Arg Leu Glu
385 390 395 400
Ser Thr Leu Gln Arg Leu Gln Asn Pro Tyr Pro Arg Pro Ser Arg Thr
405 410 415
Val Tyr Trp Gly Gln Pro Glu Ile Leu Val Gly Val Ser Met Ser Leu
420 425 430
Asp Lys Thr Val Thr Ile Ala Val Val Asn Ala Leu Thr Glu Gln Val
435 440 445
Leu Thr Tyr Arg Ser Ala Lys Gln Leu Leu Gly Glu Arg Tyr Arg Leu
450 455 460
Leu Gln Arg Ala Arg Lys Glu Ile Val Lys Ile Ser His Gln Gly His
465 470 475 480
Arg Gln Arg Arg Lys Gly Gly Arg Arg Ile Ser Gln Glu Ser Asp Val
485 490 495
Gly Lys Tyr Val Asp Arg Leu Ile Ala Lys Ala Ile Asp Thr Leu Ala
500 505 510
Leu Lys Tyr Arg Ala Gly Ser Ile Val Leu Pro Asn Leu Ala Tyr Ile
515 520 525
Arg Glu Ser Ile Glu Ala Glu Val Gln Gln Arg Ala Ile Glu Lys Val
530 535 540
Pro Asp Phe Lys Asp Gly Gln Lys Gln Tyr Ala Lys Ala Tyr Arg Thr
545 550 555 560
Gln Ile His Arg Trp Pro Phe Ser Arg Leu Gln Ser Ala Ile Ile Ser
565 570 575
Lys Ala Glu Gln Ser Gly Ile Thr Ile Glu Ile Ala Thr Gln Gln Ile
580 585 590
Ser Gly Ser Phe Gln Asp Lys Ala Arg Glu Leu Gly Leu Gln Ala Tyr
595 600 605
Ala His Arg Ser Ala Ser
610
<210> 72
<211> 440
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-25 effector
<400> 72
Leu Lys Asn Arg Gln Arg Leu Pro Lys Lys Ala Glu Asp Pro Glu Lys
1 5 10 15
Leu Ala Gln Arg Arg Arg Lys Val Glu Ile Lys Ile Glu Arg Leu Arg
20 25 30
Asp Gln Ile Glu Ser Cys Ile Pro Lys Gly Arg Asp Ile Thr Gly Glu
35 40 45
Ala Trp Leu Asn Thr Leu Leu Thr Ala Ala Asn Thr Val Pro Gln Ser
50 55 60
Ala Gln Glu Ala Lys Thr Trp Gln Asp Ile Leu Leu Thr Arg Ser Lys
65 70 75 80
Ser Val Pro Tyr Pro Val Ala Tyr Glu Thr Asn Glu Asp Leu Thr Trp
85 90 95
Ser Lys Asn Glu Lys Asn Arg Leu Cys Val Arg Phe Asn Gly Met Ser
100 105 110
Asp Tyr Ser Phe Gln Ile Tyr Cys Asp Gln Arg Gln Leu Lys Trp Phe
115 120 125
Glu Arg Phe Phe Gln Asp Gln Glu Thr Lys Lys Gln Ser Gln Asn Gln
130 135 140
His Pro Ser Ala Leu Phe Thr Leu Arg Ser Ala Arg Ile Phe Trp Gln
145 150 155 160
Glu His Gln Gly Lys Gly Gln Pro Trp Gln Lys His Arg Leu Ile Leu
165 170 175
Tyr Cys Ser Leu Asp Thr Arg Phe Trp Thr Ala Glu Gly Thr Glu Gln
180 185 190
Ile Arg Gln Glu Lys Ala Ala Lys Ile Thr Lys Thr Leu Ser Asn Leu
195 200 205
Gln Ala Lys Asp Glu Leu Thr Asp Ser Gln Gln Ala Phe Leu Arg Arg
210 215 220
Gln Thr Ser Thr Leu Glu Arg Ile Asn Thr Pro Phe Pro Arg Pro Asn
225 230 235 240
Gln Ala Ala Tyr Gln Gly Gln Pro His Ile Leu Val Gly Val Ala Leu
245 250 255
Gly Leu Glu Lys Pro Ala Thr Val Ala Val Val Asp Ile Asn Thr Gly
260 265 270
Arg Ala Ile Ala Tyr Arg Ser Ile Lys Gln Leu Leu Gly Ser Asn Tyr
275 280 285
Lys Leu Leu Asn Arg Gln Arg Arg Gln Lys Gln Arg Asn Ala His Gln
290 295 300
Arg His Lys Ala Gln Lys Gln Asn Lys Pro Asn Gln Phe Gly Asp Ser
305 310 315 320
Asn Leu Gly Glu Tyr Ile Asp Arg Leu Leu Ala Lys Ala Ile Leu Ser
325 330 335
Val Ala Gln Gln Tyr Gln Ala Ser Ser Ile Val Leu Pro Lys Leu Gly
340 345 350
Asp Leu Arg Glu Leu Val Gln Ser Glu Val Lys Val Lys Ala Glu Ala
355 360 365
Lys Ile Pro Gly Tyr Leu Glu Gly Gln Glu Gln Tyr Ala Lys Gln Tyr
370 375 380
Arg Val Ser Val His Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile
385 390 395 400
His Gln Gln Ala Ser Lys Ile Gly Ile Ala Ile Glu Gln Gly Gln Gln
405 410 415
Pro Thr Arg Ala Ser Pro Gln Asn Gln Ala Arg Glu Leu Ala Ile Thr
420 425 430
Ala Tyr Gln Ser Arg Thr Gln Lys
435 440
<210> 73
<211> 561
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-26 effector
<400> 73
Gln His Lys Asp Phe Pro Gln Trp Val Ser Ala Gly Glu Ile Pro Ala
1 5 10 15
Gln Val Val Lys Asn Leu Val Asn Gln Ala Gln Ser Gly Leu Pro Ala
20 25 30
Arg Trp Cys Ala Ser Ala Gln Arg Gln Val Gln Glu Thr Tyr Lys Ala
35 40 45
Trp Ile Thr Lys Arg Arg Lys Leu Gln Gln Lys Leu Gln Gly Gln Gln
50 55 60
Thr Trp Leu Ser Val Leu Arg Pro Asp Ala Glu Leu Ala Lys Asn Ala
65 70 75 80
Gly Leu Ser Leu Glu Glu Met Lys Ile Arg Ala Gln Ala Leu Leu His
85 90 95
Arg Glu Ile His Asn Trp Phe Gln Val Tyr Gln Gln Cys Gln Asp Val
100 105 110
Val Glu Arg Ser Ile Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val
115 120 125
Pro Ala Glu Pro Glu Asn Thr Asp Lys Leu Arg Gln Lys Arg Arg Gln
130 135 140
Val Glu Ile Lys Ile Glu Trp Leu Glu Thr Gln Leu Ala Gly Arg Ser
145 150 155 160
Pro Gln Gly Arg Asp Leu Thr Gly Ser Arg Tyr Val Ala Ala Leu Asn
165 170 175
Glu Gly Glu Gln Cys Tyr Trp Glu Asn Asp Ala Asp Phe Leu Ala Trp
180 185 190
Gln Ala Glu Ile Leu Ser Arg Pro Asp Ser Leu Pro Pro Pro Val Glu
195 200 205
Tyr Ala Thr Asn Thr Asp Met Thr Trp His Lys Asp Glu Gln Gly Arg
210 215 220
Leu Ala Val Thr Phe Asn Gly Leu Gly Lys Leu Lys Phe Lys Ile Ala
225 230 235 240
Cys Asp Gln Arg Gln Leu His Trp Phe Gln Arg Phe Tyr Gln Asp Gln
245 250 255
Glu Gln Phe Lys Ser Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr
260 265 270
Leu Arg Ser Ala Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Asp
275 280 285
Pro Trp Gln Ala Asn Phe Leu Tyr Leu His Cys Thr Val Asp Pro Arg
290 295 300
Leu Trp Thr Gln Glu Gly Thr Ala Met Val Gln Gln Glu Lys Ala Lys
305 310 315 320
Lys Ser Gln Ala Ile Val Lys Lys Leu Ser Glu Arg Ser Asp Leu Thr
325 330 335
Ala Gln Gln Lys Asp Cys Leu Gln Arg His Gln Ser Thr Leu Ala Arg
340 345 350
Leu His Met Gly Tyr Asp Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys
355 360 365
Ser His Leu Val Val Gly Ile Ser Leu Asp Met Glu Asn Leu Val Thr
370 375 380
Val Ala Leu Val Asp Val Val Lys Gln Glu Val Ile Thr Gly Cys Thr
385 390 395 400
Met Lys Ser Leu Leu Gly Gln Asp Tyr Ala Leu Val Arg Arg Leu Arg
405 410 415
Tyr Glu Lys Arg Gln Asn Ser His Leu Arg Lys Val Ala Gln Glu Arg
420 425 430
Gly Ser Lys Ile Val Asn His Glu Ala Asn Leu Ala Ile His Val Glu
435 440 445
Arg Leu Leu Val Lys Ala Ile Ile His Phe Ala Gln Gln His Leu Ala
450 455 460
Gly Ser Leu Cys Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln
465 470 475 480
Ala His Leu Gln Cys Arg Ala Glu Glu Arg Phe Pro Asp Ser Lys Glu
485 490 495
Leu Gln Arg Arg Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp
500 505 510
Ser Tyr Asn Arg Leu Leu Lys Leu Leu Asn Gln Gln Ala Lys Phe Ala
515 520 525
Gly Leu Val Val Glu Gln Gly Val Gln Ser Ala Gly Glu Thr Ala Leu
530 535 540
Glu Arg Ala Leu Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala
545 550 555 560
Ala
<210> 74
<211> 583
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-27 effector
<400> 74
Gln Val Trp Glu Met Met Ala Gly Arg Tyr Ala Ser Leu Ile Ala Thr
1 5 10 15
Thr Leu Glu Gln Val Ser Gln His Lys Asp Phe Pro Gln Trp Val Ser
20 25 30
Ala Gly Glu Ile Pro Ala Gln Val Val Lys Asn Leu Val Asn Gln Ala
35 40 45
Gln Ser Gly Leu Pro Ala Arg Trp Cys Ala Ser Ala Gln Arg Gln Val
50 55 60
Gln Glu Thr Tyr Lys Ala Trp Leu Thr Lys Arg Arg Lys Leu Gln Gln
65 70 75 80
Lys Leu Gln Gly Gln Gln Thr Trp Leu Ser Val Leu Arg Pro Asp Ala
85 90 95
Glu Leu Ala Lys Asn Ala Gly Leu Ser Leu Glu Glu Met Lys Ile Arg
100 105 110
Ala Gln Ala Leu Leu His Arg Glu Ile Asn Asn Trp Phe Gln Val Tyr
115 120 125
Gln Gln Cys Gln Asp Val Val Glu Arg Ser Ile Phe Ala Tyr Leu Leu
130 135 140
Lys His Arg Leu Thr Val Pro Thr Glu Pro Glu Asp Thr Asp Lys Leu
145 150 155 160
Arg Arg Lys Arg Arg Gln Val Glu Ile Lys Ile Glu Arg Leu Glu Thr
165 170 175
Gln Leu Ala Gly Arg Ser Pro Gln Gly Arg Asp Leu Thr Gly Ser Arg
180 185 190
Tyr Val Ala Ala Leu Asn Glu Gly Glu Gln Cys Tyr Trp Glu Asn Asp
195 200 205
Ala Asp Phe Leu Ala Trp Gln Ala Glu Ile Leu Ser Cys Pro Asp Ser
210 215 220
Leu Pro Pro Pro Val Glu Tyr Ala Thr Asn Thr Asp Met Thr Trp His
225 230 235 240
Lys Asp Glu Gln Gly Arg Leu Ala Val Thr Phe Asn Gly Leu Gly Lys
245 250 255
Leu Lys Phe Lys Ile Ala Cys Asp Gln Arg Gln Leu His Trp Phe Gln
260 265 270
Arg Phe Tyr Gln Asp Gln Glu Gln Phe Lys Ser Gln Lys Gly Gln Arg
275 280 285
Ser Gln Ala Leu Phe Thr Leu Arg Ser Ala Glu Leu Leu Trp Lys Pro
290 295 300
Gly Asn Arg Ser Gly Asp Pro Trp Gln Ala Asn Phe Leu Tyr Leu His
305 310 315 320
Cys Thr Val Asp Pro Arg Leu Trp Thr Gln Glu Gly Thr Ala Met Val
325 330 335
Gln Gln Glu Lys Ala Lys Lys Ser Gln Ala Ile Val Lys Lys Leu Ser
340 345 350
Glu Arg Ser Asp Leu Thr Ala Gln Gln Arg Asp Cys Leu Gln Arg His
355 360 365
Gln Ser Thr Leu Ala Arg Leu His Met Gly Tyr Asp Arg Pro Gln Arg
370 375 380
Arg Met Tyr Gln Gly Lys Ser His Leu Val Val Gly Ile Ser Leu Asp
385 390 395 400
Met Glu Asn Leu Val Thr Val Ala Leu Val Asp Val Val Lys Gln Lys
405 410 415
Val Ile Thr Gly Cys Thr Met Lys Ser Leu Leu Gly Gln Asp Tyr Ala
420 425 430
Leu Val Arg Arg Leu Arg Tyr Glu Lys Arg Gln Asn Ser His Leu Arg
435 440 445
Lys Val Ala Gln Glu Arg Gly Ser Lys Ile Val Asn Tyr Glu Ala Asn
450 455 460
Leu Ala Ile His Val Glu Arg Leu Leu Val Lys Ala Ile Ile His Phe
465 470 475 480
Ala Gln Gln His Leu Ala Gly Ser Leu Cys Val Pro Thr Leu Lys Asp
485 490 495
Ile Arg Glu Thr Ile Gln Ala His Leu Gln Cys Arg Ala Glu Glu Arg
500 505 510
Phe Pro Asp Ser Lys Glu Leu Gln Arg Arg Tyr Ala Lys Glu Tyr Arg
515 520 525
Ile Asn Ala His Arg Trp Ser Tyr Asn Arg Leu Leu Lys Leu Leu Asn
530 535 540
Gln Gln Ala Lys Phe Ala Gly Leu Val Val Glu Gln Gly Val Gln Ser
545 550 555 560
Ala Gly Glu Thr Ala Leu Glu Arg Ala Leu Gly Val Ala Leu Ser Ala
565 570 575
Tyr Tyr Gln Arg Ser Ala Ala
580
<210> 75
<211> 417
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-28 effector
<400> 75
Val Glu Ile Lys Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser
1 5 10 15
Pro Gln Gly Arg Asp Leu Thr Gly Ser Arg Tyr Ala Thr Ala Leu Asn
20 25 30
Asp Gly Glu Gln Cys Asp Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp
35 40 45
Gln Ala Glu Ile Leu Ser Arg Pro Asp Ser Leu Pro Pro Pro Val Glu
50 55 60
Tyr Ala Thr Asn Thr Asp Met Thr Trp His Lys Asp Glu Gln Gly Arg
65 70 75 80
Leu Ala Val Thr Phe Asn Gly Leu Gly Lys Leu Lys Phe Lys Ile Ala
85 90 95
Cys Asp Gln Arg Gln Leu His Trp Phe Gln Arg Phe Tyr Gln Asp Gln
100 105 110
Glu Gln Phe Lys Ser Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr
115 120 125
Leu Arg Ser Ala Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Asp
130 135 140
Pro Trp Gln Ala Asn Phe Leu Tyr Leu His Cys Thr Val Asp Ser Arg
145 150 155 160
Leu Trp Thr Gln Glu Gly Thr Ala Met Val Gln Gln Glu Ile Ala Lys
165 170 175
Lys Ser Gln Ala Ile Val Lys Lys Leu Ser Glu Arg Ser Asp Leu Thr
180 185 190
Ala Gln Gln Lys Asp Cys Leu Gln Arg His Gln Ser Thr Leu Ala Arg
195 200 205
Leu His Met Gly Tyr Asp Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys
210 215 220
Ser His Leu Val Val Gly Ile Ser Leu Asp Met Glu Asn Leu Val Thr
225 230 235 240
Val Ala Leu Val Asp Val Val Lys Gln Lys Val Ile Thr Gly Cys Thr
245 250 255
Met Lys Ser Leu Leu Gly Gln Asp Tyr Ala Leu Val Gln Arg Leu Arg
260 265 270
Tyr Glu Lys Arg Gln Asn Ser His Leu Arg Lys Val Ala Gln Glu Arg
275 280 285
Gly Ser Lys Ile Val Asn Tyr Glu Ala Asn Leu Ala Ile His Val Glu
290 295 300
Arg Leu Leu Val Lys Ala Ile Ile His Phe Ala Gln Gln His Leu Ala
305 310 315 320
Gly Ser Leu Cys Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln
325 330 335
Ala His Leu Gln Cys Arg Ala Glu Glu Arg Phe Pro Asp Ser Lys Glu
340 345 350
Leu Gln Arg Arg Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp
355 360 365
Ser Tyr Asn Arg Leu Leu Lys Leu Leu Asn Gln Gln Ala Lys Phe Ala
370 375 380
Gly Leu Val Val Glu Gln Gly Val Gln Ser Ala Gly Glu Thr Ala Leu
385 390 395 400
Glu Arg Ala Leu Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala
405 410 415
Ala
<210> 76
<211> 488
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-29 effector
<400> 76
Met Gly Lys Asp Ile Leu Asp Glu Ile Ala Ser Ile Gly Val Ile Glu
1 5 10 15
Asp Glu Thr Glu Trp Asn Ser Ile Glu Ser Ala Leu Leu Lys Lys Gln
20 25 30
Thr Leu Met Pro His Pro Ile Leu Phe Glu Ser Ser Asp Asp Phe Ile
35 40 45
Trp Ala Glu Pro Ala Arg Phe Gln Ile Glu Asp Leu Gln Ala Glu Glu
50 55 60
Glu Ile Ser Arg Asp Thr Glu Ala Lys Glu Leu Lys Ala Lys Asn Leu
65 70 75 80
Gln Ala Glu Lys Glu Ser Ser Asn Thr Glu Pro Arg Lys Arg Val Cys
85 90 95
Val Cys Phe Lys Ser Phe Asp Glu Lys Tyr Thr Phe Glu Val Ala Gly
100 105 110
Asp Tyr Arg His Ile His Ala Val Trp Gln Ala Leu Lys Glu Arg Lys
115 120 125
Glu Tyr Asp Lys Asn Ala Asp Lys Asn Thr Ser Ala Leu Phe Leu Val
130 135 140
Arg Ser Ala Thr Leu Ile Trp Arg Glu Tyr Lys Lys Asn Asp Asn Arg
145 150 155 160
Ile Val Arg Arg Arg Lys Ala Ala Lys Lys Arg Ala Lys Arg Glu Gly
165 170 175
Leu Val Ala Ser Thr Glu Ser Asp Ser Ser Leu Ala Pro Glu Phe Tyr
180 185 190
Asp Pro Glu Phe Pro Trp Asn Arg Tyr Gln Leu Phe Leu His Cys Thr
195 200 205
Ile Glu Thr Arg Tyr Leu Ser Lys Glu Gly Thr Glu Ile Asp Ile Glu
210 215 220
Lys Gln Lys Lys Ser Thr Ala Lys Ser Ile Gln Thr Leu Glu Lys Asn
225 230 235 240
Ile Ala Glu Leu Glu Lys Lys Gly Glu Ser Ala Lys Thr Arg Lys Asp
245 250 255
Arg His Asn Arg Arg Ser Gly Thr Leu Arg Arg Leu Glu Ser Tyr Asp
260 265 270
Asn Asn Tyr Glu Arg Ser Ser Lys Pro Leu Tyr Ala Gly Gln Pro His
275 280 285
Ile Val Thr Gly Val Ala Leu Gly Ser Ser Gly Leu Val Thr Thr Thr
290 295 300
Ile Ser Asp Ala Ile Ser Gly Lys Ile Leu Glu Cys Arg Gly Leu Glu
305 310 315 320
Ala Leu Leu Gly Lys Asp Tyr Glu Leu Val Lys Arg Arg Gln Phe Glu
325 330 335
Arg Gln Leu Asn Ser Arg Arg Arg Thr Gln Asn Gln Lys Arg Gly Ala
340 345 350
Asn Asp Gln Phe Gly Glu Ser Asn Leu Gly Asp Thr Ile Asp Lys Arg
355 360 365
Ile Ala Asn Ala Val Ile Asp Phe Ala Lys Lys His Gln Ser Gly Phe
370 375 380
Ile Val Leu Pro Asp Met Asn Asp Tyr Arg Arg Arg Lys Gln Ser Glu
385 390 395 400
Ile Ala Ala Phe Ala Glu Arg Glu Cys Gly Gly Trp Lys Gly Ile Glu
405 410 415
Lys Lys Phe Ala Lys Ala Gln Lys Glu Lys Ile His Ser Trp Ser Tyr
420 425 430
Gly Arg Leu Thr Thr Tyr Ile Thr Asn Gln Ala Glu Lys Glu Gly Ile
435 440 445
Leu Val Arg Thr Arg Arg Gln Pro Ile Gln Gly Ser Ser Gln Glu Gln
450 455 460
Gly Lys Leu Met Ala Ile Glu Ala Tyr Lys Asp Lys Pro Lys Pro Lys
465 470 475 480
Lys Ser Arg Pro Lys Lys Ser Ala
485
<210> 77
<211> 467
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-30 effector
<400> 77
Lys Thr Ala Glu Ile Leu Ala Gln Thr Thr Pro Gln Pro Ala Glu Ala
1 5 10 15
Arg Thr Ala Lys Ser Ser Lys Lys Lys Gln Lys Ser Lys Leu Asn Gly
20 25 30
Gln Lys Gln Ser Phe Asp Leu Leu Phe Glu Gln Tyr Gln Glu Thr Asp
35 40 45
Asp Glu Leu Thr Arg Ser Ala Ile Val Tyr Leu Leu Lys Asn Gly Arg
50 55 60
Lys Leu Pro Asn Glu Pro Glu Asp Pro Lys Gln Phe Ala Lys Arg Arg
65 70 75 80
Arg Lys Ala Glu Ile Arg Val Glu Arg Thr Thr Asn Thr Leu His Arg
85 90 95
Met Gln Leu Pro Thr Gly Arg Asp Met Thr Asp Gln Glu Trp Leu Lys
100 105 110
Thr Leu Ala Thr Ala Val Ser Asn Val Pro Glu Asp Asp Gly Glu Ala
115 120 125
Ala Ser Trp Gln Ala Ile Leu Met Ser Glu Ala His Lys Leu Pro Phe
130 135 140
Pro Ile Leu Tyr Glu Thr Asn Glu Asp Leu Ser Trp Phe Leu Asn Asp
145 150 155 160
Gly Glu Arg Leu Cys Val Thr Phe Asn Gly Leu Ser Glu His Thr Phe
165 170 175
Glu Ile His Cys Asp Arg Arg Gln Leu His Trp Phe Lys Arg Phe Leu
180 185 190
Glu Asp Gln Glu Ile Lys Lys Ala Ser Lys Asn Gln His Ser Cys Ala
195 200 205
Leu Phe Thr Leu Arg Ser Ala Arg Ile Ala Trp Gln Glu Gly Lys Glu
210 215 220
Lys Gly Glu Pro Trp Asn Thr His Arg Leu Thr Leu Ala Cys Thr Val
225 230 235 240
Glu Thr Arg Ala Trp Thr Ala Glu Gly Thr Glu Gln Ile Arg Gln Glu
245 250 255
Lys Ala Ala Glu Cys Lys Lys Val Ile Leu Gly Thr Lys Ala Lys Gly
260 265 270
Asn Leu Asn Gln Arg Gln Glu Gln Phe Ile Gln Arg Arg Glu Lys Thr
275 280 285
Ile Val Leu Met Asn Asn Ser Phe Pro Arg Pro Ser Arg Pro Leu Tyr
290 295 300
Gln Gly Gln Pro Glu Ile Ile Ala Ser Val Ser Tyr Gly Leu Asp Arg
305 310 315 320
Pro Ala Thr Leu Ala Ile Val Asp Ile Thr Thr Gly Lys Ala Ile Ala
325 330 335
Tyr Arg Ser Ile Arg Gln Leu Leu Gly Asp His Tyr Lys Leu Leu Thr
340 345 350
Arg Tyr Arg Leu Arg Gln Gln Gln Asn Ala His Arg Arg His Asn Arg
355 360 365
Gln Arg Lys Gly Ala Ser Asn Arg Ile Gln Glu Ser Gln Leu Gly Glu
370 375 380
Tyr Leu Asp Cys Leu Ile Ala Gln Ala Ile Val Ser Val Ala Gln Thr
385 390 395 400
Tyr Gln Ala Ser Ser Ile Val Leu Pro Asp Leu Gly Asn Ile Arg Glu
405 410 415
Val Val Glu Ala Glu Val Arg Ala Arg Ala Glu Gln Arg Ile Val Gly
420 425 430
Tyr Leu Glu Gly Gln Gln Gln Tyr Ala Lys Gln Tyr Arg Ala Ser Ile
435 440 445
His Arg Trp Ser Tyr Gly Arg Leu Ser Glu Lys Ile Gln Ser Gln Ala
450 455 460
Ala Gln Ala
465
<210> 78
<211> 550
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-31 effector
<400> 78
Pro Leu Ile Asn Ala Leu Ile Arg Glu Leu Val Ser His Pro Glu Phe
1 5 10 15
Glu Ser Trp Arg Glu Lys Gly Arg His Pro Ser Asp Val Val Ala Lys
20 25 30
Leu Asn Arg Thr Leu Lys Thr Asp Ala Gln Phe Ala Gly Gln Pro Ser
35 40 45
Arg Phe Phe Met Ser Ala Glu Lys Val Val Asn Tyr Ile Phe Lys Ser
50 55 60
Trp Phe Lys Ile Gln Ser Arg Leu Gln Gln Lys Leu Ser Gly Lys Gln
65 70 75 80
Lys Trp Leu Glu Ile Leu Lys Ser Asp Glu Glu Leu Val Glu Leu Cys
85 90 95
Gly Gln Ser Ile Asp Val Leu Gln Lys Lys Ala Val Gln Val Leu Gln
100 105 110
Glu Val Gly Lys Ala Ile Asp Lys Glu Thr Ser Asp Thr Ile Pro Glu
115 120 125
Lys Lys Arg Ala Asn Leu Ile Arg Gln Arg Leu Phe Lys Lys Leu Ser
130 135 140
Ser Ala Lys Gln Pro Leu Pro Gln Tyr Ala Ala Ile Tyr Leu Leu Lys
145 150 155 160
Asn His Cys Lys Ile Pro Asn Glu Pro Glu Asp Val Glu Asn Phe Ala
165 170 175
Gln Arg Arg Arg Lys Thr Glu Ile Gln Ile Gln Ile Leu Gln Asp Gln
180 185 190
Ile Glu Ser Arg Ile Pro Lys Gly Arg Asp Leu Thr Gly Lys Ala Trp
195 200 205
Thr Glu Thr Leu Leu Lys Ala Val Asn Ser Ile Pro Gln Asp Asn Gln
210 215 220
Glu His Lys Gln Trp Gln Asp Arg Leu Leu Ser Met Pro Ser Thr Ala
225 230 235 240
Pro Phe Pro Ile Leu Phe Glu Thr Asn Glu Asp Leu Val Trp Ser Ala
245 250 255
Asn Glu Arg Asp Arg Ile Cys Val Arg Phe Asn Gly Leu Ser Glu His
260 265 270
Thr Phe Gln Ile Tyr Cys Asp Gln Arg Gln Leu His Trp Phe Lys Arg
275 280 285
Phe Leu Glu Asp Gln Lys Thr Lys Arg Ala Ser Lys Asn Gln His Ser
290 295 300
Ser Ala Leu Phe Thr Leu Arg Ser Ala Arg Ile Ser Trp Gln Glu Asn
305 310 315 320
Asp Arg Lys Gly Asn Pro Trp Glu Thr His Tyr Ile Thr Leu Ser Cys
325 330 335
Thr Val Asp Val Arg Leu Trp Ser Ala Glu Gly Thr Asp Glu Val Arg
340 345 350
His Glu Lys Ala Ala Asp Val Ala Lys Val Leu Thr Arg Leu Asn Glu
355 360 365
Lys Asp Ser Leu Thr Glu Thr Gln Ala Gly Tyr Ala Arg Arg Leu Thr
370 375 380
Ser Thr Leu Glu Lys Leu Ser Ser Pro Phe Glu Arg Pro Ser Leu Pro
385 390 395 400
Arg Tyr Gln Gly Lys Asp Asn Ile Ile Ala Gly Ile Ser Leu Gly Trp
405 410 415
Asp Lys Pro Val Thr Leu Ala Ile Trp Asn Thr Asp Thr Gln Glu Val
420 425 430
Leu Thr Tyr Arg Ser Leu Lys Gln Leu Leu Gly Lys Asp Tyr Pro Leu
435 440 445
Tyr Leu Arg His Arg Arg Glu Gln Gln Lys Gln Ser His Glu Arg His
450 455 460
Lys Ala Gln Lys Gln Gly Lys Gly Asn Arg Phe Gly Thr Ser Asn Leu
465 470 475 480
Gly Glu His Leu Asp Arg Leu Leu Ala Lys Ala Ile Val Ala Ile Ala
485 490 495
Gln Gln Tyr Ser Ala Gly Ser Ile Ala Val Pro Lys Leu Asp Ser Ile
500 505 510
Arg Asp Thr Leu Gln Ala Glu Ile Asp Ala Lys Ala Glu Gln Arg Ile
515 520 525
Pro Gly Tyr Leu Glu Gly Gln Lys Arg Tyr Ser Arg Asp Tyr Lys Arg
530 535 540
Ser Ile His Arg Trp Ser
545 550
<210> 79
<211> 446
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-32 effector
<400> 79
Ser Ile Phe Ala Tyr Leu Leu Lys His Arg Leu Thr Val Pro Thr Glu
1 5 10 15
Ser Glu Asp Thr Asp Glu Leu Arg Arg Lys Arg Arg Gln Val Glu Ile
20 25 30
Lys Ile Glu Arg Leu Glu Thr Gln Leu Ala Gly Arg Ser Pro Gln Gly
35 40 45
Arg Asp Leu Thr Gly Ser Arg Tyr Ala Thr Ala Leu Asn Asp Gly Glu
50 55 60
Gln Cys Asp Trp Glu Asp Asp Ala Asp Phe Leu Ala Trp Gln Ala Glu
65 70 75 80
Ile Leu Ser Arg Pro Asp Ser Leu Pro Pro Pro Val Glu Tyr Ala Thr
85 90 95
Asn Thr Asp Met Thr Trp His Lys Asp Glu Gln Gly Arg Leu Ala Val
100 105 110
Thr Phe Asn Gly Leu Gly Lys Leu Lys Phe Lys Ile Ala Cys Asp Gln
115 120 125
Arg Gln Leu His Trp Phe Gln Arg Phe Tyr Gln Asp Gln Glu Gln Phe
130 135 140
Lys Ser Gln Lys Gly Gln Arg Ser Gln Ala Leu Phe Thr Leu Arg Ser
145 150 155 160
Ala Glu Leu Leu Trp Lys Pro Gly Asn Arg Ser Gly Asp Pro Trp Gln
165 170 175
Ala Asn Phe Leu Tyr Leu His Cys Thr Val Asp Ser Arg Leu Trp Thr
180 185 190
Gln Glu Gly Thr Ala Met Val Gln Gln Glu Lys Ala Lys Lys Ser Gln
195 200 205
Ala Ile Val Lys Lys Leu Ser Glu Arg Ser Asp Leu Thr Ala Gln Gln
210 215 220
Lys Asp Cys Leu Gln Arg His Gln Ser Thr Leu Ala Arg Leu His Met
225 230 235 240
Gly Tyr Asp Arg Pro Gln Arg Arg Met Tyr Gln Gly Lys Ser His Leu
245 250 255
Val Val Gly Ile Ser Leu Asp Met Glu Asn Leu Val Thr Val Ala Leu
260 265 270
Val Asp Val Val Lys Gln Lys Val Ile Thr Gly Cys Thr Met Lys Ser
275 280 285
Leu Leu Gly Gln Asp Tyr Ala Leu Val Gln Arg Leu Arg Tyr Glu Lys
290 295 300
Arg Gln Asn Ser His Leu Arg Lys Val Ala Gln Glu Arg Gly Ser Lys
305 310 315 320
Ile Val Asn Tyr Glu Ala Asn Leu Ala Ile His Val Glu Arg Leu Leu
325 330 335
Val Lys Ala Ile Ile His Phe Ala Gln Gln His Leu Ala Gly Ser Leu
340 345 350
Cys Val Pro Thr Leu Lys Asp Ile Arg Glu Thr Ile Gln Ala His Leu
355 360 365
Gln Cys Arg Ala Glu Glu Arg Phe Pro Asp Ser Lys Glu Leu Gln Arg
370 375 380
Arg Tyr Ala Lys Glu Tyr Arg Ile Asn Ala His Arg Trp Ser Tyr Asn
385 390 395 400
Arg Leu Leu Glu Leu Ile Ser Gln Gln Ala Ile Val Ala Gly Leu Leu
405 410 415
Val Glu Gln Gly Leu Gln Gly Ser Gly Gly Thr Ala Ile Lys Arg Ala
420 425 430
Leu Gly Val Ala Leu Ser Ala Tyr Tyr Gln Arg Ser Ala Ala
435 440 445
<210> 80
<211> 649
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-44 effector
<400> 80
Met Ser Gln Ile Thr Ile Gln Cys Asn Leu Val Ala Ser Glu Ala Thr
1 5 10 15
Arg Gln Tyr Leu Trp His Leu Met Ala Asp Ile Tyr Thr Pro Phe Ile
20 25 30
Asn Glu Met Leu Ala Thr Ile Ala Gln His Pro Asn Phe Glu Glu Trp
35 40 45
Ser Gln Asn Gly Arg Ile Pro Ala Asp Val Phe Glu Asp Ile Arg Lys
50 55 60
Thr Leu Lys Ala His Pro Asp Phe Gln Gly Met Pro Gly Arg Trp Tyr
65 70 75 80
Tyr Ala Gly Arg Asp Leu Val Lys Arg Ile Phe Lys Ser Trp Leu Ala
85 90 95
Leu Arg Arg Arg Leu Arg His Gln Leu Ser Gly Gln Thr His Trp Leu
100 105 110
Glu Ile Phe Gln Ser Asp Asp Asp Leu Val Ala Ala Cys Gly Gln Asp
115 120 125
Leu Pro Ala Ile Arg Ala Glu Ala Ala Ser Ile Leu Thr Lys Ile Gln
130 135 140
Ile Glu Ala Pro Asn Thr Ser Lys Gln Pro Lys Lys Thr Lys Gln Pro
145 150 155 160
Lys Lys Ala Gly Ser Lys Thr Gln Lys Pro Glu Glu Glu Gln Arg Asn
165 170 175
Arg Asn Leu Phe Pro Ala Leu Phe Lys Glu Tyr Asp Gly Ala Glu Thr
180 185 190
Glu Leu Val Lys Cys Ala Ile Ala Cys Leu Leu Lys Asn Asn Cys Gln
195 200 205
Ile Pro Thr Lys Ala Glu His Pro Glu Lys Phe Gln Lys Arg Arg Arg
210 215 220
Lys Thr Glu Ile Arg Val Glu Arg Ile Ile Glu Gln Leu Ala Arg Thr
225 230 235 240
Arg Leu Pro Lys Gly Arg Asp Leu Thr Asn Glu Lys Trp Leu Asp Thr
245 250 255
Leu Lys Met Ala Val Gln Gln Val Pro Lys Asp Glu Thr Glu Ala Ala
260 265 270
Ala Trp Glu Ala Asp Leu Gln Thr Asp Ser Ser Pro Leu Pro Phe Pro
275 280 285
Ile Ala Tyr Glu Ser Asn Glu Asp Leu Lys Trp Ser Gln Asn Ala Lys
290 295 300
Gly Arg Leu Cys Val Arg Phe Asn Gly Leu Gly Lys His Thr Phe Glu
305 310 315 320
Ile Tyr Cys Asp Thr Arg Gln Leu His Trp Phe Lys Arg Phe Leu Asp
325 330 335
Asp Gln Thr Ile Lys Lys Gln Gly Gly Asn Ser His Ser Ala Gly Ala
340 345 350
Leu Thr Leu Arg Ser Gly Arg Ile Ser Trp Arg Leu Asp Ser Ser Lys
355 360 365
Gly Asn Pro Trp Asp Arg Asn Arg Leu Val Leu Phe Cys Ser Val Asp
370 375 380
Thr Leu Leu Trp Thr Lys Glu Gly Thr Glu Lys Ala Ser Gln Glu Lys
385 390 395 400
Ala Ser Lys Ile Ala Gln Val Ile Ser Gly Thr Lys Ala Lys Gly Asn
405 410 415
Leu Thr Ser Lys Gln Glu Asp Phe Val Arg Lys Arg Glu Lys Thr Leu
420 425 430
Ala Leu Leu Gln Asn Pro Phe Pro Arg Pro Ser Arg Pro Leu Tyr Gln
435 440 445
Gly Ser Pro Ala Ile Leu Ala Gly Val Ser Phe Gly Leu Asp Lys Pro
450 455 460
Ala Thr Leu Ala Ile Val Asp Val Thr Thr Gly Lys Ala Ile Ala Tyr
465 470 475 480
Arg Ser Ile Arg Gln Leu Leu Gly Asp Asp His Lys Leu Leu Asn Arg
485 490 495
Gln Arg Gln Arg Gln Arg Gln Lys Ala Gln Arg Arg Arg Ser Asn Gln
500 505 510
Leu Lys Phe Ala Ser Asn Arg Ile Ser Glu Gly Gly Leu Gly Gly Gln
515 520 525
Ile Asp Ser Leu Ile Ala Lys Ala Ile Val Gln Ile Ala Gln Gln Tyr
530 535 540
Asn Ala Ser Ser Ile Val Leu Gly Asp Leu Ala Asn Ile Arg Glu Ile
545 550 555 560
Ile Glu Ser Glu Ile Gln Ala Lys Ala Glu Gln Lys Thr Thr Leu Lys
565 570 575
Glu Ile Gln Ala Lys Tyr Ala Arg Asp Tyr Arg Ala Ser Ile His Arg
580 585 590
Trp Ser Tyr Lys Arg Leu Ala Gln Lys Ile Glu Ser Asn Ala Leu Gln
595 600 605
Ala Gly Leu Ile Val Ala Thr Ile Lys Gln Pro Leu Ala Gly Ser Pro
610 615 620
Gln Asp Lys Ala Arg Asp Val Ala Ile Ala Gly Phe Gln Ser Arg Ser
625 630 635 640
Val Ser Lys Ile Leu Asp Thr Gly Ser
645
<210> 81
<211> 429
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-45 effector
<400> 81
Met Pro Pro Cys Arg Pro Pro Ala Thr Arg Gln Tyr Leu Trp Gly Leu
1 5 10 15
Ala Ala Glu Lys Asn Thr His Leu Ile Asn Ala Leu Ile Gln Glu Val
20 25 30
Val Ser His Glu Asp Phe Glu Asp Trp Arg Leu Lys Gly Arg His Pro
35 40 45
Ala Asp Val Val Ala Lys Ala Cys Arg Arg Leu Lys Thr Glu Val Pro
50 55 60
Phe Ser Gly Gln Pro Ser Arg Phe Tyr Ala Ser Ala Glu Lys Ala Val
65 70 75 80
Asn Tyr Ile Phe Lys Ser Trp Phe Thr Leu Gln Ser Arg Leu Gln Arg
85 90 95
Gln Ile Ser Gly Lys Gln Ala Trp Leu Asp Met Leu Lys Ser Asp Asp
100 105 110
Glu Leu Val Glu Leu Cys Gly Arg Pro Leu Glu Gly Ile Gln Ala Thr
115 120 125
Ala Ala Gln Leu Leu Lys Gln Ile Glu Lys Thr Leu Glu Ser Glu Ala
130 135 140
Thr Glu Glu Ser Gln Gly Lys Ser Lys Glu Asp Gln Val Arg Thr His
145 150 155 160
Leu Phe Lys Lys Tyr His Ser Ala Lys Gln Ala Leu Asn Leu Cys Ala
165 170 175
Ala Ala Tyr Leu Leu Lys Asn Asn Ser Lys Ile Pro Asp Lys Pro Glu
180 185 190
Asp Pro Asn Lys Phe Ala Gln Arg Gln Arg Lys Ala Glu Ile Gln Val
195 200 205
Gln Arg Leu Gln Asp Gln Ile Glu Gly Arg Ile Pro Lys Gly Arg Asp
210 215 220
Leu Thr Gly Gln Ala Trp Leu Ser Thr Leu Leu Thr Val Thr Thr Thr
225 230 235 240
Val Pro Arg Asp Asn Arg Glu His Lys Gln Trp Gln Asp Arg Leu Leu
245 250 255
Ala Gln Pro Arg Thr Ile Pro Phe Pro Ile Leu Phe Glu Thr Asn Glu
260 265 270
Asp Leu Val Trp Ser Arg Asn Gln Ala Asp Arg Leu Cys Val Arg Phe
275 280 285
Asn Gly Leu Ser Glu His Thr Phe Gln Ile Tyr Cys Asp Gln Arg Gln
290 295 300
Leu Pro Trp Phe Gln Arg Phe Leu Glu Asp Gln Gln Thr Lys Arg Ala
305 310 315 320
Ser Lys Asn Gln His Ser Ser Ala Leu Phe Ala Leu Arg Ser Ala Arg
325 330 335
Ile Ser Trp Gln Glu Asn Asp Arg Lys Gly Gln Pro Trp Asp Ala His
340 345 350
Ser Leu Thr Leu Ser Cys Thr Ile Asp Thr Arg Leu Trp Ser Ala Glu
355 360 365
Gly Thr Asp Glu Val Arg Gln Glu Lys Ala Ala Asp Thr Ala Lys Val
370 375 380
Leu Thr Arg Leu Asn Glu Lys Gly Ser Leu Ser Asp Thr Gln Ala Gly
385 390 395 400
Tyr Ala Lys Arg Leu Thr Ser Thr Leu Asn Arg Leu Asp Ser Pro Phe
405 410 415
Lys Arg Pro Ser Gln Pro Arg Tyr Gln Gly Lys Pro His
420 425
<210> 82
<211> 477
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-46 effector
<400> 82
Glu Gln Gln Asn Arg Asn Leu Phe Pro Ala Leu Phe Lys Glu Tyr Asp
1 5 10 15
Gly Ala Glu Thr Glu Leu Val Lys Cys Ala Ile Ala Cys Leu Leu Lys
20 25 30
Asn Asn Cys Gln Ile Pro Thr Lys Ala Glu His Pro Glu Lys Phe Gln
35 40 45
Lys Arg Arg Arg Lys Thr Glu Ile Arg Val Glu Arg Ile Ile Glu Gln
50 55 60
Leu Ala Arg Thr Arg Leu Pro Lys Gly Arg Asp Leu Thr Asn Glu Lys
65 70 75 80
Trp Leu Asp Thr Leu Lys Met Ala Val Gln Gln Val Pro Lys Asp Glu
85 90 95
Thr Glu Ala Ala Ala Trp Glu Ala Asp Leu Gln Thr Asp Ser Ser Pro
100 105 110
Leu Pro Phe Pro Ile Ala Tyr Glu Ser Asn Glu Asp Leu Lys Trp Ser
115 120 125
Gln Asn Ala Lys Gly Arg Leu Cys Val Arg Phe Asn Gly Leu Gly Lys
130 135 140
His Thr Phe Glu Ile Tyr Cys Asp Thr Arg Gln Leu His Trp Phe Lys
145 150 155 160
Arg Phe Leu Asp Asp Gln Thr Ile Lys Lys Gln Gly Gly Asn Ser His
165 170 175
Ser Ala Gly Ala Leu Thr Leu Arg Ser Gly Arg Ile Ser Trp Arg Leu
180 185 190
Asp Ser Ser Lys Gly Asn Pro Trp Asp Arg Asn Arg Leu Val Leu Phe
195 200 205
Cys Ser Val Asp Thr Leu Leu Trp Thr Lys Glu Gly Thr Glu Lys Ala
210 215 220
Ser Gln Glu Lys Ala Ser Lys Ile Ala Gln Val Ile Ser Gly Thr Lys
225 230 235 240
Ala Lys Gly Asn Leu Thr Ser Lys Gln Glu Asp Phe Val Arg Lys Arg
245 250 255
Glu Lys Thr Leu Ala Leu Leu Gln Asn Pro Phe Pro Arg Pro Ser Arg
260 265 270
Pro Leu Tyr Gln Gly Ser Pro Ala Ile Leu Ala Gly Val Ser Phe Gly
275 280 285
Leu Asp Lys Pro Ala Thr Leu Ala Ile Val Asp Val Thr Thr Gly Lys
290 295 300
Ala Ile Ala Tyr Arg Ser Ile Arg Gln Leu Leu Gly Asp Asp His Lys
305 310 315 320
Leu Leu Asn Arg Gln Arg Gln Arg Gln Arg Gln Lys Ala Gln Arg Arg
325 330 335
Arg Ser Asn Gln Leu Lys Phe Ala Ser Asn Arg Ile Ser Glu Gly Gly
340 345 350
Leu Gly Gly Gln Ile Asp Ser Leu Ile Ala Lys Ala Ile Val Gln Ile
355 360 365
Ala Gln Gln Tyr Asn Ala Ser Ser Ile Val Leu Gly Asp Leu Ala Asn
370 375 380
Ile Arg Glu Ile Ile Glu Ser Glu Ile Gln Ala Lys Ala Glu Gln Lys
385 390 395 400
Thr Thr Leu Lys Glu Ile Gln Ala Lys Tyr Ala Arg Asp Tyr Arg Ala
405 410 415
Ser Ile His Arg Trp Ser Tyr Lys Arg Leu Ala Gln Lys Ile Glu Ser
420 425 430
Asn Ala Leu Gln Ala Gly Leu Ile Val Ala Thr Ile Lys Gln Pro Leu
435 440 445
Ala Gly Ser Pro Gln Asp Lys Ala Arg Asp Val Ala Ile Ala Gly Phe
450 455 460
Gln Ser Arg Ser Val Ser Lys Ile Leu Asp Thr Gly Ser
465 470 475
<210> 83
<211> 439
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-47 effector
<400> 83
Leu Lys Asn Gly Gly Lys Ile Ser Asn Lys Glu Glu Asp Pro Glu Lys
1 5 10 15
Phe Ala Lys Arg Arg Arg Lys Leu Glu Ile Gln Ile Glu Arg Leu Arg
20 25 30
Glu Gln Leu Glu Ala Arg Ile Pro Lys Gly Arg Asp Leu Thr Asp Ala
35 40 45
Lys Trp Leu Glu Thr Leu Leu Leu Ala Thr Asn Lys Ala Pro Glu Asn
50 55 60
Glu Glu Glu Ala Lys Phe Trp Gln Asp Ser Leu Leu Lys Lys Ser Ser
65 70 75 80
Thr Val Pro Phe Pro Val Ala Tyr Glu Thr Lys Glu Asp Met Thr Trp
85 90 95
Phe Lys Asn Glu Arg Gly Arg Ile Cys Val Lys Phe Asn Gly Leu Ser
100 105 110
Glu His Ser Phe Gln Val Tyr Cys Asp Thr Arg His Leu His Trp Phe
115 120 125
Gln Arg Phe Leu Lys Asp Gln Gln Ile Lys His Asn Ser Lys Asn Gln
130 135 140
His Ser Ser Ser Leu Phe Thr Leu Arg Ser Gly Arg Ile Val Trp Gln
145 150 155 160
Glu Gly Glu Ser Lys Gly Asp Pro Trp Lys Val Asn His Leu Ile Leu
165 170 175
Tyr Cys Ser Val Asp Thr Arg Leu Trp Thr Ala Glu Gly Thr Asn Leu
180 185 190
Val Arg Glu Glu Lys Ala Glu Glu Ile Ala Lys Thr Ile Thr Gln Thr
195 200 205
Lys Val Lys Gly Glu Leu Asn Asp Lys Gln Leu Ala His Ile Lys Arg
210 215 220
Lys Asn Ser Ser Leu Ala Arg Ile Asn Asn Pro Phe Pro Arg Pro Ser
225 230 235 240
Lys Pro Leu Tyr Lys Gly Gln Pro His Ile Leu Val Gly Val Ser Leu
245 250 255
Gly Leu Glu Lys Pro Thr Thr Leu Ala Ile Val Asp Gly Thr Thr Ser
260 265 270
Lys Val Ile Thr Tyr Arg Ser Ile Lys Gln Leu Leu Gly Asp Asn Tyr
275 280 285
Lys Leu Leu Asn Arg Gln Arg Gln Gln Lys His Leu Leu Ser His Gln
290 295 300
Arg Gln Ile Ala Gln Thr Leu Ala Ser Pro Asn Gln Leu Gly Glu Ser
305 310 315 320
Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu Ala Lys Glu Ile Val Ala
325 330 335
Ile Ala Gln Thr Tyr Lys Ala Gly Ser Ile Val Leu Pro Lys Leu Gly
340 345 350
Asp Met Arg Glu Gln Leu Gln Ser Glu Ile Gln Ala Lys Ala Glu Gln
355 360 365
Lys Ser Asp Leu Leu Glu Val Gln Gln Lys Tyr Ala Lys Gln Tyr Arg
370 375 380
Val Ser Val Tyr Gln Trp Ser Tyr Gly Arg Leu Ile Ala Asn Ile Arg
385 390 395 400
Ser Ser Ala Ala Lys Ala Gly Ile Val Ile Glu Glu Ser Lys Gln Pro
405 410 415
Ile Arg Gly Ser Pro Lys Glu Lys Ala Lys Glu Leu Ala Ile Val Ala
420 425 430
Tyr Asn Ser Arg Gln Thr Thr
435
<210> 84
<211> 641
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-48 effector
<400> 84
Met Ser Val Ile Thr Ile Gln Cys Arg Leu Val Ala Lys Glu Phe Ser
1 5 10 15
Leu Arg Tyr Leu Trp Glu Leu Met Ala Gln Lys Asn Thr Pro Leu Val
20 25 30
Asn Glu Leu Leu Gln Ala Ile Val Gln His Ser Asp Phe Glu Ser Trp
35 40 45
Leu Gln Lys Gly Ser Ile Pro Gln Ala Thr Ile Lys Ala Leu Cys Asp
50 55 60
Ser Leu Lys Asn Asp Pro Arg Phe Ser Gly Gln Pro Gly Cys Phe Tyr
65 70 75 80
Thr Ser Ala Thr Ser Leu Val Ser Tyr Asn Tyr Lys Ser Trp Phe Ala
85 90 95
Leu Gln Lys Arg Arg Gln Gln Lys Ile Glu Gly Lys Glu Arg Trp Leu
100 105 110
Asn Leu Leu Lys Ser Glu Arg Glu Leu Glu Glu Glu Cys Asp Arg Thr
115 120 125
Leu Glu Glu Ile Arg Ala Lys Ala Thr Gln Ile Leu Thr Gln Phe Gln
130 135 140
Pro Gln Ala Glu Asn Ala Glu Thr Pro Pro Gly Glu Ala Thr Gln Lys
145 150 155 160
Lys Lys Gly Lys Lys Ser Lys Ser Thr Pro Ser Lys Gly Lys Ala Ala
165 170 175
Ser Leu Phe Asn Thr Leu Phe Asn Ala Tyr Ala Gln Thr Lys Asp Pro
180 185 190
Leu Glu Arg Cys Ala Leu Ala Tyr Leu Leu Lys Asn Asn Gly Glu Val
195 200 205
Ser Leu Val Glu Glu Asp Leu Glu Ala Tyr Gln Gln Arg Arg Arg Lys
210 215 220
Lys Glu Ile Glu Ile Glu Arg Leu Lys Glu Gln Leu Lys Ser Arg His
225 230 235 240
Pro Lys Gly Arg Asp Leu Thr Ala Glu Lys Trp Leu Glu Thr Leu Glu
245 250 255
Ala Ala Arg Thr Gln Gln Pro Glu Ser Glu Ala Glu Ala Ala Thr Trp
260 265 270
Gln Ala Asn Leu Leu Arg Asn Ser Ser Pro Val Pro Phe Pro Val Asn
275 280 285
Tyr Glu Thr Asn Glu Asp Leu Thr Trp Phe Lys Asn Glu Ala Gly Arg
290 295 300
Ile Cys Val Phe Phe Ser Gly Leu Arg Glu His His Phe Glu Val Trp
305 310 315 320
Cys Asp Asn Arg Gln Leu His Trp Phe Glu Arg Phe Phe Gln Asp Gln
325 330 335
Gln Ile Lys Arg Gln Ser Lys Asn Gln His Ser Ser Ser Leu Phe Thr
340 345 350
Leu Arg Ser Gly Arg Ile Gly Trp Gln Glu Cys Thr Gly Glu Gly Glu
355 360 365
Ala Trp Asn Ile His His Leu Lys Leu Tyr Cys Thr Leu Asp Thr Arg
370 375 380
Leu Trp Thr Ala Glu Gly Thr Glu Gln Val Ala Gln Glu Lys Ala Ala
385 390 395 400
Glu Ile Ser Asn Ile Leu Thr Lys Thr Lys Gln Lys Asp Asp Leu Asn
405 410 415
Glu Lys Gln Leu Ala Phe Ile Lys Arg Gly Glu Thr Met Leu Ala Arg
420 425 430
Ile Asn Thr Pro Phe Pro Arg Pro Ser Lys Pro Leu Tyr Gln Gly Gln
435 440 445
Ser Glu Ile Val Val Gly Val Ser Leu Gly Leu Glu Lys Pro Ala Thr
450 455 460
Val Ala Val Ile Asp Val Pro Gly Asp Arg Val Leu Ala Tyr Arg Asn
465 470 475 480
Val Lys Gln Leu Leu Gly Asp His Tyr Pro Leu Leu Asn Arg Arg Arg
485 490 495
Gln Gln Gln Arg Ser Leu Ser Gln Lys Arg Gln Lys Ala Gln Lys Gln
500 505 510
Gly Ala Ala Asn Glu Phe Gly Glu Ser Glu Leu Gly Gln Tyr Ile Asp
515 520 525
Arg Leu Leu Ala Lys Glu Ile Val Ala Ile Ala Arg Ser Tyr Gln Ala
530 535 540
Gly Ser Ile Ala Leu Pro Lys Leu Thr Asp Ile Arg Glu Ile Leu His
545 550 555 560
Ser Glu Met Gln Thr Arg Val Glu Lys Lys Ile Pro Gly Tyr Lys Glu
565 570 575
Ala Gln Asp Lys Tyr Ala Lys Gln Tyr Arg Val Asn Val His Arg Trp
580 585 590
Ser Tyr Gly Arg Leu Met Asp Ala Ile Ala Ser Gln Ala Ala Lys Val
595 600 605
Gly Ile Val Ile Glu Val Gly Lys His Pro Ser Glu Gly Ser Phe Gln
610 615 620
Asp Lys Ala Arg Glu Val Ala Ile Ser Ala Tyr Cys Asp Arg Ser Val
625 630 635 640
Asn
<210> 85
<211> 709
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-49 effector
<400> 85
Met Ser Ile Ile Thr Ile Arg Cys Arg Leu Val Ala Gly Ile Lys Gln
1 5 10 15
Gln Ile Asp Lys Lys Ser Ile Lys Asn Phe Ser Ala Glu Asp Arg Ala
20 25 30
Leu Leu Gln Lys Leu Leu Asp Asp Lys Ser Gln Thr Asp Arg Asp Asn
35 40 45
Pro Lys Asp Lys Gln Lys Ile Phe Leu Ala Gln Ser Ser Glu Asp Val
50 55 60
Arg Gln Asn Leu Trp Gln Leu Phe Phe Thr Ser Ser Ala Leu Ile Asp
65 70 75 80
Gln Leu Leu Asp Arg Leu Ser Gln His Pro Asn Val Gln Thr Trp Gln
85 90 95
Gln Gln Gly Lys Leu Pro Asp Asp Glu Leu Lys Ala Cys Trp Leu Glu
100 105 110
Leu Lys Thr Ser Pro Leu Tyr Asp Glu Lys Leu Pro Gly Arg Phe Phe
115 120 125
Ser Ser Val Gln Ser Met Val Lys Thr Ile Tyr Ala Ser Trp Leu Ala
130 135 140
Leu His Gln Gln Lys Gln Arg Arg Leu Asn Gly Leu Asn Arg Leu Thr
145 150 155 160
Glu Ile Val Tyr Ser Asp Glu Thr Leu Leu Glu Met Cys Asp Ser Thr
165 170 175
Phe Ala Gln Leu Gln Leu Asn Ala Ala Ser Met Leu Ser Glu Ile Asp
180 185 190
Lys Glu Val Val Asn Ser Glu Lys Ser Arg Ser Arg Ile Asp Leu Leu
195 200 205
Phe Lys Lys Tyr Thr Glu Leu Pro Val Glu Asp Thr Ile Gly Arg Ser
210 215 220
Ala Ile Ser Tyr Leu Ile Lys His Gly Cys Lys Ile Glu Ser Lys Ile
225 230 235 240
Glu Leu Thr Pro Lys Phe Ala Arg Trp Phe Lys Thr Lys Leu Lys Gln
245 250 255
Ala Gln Arg Leu Glu His Gln Leu Ala Gly His Phe Pro Arg Gly Arg
260 265 270
Asp Leu Asn Gly Ile Ala Phe Leu Asn Ala Leu Glu Thr Ala Thr Lys
275 280 285
Asp Glu Pro Gln Asp Asn Pro Glu Leu Met Leu Trp Gln Ser Gln Ile
290 295 300
Leu Arg Asp Pro Ser Ser Leu Pro His Pro Ile Glu Phe Asn Ser Asn
305 310 315 320
Thr Asp Leu Arg Trp Leu Lys Leu Tyr Arg Lys Gln Tyr Gln Cys Lys
325 330 335
Arg Thr Val Ser Gly Asp Ser Ile Asp Ser Ile Glu Leu Thr Gln Arg
340 345 350
Leu Phe Val Glu Phe Lys Gly Leu Thr Gln Gly Ser Asn Tyr Val Phe
355 360 365
Glu Val Tyr Cys Asp Arg Arg Gln Leu Ala Ile Phe Gln Gln Phe Phe
370 375 380
Asp Asp Asp Arg Leu Leu Arg Asn Ser Ser Ser Glu Glu Lys Tyr Ser
385 390 395 400
Ser Ser Leu Phe Thr Leu Arg Ser Ala Tyr Leu Leu Trp Asp Arg Gln
405 410 415
Glu Ser Gln Asp Arg Tyr Arg Arg His Thr Leu Ser Ile Gln Thr Ala
420 425 430
Thr Glu Pro Trp Asn Thr Asn Gln Leu Tyr Leu His Cys Ser Ile Glu
435 440 445
Thr Lys Ser Leu Thr Ala Glu Gly Met Arg Glu Ile Gln Gln Gln Lys
450 455 460
Thr Gln Lys Val Asn Asn Ile Leu Ala Lys Gln Ser Lys Asn Ala Tyr
465 470 475 480
Pro Ser Ile Asp Gln Gln Gln Ser Gln Arg Lys Asn Gln Thr Ser Leu
485 490 495
Asn Leu Leu Asp Arg Ser Leu Pro Arg Pro Ser Arg Pro Ile Tyr Gln
500 505 510
Gly Asn Pro Gln Ile Ile Val Gly Leu Ile Phe Asp Pro Val Arg Pro
515 520 525
Ile Tyr Leu Ala Val Val Asp Val Thr Thr Gly Lys Pro Ile Thr Tyr
530 535 540
Arg Ser Thr Arg Gln Leu Leu Gly Asp Lys Tyr Gln Lys Leu Ser Glu
545 550 555 560
Tyr Arg Leu Lys Gln Gln Gln Asn Ser His His Arg Arg Lys His Asn
565 570 575
Gln Gln Gly Gln Phe Gln Gln Pro Thr Glu Ser Thr Gln Gly Glu Tyr
580 585 590
Leu Asn Arg Leu Leu Ala Lys Ala Val Ile Gln Ile Ala Gln Glu Phe
595 600 605
Lys Ala Ala Ser Ile Ala Leu Pro Pro Ile Asn His Asn Ile Glu Lys
610 615 620
Val Gln Ser Lys Ile Glu Ala Asp Ala Glu Glu Asp Leu Pro Glu Asp
625 630 635 640
Val Gly Thr Gln Lys Lys Ile Thr Arg Lys Thr Ser Val Val Ile His
645 650 655
Lys Trp Ser Tyr His Ser Leu Leu Glu Tyr Val Lys Ser Asn Ala Ala
660 665 670
Lys Leu Gly Ile Thr Val Glu Thr Val Ser Leu Pro Ser Leu Gly Thr
675 680 685
Pro Ser Gln Gln Ala Ala Glu Val Ala Ile Ser Ala Tyr Asn Ser Arg
690 695 700
Lys His Ile Lys Lys
705
<210> 86
<211> 642
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-50 effector
<400> 86
Met Arg Tyr Ala Ile Ser Met Ser Gln Ile Thr Ile Gln Cys Gln Leu
1 5 10 15
Phe Ala Asp Glu Ala Ala Arg Lys Tyr Leu Trp Gln Leu Met Thr Ala
20 25 30
Arg Asn Thr Pro Leu Val Asn Glu Leu Leu Arg Leu Ile Ala Leu His
35 40 45
Pro Asp Phe Leu Lys Trp Arg Ser Ser Gly Lys Leu Pro Thr Thr Glu
50 55 60
Val Thr Lys Leu Ala Lys Thr Leu Lys Thr Asp Glu Arg Phe Asn Asn
65 70 75 80
Gln Pro Ala Lys Phe His Ile Ser Ala Glu Lys Thr Ala Ile Tyr Thr
85 90 95
Phe Lys Ser Trp Leu Ala Ile Gln Lys Arg Ala Gln Gln Gln Leu Glu
100 105 110
Gly Lys Ile Ser Trp Leu Arg Met Leu Arg Thr Asn Glu Glu Leu Val
115 120 125
Ala Asp Cys Gly Gln Asp Leu Ala Gln Ile Arg Thr Lys Ala Gln Ala
130 135 140
Leu Ile Leu Gln Tyr Gln Ser Ser Glu Asp Ser Ala Glu Ser Gln Lys
145 150 155 160
Asn Phe Arg Lys Ser Leu Tyr Gln Ala Tyr Asp Ile Ala Glu Pro Arg
165 170 175
Leu Gly Ala Gln Asn Glu Arg Ser Leu Thr Arg Ser Ala Ile Ala Tyr
180 185 190
Leu Leu Lys Asn Arg Cys His Ile Pro Ser Asp Thr Asp Glu Asp Leu
195 200 205
Lys Lys Phe Leu Lys Tyr Arg Arg Lys Ile Glu Asn Gln Val Lys Arg
210 215 220
Leu Thr Gln Gln Leu Glu Asn Arg Leu Pro Gln Gly Arg Asp Leu Thr
225 230 235 240
Gly Glu Arg Phe Leu Lys Thr Leu His Ser Ala Thr Lys Ser Val Ser
245 250 255
Val Asp Asn Thr Glu Ala Ser Arg Trp Gln Ser Gln Leu Leu Glu Arg
260 265 270
Pro Asp Leu Val Pro Phe Pro Ile Thr Leu Glu Ser Asn Met Asp Leu
275 280 285
Met Trp Phe Ile Thr Gln Gln Asp Lys Ile Gly Leu His Ile Gly Gly
290 295 300
Ile Ser Glu His Glu Phe Thr Ile Gly Cys Gly Gln Arg Gln Leu His
305 310 315 320
Tyr Phe Gln Arg Phe Leu Ser Asp Tyr Gln Thr Met Leu Ala Ser Lys
325 330 335
Arg Gln His Thr Ser Ser Leu Phe Leu Leu Arg Ser Ala Lys Ser Ile
340 345 350
Trp Ile Pro Ser Lys Asp Lys Gly Glu Pro Trp Asn Val His Gln Leu
355 360 365
Tyr Leu Ser Cys Thr Leu Asp Thr Arg Leu Leu Thr Ser Glu Gly Thr
370 375 380
Glu Leu Val Lys Gln Glu Val Ala Ala Gly Thr Thr Lys Lys Leu Val
385 390 395 400
Thr Met Gln Glu Lys Leu Asp Arg Thr Asp Asn Gln Asp Asn Tyr Val
405 410 415
Lys Arg Leu Gln Ser Thr Leu Asp Arg Leu Asp Arg Pro Phe Asn Arg
420 425 430
Pro Ser Lys Pro Leu Tyr Gln Gly Gln Ser Asn Ile Ile Val Ala Val
435 440 445
Ser Met Gly Leu Gln Ser Pro Val Thr Ala Ile Ala Ile Asp Ile Thr
450 455 460
Thr Gln Lys Ile Leu Ala Tyr Arg His Thr Lys Gln Leu Leu Gly Asp
465 470 475 480
Asp Tyr Arg Leu Val Asn Arg Gln Arg Asn Leu Gln Thr Gln Gln Arg
485 490 495
His Ser Ser His Lys Ala Gln Lys Gln Gly Leu Ser Arg Gln Cys Ser
500 505 510
Asn Ser Glu Leu Gly Glu His Leu Asp Arg Leu Phe Ala Lys Ala Ile
515 520 525
Val Glu Leu Ala Gln Thr Tyr Gln Ala Gly Ser Ile Ala Leu Pro Lys
530 535 540
Leu Asp Gln Ile Arg Leu Ser Ile Gln Ser Glu Ile Asp Thr Lys Ala
545 550 555 560
Gln Gln Lys Ile Pro Gly Tyr Val Glu Gly Gln Lys Lys Tyr Ala Lys
565 570 575
Gln Ile Arg Ile Asn Leu His Asn Trp Ser Tyr Asn Arg Val Ser Gln
580 585 590
Leu Ile Ile Asn Lys Ala Gly Gln Ser Gly Ile Ala Ile Glu Tyr Gly
595 600 605
Asp Gln Pro Ala Arg Ala Ser Pro Asn Val Arg Glu Ala Ser Arg Asn
610 615 620
Glu Asn Arg Ala Gly Glu Ile Ala Leu Ser Ala Tyr Ala Lys Arg Thr
625 630 635 640
Ile Pro
<210> 87
<211> 467
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-51 effector
<400> 87
Met Phe Pro Ser Phe Cys Ser Pro Pro Phe Leu Ser Tyr Phe Ser Thr
1 5 10 15
Pro Leu Asn Gly Tyr Asn Arg Cys Ala Ile Ser Tyr Leu Leu Lys Asn
20 25 30
Gly Cys Lys Ile Asn Asp Lys Glu Glu Asn Pro Glu Lys Phe Ala Gln
35 40 45
Arg Arg Arg Lys Leu Glu Ile Gln Ile Gln Arg Leu Thr Glu Lys Leu
50 55 60
Ala Ala Arg Ile Pro Lys Gly Arg Asp Leu Thr Asp Thr Gln Trp Leu
65 70 75 80
Glu Ala Leu Phe Thr Ala Thr Gln Thr Val Pro Glu Asn Glu Thr Glu
85 90 95
Ala Lys Phe Trp Gln Asn Ser Leu Leu Lys Lys Ser Ser Ser Val Pro
100 105 110
Phe Pro Val Ala Tyr Glu Thr Asn Glu Asp Leu Val Trp Val Lys Asn
115 120 125
Gln Phe Gly Arg Ile Cys Ile Lys Phe Ser Gly Leu Ser Glu His Thr
130 135 140
Phe Gln Ile Tyr Cys Asp Ser Arg Gln Leu His Trp Phe Gln Arg Leu
145 150 155 160
Leu Glu Asp Gln Lys Ile Lys Lys Asn Ser Lys Asn Gln His Ser Ser
165 170 175
Ala Leu Phe Thr Leu Arg Ser Gly Arg Ile Ser Trp Gln Glu Gly Glu
180 185 190
Asp Lys Gly Asp Pro Trp Asn Val His His Leu Thr Leu Tyr Cys Ser
195 200 205
Val Asp Thr Arg Leu Trp Thr Glu Glu Gly Thr Asn Leu Val Lys Glu
210 215 220
Glu Lys Ala Glu Glu Ile Ala Lys Thr Ile Thr Gln Thr Gln Ala Lys
225 230 235 240
Gly Asp Leu Asn Asp Asn Gln Gln Ala His Ile Lys Arg Lys Asn Ser
245 250 255
Ser Leu Ala Arg Ile Asn Asn Pro Phe Pro Arg Pro Ser Gln Pro Leu
260 265 270
Tyr Gln Gly Gln Ser His Ile Leu Val Gly Val Ser Leu Gly Leu Glu
275 280 285
Asn Pro Ala Thr Ile Ala Ile Val Asp Gly Thr Thr Ser Lys Val Leu
290 295 300
Thr Tyr Arg Asn Ile Lys Gln Ile Leu Gly Asp Asn Tyr Lys Leu Leu
305 310 315 320
Asn Lys Gln Arg Gln Gln Lys His Leu Leu Ser His Gln Arg His Ile
325 330 335
Ala Gln Arg Met Ala Ala Ser Asn Glu Phe Gly Asp Ser Glu Leu Gly
340 345 350
Glu Tyr Ile Asp Arg Leu Leu Ala Lys Glu Ile Ile Ala Ile Ala Gln
355 360 365
Thr Tyr Lys Ala Gly Ser Ile Val Leu Pro Lys Leu Gly Asp Met Arg
370 375 380
Glu Gln Val Gln Ser Glu Ile Lys Ala Lys Ala Glu Gln Lys Ser Asp
385 390 395 400
Leu Val Glu Val Gln Gln Lys Tyr Ala Lys Gln Tyr Arg Val Ser Val
405 410 415
His Gln Trp Ser Tyr Gly Arg Leu Ile Ala Asn Ile Gln Cys Gln Ala
420 425 430
Asn Lys Ala Gly Ile Val Ile Glu Glu Ala Lys Gln Pro Ile Arg Gly
435 440 445
Ser Pro Gln Glu Lys Ala Lys Glu Leu Ala Ile Asn Ala Tyr Gln Ser
450 455 460
Arg Lys Ala
465
<210> 88
<211> 814
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-52 effector
<400> 88
Met Ala Ile Arg Thr Met Glu Thr Asp Val Ile Val Arg Thr Ser Lys
1 5 10 15
Pro Arg Glu Ser Lys Arg Ser Ile Asp Asp Leu Val Leu Phe Asp Glu
20 25 30
Ala Ala Trp Cys Arg Val Cys Glu Phe Gly Tyr Gln His Thr Leu Phe
35 40 45
Val Asp Thr Ile Met Lys Gln Val Lys Gln Leu Pro Ile Asn Trp Leu
50 55 60
Tyr Thr Asn Gln Glu Leu Gln Lys Gln Asp Asp Thr Thr His Glu Thr
65 70 75 80
Glu Thr Lys Gln Gly Gln Asn Gly Leu Pro Glu Gly Leu Val Lys Ala
85 90 95
Leu His Asp Ala Leu Ala Ser Thr Pro Gln Leu Ser Lys Met Ser Gly
100 105 110
Arg Phe Tyr Ala Ser Ala Ile Asp Arg Val Glu Glu Ile Ile Glu Ser
115 120 125
Trp Phe Ala Ala His Gln Lys Leu Ile His Lys Leu Arg Gly Gln Arg
130 135 140
Arg Trp Leu Ala Ala Val Glu Ser Asp Thr Ala Leu Ala Glu Ser Ser
145 150 155 160
His Phe Ser Gln Tyr Glu Ile Glu Gln Arg Ala Ala Gln Ile Leu Ala
165 170 175
Glu Leu Glu Ala Lys Gly Glu Leu Thr Ala Ala Ser Gly Asn Gln Thr
180 185 190
Pro Phe Asn Val Leu Phe Lys Gln Phe Asp Glu Thr Glu Ala Val Leu
195 200 205
Ser Arg Arg Ala Ile Ile His Leu Leu Lys Asn Ile Asn Glu Val Gln
210 215 220
Val Lys Leu Lys Gln Pro Lys Lys Gly Lys Gly Arg Asn Lys Ala Ala
225 230 235 240
Gln Arg Ser Leu Thr Glu Arg Leu Glu Ala Lys Arg Val Glu Ile Glu
245 250 255
Arg Leu Glu Lys Gln Leu Leu Gly Gln Leu Pro Arg Ala Arg Asn Leu
260 265 270
Phe Pro Asp Gln Ala Phe Asp Gln Arg Leu Glu Ala Leu Ile Asp Met
275 280 285
Pro Leu Ser Glu Ala Thr Glu Leu Glu Arg Tyr Tyr Phe Leu Tyr Phe
290 295 300
Ser Leu Leu Leu Tyr Leu Ser Gly Ser Asn Thr Tyr Val Gln Leu Glu
305 310 315 320
Gln His Leu Leu Ile Ala Leu Val Leu Gln Trp Ser Lys Leu Asp Asp
325 330 335
Leu His Tyr Tyr Arg Ala Leu Asn Tyr Ser Phe Ile Leu Tyr Ala Ala
340 345 350
Ser Glu Gln Gln Tyr Leu Gln Leu Gly Ser Tyr Leu Leu Gln Ser Ile
355 360 365
Lys Ile Glu Ala Glu Arg Val Glu Ala Ala Phe Phe Ala Trp His Glu
370 375 380
Ser Ile Thr Pro Lys Leu Gln Asp Phe Leu Arg Glu Pro Lys Ala Leu
385 390 395 400
Pro Tyr Pro Ile Ser Phe Gly Tyr Glu Asp Val Arg Ser Trp His Val
405 410 415
Asn Gln Lys Gly Lys Ile Phe Phe Lys Leu Asn Gly Trp Gly Asp Leu
420 425 430
Leu Phe Glu Val Arg Cys His Arg Arg Gln Leu Ser Leu Ile Lys Thr
435 440 445
Phe Cys Lys Asp Trp Gln Thr Lys Asn Asn Ala Glu His Lys Gly Gln
450 455 460
Tyr Ser Gly Ser Leu Met Leu Leu Arg Ser Ile Glu Leu Ile Trp Lys
465 470 475 480
Pro Lys Lys Ala Ser Glu Gln Lys Asp Ala Gln Leu Cys Ser Gln Cys
485 490 495
Glu Val Phe Gln Gln Tyr Gly Gly Lys Gly Phe Trp Asn Glu Cys Lys
500 505 510
Leu Thr Ile His Trp Thr Phe Asp Thr Asp Gly Leu Thr Lys Gln Gly
515 520 525
Ser Glu Gln Ile Arg Gln Arg Lys Leu Lys Pro Gln Leu Lys Lys Leu
530 535 540
Gln Asp Asp Gln Ala Ala Leu Glu Gln Lys Gln Asp Arg Leu Asn Lys
545 550 555 560
Leu Glu Gln Gln Val Ala Glu Pro Ser Gln Ser Gln Ala Gln Leu Lys
565 570 575
Arg Leu Glu Pro Leu Lys Lys Glu Val Gln Lys Leu Gln Glu Lys Leu
580 585 590
Ala Lys Pro Arg Pro Lys Leu Asp Cys Leu Gln Ala Ala Lys Pro Phe
595 600 605
Asp Arg Pro Asp Arg Pro Leu Tyr Glu Gly Ile Pro Asn Ile Phe Val
610 615 620
Gly Val Leu Leu Asp Leu Asp Lys His Leu Val Val Thr Val Val Asp
625 630 635 640
Ala Met Arg Arg Lys Arg Leu Thr Leu Arg Ser Ala Arg Lys Val Ser
645 650 655
Pro Glu Gly Tyr Arg Leu Leu Gln Lys Tyr Phe Arg Gln Arg Gln Glu
660 665 670
His Ser Gln Gln Arg Gln Gln Asp Gln Lys Ala Gln Arg Arg Ser His
675 680 685
Gln Thr Glu Ser Gly Leu Gly Gln Gln Val Ala Arg Leu Phe Ala Lys
690 695 700
Gly Leu Val Glu Leu Ala Gln Ala Tyr Lys Ala Ser Thr Ile Val Ile
705 710 715 720
Pro Ile Thr Gly Gly Trp Arg Glu Arg Leu Tyr Ser Gln Leu Val Ala
725 730 735
Arg Ala Lys Ile Arg Cys Asn Gly Ser Lys Gln Ala Val Asp Arg Tyr
740 745 750
Thr Lys Glu His Gly Glu Arg Leu His Gln Trp Asp Tyr Asn Arg Leu
755 760 765
Ser Gln Ala Ile Thr Asp Cys Ala Ala Thr His Gly Ile Glu Ile Val
770 775 780
Leu Gln Lys Thr Val Phe Glu Ala Asp Val Phe Gln Gln Ser Ala Asn
785 790 795 800
Leu Ala Ile Ala Ala Tyr Asp Ser Leu Asn Ser Glu Pro Pro
805 810
<210> 89
<211> 637
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-53 effector
<400> 89
Ser Met Ser Gln Ile Thr Ile Gln Cys Gln Leu Phe Ala Asp Glu Ala
1 5 10 15
Ala Arg Lys Tyr Leu Trp Gln Leu Met Thr Asp Arg Asn Thr Pro Leu
20 25 30
Val Asn Glu Leu Leu Arg Leu Ile Ala Leu His Pro Asp Phe Leu Lys
35 40 45
Trp Arg Ser Ser Gly Lys Leu Pro Thr Thr Glu Val Thr Lys Leu Ala
50 55 60
Lys Thr Leu Lys Thr Asp Glu Arg Phe Asn Asn Gln Pro Ala Lys Phe
65 70 75 80
His Ile Ser Ala Glu Lys Thr Ala Ile Tyr Thr Phe Lys Ser Trp Leu
85 90 95
Ala Ile Gln Lys Arg Ala Gln Gln Gln Leu Glu Gly Lys Ile Ser Trp
100 105 110
Leu Arg Met Leu Arg Thr Asn Glu Glu Leu Val Ala Asp Cys Gly Gln
115 120 125
Asp Leu Ala Gln Ile Arg Thr Lys Ala Gln Ala Leu Ile Leu Gln Tyr
130 135 140
Gln Ser Ser Glu Asp Ser Ala Glu Ser Gln Lys Asn Phe Arg Lys Ser
145 150 155 160
Leu Tyr Gln Ala Tyr Asp Ile Ala Glu Pro Arg Leu Gly Ala Gln Asn
165 170 175
Glu Arg Ser Leu Thr Arg Ser Ala Ile Ala Tyr Leu Leu Lys Asn Arg
180 185 190
Cys His Ile Pro Ser Asp Thr Asp Glu Asp Leu Lys Lys Phe Leu Lys
195 200 205
Tyr Arg Arg Lys Ile Glu Asn Gln Val Lys Arg Leu Thr Gln Gln Leu
210 215 220
Glu Asn Arg Leu Pro Gln Gly Arg Asp Leu Thr Gly Lys Arg Phe Leu
225 230 235 240
Lys Thr Leu Asp Ser Ala Thr Lys Ser Val Pro Val Asp Asn Thr Glu
245 250 255
Ala Ser Arg Trp Gln Ser Gln Leu Leu Glu Arg Pro Asp Leu Val Pro
260 265 270
Phe Pro Ile Thr Leu Glu Ser Asn Met Asp Leu Met Trp Phe Ile Ala
275 280 285
Gln Gln Asp Lys Ile Gly Leu His Ile Gly Gly Ile Ser Glu His Glu
290 295 300
Phe Thr Ile Gly Cys Gly Gln Arg Gln Leu His Tyr Phe Gln Arg Phe
305 310 315 320
Leu Ser Asp Tyr Gln Thr Met Leu Ala Ser Lys Arg Gln His Thr Ser
325 330 335
Ser Leu Phe Leu Leu Arg Ser Ala Lys Leu Ile Trp Ile Pro Ser Lys
340 345 350
Asp Lys Gly Glu Pro Trp Asn Val His Gln Leu Tyr Leu Ser Cys Thr
355 360 365
Leu Asp Thr Arg Leu Leu Thr Ser Glu Gly Thr Glu Leu Val Lys Gln
370 375 380
Glu Val Ala Ala Gly Thr Thr Lys Lys Leu Val Thr Met Gln Glu Lys
385 390 395 400
Leu Asp Arg Thr Asp Thr Gln Asp Asn Tyr Val Lys Arg Leu Gln Ser
405 410 415
Thr Leu Asp Arg Leu Asp Arg Pro Phe Asn Arg Pro Ser Lys Pro Ser
420 425 430
Tyr Gln Gly Gln Ser Asn Ile Ile Val Ala Val Ser Met Gly Leu Gln
435 440 445
Ser Pro Val Thr Ala Ile Ala Ile Asp Ile Thr Thr Gln Lys Ile Leu
450 455 460
Ala Tyr Arg Asn Thr Lys Gln Leu Leu Gly Asp Asp Tyr Arg Leu Val
465 470 475 480
Asn Arg Gln Arg Asn Leu Gln Thr Gln Gln Arg His Leu Ser His Lys
485 490 495
Ala Gln Lys Gln Gly Leu Ser Arg Gln Cys Ser Asn Ser Glu Leu Gly
500 505 510
Glu His Leu Asp Arg Leu Phe Ala Lys Ala Ile Val Glu Leu Ala Gln
515 520 525
Thr Tyr Gln Ala Gly Ser Ile Ala Leu Pro Lys Leu Asp Gln Ile Arg
530 535 540
Leu Ser Ile Gln Ser Glu Ile Asp Thr Lys Ala Gln Gln Lys Ile Pro
545 550 555 560
Gly Tyr Val Glu Gly Gln Lys Lys Tyr Ala Lys Gln Ile Arg Ile Asn
565 570 575
Leu His Asn Trp Ser Tyr Asn Arg Val Ser Gln Leu Ile Ile Asn Lys
580 585 590
Ala Gly Gln Ser Gly Ile Ala Ile Glu Tyr Gly Asp Gln Pro Ala Arg
595 600 605
Ala Ser Pro Asn Val Arg Glu Ala Ser Arg Asn Glu Asn Arg Ala Arg
610 615 620
Glu Ile Ala Ile Ser Ala Tyr Ala Lys Arg Thr Ile Pro
625 630 635
<210> 90
<211> 376
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-2 effector intergenic region encoding tracrRNA
<400> 90
cacacaacag aaccttgata atagaatagt aaataattaa tagcgccgcc gttcatgctt 60
ctaggagcct ctgaaaggtg acaaatgcgg gttagtttgg ctgttgtcag acagtcttgc 120
tttctgaccc tggtagctgc ccaccccgaa gctgctgttc cttgtgaaca ggaattaggt 180
gcgcccccag taataagggt atgggtttac cacagtggtg gctactgaat cacctccgag 240
caaggaggaa cccactttaa ttttttttcg taaagccaag cgggagccaa aaccctaggg 300
ggtttacgaa agtctcacga ttcttacatt gagtaagttt cagtgttttt gggatggtta 360
accctttatt tacaag 376
<210> 91
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-4 effector intergenic region encoding tracrRNA
<400> 91
tatacaaacg tttgaacctg gaaaatagaa taatgagaaa tagcgccgct tgttcatgcg 60
cgaaagcgtc tctgaacagt gtaaatgtgg gttagtttga ctgtcgtgaa gacggtcttg 120
ctttctgacc ctggtagctg cccaccttga agctgctgtc tcttgtagac aggaatcagg 180
tgcgccccca gtaatatagg tgcgggttta ccgcagtggt ggctacccaa tcacctccga 240
gcaaggagga acccacctta attatttttt ggcaaaccaa agtgggagca atttcactgg 300
gaggttcgcc aagttttcaa acaacttatt ttgtagaggt tttgccgttt tctgctaaga 360
aaagattttc ttgtccagat gcagtgataa 390
<210> 92
<211> 462
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-6 effector intergenic region encoding tracrRNA
<400> 92
gatttatcag taccgtacct ggaaaattga atataattga taacagcgcc gcaggtcatg 60
ccgtcaaaag cctctgaact gtgttaaatg ggggttagtt tgactgttga aagacagttg 120
tgctttctga ccctggtagc tgcccaccct gatgctgcta tctttcggga taggaataag 180
gtgcgctccc agtaataggg gtgtagatgt actacagtgg tggctactaa atcacctccg 240
accaaggagg aatccatcct taatttttta ttttttcgtg aacctaagcg agagcaaaat 300
ctctaggagg ttcacgaaaa agctgaatcc ttcatggaat atgagtttca gtttgttagt 360
gggatgatgg cttctcctga aaaggagaaa tggagtaaga attttagagg tttacgaaaa 420
tgacctttaa aagctacttc aggcaagtgt tacagcgctc gc 462
<210> 93
<211> 456
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-7 effector intergenic region encoding tracrRNA
<400> 93
tcaaaaagac cgtaccttga aaatataatg gtaacaaaca gcgccgcagt tcatgcgtct 60
tatggcgcct ctgtgctgtg caaaatgtgg gttagtttga ctgttggaag acagtcttgc 120
tttctgaccc tggtagctgc ccaccttgaa gctgctatcc cttgtggata ggaatcaggt 180
gcgcccccag taatagaggt gcgggtttac cgcagtggtg gctaccgaat cacctccgag 240
caaggaggaa cccaccttaa ttattttttt ggcatggcaa agcgggagcg attttaccgg 300
gactgatgcc aaagcttcaa atctttttat tgacaaggtt tctagacttt tgtttgtcac 360
ttgatttatt tttttaattg tcaactagca agtgattttg gtagttttgc caaaagtgtc 420
tctaggaatc ttgataaata aagggtttta ggcgcg 456
<210> 94
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-2 effector target CRISPR repeat
<400> 94
gtttcaacga ccatcccaac taggggtggg ttgaaag 37
<210> 95
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-4 effector target CRISPR repeat
<400> 95
gtttcaactt tccttccagc tagaggcggg ttgaaag 37
<210> 96
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-6 effector target CRISPR repeat
<400> 96
gtttcaacca ccatctcaac tagggatggg ttgaaag 37
<210> 97
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-7 effector target CRISPR repeat
<400> 97
gtttcaacgc cccttcaagc tttgggcggg ttgaaagc 38
<210> 98
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG108-1 effector target CRISPR repeat
<400> 98
gttgcgatcg ccgctccggt ggcgatgggg ttgaaag 37
<210> 99
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG110-1-6 effector target CRISPR repeat
<400> 99
gtgacctgcc gcataggcag ctggtaaa 28
<210> 100
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG110-2-6 effector target CRISPR repeat
<400> 100
tatgaactgc cgcataggca gccaaga 27
<210> 101
<211> 922
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-13-B transposition protein
<400> 101
Met Leu Ser Ser Gln Ala Phe Asn Asp Trp Cys Gln Arg Leu Gln Ile
1 5 10 15
Asn Ser Val Ala Arg Ala Val Ile Glu Gln Val Arg Asn Ala Ala Pro
20 25 30
Ser Arg Gln Val Gln Gly Arg Arg Lys Asn Val Cys Gly Ser Tyr Pro
35 40 45
Ser Arg Lys Met Gly Val Thr Ile Gln Phe Glu Ser His Arg Asn Glu
50 55 60
Leu Ala Arg Ile His Glu Leu Glu His Asp Gln Thr Val Leu Glu Tyr
65 70 75 80
Tyr Asp Gln Pro Pro Pro Ile Glu Leu Val Tyr Ser Ser Lys Thr Gly
85 90 95
Arg Arg Thr Arg His Gln Tyr Thr Pro Asp Phe Phe Val Leu Arg Thr
100 105 110
Asp Gly Val Glu Trp Glu Glu Cys Lys Thr Glu Thr Glu Leu Ile Lys
115 120 125
Leu Ala Gln Glu Asn Ser Asn Arg Tyr Cys Gln Asp Val Glu Gly Lys
130 135 140
Trp His Cys Pro Pro Gly Glu Ala Tyr Ala Gln Val Phe Gly Phe Gln
145 150 155 160
Phe Arg Val Trp Cys Asn Ser Glu Ile Asn Trp Val Leu Gln Asp Asn
165 170 175
Trp Val Trp Leu Glu Asp Tyr Leu Gly Val Glu Val Pro Ser Val Ser
180 185 190
Pro Ala Ala Leu Gln Ala Leu Gln Arg His Leu Gln Gln Thr Pro Gly
195 200 205
Ile Cys Val Ser Glu Leu Leu Ala Val Glu Pro Thr Val Ser Pro Asp
210 215 220
His Leu Tyr His Leu Ile Ala Thr Glu Gln Val Tyr Val Glu Leu Ala
225 230 235 240
Ala Ala Arg Leu Ser Glu Pro Glu Gln Val Arg Val Phe Leu Asp Gln
245 250 255
Asp Met Ala Gln Ala Phe His Arg Ile Gln Gly Glu Phe Glu Leu Val
260 265 270
Gln Thr Asn Lys Gln Ser Met Leu Asn Phe Ser Ile Gly Thr Phe Leu
275 280 285
His Trp Asp Glu Val Glu Trp Glu Val Ile Asn Ile Gly Ala Asn Thr
290 295 300
Val Gly Leu Leu Arg Ser Glu Gly Glu Val Ile Glu Leu Ala Lys Pro
305 310 315 320
Thr Leu Glu Asn Leu Val Ser Arg Gln Arg Ile Val Ala Ser Tyr Asn
325 330 335
Ser Glu Asn Ile Glu Lys Gln Lys Ile Ile Asn Asp Lys Ile Lys Ala
340 345 350
Ile Leu Gln Glu Ala Thr Ser Ala Glu Ile Ala Glu Ala Asn Arg Arg
355 360 365
Tyr Asp Leu Ile Gln Ala Cys Ser Asn Thr Ser Arg His Pro Ser Ser
370 375 380
Thr Val Arg Arg Trp Gln Asn Gln Tyr Gln Lys Ala Glu Lys Ile Tyr
385 390 395 400
Gly Asn Gly Tyr Val Gly Leu Leu Pro Arg Tyr His Thr Lys Gly Asn
405 410 415
Arg Thr Met Arg Ile Asp Asp Ile Ala Tyr Gln Phe Met Ile Glu Phe
420 425 430
Ile Glu Gln His Tyr Glu Asn Pro Lys Gln Arg Arg Lys Gln Arg Val
435 440 445
Tyr Glu Ala Phe Val Ser Ala Cys Glu Ala His Glu Pro Lys Leu Ile
450 455 460
Pro Pro Ser Arg Ile Thr Phe Ser Gln Ala Ile Asp Lys Arg Gly Gly
465 470 475 480
Gln Ala Gln Thr Leu Lys Arg Glu Gly Arg Arg Ala Ala Ile Ala Lys
485 490 495
Glu Ala Phe Tyr Trp Gln Leu Glu Arg Thr Thr Pro Gln His Gly Ser
500 505 510
Arg Pro Phe Glu Ile Val His Leu Asp His Thr Gln Leu Asp Ile Glu
515 520 525
Leu Met Ser Ser Leu Ser Thr Leu Ala Val Gln Pro Leu Ala Ser Asn
530 535 540
His Arg Thr Leu Ser Gln Asn Leu Gly Arg Pro Trp Ala Thr Phe Met
545 550 555 560
Val Asp Ala Tyr Ser Arg Arg Leu Leu Ala Val Tyr Leu Thr Tyr Glu
565 570 575
Glu Pro Ser Tyr Arg Ser Cys Met Met Ala Leu Arg Ile Cys Val Gln
580 585 590
Arg Phe Glu Arg Leu Pro Gln Ile Leu Val Val Asp Asn Gly Val Glu
595 600 605
Phe His Ser His Tyr Phe Glu Glu Leu Leu Ala Tyr Tyr Ala Cys Thr
610 615 620
Lys Lys His Arg Pro Pro Ala Met Ala Arg Phe Gly Ser Val Val Glu
625 630 635 640
Arg Leu Phe Gly Thr Ala Asn Thr Gln Phe Val His Glu Leu Gln Gly
645 650 655
Asn Thr Gln Ile Thr Arg Gln Val Arg Gln Val Thr Gln Ser Ile Asn
660 665 670
Pro Lys Arg Leu Ala Ile Trp Thr Leu Ser Asp Leu Tyr Pro Ala Leu
675 680 685
Cys Glu Trp Ala Tyr Glu Ile Tyr Asp Gln Arg Glu His Pro Ala Leu
690 695 700
Gly Gln Ser Pro His Asp Ile Phe Thr Gln Gly Leu Ala Leu Gly Gly
705 710 715 720
Thr Arg Asp His Arg Arg Val Glu Asn Asn Glu Val Phe Gln Ile Leu
725 730 735
Thr Leu Pro Ala Pro Asp Gln Arg Arg Arg Lys Val Gln Ala Gly Arg
740 745 750
Gly Val Lys Ile His Asn Ile Tyr Tyr Trp Ser Asn Ala Phe Arg Asp
755 760 765
Pro Lys Val Glu Gly Ser Gln Val Glu Val Lys Tyr Asp Pro Phe Asp
770 775 780
Ala Ser Ile Ala Tyr Ala Phe Val His His Gln Trp Val Lys Cys Ile
785 790 795 800
Ser Thr Tyr Cys Ala Asp Leu Gln Gly Arg Ser Glu Arg Glu Leu Arg
805 810 815
Leu Val Ser Glu Glu Leu Arg Gln Arg Gln Arg Val Ala Gly Cys Arg
820 825 830
His Ser Leu Ser Asp Lys Glu Leu Val Glu Phe Leu Asn Ser Gln His
835 840 845
Ala Lys Glu Gly Gln Phe Leu Gln Arg Arg Leu Gln Ala Val Glu Gln
850 855 860
Leu Ala Val Leu Gln Gln Leu Asp Pro Pro Val Asp Asp Ala Asp Ala
865 870 875 880
Glu Ser Gln Gln Ile Glu Phe Gly Gly Asp Ala Gln Pro Ser Cys Asn
885 890 895
Gly Asn Ser Pro Gln Thr Ala Gln Thr Val Pro Ala Ile Val Asn Phe
900 905 910
Ala Val Pro Pro Glu Phe Tyr Gly Glu Phe
915 920
<210> 102
<211> 364
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-13-C transposition protein
<400> 102
Met Ala Val Gln Asp Gly Phe Pro Tyr Glu Leu Leu Asp Gln Pro Ile
1 5 10 15
Thr Asp Arg Val Ala Tyr Phe Arg His Tyr Thr Met Ala His Pro Val
20 25 30
Leu Leu Asn Ala Ala Gln Ile Leu Met Gln Thr Val Arg Glu Pro Ala
35 40 45
Gly Ile Ser Leu Val Phe Val Phe Gly Pro Thr Gly Val Gly Lys Ser
50 55 60
Thr Leu Leu Arg Arg Val Ser Gln Lys Leu Thr Glu Ala Met Phe Ala
65 70 75 80
Ala Leu Gln Gln Asp Gln Gly Arg Ile Pro Met Thr Gly Ile Glu Ala
85 90 95
Ala Thr Pro Glu Phe Gly Gln Phe Asp Trp Lys Asp Phe Tyr Leu Arg
100 105 110
Ala Leu Ala Ala Val Gln Glu Pro Phe Ile Tyr Pro Trp Ser Thr Ser
115 120 125
Arg Leu Thr Thr Leu Lys Leu Arg Leu Ala Leu Glu His Ala Leu Arg
130 135 140
Lys Arg Gln Leu Gln Val Phe Tyr Ile Asp Glu Ala Gln Asn Phe Ala
145 150 155 160
Lys Val Ala Ser Ala Arg Lys Leu Ser Asp Gln Thr Asp Ala Ile Lys
165 170 175
Ser Leu Ala Asn Leu Thr Gly Val Gln Phe Val Leu Thr Gly Thr Tyr
180 185 190
Glu Val Leu Met Leu Arg Asn Leu Ser Ala Gln Leu Cys Arg Arg Ser
195 200 205
Ile Asp Ile His Phe Pro Arg Tyr Arg Ala Glu Ile Pro Glu Asp Leu
210 215 220
Gln Ser Phe Arg Gly Ile Val Gln Thr Phe Gln Arg His Leu Pro Leu
225 230 235 240
Pro Gln Glu Pro Asn Leu Leu Glu Gln Trp Glu Phe Cys Tyr Glu Arg
245 250 255
Ser Leu Gly Cys Val Gly Ile Leu Lys Asp Trp Leu Ser Arg Ala Leu
260 265 270
Val Ala Thr Leu Glu Ala Gly Ala Lys Thr Leu Thr Pro Gln Met Leu
275 280 285
Glu Gln His Ala Trp Ser Leu Glu Arg Cys Met Ile Met Leu Ala Glu
290 295 300
Ala Lys Glu Glu Glu Lys Lys Leu Glu Val Gln Pro Leu Gln Ser Ala
305 310 315 320
Leu Arg Ile Ala Leu Gly Leu Glu Thr Ala Val Val Glu Pro Ala Ser
325 330 335
Pro Pro Thr Pro Ser Val Ser Pro Arg Arg Thr Ala Ile Ser Ala Lys
340 345 350
Pro Lys Arg Tyr Pro Val Gly Gly Gly Gln His Asp
355 360
<210> 103
<211> 267
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-13-Q transposition protein
<400> 103
Met Ile Glu Val Pro Ser Ile Phe Glu Ser Trp Ser Leu Glu Thr Phe
1 5 10 15
Gln Leu Pro Arg Arg Ser His Leu Tyr Ser Leu Ser Pro Ala Gly Leu
20 25 30
Ala Thr Asp Ala Ile Glu Ser Leu Thr Ser Tyr Leu Thr Arg Leu Ala
35 40 45
Glu Ala His Arg Val Ser Val Arg Lys Leu Leu Asp Glu Lys Ile Leu
50 55 60
Leu Leu Leu Lys Pro Pro Arg Thr Phe Lys Tyr Glu Ile Gln Ser Ala
65 70 75 80
Gln Ser Trp Leu Ala Ala Thr Pro Glu Val Ala Lys Ala Val Glu Cys
85 90 95
Leu Arg Arg Leu Thr Leu Arg Gln Asp Leu Gln His Leu Thr Leu Leu
100 105 110
Pro Trp Gln His Gln Leu Ser Thr Pro Ser Val Phe His Asp Val Gln
115 120 125
Pro Phe Cys Pro Val Cys Phe Glu Glu Ala Arg Asn Thr Asp Ala Ala
130 135 140
Val Tyr Glu Pro Leu Leu Trp Thr Leu Glu Ala Val Lys Val Cys Leu
145 150 155 160
Arg His Arg Arg Tyr Leu Gln Phe Cys Cys Thr Tyr Cys Gly Arg Lys
165 170 175
Gln Pro Phe Leu Lys Leu Glu Ala Arg Pro Gly His Cys Ala His Cys
180 185 190
Gly Ser Trp Leu Gly Leu Glu Leu Pro Phe Phe Val Ser Thr Glu Pro
195 200 205
Glu Glu Leu Asp Trp His Ile Asn Leu Ala Gln Met Leu Gly Gln Arg
210 215 220
Leu Gln Ala Ala Trp Gln Arg Thr Asn Gln Ser Leu Ser Lys Ala Lys
225 230 235 240
Arg Ser Lys Gln Ala Gln Lys Pro Ser Leu Met Ser Leu Leu Glu Ser
245 250 255
Arg Tyr Glu Leu Asp Glu Ile Lys Leu Val Tyr
260 265
<210> 104
<211> 218
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-54 effector
<400> 104
Met Thr Ile Ile Thr Val Gln Cys Arg Leu Lys Ala Pro Glu Ala Thr
1 5 10 15
Arg Arg Thr Leu Trp Glu Leu Met Ala Gly Arg Asn Thr Pro Leu Ile
20 25 30
Asn Lys Leu Ile Glu Leu Leu Arg Gly His Pro Asp Leu Asp Lys Trp
35 40 45
Arg Asp Lys Gly Lys Leu Pro Ala Gly Val Val Gly Glu Leu Cys Lys
50 55 60
Thr Leu Lys Ala Asp Pro Leu Tyr Asn Gly Gln Pro Ser Asn Ala Tyr
65 70 75 80
Lys Ser Ala Val Glu Thr Val Glu Glu Gln Phe Glu Ser Leu Leu Ala
85 90 95
Leu His Leu Glu Leu Lys Glu Lys Leu Arg Ile Lys Thr Arg Arg Leu
100 105 110
Ala Ile Phe Lys Ser Asn Ala Glu Leu Met Gln Leu Ser Gly Leu Thr
115 120 125
Leu Asp Asp Met Lys Lys Arg Ala Gly Glu Val Leu Asn Glu Leu Lys
130 135 140
Glu Asp Glu Arg Lys Lys Pro Ile Gly Thr Leu Tyr Arg Lys Tyr Glu
145 150 155 160
Leu Leu Phe Phe Asp Asp Pro Asp Arg Trp Ala Val Cys Tyr Leu Ile
165 170 175
Lys Asn Gly Gly Lys Leu Pro Lys Gly Lys Glu Asp Pro Glu Lys Phe
180 185 190
Glu Lys Ser Arg Arg Lys Leu Glu Ile Met Val Gln Lys Leu Thr Met
195 200 205
Arg Leu Asp Ser Cys Leu Pro Gly Gly Arg
210 215
<210> 105
<211> 541
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-54-B transposition protein
<400> 105
Met Asp Lys Thr Asn Asn Pro Thr Leu Thr Glu Gly Leu Glu Gly Glu
1 5 10 15
Ala Ala Leu Arg Leu Glu Val Ile Thr Asp Leu Leu Gln Pro Cys Asp
20 25 30
Arg Ser Thr Tyr Gly Gln Arg Leu Arg Glu Gly Ala Ala Lys Leu Gly
35 40 45
Ile Ser Val Arg Ser Leu Gln Arg Leu Phe Lys Arg Tyr Gln Glu Glu
50 55 60
Gly Leu Ser Ala Leu Met Ser Gly Pro Arg Arg Asp Arg Gly Ala His
65 70 75 80
Arg Ile Gly Glu Glu Trp Ile Gln Phe Ile Val Lys Thr Tyr Gln Asp
85 90 95
Gly Asn Lys Gly Ser Lys Arg Leu Thr Pro Lys Gln Val Ala Ile Arg
100 105 110
Val Arg Ala Gln Ala His Gln Lys Gly Gln Glu Ser Tyr Pro Ser Tyr
115 120 125
Arg Thr Val Leu Arg Val Leu Glu Pro Ser Ile Glu Asn Lys Asn Lys
130 135 140
Ser Ile Arg Ser Pro Gly Trp Arg Gly Glu Ala Leu Ser Leu Lys Thr
145 150 155 160
Arg Asp Gly Asp Ala Leu Glu Ala Ile Arg Ser Asn Gln Val Trp Gln
165 170 175
Cys Asp His Thr Arg Ala Asp Val Leu Leu Val Asp Arg Glu Gly Arg
180 185 190
Leu Ile Gly Arg Pro Trp Leu Thr Thr Val Ile Asp Ser Tyr Ser Arg
195 200 205
Cys Ile Val Gly Ile Asp Leu Ser Phe Asp Ala Pro Ser Ser Gln Lys
210 215 220
Val Ala Leu Ala Leu Arg His Ala Ile Leu Pro Lys Leu Tyr Gly Ala
225 230 235 240
Glu Tyr Lys Leu Asn Cys Glu Trp Asn Ala Tyr Gly Lys Pro Glu Cys
245 250 255
Leu Phe Thr Asp Gly Gly Lys Asp Phe Arg Ser Asn His Leu Ala Glu
260 265 270
Ile Ala Ala Gln Leu Gly Phe Ile Leu Lys Leu Arg Asp Arg Pro Ser
275 280 285
Glu Gly Gly Ile Val Glu Arg Pro Phe Lys Thr Leu Asn Gln Ser Leu
290 295 300
Phe Ser Thr Leu Pro Gly Tyr Thr Gly Pro Asn Val Lys Glu Arg Pro
305 310 315 320
Glu Asp Ala Glu Lys Glu Ala Thr Leu Thr Leu Arg Glu Leu Glu Ile
325 330 335
Leu Ile Val Arg Tyr Ile Val Asp Asn Tyr Asn Gln Lys Gln Asp Ala
340 345 350
Arg Thr Gly Asp Gln Thr Arg Ala Gln Arg Trp Glu Gly Gly Ile Asp
355 360 365
Leu Pro Glu Pro Leu Ser Glu Arg Glu Leu Asp Ile Cys Leu Leu Lys
370 375 380
Ser Thr Arg Arg Lys Ile Gln Arg Gly Gly His Leu Gln Phe Glu Asn
385 390 395 400
Ile Thr Tyr Arg Gly Glu His Leu Gly Gly Tyr Glu Gly Asp Tyr Met
405 410 415
Asn Leu Arg Tyr Asp Pro Arg Asp Ile Thr Ser Ile Trp Val Tyr Arg
420 425 430
Gln Glu Ser Ser Gly Asp Val Phe Leu Cys Arg Ala His Ala Val Gly
435 440 445
Leu Gln Thr Glu Ile Leu Ser Leu Asn Asp Ala Gln Ala Ala Ala Lys
450 455 460
Arg Leu Arg Asp Lys Gly Arg Gly Leu Asp Asn Asn Ser Ile Leu Gln
465 470 475 480
Glu Ser Ile Glu Arg Glu Ala Thr Val Thr Lys Asn Leu Gln Arg Arg
485 490 495
Lys Lys Glu Glu Gln Ala Tyr Lys Thr Pro Thr Pro Ala Pro Glu Glu
500 505 510
Lys Val Glu Leu Thr Pro Glu Val Ser Lys Ile Glu Asp Ile Glu His
515 520 525
Leu Glu Val Trp Asp Leu Asp Glu Leu Asn Gly Trp Gly
530 535 540
<210> 106
<211> 268
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-54-C transposition protein
<400> 106
Met Glu Asp Lys Lys Leu Pro Ile Asp Gln Glu Trp Leu Asn Gly Glu
1 5 10 15
Ile Ala Arg Leu Asn Lys Lys Thr Val Ile Pro Ile Glu Gln Val Lys
20 25 30
Ser Leu His Asp Trp Leu Asp Glu Lys Arg Ala Ala Arg Gln Ser Cys
35 40 45
Arg Val Val Gly Glu Ser Arg Thr Gly Lys Thr Val Thr Cys Gln Ser
50 55 60
Tyr Ala Leu Arg Asn Thr Pro Arg Leu Ser Gly Asn Thr Pro Pro Asn
65 70 75 80
Leu Pro Val Val Tyr Val Val Pro Ala Gln Lys Cys Gly Pro Lys Asp
85 90 95
Phe Phe Gly Ala Ile Ile Gly Ala Leu Ile Tyr Arg Ala Val Lys Gly
100 105 110
Ser Thr Ser Glu Leu Arg Asn Arg Ala Thr Glu Ile Leu Lys Ser Cys
115 120 125
Gly Val Glu Met Leu Ile Ile Asp Glu Ala Asp Arg Leu Arg Pro Glu
130 135 140
Thr Phe Ser Glu Val Arg Asp Ile Tyr Asp Asn Leu Glu Ile Ala Val
145 150 155 160
Val Leu Val Gly Thr Asp Arg Leu Asp Ala Ala Ile Lys Arg Asp Glu
165 170 175
Gln Val Tyr Asn Arg Phe Ser Ala Cys Arg Arg Phe Gly Leu Leu Thr
180 185 190
Gly Glu Asp Phe Ile Arg Ala Val Ala Ile Trp Glu Asp Lys Ile Leu
195 200 205
Lys Leu Pro Val Ala Ser Asn Leu Thr Ser Lys Glu Thr Leu Lys Ile
210 215 220
Leu Thr Arg Gly Thr Gly Gly Tyr Ile Gly Lys Leu Asp Gln Ile Leu
225 230 235 240
Lys Gly Ala Ala Ile Arg Ser Leu Arg Lys Gly His Lys Arg Val Glu
245 250 255
Thr Glu Val Leu Lys Glu Val Val Lys Glu Phe Ser
260 265
<210> 107
<211> 178
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-54-Q transposition protein
<400> 107
Met Ser Glu Asp Ile Lys Pro Trp Leu Leu Pro Val Gln Pro Glu Pro
1 5 10 15
Gly Glu Ser Leu Ser Ser Phe Leu Gly Arg Val Arg Gln Arg Asn His
20 25 30
Leu Thr Ala Gly Ala Leu Gly Asn Ile Thr Arg Leu Gly Ala Thr Ile
35 40 45
Ala Arg Trp Glu Lys Phe Tyr Leu Asn Pro Phe Pro Ser Ala Ala Gln
50 55 60
Leu Glu Ala Met Ala Ala Ile Val Gly Leu Thr Gly Glu Phe Ile Arg
65 70 75 80
Asp Met Leu Pro Pro Thr Gly Glu Ala Met Lys Cys Glu Pro Ile Arg
85 90 95
Leu Cys Pro Glu Cys Tyr Ala Glu Ser Pro Tyr His Arg Leu Gln Trp
100 105 110
Gln Phe Gln Ser Val Trp Lys Cys Thr Ser His Gly Asn Lys Leu Leu
115 120 125
Ser Lys Cys Pro Val Cys Ser Ala Ser Phe Gly Ile Pro Ser Asn Trp
130 135 140
Asn Gly Tyr Cys Arg Arg Cys Gly Thr Pro Phe Glu Leu Met Arg Ala
145 150 155 160
Arg Ser Glu Ser Ile Pro Ala Leu Ser Pro Val Asp Asp Lys Gly Tyr
165 170 175
Asp Arg
<210> 108
<211> 638
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG108 effector sequence
<220>
<223> MG108-2 effector
<400> 108
Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Ser Glu Ser Thr
1 5 10 15
Arg Arg Glu Leu Trp Glu Leu Met Ala Glu Lys Asn Thr Pro Leu Ile
20 25 30
Asn Glu Leu Leu Glu Gln Ile Gly His His Pro Asp Phe Glu Thr Trp
35 40 45
Arg Glu Lys Gly Lys Leu Pro Ala Asp Val Val Lys Gln Leu Ala Glu
50 55 60
Pro Leu Lys Thr Asp Pro Arg Phe Ile Gly Gln Pro Gly Arg Phe Tyr
65 70 75 80
Thr Ser Ala Ile Ala Leu Val Lys Tyr Ile Tyr Lys Ser Trp Phe Ala
85 90 95
Val Met Met Gln Leu Gln Tyr Gln Leu Lys Gly Lys Ile Arg Trp Leu
100 105 110
Glu Met Leu Lys Ser Asp Glu Glu Leu Val Glu Thr Ser Gly Ile Thr
115 120 125
Leu Asp Asn Leu Arg Ile Lys Ala Ala Glu Ile Leu Ala Gln Cys Thr
130 135 140
Pro Gln Pro Asp Ser Val Glu Ser Gln Glu Lys Lys Ser Lys Lys Arg
145 150 155 160
Lys Lys Gly Lys Lys Thr Lys Lys Ser Asp Ser Gln Pro Ser Leu Ser
165 170 175
Lys Asn Leu Phe Asp Thr Tyr Asp Ser Thr Glu Asp Ile Ile Ser Lys
180 185 190
Ser Ala Ile Val Tyr Leu Leu Lys Asn Gly Cys Lys Leu Thr Asp Lys
195 200 205
Glu Glu Asp Pro Lys Glu Phe Ala Lys Arg Arg Arg Thr Thr Glu Ile
210 215 220
Gln Ile Gln Arg Leu Thr Glu Gln Leu Ser Ala Arg Ile Pro Lys Gly
225 230 235 240
Arg Asp Leu Thr Asn Ala Lys Trp Leu Glu Thr Leu Ala Ile Ala Thr
245 250 255
Glu Asn Ala Pro Glu Asn Glu Thr Glu Ala Lys Ser Trp Gln Asn Lys
260 265 270
Leu Leu Arg Lys Ser Ala Ser Val Pro Phe Pro Val Ser Tyr Glu Thr
275 280 285
Asn Glu Asp Leu Thr Trp Phe Lys Asn Asn Lys Gly Arg Leu Cys Val
290 295 300
Tyr Phe Asn Gly Leu Ser Glu His Ile Phe Gln Ile Tyr Cys Asp Ser
305 310 315 320
Gln His Leu His Trp Phe Gln Arg Phe Leu Ala Asp Gln Glu Val Lys
325 330 335
Glu Asn Ser Lys Asn Gln His Ser Ala Ser Leu Phe Thr Leu Arg Ala
340 345 350
Gly Lys Ile Val Trp Gln Glu Gly Glu Gly Lys Gly Glu Pro Trp Asn
355 360 365
Ile Asn His Leu Thr Leu His Cys Ser Val Asp Thr Arg Leu Trp Thr
370 375 380
Ala Glu Gly Thr Gln Gln Val Arg Lys Glu Lys Glu Val Glu Ile Ile
385 390 395 400
Lys Phe Leu Asn Lys Asn Lys Asp Arg Ser Asp Leu Ser Lys Asn Gln
405 410 415
Lys Ala Asn Ile Lys Arg Gln Asn Ser Thr Leu Val Lys Ile Ala Asn
420 425 430
Pro Phe Pro Arg Pro Ser Gln Pro Leu Tyr Gln Gly Gln Gly Gln Ile
435 440 445
Leu Val Gly Val Ser Ile Gly Leu Glu Ser Pro Ala Thr Leu Ala Val
450 455 460
Val Asp Ala Ile Thr Lys Lys Val Ile Thr Tyr Arg Ser Ile Arg Gln
465 470 475 480
Leu Leu Gly Glu Asn Tyr Arg Leu Leu Asn Arg Gln Arg Arg Gln Lys
485 490 495
Gln Ser Leu Ser His Gln Arg Gln Lys Ala Gln Arg Leu Ala Asp Gly
500 505 510
Asn Gln Leu Gly Glu Ser Glu Leu Gly Gln Tyr Ile Asp Arg Leu Ile
515 520 525
Ala Lys Lys Ile Val Val Ile Ala Ala Ala Tyr Asn Ala Gly Ser Ile
530 535 540
Val Leu Pro Lys Leu Gly Asn Val Arg Gln Ile Ile Gln Ser Glu Met
545 550 555 560
Asp Ala Leu Ala Glu Gln Lys Cys Pro Glu Tyr Lys Glu Gly Gln Lys
565 570 575
Lys Tyr Ala Lys Gln Tyr Arg Ile Asn Ile His Gln Trp Ser Tyr Gly
580 585 590
Arg Leu Ile Glu Cys Val Lys Thr Gln Ala Ala Lys Ile Gly Ile Val
595 600 605
Ile Glu Glu Ala Lys Gln Ser Ile Arg Gly Ser Pro Gln Glu Lys Ala
610 615 620
Lys Glu Leu Ala Leu Ala Ala Tyr Asp Ser Arg Ser Asn Asp
625 630 635
<210> 109
<211> 572
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG108 transposition protein sequence
<220>
<223> MG108-2-B transposition protein
<400> 109
Met Tyr Met Gln Asp Asp Arg Thr Arg Ser Ala Glu Ile Pro Ala Pro
1 5 10 15
Ser Ser Gly Glu Gly Asn Ser Glu Val Glu Thr Ser Glu Val Ile Thr
20 25 30
Glu Leu Pro Leu Glu Ala Arg Leu Lys Gln Glu Ile Ile Gln Ser Leu
35 40 45
Leu Glu Pro Cys Asp Arg Ile Thr Tyr Gly Gln Arg Gln Arg Glu Ala
50 55 60
Ala Glu Lys Leu Gly Val Ser Val Arg Thr Val Arg Arg Leu Val Lys
65 70 75 80
Lys Trp Glu Glu Lys Gly Leu Glu Ala Leu Thr Gln Thr Ala Arg Thr
85 90 95
Asp Lys Gly Lys His Arg Ile Asp Glu Glu Trp Gln Glu Phe Ile Ile
100 105 110
Lys Thr Tyr Lys Glu Gly Asn Lys Gly Ser Lys Arg Ile Thr Pro Lys
115 120 125
Gln Val Ala Val Arg Val Gln Val Arg Ala Ala Gln Leu Gly Glu Glu
130 135 140
Lys Tyr Pro Ser Tyr Arg Thr Val Tyr Arg Val Leu Glu Pro Ile Ile
145 150 155 160
Glu Gln Gln Glu Gln Thr Gln Asn Ile Arg Ser Arg Gly Trp Arg Gly
165 170 175
Ser Arg Leu Ser Val Lys Thr Arg Thr Gly Gln Asp Leu Ser Val Glu
180 185 190
Tyr Ser Asn His Val Trp Gln Cys Asp His Thr Arg Val Asp Val Leu
195 200 205
Leu Val Asp Arg His Ser Lys Ile Leu Gly Arg Pro Trp Leu Thr Thr
210 215 220
Val Ile Asp Thr Tyr Ser Arg Cys Ile Val Gly Ile Asn Leu Gly Phe
225 230 235 240
Asp Ala Pro Ser Ser Gln Val Val Ala Leu Ala Leu Arg His Ala Ile
245 250 255
Leu Pro Lys Gln Tyr Gly Leu Glu Tyr Lys Leu His Cys Glu Trp Gly
260 265 270
Thr Phe Gly Lys Pro Glu His Phe Tyr Thr Asp Gly Gly Lys Asp Phe
275 280 285
Arg Ser Asn His Leu Gln Gln Ile Gly Val Gln Leu Gly Phe Val Cys
290 295 300
His Leu Arg Asp Arg Pro Ser Glu Gly Gly Ile Val Glu Arg Pro Phe
305 310 315 320
Gly Thr Phe Asn Thr Glu Leu Phe Ser Thr Leu Pro Gly Tyr Thr Gly
325 330 335
Ser Asn Val Gln Glu Arg Pro Glu Glu Ala Glu Lys Glu Ala Cys Leu
340 345 350
Thr Leu Arg Glu Leu Glu Gln Leu Leu Val Arg Tyr Ile Val Asp Lys
355 360 365
His Asn Gln Ser Ile Asp Ala Arg Met Gly Asp Gln Ser Arg Phe Gln
370 375 380
Arg Trp Glu Ala Gly Leu Ile Ala Val Pro Ser Leu Met Gly Glu Arg
385 390 395 400
Glu Leu Asp Ile Cys Leu Met Lys Gln Thr Arg Arg Thr Ile Tyr Arg
405 410 415
Gly Gly Tyr Leu Gln Phe Glu Asn Leu Thr Tyr Arg Gly Glu His Leu
420 425 430
Ala Gly Tyr Ala Gly Glu Ser Val Val Leu Arg Tyr Asp Pro Arg Asp
435 440 445
Ile Thr Thr Ile Leu Val Tyr Arg Ser Glu Glu Gly Lys Glu Val Phe
450 455 460
Leu Ala Arg Ala Tyr Ala Gln Asp Leu Glu Thr Glu Gln Leu Ala Leu
465 470 475 480
Asp Glu Ala Lys Ala Ser Ser Arg Lys Ile Arg Glu Ala Gly Lys Thr
485 490 495
Val Ser Asn Arg Ser Ile Leu Ala Glu Val Gln Glu Arg Glu Thr Phe
500 505 510
Leu Thr Gln Lys Lys Thr Lys Lys Glu Arg Gln Lys Glu Glu Gln Val
515 520 525
Gln Leu Arg Lys Ala Lys Gln Pro Leu Pro Ile Glu Pro Glu Glu Ile
530 535 540
Glu Val Ala Ser Val Arg Asp Glu Ala Glu Ser Glu Met Pro Glu Val
545 550 555 560
Phe Asp Tyr Asp Gln Met Arg Glu Asp Tyr Gly Trp
565 570
<210> 110
<211> 240
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG108 transposition protein sequence
<220>
<223> MG108-2-C transposition protein
<400> 110
Met Thr Thr Gln Glu Ala Lys Thr Val Ala Gln Gln Leu Gly Asp Phe
1 5 10 15
Pro Val Asn Asp Thr Lys Leu Gln Ala Glu Ile Gln Arg Leu Asn Arg
20 25 30
Lys Thr Phe Val Pro Leu Glu Gln Val Glu Asn Leu His Glu Trp Leu
35 40 45
Glu Glu Lys Arg Gln Ala Arg Gln Ser Gly Arg Val Val Gly Glu Ser
50 55 60
Arg Thr Gly Lys Thr Met Gly Cys Asn Ala Tyr Arg Leu Arg His Lys
65 70 75 80
Pro Lys Gln Glu Leu Gly Lys Pro Pro Ile Val Pro Val Val Tyr Phe
85 90 95
Lys Val Thr Gln Glu Cys Ala Ala Lys Glu Phe Phe Gly Leu Ile Ile
100 105 110
Gln Asn Leu Lys Tyr Gln Val Val Lys Gly Thr Val Pro Glu Leu Arg
115 120 125
Ala Arg Ala Val Gln Val Leu Lys Gly Cys Arg Val Glu Met Leu Ile
130 135 140
Leu Asp Glu Ala Asp Arg Leu Lys Pro Lys Thr Phe Ala Glu Val Gln
145 150 155 160
Asp Ile Phe Asp Asp Leu Glu Leu Ala Val Ile Leu Val Gly Thr Asp
165 170 175
Arg Leu Asp Ala Val Ile Lys Arg Asp Glu Gln Val Tyr Asn Arg Phe
180 185 190
Arg Ala Cys His Arg Phe Gly Lys Leu Ser Gly Glu Glu Phe Lys Arg
195 200 205
Thr Val Glu Ile Trp Glu Lys Lys Val Leu Gln Leu Pro Val Ala Ser
210 215 220
Asn Leu Phe Ser Lys Thr Ile Glu Arg Gly Lys Cys Ser Gln Asn Gly
225 230 235 240
<210> 111
<211> 261
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-6 active effector sgRNA
<220>
<221> modified_base
<222> (239)..(261)
<223> a, c, u, g, unknown or other
<400> 111
auaacagcgc cgcaggucau gccgucaaaa gccucugaac uguguuaaau ggggguuagu 60
uugacuguug aaagacaguu gugcuuucug acccugguag cugcccaccc ugaugcugcu 120
aucuuucggg auaggaauaa ggugcgcucc caguaauagg gguguagaug uacuacagug 180
guggcuacua aaucaccucc gaccaaggag gaauccaucc gaaaggaugg guugaaagnn 240
nnnnnnnnnn nnnnnnnnnn n 261
<210> 112
<211> 263
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-2 effector sgRNA
<220>
<221> modified_base
<222> (241)..(263)
<223> a, c, u, g, unknown or other
<400> 112
gaauuaauag cgccgccguu caugcuucua ggagccucug aaaggugaca aaugcggguu 60
aguuuggcug uugucagaca gucuugcuuu cugacccugg uagcugccca ccccgaagcu 120
gcuguuccuu gugaacagga auuaggugcg cccccaguaa uaaggguaug gguuuaccac 180
agugguggcu acugaaucac cuccgagcaa ggaggaaccc acugaaaggu ggguugaaag 240
nnnnnnnnnn nnnnnnnnnn nnn 263
<210> 113
<211> 265
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-4 effector sgRNA
<220>
<221> modified_base
<222> (243)..(265)
<223> a, c, u, g, unknown or other
<400> 113
gaaauagcgc cgcuuguuca ugcgcgaaag cgucucugaa caguguaaau guggguuagu 60
uugacugucg ugaagacggu cuugcuuucu gacccuggua gcugcccacc uugaagcugc 120
ugucucuugu agacaggaau caggugcgcc cccaguaaua uaggugcggg uuuaccgcag 180
ugguggcuac ccaaucaccu ccgagcaagg aggaacccac cuugaaagag gcggguugaa 240
agnnnnnnnn nnnnnnnnnn nnnnn 265
<210> 114
<211> 276
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-7 effector sgRNA
<220>
<221> modified_base
<222> (254)..(276)
<223> a, c, u, g, unknown or other
<400> 114
guaacaaaca gcgccgcagu ucaugcgucu uauggcgccu cugugcugug caaaaugugg 60
guuaguuuga cuguuggaag acagucuugc uuucugaccc ugguagcugc ccaccuugaa 120
gcugcuaucc cuuguggaua ggaaucaggu gcgcccccag uaauagaggu gcggguuuac 180
cgcaguggug gcuaccgaau caccuccgag caaggaggaa cccaccuuga aaaagcuuug 240
ggcggguuga aagnnnnnnn nnnnnnnnnn nnnnnn 276
<210> 115
<211> 246
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-1 effector sgRNA 1
<220>
<221> modified_base
<222> (224)..(246)
<223> a, c, u, g, unknown or other
<400> 115
gaugcuaagu cgcgccuagc aucaaggagc uaugucuuga uugucuuggg uguccgcccu 60
ggaugaguug agguguagau gcuucuauca uggcagcuac uaaacgcccc aagcaagggg 120
aacccaucuu uaauuuuggc aaaccgaagc gggggcaaaa ucuccaggag guucgccaaa 180
accuuugaaa cuccuuagcu ggaaauggcg augggguuga aagnnnnnnn nnnnnnnnnn 240
nnnnnn 246
<210> 116
<211> 274
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-1 effector sgRNA 2
<220>
<221> modified_base
<222> (252)..(274)
<223> a, c, u, g, unknown or other
<400> 116
cuuguucgag uucguuugaa cugaacaagg guaaguaugg gccaguuuaa uugcuuuccg 60
ucccaggaua gcugccagcu ucuaccguag guucguccug caagugaugc uaagucgcgc 120
cuagcaucaa ggagcuaugu cuugauuguc uugggugucc gcccuggaug aguugaggug 180
uagaugcuuc uaucauggca gcuacuaaac gccccaagca aggggaaccc aucgaaagau 240
gggguugaaa gnnnnnnnnn nnnnnnnnnn nnnn 274
<210> 117
<211> 550
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-13 effector intergenic region encoding tracrRNA
<400> 117
gttgaggtgg atttgtgtac tgggtcaaaa gatttcgcta ggtttgcctt ttcgcgcgct 60
gctgaagcag tgaaaagttc cgacagttta aaagttctaa cacttttact gctttccgtc 120
gggagtagtt gtccgcttct gcgttgttga gaccgaagtt tgtccaggtg ataggcagaa 180
cgttgatgca acaggtagat agtcgcgctc tatcaggaag ctgttctagt tattagtgtt 240
cgtgcactaa taaagaggat acagggatac atgtggttgt gtccagcaat ggcacaacag 300
ggccactact cgaagccccg agcaagggtt gagcctaccc aaattttgta ctaaaaattt 360
ggcaaaccga agcgaggtca gtttgaccca gcaccttgtc aatcagtcga aatcttgcac 420
cagtctgcgt tttgagttgg caacagcctc acgctgaacc acttcaagca gaaagttatg 480
gcaatgtgat gacctttgcc aaaataggtg tgcaaagccg actgtagcaa gaatttgagc 540
actaggagtt 550
<210> 118
<211> 457
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-2 effector intergenic region encoding tracrRNA
<400> 118
tactagaaaa atttgcacct tgataataga ataatagtca caatagcgcc gtagttcatg 60
cttgctaaag cctctgaatt gcgaaaagtc cgggttagtg ctgtcggcag acagcgttgc 120
tttctgaccc tggtagctgc ccaccccgat gctgctgtcc cttgcagaca ggaaccaggt 180
gcgcccccag taataagggt gtgggtttac cacagtggtg gctactgaat cacctccgag 240
caaggaggaa tccaccttaa ctattttttc gtgaatccaa gcgggagcaa aattcccaag 300
ggatagacga atttggtgaa ataaatagcc agacttaagt ttgagctttt tctgggatgg 360
tcaaccctcc tgttacgaca gtttccaaag taaaattttc gagttttacg agttttgttt 420
ctggaagcta gtacacaaaa gggttgaagc gtttaaa 457
<210> 119
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-13 effector target CRISPR repeat
<400> 119
tggcaattgc ccttccagtg ttgggtgggt tgaaag 36
<210> 120
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG108-2 effector target CRISPR repeat
<400> 120
gtttcaacga ccatcccgac aaggggtggg ttgaaag 37
<210> 121
<211> 60
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG110-1-6 effector crRNA
<220>
<221> modified_base
<222> (9)..(40)
<223> a, c, u, g, unknown or other
<400> 121
cugguaaann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn gugaccugcc gcauaggcag 60
<210> 122
<211> 59
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG110-2-6 effector crRNA
<220>
<221> modified_base
<222> (7)..(38)
<223> a, c, u, g, unknown or other
<400> 122
ccaagannnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnua ugaacugccg cauaggcag 59
<210> 123
<211> 385
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-6 active transposon end LE
<400> 123
gggaggaaag gttaattggg gggttgattt attttggttg gttgtgttat atttgttatt 60
cgcgggcgat tagcacagtg gtagcgcact tccttcacac ggaaggggtc acaggttcaa 120
atcctgtatc gcccatttgt gtacagtgac acattaattg tcatcaatga cagattgctg 180
tcgtggagcc aaattatgtg tcgctgagac aaattaatgt cgtttaacta tcagtgacaa 240
atttttgtcg cttttcacaa caatagtgtg aaggaagtgc gcctttcaat ccatcctaga 300
aattataatt ccaatcccta cttacctaga atggtggttg aaactgtaag attcgcgccg 360
ctaataaaac tttcagcgat ttgga 385
<210> 124
<211> 313
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-6 active transposon end RE
<400> 124
aacacataat gctatcctag cttacaaaaa agaaagcgac aatcaatctg tcactcctca 60
aattctcttc tttgagaacg acgacagcta aattgtcact gattgggagg acgacactta 120
atttgtcact aacggctagc gatctttaat caaggaaaac agctagaata tagagaaatc 180
aatagttttc atcagcgaca acaatttggc atcacgtcaa ataattagtc actgtacagg 240
ttttattttt aatgtacagt agccctcttg caaaagtcca agaattagga atgttagagg 300
aggtttgata act 313
<210> 125
<211> 300
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-2 putative transposon end LE
<400> 125
ttgtaaaacc tcagatgagc aaggtattga tgaataatat tttccgccaa aatttacctc 60
tgtttgggca ataattgtat gatagaattt atatattagt tgcttcaata gcaaaatgcg 120
ggtgtagttc agtggtagaa cgtcaccttc ccaaggtgaa tgtcgtgggt tcgagtccca 180
tctcccgctt gtgttgttgt tgtacagtgt tgtcgattgc caaattattt gtccgcgttg 240
acaaattgat gtccgtttgc caaattattt gtcatttaca aaactcgaac ccacgacatt 300
<210> 126
<211> 400
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-2 putative transposon end RE
<400> 126
atctacaaaa ttgttttata caactatgtt tgtattttag ttctcaggac aaagattgtg 60
tcaattcttc acaaaagttg taattctcgc ctttttcaaa aaaggacaaa gaatttgtca 120
actttcctaa accggacaac taatttgtca aaaagctttt tcaatatata aagggggtat 180
aatagctgta acccttgcgt agagtaggtt agtgagctac taggtttggc ggtcaataat 240
ttggcaagtg gtcaaataat ttggcaatcg acaattattt atcgttgggg acgaatcagt 300
gtcacggagt caaattatgt gtcgttgtga cagattgatg tcgtctaagc accagtgaca 360
aattgatgtt gctttaataa tttaaaatcg tcacgaaata 400
<210> 127
<211> 489
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-4 putative transposon end LE
<400> 127
tttcgggttc tccagttgtg ctcacaaggc tgcccgtttg gcttcatccc gttggcaata 60
cccatacgtt tttttttacg gctgtgtcca atcttccgta gtgccctcga aatcgtgcgc 120
tgactaatct ccccctccca tagctgtgcc atctcgcttt gggttttatc cccatgctct 180
ttgacgaaag cccgaaaatt ctcccaatcg ctgattttgc ctgtctgttg gcatgcttgc 240
cttggctttg gcttgacatc gcccgtttcg gcttggcgct caaaccataa gttaatcgta 300
ttgcgactga tattgaacag ttgactcgcc tcacttttct tcagaccgtc caactcaatc 360
gcttgcatta ctttttgccg gaagtcatca ctgtaaggtt tagccattga aatgaggtag 420
acgcaatggg tattcttcta gcttacgtcc taacctgcat ggctatagct atactatcca 480
cgacttgga 489
<210> 128
<211> 602
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-4 putative transposon end RE
<400> 128
aagtgttcaa tcaaaacaca tatgtattat aaagttaaaa ggacatttat tttgtcaatg 60
acagtaaaaa gtcacaaaaa tattgatttc agaaaaaaga catatatttt gtcgaattta 120
caatatagga cggctaattc gtcaataact tcgtgctagg aattagcgat agaaaaacaa 180
taaaaccctt gcatagcaaa ggctttagag taaataataa gttgtcaatt aatttggcaa 240
acggtcagat aatgtgacac tcgacagaaa tcctttctag ggaaaggttt tgttgtttat 300
atatctaact ttgttcgagc gctcattctc aataagcagc ctagaaatgg gtacagatcg 360
agatatctag agccggaatt gagataggat tgagataatt taatcagggc cattaagcat 420
atggcaaggg tttcggacgc tacgaagaaa ccacatgaga taaacccaag ctctcaatct 480
ttatagctcg taagctcaac aatttcttaa gtcacattga aagcactggt tctaacgatt 540
tcaatctcta taggcagtca gaaaagaatc caagtgaaga taaacctttg tttgtgctag 600
tg 602
<210> 129
<211> 681
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-7 putative transposon end LE
<400> 129
agttaggagt ttgaagttag gagtttgaag ttaccactca gcactcaata ctcagcactt 60
tctactcatt tccctttctt tgtggtacac tgcaatatag gctagtcaaa ctatgccggg 120
atgtagcgca gcttggtagc gcacttcgtt cgggacgaag gggtcgctgg ttcgaatcca 180
gtcatcccga taattattta gttatttata cgacatatta cacgtaatga aagctgtaca 240
ttaactaatt atttgtcact gttaacagat tgatgtcaaa tttcacaaat tgatgtcact 300
attaacagat tagtgtgctt gagctagccg ttaagactca gcttttgatt gtagctgaaa 360
tttatttgtt tgctatgtta caggctcacc cttgaaatta attataactg gacatgactt 420
tacttgttca aatacgaact gttctggtat ataatgattt ttgtttgggg tcatacttca 480
aactgttagg attattttgc aatatacatt tcggcagttt ttgacccttc ctaaaatctt 540
gtgagaaatc cgggacaact ggattcgctt tcaacccacc actaataatt ttaaattatt 600
ctttccactg ttgattaatc catttaattt cagctaaggc ttaaaacatc aaaatattca 660
aagtatctca ctgccaacag a 681
<210> 130
<211> 415
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-7 putative transposon end RE
<400> 130
atttgtgttt tataaaaaca tagttgtatt atactgacac ctggacaaag aatttgttaa 60
attttgcaaa atcattggtt tgtttgtttt ttggaaaatg acaattaatg tgttatattt 120
ctgagattgg acagttaata tgttaattaa ggtttgaaag gctttaaatc tgaaaataat 180
aaaagcccca tcagaaacct ttctatgaca gggctttcaa tatttgatag agttgtgaca 240
ataatttgtt aagttgacaa ataattagtt aatgtacaaa atatttaatg tatagttaaa 300
atattgtaat agtaacggtt ttgtctatga attatagcaa aggacgggca aggatgcccg 360
ttccacaaga ttttgatttg tagtttactt tggaattttt ctttttatta tttaa 415
<210> 131
<211> 260
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-13 putative transposon end LE
<400> 131
tgtcactgta tccataaggt gagccattgt gaaagcataa gttgagccaa aaatgcttga 60
aatgctgatt tttgcgttgc ttgatttagt ttaatccaaa cggtttgaaa gcataacgtg 120
agccaaagtt ttattttgaa agcataagct gagcaaacat ttgcggcaac ggcttgaaca 180
gcctcaaaat tgtgattagc tgaaatcaga agcgatgagt tccggtttca cggttgtaac 240
tcttcaggag gctgcgaaga 260
<210> 132
<211> 1979
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-13 putative transposon end RE
<400> 132
agagcctcac tttatcgcat tgccacacaa gagcgcacac ataaaacatt aggggtaggt 60
tgaaagaggc aggggtctgc aaattaaata ccaagcttga cctgaagcag cattagcttt 120
aggaactgcg atcgccatca tgcgaactgc tttattaatg cagtgagcag aaattcaagt 180
ttcgacgagt aattgtcgat tattagaagg agttacaaag tatggagcca gaagatacgg 240
aattgagagt gagcaaacca atccaagtgg gagcaagaaa tcaattctgg caaatagatt 300
gcactgtttt tgatgtcagt ctggtcgaga aaactactcc agattattgg caaatggatt 360
ttactgctct tgatgtaaat ctggtcgggg aaactacttc agatgaccct ctttaaccct 420
agctactgtg cgcgacacac aatcgcaaac tatgttggga taccaactta catctgaaga 480
ggtacatggg agtgcgatcg caacactact tcatgctgcc gctcgaaaaa ctatctatca 540
caatatgaat tatttaatct gcgttttcat ggaggcatga tggaagaaca taaatttgga 600
atcactaatg cagttatcct taattcaata tcagggtacg tcaaactcac aagaagaaga 660
cccagcaccc tcaaggatat tgaagagatg gtgaatcgat attttcagca aagctcaggt 720
gactagaaac aatattcatc cacgaatgct tgataagtat agcttgattc tcgtctgagc 780
gagaatcaag ctggcatata tcgttagaac ttcgtggaca acagcacaaa aaacaagaga 840
caaactgctc gttaataaac tcaagtttcg cattaaagct atttagaaat gggtgaagac 900
cgttttatct tcatctattt ttagtctagc tcataaacct tttggaacag tacgttacaa 960
attaattaca ttagcagccg gggacttagc gctacagata aacgtgaatc tgggataagc 1020
tgaaacgcat ttaacccgag ataaagttag ctcatctagg tatagacaca ctagtccaat 1080
taatttggag gctttcttat tcaggttata catactgaaa ctcttttcct ctctatctgc 1140
caagcaccgc aactaatttg atagaaggca accaggaaat ttattggata aattggcgcg 1200
gtaatttgac gatgtgttag ggcagtgatg cactgcttct tgtgaagaag cgtttaaaga 1260
gtaatttgtc tctcatattt cttgctcaac gcagcaaatg tgatgctagt gcaaaatagc 1320
gtgacgggtg acacttacta aattgagtca gccgagcatc ggatggtgat atggagcgac 1380
agcaaaccag agcatcggtt gccaatccag caatctagct gactaagcag tgcaagtaat 1440
ttgacagcag agcaaaacag cgtgactgtt gacaaggaga aatttcattt ctagatcgtg 1500
ccattaattt gcgaatttag gtgaattttg tgctatcaat ttgcgaacct agaatttgtg 1560
ccattgattt aagaacaaag gatcgtgcag tagaccgcca gatcggttgc aatgcactag 1620
gttcgattcc ttcaatgtgc tttcagatga acaagcaagt atctgtgcca ctgatttgcg 1680
aatcggtcga agatttgtgc cacagattta caaatgacta ttcgacccta acaagccgat 1740
tgtgccagca atttgcgaat cgtgccatat tttttgatta ttcacacgtg cgactttccc 1800
aaaagtcagc caaaaatcgc tcaaaacgac attagcgtgc gacaagcgac atttatcgtg 1860
cgaccgtaca tttgctttta caaaggcggc acccagattc gaactggggg tggaggtttt 1920
gcagacctct gccttaccac ttggcgatgc cgccgaattg catcatggac attgtatca 1979
<210> 133
<211> 1444
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-54 putative transposon end LE
<400> 133
ccgccggagg gtcgagcgac aaactgagca aaagtagtga taaattttgt ctaaaatcaa 60
gcgacctcat tctctgtaca gtgccagatt aaatgacgtg atgccaaatt agtgtcgtcg 120
gttgataccc ttgctacatc aacactctac agcctcataa ccattcttag acctatcact 180
ttagtgccaa attgtgagtc gtttaatcaa ataatgacag attaatcgtc tttaaagaat 240
taatctcagt gacgaattaa ctgtcattat ccgacgatag ccccaagata atatcatgtt 300
gcctctaaca tgaatatgta atggggagaa tatcctaaac cattagtatc ctttcctaaa 360
taaacacttt cattcgcgcg aagagttata gcgccgttat tgccgataaa ctcaagcgcc 420
gttattgccg ataaactcaa tggtgttatt ctacaacggc ggtcaattaa tatttatagt 480
gaaactcctc catttttagt aaaaaatagc aacgtaacaa catagggcta tcgtttatta 540
taaatacgta attcccgaaa attagtggga aggtcacacc ttccatccgt tccatatatc 600
tgagagctga attgatttga attcatcaaa ctccaagtcg catacattct agtagtacag 660
ccatttcttc tatcctgacg tgtataagtt acagaggctt gattataact cttatggcgg 720
cctttaattt gatgatcgaa atctcctgaa tatagttcag cattaatatt aactccatca 780
tcactagaat taataactac tgcgtcctgt tctgaagctt gccacatacc attaaatgct 840
ccaggtgctc tattttgagc aaaagcagaa gacaatccag aaatagctat tacgcaaata 900
gaagaagcaa gtacaagtac gagtttttta ggtctcatgg tttttaattc taaaagctag 960
tcaatttgtg agattgaagg gtgttaaact aaagcagagg tagctacaaa taatgtagaa 1020
gctacgaaat tacgtatgaa acttttttca aatccagcgt ggtcattatg gatagtgatt 1080
tttacgccta tagcttctta ttctaaagga atttcctatt aacgatcgcc gctattgtag 1140
cagtggcata attgtcacac taaggattga ctcccaaccg tataattaaa cactatttga 1200
aaggtagggg cagattttga tgtttgctac tccacggtat aagttttctt cggggagagc 1260
taaaacgtcc tttattcgcc gatgcaggcg aaaccataga gttttgaatt acagggtgga 1320
agacccaaac aaaacgtgcc gctcatgttc tgttgtctcc gccagtgcta aatgccaaac 1380
taattgtcgc attatcttag tatgttgcta ggataacaat atgttttatt aaaattttta 1440
ttta 1444
<210> 134
<211> 307
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-1 putative transposon end LE
<400> 134
tgtccattaa agaattattt gtcgccttta aagaattaat gtccaatttc aggaattttg 60
gatgtttcag gctttggcaa gaaatctctt gctcaaaatt ttggtttaaa gaattaatgt 120
ccaaaatttc gacatacttg cgttgaaata catcactcat cgttagagtg cgatcgcagc 180
gctcctttca acccatctac attcacacaa aagcactctt accaaagact cttactcttt 240
cagtgcaatc aaccttggaa gggcgattac aaagcagtct tccaaattca gcgtagtatt 300
gacattc 307
<210> 135
<211> 619
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-1 putative transposon end RE
<400> 135
ggtgtgagca gttaacaacc atggcttaaa taatgacact ttttggttta aatattcaac 60
cagcgaatag taaaatttat gacaaatttt gctttaaaca aagctatggc tattttggtg 120
aagtgaatca gcctgaagat caatagcagc aagggttgca tcacctagca gtgtttagag 180
ccaagatgac aataattctt taaagtcggt caaacaattc tttaatggac accatgtgtg 240
atgtacacta acgctcatct gtcactctag gcagatgtcc attaaggagc tatttgtcag 300
ttttaaacag ctcttgtcaa aaaattttag tactcaacgt attttcaagg gttttaagcg 360
acaccccttg atttgctgct tttttgccct gaaattccag ttttaaggag atgttgtcac 420
agatgattca tgccttgcta ccctgtatcg gtatatggac agagtcatta cagacgatcg 480
cctgtagtgc gatcgcagcg ctcctttcta tccacattaa ttcacatgtt ttaacgctca 540
ccactaatcg actgctgagc ggttgctgta atagcgtcga gacgtatgta ggccgaaatc 600
gatcgcatcc gcaacagcg 619
<210> 136
<211> 709
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG110-1-6 putative transposon end LE
<400> 136
tattgttatc cctatttatt gttattagac aaattgttta tttaaacaac aataaataga 60
taccatcaaa atacaatttg tacagtgata aaatcgaaaa aatagataac aatttgttat 120
atgcagcgcg aaaactggaa tagagaactg agcggcgtgg tttaatatat gagcggcaat 180
agtggaagtt taagggggaa tgtatcgctg acgggtatag cttgttgatt gaagcataaa 240
ttgacaaatt cacaaacgaa aaatcaatga gttacgcttc tctttgaacc ataagatggc 300
aaaaaattaa accataagct gacaaatttc ttagtgaacg tgttacacca cccaaaacgt 360
ggtaagccac tgttgtaaaa ttacaagata tctcatgtac ttcatagtta cgaagtcggt 420
ttagctaagg gcgagtcact cacgaccagt tcaacagtgt tacgggcact gtttaccagc 480
gacctatgac gaagaccttc gatactttca ataatactac tgtagagcat ttcaaaggcc 540
atcgaaatat agaggtgtag ttatatttta agcgtctcag agcaaaaaag ccctctccat 600
agcgctttca cattttcatc cattctcgat ctcgacaatg aaacttaact cccaaatcaa 660
cgagccagcg gagaggagca atttagctag ctccgcgtgc attggcttg 709
<210> 137
<211> 479
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG110-1-6 putative transposon end RE
<400> 137
aaccgagacc tgtaagttgt aagtaaataa caacttaaat ataggttatg ccagctatta 60
ctgcaaattt gacaacttat ggttcaaatt tgtcacttta tgcttcaatt tacatagctt 120
taagttggtg gcatctctgc cagcctcacc ccggcacccg agtctaccgc tgtggctgct 180
tccttccgga cctgaccaga ttcacggttt atcgttgcgg ggggaccagc agagacacca 240
tagaggaggt ctcgttgacc ttggtggggc attatacgca ctctgtttcg atgtgcaacc 300
tacgctatgg ggtttattat cttttttcta ttagtgagaa tactttaacg aaattcgctg 360
gttcgccgct cccgttgctg aagcttttag cgctctcggc tatacttgac taactttatc 420
ggtttttgcc gctgtctctg tatcacagag ccggcgatgt attttatggg agcgcgcag 479
<210> 138
<211> 474
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG110-2-6 putative transposon end LE
<400> 138
tgaggttgcc tccagtacgt ccacaccacg tggatgacca gacaggcttt gaggttaact 60
aattgatgtt gttacaacca taagttgaca taacggccat aataaaatca acaggttaca 120
aaacgatttt tacccataag ttgacataaa aatgaagcat aagctgacat agagtgacaa 180
gaccacacat ggacacaaaa tcggcgttgt aagtttacaa gatcgacttg tagcatccac 240
tataggcaaa cacacctacg gcagccatcc tctcattaag tgcaagtggc actatcgaac 300
acaacgctca ccatttttgc gtagggcaaa gtcgatccgc cccgaatttt ctagaccatc 360
cgaacctttg gctagcaggc tacatgaatt tctccatgtg ccggatatcg agccattgtc 420
tgcataatta taaaacgctc cctattgctt gaaacgactt gcattgtttt gagg 474
<210> 139
<211> 334
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG110-2-6 putative transposon end RE
<400> 139
agcgcctcca acctgtagtt gcttttctac aggtttaggc tatgtcaact tatgatgcaa 60
gtttatgtca gcttttggtt ccactatgtc aacttatggt tccaacgaca attgatttgc 120
cagaaatggt gggggctctg ccagccacat cccggcactc gaaggactcg ccttggctgc 180
taccttccgg tcctgaccag gtcgacgaga ttccgatgcg ggaggaccaa cagagccccc 240
ataacaacgc cggcgagtct acctagcctg accggcaatt gcaatcgctt taccggtcag 300
ctgagttcaa gtgtctgaaa actcgacaag tagc 334
<210> 140
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> Nucleoplasmin NLS
<400> 140
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 141
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> SV40 2x NLS
<400> 141
Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro Lys Lys Lys Arg Lys
1 5 10 15
Val Asp Ser
<210> 142
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> P2A
<400> 142
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 143
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> T2A
<400> 143
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 144
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> HA
<400> 144
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 145
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> Myc
<400> 145
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210> 146
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<223> FLAG
<400> 146
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 147
<211> 640
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 effector sequence
<220>
<223> MG64-56 effector
<400> 147
Met Ser Val Ile Thr Ile Gln Cys Arg Leu Val Ala Asp Asp Lys Ala
1 5 10 15
Leu Arg His Leu Trp Glu Leu Met Ala Glu Lys Asn Thr Pro Leu Val
20 25 30
Asn Glu Leu Leu Asp Arg Leu Gly Lys His Thr Asp Phe Glu Ala Trp
35 40 45
Val Gln Ala Gly Lys Val Pro Lys Thr Thr Ile Lys Ala Leu Cys Asp
50 55 60
Ser Leu Lys Thr Gln Glu Pro Phe Ile Gly Gln Pro Gly Arg Phe Tyr
65 70 75 80
Thr Ser Ala Thr Thr Leu Val Ala Tyr Ile Tyr Lys Ser Trp Leu Ala
85 90 95
Leu His Lys Arg Arg Gln Arg Lys Ile Glu Gly Lys Glu Arg Trp Leu
100 105 110
Glu Met Leu Lys Ser Asp Val Glu Leu Glu Gln Glu Ser Asn Ser Ser
115 120 125
Leu Glu Leu Ile Arg Thr Ile Ala Thr Glu Ile Leu Ser Lys Phe Ser
130 135 140
Ala Ser Ser Thr Asp Gly Ile Asn Gln Lys Ser Lys Gly Lys Lys Ser
145 150 155 160
Lys Lys Leu Lys Lys Asp Lys Ala Asp Glu Pro Met Ser Ile Lys Pro
165 170 175
Gly Val Leu Phe Glu Ala Tyr Gln Lys Thr Glu Asp Ile Leu Arg Arg
180 185 190
Ser Ala Leu Val Tyr Leu Ile Lys Asn Asn Cys Gln Val Asn Phe Ala
195 200 205
Glu Glu Asp Pro Asp Lys Tyr Ala Lys Met Arg Arg Lys Lys Glu Ile
210 215 220
Glu Ile Glu Arg Leu Lys Glu Gln Leu Lys Ser Arg Val Pro Lys Gly
225 230 235 240
Arg Asp Leu Thr Gly Lys Lys Trp Leu Glu Thr Leu Glu Lys Ala Val
245 250 255
Asn Ser Ile Pro Gln Asp Glu Asn Glu Ala Lys Ser Trp Gln Ala Gly
260 265 270
Leu Leu Arg Lys Ser Ser Thr Val Pro Phe Pro Val Ala Tyr Glu Thr
275 280 285
Asn Glu Asp Met His Trp Glu Ile Ser Asp Lys Gly Arg Ile Phe Val
290 295 300
Ser Phe Asn Gly Leu Ser Lys Leu Lys Leu Glu Val Tyr Cys Asp Gln
305 310 315 320
Arg His Leu Pro Trp Phe Gln Arg Phe Val Glu Asp Gln Glu Thr Lys
325 330 335
Arg Lys Gly Lys Asn Gln His Ser Ser Gly Leu Phe Thr Leu Arg Ser
340 345 350
Gly Arg Leu Ser Trp Leu Lys Gln Glu Gly Lys Gly Glu Pro Trp Ser
355 360 365
Val Asn Arg Leu Ile Leu Phe Cys Ser Val Asp Thr Arg Met Trp Thr
370 375 380
Val Glu Gly Thr Gln Gln Val Ala Ile Glu Lys Ile Ala Asp Val Glu
385 390 395 400
Gln Asn Leu Thr Lys Ala Lys Glu Lys Gly Glu Leu Asn Ser Asn Gln
405 410 415
Gln Ala Phe Val Thr Arg Gln Gln Ser Thr Leu Ala Lys Ile Asn Thr
420 425 430
Pro Phe Pro Arg Pro Ser Lys Pro Leu Tyr Glu Gly Lys Ser His Ile
435 440 445
Leu Val Gly Val Ser Leu Gly Leu Glu Asn Pro Ala Thr Val Ala Val
450 455 460
Phe Asp Ala Val Asn Asn Lys Val Leu Ala Tyr Arg Ser Val Lys Gln
465 470 475 480
Leu Leu Gly Asn Asn Tyr Asn Leu Leu Asn Arg Gln Gln Gln Gln Lys
485 490 495
Gln Arg Leu Ser His Asp Arg His Lys Ala Gln Lys Asp Phe Ala Arg
500 505 510
Asn Asp Phe Gly Glu Ser Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu
515 520 525
Ala Lys Glu Ile Val Ala Ile Ala Val Thr Tyr Phe Ala Gly Ser Ile
530 535 540
Val Leu Pro Lys Leu Gly Asp Met Arg Glu Ile Ile Gln Ser Glu Val
545 550 555 560
Gln Ala Arg Ala Glu Lys Lys Ile Pro Gly Phe Lys Glu Gly Gln Gln
565 570 575
Lys Tyr Ala Lys Glu Tyr Arg Lys Gln Val His Asn Trp Ser Tyr Gly
580 585 590
Arg Leu Ile Glu Asn Ile Gln Ser Gln Ala Ala Lys Val Gly Ile Leu
595 600 605
Ile Glu Thr Gly Gln Gln Pro Ile Arg Gly Ser Pro Gln Glu Gln Ala
610 615 620
Arg Asp Leu Ala Leu Phe Ala Tyr Gln Cys Arg Ile Ala Ser Ser Ile
625 630 635 640
<210> 148
<211> 579
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-56-B transposition protein
<400> 148
Met Gly Glu Thr Leu Asn Ser Asn Glu Val Asp Glu Ser Leu Val Leu
1 5 10 15
Tyr Asp Gly Ser Asp Glu Val Asp Glu Ile Ser Glu Ser Glu Asp Thr
20 25 30
Lys Gln Asn Asn Val Ile Val Thr Glu Leu Ser Glu Glu Ala Lys Leu
35 40 45
Arg Met Glu Val Leu Gln Ser Leu Ile Glu Pro Cys Asp Arg Lys Thr
50 55 60
Tyr Gly Ile Lys Leu Lys Gln Ala Ala Glu Lys Leu Gly Lys Thr Val
65 70 75 80
Arg Thr Val Gln Arg Leu Val Lys Lys Tyr Gln Glu Gln Gly Leu Ser
85 90 95
Gly Val Thr Glu Val Glu Arg Ser Asp Lys Gly Gly Tyr Arg Ile Asp
100 105 110
Asp Asp Trp Gln Asp Phe Ile Val Lys Thr Tyr Lys Glu Gly Asn Lys
115 120 125
Gly Gly Arg Lys Met Thr Pro Ala Gln Val Ala Ile Arg Val Gln Val
130 135 140
Arg Ala Gly Gln Leu Gly Leu Glu Lys Tyr Pro Cys His Met Thr Val
145 150 155 160
Tyr Arg Val Leu Asn Pro Ile Ile Glu Arg Lys Glu Gln Lys Gln Lys
165 170 175
Val Arg Asn Ile Gly Trp Arg Gly Ser Arg Val Ser His Gln Thr Arg
180 185 190
Asp Gly Gln Thr Leu Asp Val His His Ser Asn His Val Trp Gln Cys
195 200 205
Asp His Thr Lys Leu Asp Val Met Leu Val Asp Gln Tyr Gly Glu Thr
210 215 220
Leu Ala Arg Pro Trp Leu Thr Lys Ile Thr Asp Ser Tyr Ser Arg Cys
225 230 235 240
Ile Met Gly Ile His Leu Gly Phe Asp Ala Pro Ser Ser Leu Val Val
245 250 255
Ala Leu Ala Met Arg His Ala Met Leu Arg Lys Gln Tyr Ser Ser Glu
260 265 270
Tyr Lys Leu His Cys Glu Trp Gly Thr Tyr Gly Val Pro Glu Asn Leu
275 280 285
Phe Thr Asp Gly Gly Lys Asp Phe Arg Ser Glu His Leu Lys Gln Ile
290 295 300
Gly Phe Gln Leu Gly Phe Glu Cys His Leu Arg Asp Arg Pro Pro Glu
305 310 315 320
Gly Gly Ile Glu Glu Arg Gly Phe Gly Thr Ile Asn Thr Asp Phe Leu
325 330 335
Ser Gly Phe Tyr Gly Tyr Leu Gly Ser Asn Val Gln Glu Arg Ala Glu
340 345 350
Gly Ala Glu Glu Glu Ala Cys Ile Thr Leu Arg Glu Leu His Leu Leu
355 360 365
Ile Val Arg Tyr Ile Val Asp Asn Tyr Asn Gln Arg Ile Asp Ala Arg
370 375 380
Ser Gly Asn Gln Thr Arg Phe Gln Arg Trp Glu Ala Gly Leu Pro Ala
385 390 395 400
Leu Pro Asn Leu Val Asn Glu Arg Glu Leu Asp Ile Cys Leu Met Lys
405 410 415
Lys Thr Arg Arg Ser Ile Tyr Lys Gly Gly Tyr Val Ser Phe Glu Asn
420 425 430
Ile Met Tyr Arg Gly Asp Tyr Leu Ser Ala Tyr Ala Gly Glu Ser Val
435 440 445
Leu Leu Arg Tyr Asp Pro Arg Asp Ile Ser Thr Val Phe Val Tyr Arg
450 455 460
Gln Asp Ser Gly Lys Glu Val Leu Leu Ser Gln Ala His Ala Ile Asp
465 470 475 480
Leu Glu Thr Glu Gln Ile Ser Leu Glu Glu Thr Lys Ala Ala Ser Arg
485 490 495
Lys Ile Arg Asn Ala Gly Lys Gln Leu Ser Asn Lys Ser Ile Leu Ala
500 505 510
Glu Val Gln Asp Arg Asp Thr Phe Ile Lys Gln Lys Lys Lys Ser His
515 520 525
Lys Glu Arg Lys Lys Glu Glu Gln Ala Gln Val Asn Phe Val Lys Pro
530 535 540
Pro Gln Thr Asn Glu Pro Val Glu Thr Val Glu Glu Ile Pro Gln Pro
545 550 555 560
Gln Lys Arg Arg Pro Arg Val Phe Asp Tyr Glu Gln Leu Arg Lys Asp
565 570 575
Tyr Asp Asp
<210> 149
<211> 278
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-56-C transposition protein
<400> 149
Met Ala Glu Asp Tyr Leu Arg Lys Trp Val Gln Asn Leu Trp Gly Asp
1 5 10 15
Asp Pro Ile Pro Glu Glu Leu Leu Pro Ile Ile Glu Arg Leu Ile Thr
20 25 30
Pro Ser Val Val Glu Leu Glu His Ile Gln Lys Ile His Asp Trp Leu
35 40 45
Asp Ser Leu Arg Leu Ser Lys Gln Cys Gly Arg Ile Val Ala Pro Pro
50 55 60
Arg Ala Gly Lys Ser Val Thr Cys Asp Val Tyr Lys Leu Leu Asn Lys
65 70 75 80
Pro Gln Lys Arg Thr Gly Lys Arg Asp Ile Val Pro Val Leu Tyr Met
85 90 95
Gln Val Pro Gly Glu Cys Ser Ala Gly Glu Leu Leu Thr Leu Ile Leu
100 105 110
Glu Ser Leu Lys Tyr Asp Ala Ile Ser Gly Lys Leu Thr Asp Leu Arg
115 120 125
Arg Arg Val Leu Arg Leu Leu Lys Glu Ser Lys Val Glu Met Leu Val
130 135 140
Ile Asp Glu Ala Asn Phe Leu Lys Leu Asn Thr Phe Ser Glu Ile Ala
145 150 155 160
Arg Ile Tyr Asp Leu Leu Lys Ile Ser Ile Val Leu Val Gly Thr Asp
165 170 175
Gly Leu Asp Asn Leu Ile Lys Lys Glu Pro Tyr Ile His Asp Arg Phe
180 185 190
Ile Glu Cys Tyr Arg Leu Pro Leu Val Ser Glu Lys Lys Phe Pro Glu
195 200 205
Phe Val Gln Ile Trp Glu Asp Glu Val Leu Cys Leu Pro Val Pro Ser
210 215 220
Asn Leu Thr Lys Arg Glu Thr Leu Met Pro Leu Tyr Gln Lys Thr Ser
225 230 235 240
Gly Lys Ile Gly Leu Val Asp Arg Val Leu Arg Arg Ala Ala Ile Leu
245 250 255
Ser Leu Arg Lys Gly Leu Lys Asn Ile Asp Lys Ala Thr Leu Asp Glu
260 265 270
Val Leu Glu Trp Phe Glu
275
<210> 150
<211> 176
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG64 transposition protein sequence
<220>
<223> MG64-56-Q transposition protein
<400> 150
Met Glu Ile Pro Ala Glu Gln Pro Arg Phe Phe Gln Val Glu Pro Leu
1 5 10 15
Glu Gly Glu Ser Leu Ser His Phe Leu Gly Arg Phe Arg Arg Glu Asn
20 25 30
Tyr Leu Thr Ala Thr Gln Leu Gly Lys Leu Thr Gly Ile Gly Ala Val
35 40 45
Ile Ser Arg Trp Glu Lys Phe Tyr Leu Asn Pro Phe Pro Thr Pro Gln
50 55 60
Glu Leu Glu Ala Leu Ala Ala Val Val Glu Val Lys Val Asp Arg Leu
65 70 75 80
Ile Glu Met Leu Pro Pro Arg Gly Val Thr Met Lys Pro Arg Pro Ile
85 90 95
Arg Leu Cys Ser Ala Cys Tyr Gln Glu Ser Pro Cys His Arg Val Glu
100 105 110
Trp Gln Phe Lys Asp Val Met Val Cys Asp Cys Leu Arg His Cys Pro
115 120 125
Leu Asn Asn Arg His Gln Leu Ala Leu Leu Thr Lys Cys Thr Asn Cys
130 135 140
Glu Thr Pro Phe Pro Ile Pro Ala Asp Trp Val Gln Gly Glu Cys Pro
145 150 155 160
His Cys Phe Leu Pro Phe Thr Lys Met Ala Arg Arg Gln Lys Arg Tyr
165 170 175
<210> 151
<211> 485
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-56 effector intergenic region encoding tracrRNA
<400> 151
caaaataccg aaccttgaaa acttaatatg aaagtaacag cgccgcagtt catgctcttc 60
tgagtctctg tactgtgata aatctgggtt agtttaacgg ttgaaagacc gttttgcttt 120
ctgaccctgg tagctgctcg ctcttgatgc tgctgtcttt tgacaggata ggtgcgctcc 180
cagcaataaa gagttaaagc tgataaagct tgagccgttg taaaacggtg gggtttacct 240
cagtggtggc tactgaatca cccccttcgt cgggggaacc ctcctaaata ttttttttgg 300
cgtgtcaaag cgggggcaaa aatcctggag tcccgccaaa atctcaaaac ctttgtccta 360
tcttgacttg ataaactagc atgtcagtta atttagtttt ttgatgtcaa gtaggagatg 420
cttttaggca gtcctgccaa agatgtgtat ggaaagctct aatagcaagg gttctagacg 480
gatcg 485
<210> 152
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-56 effector target CRISPR repeat
<400> 152
gtttcaacaa ccatcccagc taggggtggg ttgaaag 37
<210> 153
<211> 595
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-56 putative transposon end LE
<400> 153
tatgcgactt gagcgatttg tgtaagtttt gtgttgcaca aaccatccta agcgacatta 60
gtttgcaaaa aacgacatta atttacgaat cgcgaccttt aatttgcgaa tatacaacag 120
attttgtcga ttaactaatt atttgtcgtc ttaacaaatt aatgtcgccc aaatcttcaa 180
gactataatc cttatgtatc aaaggttata gccttttgaa cttatattgg ctatcatcaa 240
atatttaact aattaagtgt cgtcttttaa ttaattaaca ttttaaatgt cgttttttca 300
aaaaacacct ttccaaattt ttcttttgct cataacaaaa taactgtcgt cttttggaag 360
tgagtgaaaa atataaaatt aaatgtcgct ttttggaaca aagtagtatg atatttatta 420
ggcaatagta gctatgtaac aacaaaaaca tagttagatt gaagtcttct tttttgtctc 480
tagctacgaa gtcattaccc ttgctgcgat taaatttaga cgcaagctaa tttcgctctt 540
agacttgctg taccgtattg cctaaccaac tagtttcaag cgatgaagtt tgttt 595
<210> 154
<211> 493
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-56 putative transposon end RE
<400> 154
taagttctat taactccaag ttttaataat tgcatggcaa taacaatcct ttttagaaag 60
gatttaagag ggttgaaagg aatgtcacct tcccaagaat acttttcaaa agctattttg 120
ggttagggaa gaataatcac agataactaa tatgcacaag taagtctaaa atagggataa 180
gtctgtcgat tagtccaata gcaaggcatc ttgttagacg acattaattt gttaacgtta 240
gttggaacta attcgacgac attaattcgt taacagcgac attaatttgt taatgacgac 300
attaatctgt taacgacgac attaatctgt taacgacgac aaataatctg ttaattgaca 360
gatttgaaag cgggtgatgg gactcgaacc cacgacgttc accttgggaa ggtgacattc 420
taccactgaa ttacacccgc aaatggagtt taggctcaat aaagctaacc cccattataa 480
cacgatttgc cca 493
<210> 155
<211> 568
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-2 active transposon end RE
<400> 155
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 60
aggtggcact tttcggggaa atgtgttcta tctacaaaat tgttttatac aactatgttt 120
gtattttagt tctcaggaca aagattgtgt caattcttca caaaagttgt aattctcgcc 180
tttttcaaaa aaggacaaag aatttgtcaa ctttcctaaa ccggacaact aatttgtcaa 240
aaagcttttt caatatataa agggggtata atagctgtaa cccttgcgta gagtaggtta 300
gtgagctact aggtttggcg gtcaataatt tggcaagtgg tcaaataatt tggcaatcga 360
caattattta tcgttgggga cgaatcagtg tcacggagtc aaattatgtg tcgttgtgac 420
agattgatgt cgtctaagca ccagtgacaa attgatgttg ctttaataat ttaaaatcgt 480
cacgaaataa gcctaacgtg agttttcgtt ccactgagcg tcagaccacc gttgatgata 540
ccgctgcctt actgggtgca ttagccag 568
<210> 156
<211> 227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-4 effector putative tracrRNA
<400> 156
aatagcgccg cttgttcatg cgcgaaagcg tctctgaaca gtgtaaatgt gggttagttt 60
gactgtcgtg aagacggtct tgctttctga ccctggtagc tgcccacctt gaagctgctg 120
tctcttgtag acaggaatca ggtgcgcccc cagtaatata ggtgcgggtt taccgcagtg 180
gtggctaccc aatcacctcc gagcaaggag gaacccacct taattat 227
<210> 157
<211> 228
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-7 effector putative tracrRNA
<400> 157
aacagcgccg cagttcatgc gtcttatggc gcctctgtgc tgtgcaaaat gtgggttagt 60
ttgactgttg gaagacagtc ttgctttctg accctggtag ctgcccacct tgaagctgct 120
atcccttgtg gataggaatc aggtgcgccc ccagtaatag aggtgcgggt ttaccgcagt 180
ggtggctacc gaatcacctc cgagcaagga ggaacccacc ttaattat 228
<210> 158
<211> 328
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-9 effector putative tracrRNA
<400> 158
gctgaagtta gtctctggat actgaagtca gtgtctaggg actgaagtaa ggggagcttt 60
acccgcaagg gatactttcg accccctgta gctgcccgct cctggtgggg tgccctgaca 120
cccgcctcat tacagcaatg tatgactgtc tgggctaatg aaagaaggat tagggacgca 180
ggttcacgac ctacttcaat catagtctgt gcaacccaga taagtgagta tgacccgcaa 240
gggtctaaac gcctttagta gaatggttct tccagtttgt taagggcagg gcttggttct 300
ccaaggtggc tacgaattct tctcgatt 328
<210> 159
<211> 187
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-10 effector putative tracrRNA
<400> 159
ggtagcgctg gagccacata gttcataagc tcacgcttct tggacttcct gtgttctcta 60
aaacgggttc tgttttaccc ttaccaaggg atactttcag atccgagtag ctgcaagctc 120
atggcggagt gtcccctgac gctttgccac cgtcatagcg atgtgatggc cgtctggcgt 180
atgaacg 187
<210> 160
<211> 326
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-12 effector putative tracrRNA
<400> 160
aatagcgccc ctaatcaaat cgaaggcgtt tgaggacggg gaaaatgggt aagtttccat 60
cgaaaggtgg ttcttttcag ccctatgtag tcccactccc ttgtggagtg ttagcatctg 120
aggtgcctag cacagcaaag tctctcagga gacggagtca aagctgggga acaagtatta 180
cgaacgaatc tcgcgattct attagtatac gtaggtcgct cccatgcaac aagatgctca 240
tctctcagca atgagggtag ggaacgtatc ccaaacacta catgaatagc tcgtcgggct 300
tgcccggtga gtatccacca agcctt 326
<210> 161
<211> 311
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-13 effector putative tracrRNA
<400> 161
cgctaggttt gccttttcgc gcgctgctga agcagtgaaa agttccgaca gtttaaaagt 60
tctaacactt ttactgcttt ccgtcgggag tagttgtccg cttctgcgtt gttgagaccg 120
aagtttgtcc aggtgatagg cagaacgttg atgcaacagg tagatagtcg cgctctatca 180
ggaagctgtt ctagttatta gtgttcgtgc actaataaag aggatacagg gatacatgtg 240
gttgtgtcca gcaatggcac aacagggcca ctactcgaag ccccgagcaa gggttgagcc 300
tacccaaatt t 311
<210> 162
<211> 342
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-14 effector putative tracrRNA
<400> 162
aacagcgccg cagtttaagc tctatagccg ctgaactgtg aaaaatgtgg gtcagtttgg 60
tcgttgcaag acgatcgtgc tttccgaccc tagtaactgt ccgctcactg actgccatcc 120
tggggcaaat cttcaaattt tgtgtatttg tgtggggatg gaaagctgca ttagtcgatt 180
ctcttcctcc aatgtagcgt aggtgcgcac ccagcagaag tgagttaagc cttcacaatg 240
tggaggtaca gaagcatcat ctctccattt tttggtgtag atggtgtgac tgaagtggta 300
gttaccgaat cgcccctgat caagggggag ccctccataa tt 342
<210> 163
<211> 297
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-15 effector putative tracrRNA
<400> 163
aatgacgttt gtttctgtgc gcgctgctga agcagtgaaa aatacggaca gtctaatttg 60
ctttccgtcc ggagtagttg tccgcttctg cgttgttgga accgaagttt gtccaggtga 120
taggcggagt gtttcggcaa cagatggaga gtcgcacctc tatcaggggg cagttttagt 180
ggttagtgtt tagcgcacta tcactaggat acagggatac atgtggtagt gaccagagat 240
ggcactgcgg gaccgctact cgaagccccg aacaagggtt gagcttaccc aaatctt 297
<210> 164
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-16 effector putative tracrRNA
<400> 164
aatagcgccg cagtttaagc tcagcaagcc tctggactgc gaaaagtatg gggtagtttg 60
accgtcggta aacggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120
ttcttaactg ggaatcgaga tgaggtgcgc ccccagcaaa agggaacggg tttactggag 180
tggtggtcgc cgaatcaccc ccgagcaagg gggactcgtc ctttgc 226
<210> 165
<211> 227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-17 effector putative tracrRNA
<400> 165
aatagcgccg cagtttaagc tcaatgagcc tcttgactgc gaacagtatg gggtagtttg 60
accggcggta accggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120
ttctcaaccg ggaatcgaga atcaggtgcg cccccagcaa gagggaacgg gtttactgga 180
gtggtggtcg ccgaatcacc cccgagcaag ggggactcgt cctttgc 227
<210> 166
<211> 227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-19 effector putative tracrRNA
<400> 166
aatagcgccg cagtttaagc tcagcaagcc tctggactgc gaaaagtatg gggtagtttg 60
accgtcggta aacggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120
ttctcaaccg ggaatcgaga atcaggtgcg cccccagcaa gagggaacgg gtttactgga 180
gtggtggtcg ccgaatcacc cccgagcaag ggggactcgt cctttgc 227
<210> 167
<211> 211
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-20 effector putative tracrRNA
<400> 167
aatagcgccg cagtttaagc tcaatgagcc tcttgactgc gaacagtatg gggtagtttg 60
accggcggta accggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120
ttctcaaccg ggaatcgaga atcaggtgcg cccccagcaa gagggaacgg gtttactgga 180
gtggtggtcg ccgaatcacc cccgagcaag g 211
<210> 168
<211> 222
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-21 effector putative tracrRNA
<400> 168
aatagcgccg cagttcatgc ttctttgaag cctctgtgct gtgcaaaatg tgggttagtt 60
tggctgttga agaaacagcc ttgctttctg accctggtag ctgtccaccc tgaagctgct 120
atcccctgtg gataggatag gtgcgccccc agcaataggg gagcgggtat accgcagtgg 180
tggctactga atcacctcca agcaaggagg aatccacttt at 222
<210> 169
<211> 222
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-22 effector putative tracrRNA
<400> 169
aatagcgccg cagttcatgc ttctttgaag cctctgtgct gtgcaaaatg tgggttagtt 60
tggctgttga agaaacagcc ttgctttctg accctggtag ctgtccaccc tgaagctgct 120
atcccctgtg gataggatag gtgcgccccc agcaataggg gagcgggtat accgcagtgg 180
tggctactga atcacctcca agcaaggagg aatccacttt at 222
<210> 170
<211> 248
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-24 effector putative tracrRNA
<400> 170
aaaagcgccg tagaacatgc tcacgcctct gttctgcgaa aaattagggt ttgtttggct 60
gtctgacagc agtcttactt tctgtcccta gaatctgacc actccgatgc tgctgttgta 120
agtgaacttg attgagctcg gacaccatgc aacaggataa ggggcgcacc cagcaagaga 180
ggacggactt accgtagtgt tggcttctga agcaactccg accaaggagt agtccatgca 240
ttcatcat 248
<210> 171
<211> 277
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-25 effector putative tracrRNA
<400> 171
aatcgcgccg cacattcatg ttccttgaga acctctgaat tgcgaaagtg tgggctagtt 60
tgttcgcttg atgcgaatgt gctttctggc cctggtagct gtccgccctg atgctgattt 120
ctacgggtaa ctgtaggaat gattaactcg ttctatagac aggtttcgtg ctttctattg 180
taacggggtc ggtgcgctcc cagcaatagg ggtgtgggtc tactacagtg atggctactg 240
aatcacctcc gagcaaggag gaatccacct taacttt 277
<210> 172
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-27 effector putative tracrRNA
<400> 172
aatagcgccg cagtttaagc tcagcaagcc tctggactgc gaaaagtatg gggtagtttg 60
accgtcggta aacggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120
ttcttaactg ggaatcgaga tgaggtgcgc ccccagcaag agggaacggg tttactggag 180
tggtggtcgc cgaatcaccc ccgagcaagg gggactcgtc ctttgc 226
<210> 173
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-28 effector putative tracrRNA
<400> 173
aatagcgccg cagtttaagc tcagcaagcc tctggactgc gaaaagtatg gggtagtttg 60
accgtcggta aacggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120
ttcttaactg ggaatcgaga tgaggtgcgc ccccagcaag agggaacggg tttactggag 180
tggtggtcgc cgaatcaccc ccgagcaagg gggactcgtc ctttgc 226
<210> 174
<211> 255
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-29 effector putative tracrRNA
<400> 174
tagcgcacga acctgactag cgtcattacg atgcgagttc tggaaatggg acagtttcat 60
tgctttccgt ccctggcact gcctgcttac tcacgaccac aaggagacaa ttcagcgctg 120
tgagttcgcg attctctact gtttatgaca aactaacgtt tgtctggcag tacagcaaga 180
ttgtgtatca gaccatgttt ggcgaagata catggcaggc cgaatcgcca atgaaaccag 240
cggacttccc ctaat 255
<210> 175
<211> 226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-32 effector putative tracrRNA
<400> 175
aatagcgccg cagtttaagc tcaatgagcc tcttgactgc gaacagtatg gggtagtttg 60
accggcggta accggttgtg ctttctgccc ctggcgactg cccaccccga tgctgtcgat 120
ttcttaactg ggaatcgaga tgaggtgcgc ccccagcaag agggaacggg tttactggag 180
tggtggtcgc cgaatcaccc ccgagcaagg gggactcgtc ctttgc 226
<210> 176
<211> 203
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-44 effector putative tracrRNA
<400> 176
tctagcgccg cagctcatgt cagcaatggc caatgtgttg tgctaaatgc gagctagttt 60
gactgcctgc taagcagtct tgctttctgg ctcaggtgac tatccaccca aaggtcgttg 120
gtgcgctggc gatttgaggg cacgggttcc ggagtgatag ttaccattac acctccggcc 180
aaggaggaat ccaccccacc ccc 203
<210> 177
<211> 203
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-46 effector putative tracrRNA
<400> 177
tctagcgccg cagctcatgt cagcaatggc caatgtgttg tgctaaatgc gagctagttt 60
gactgcctgc taagcagtct tgctttctgg ctcaggtgac tatccaccca aaggtcgttg 120
gtgcgctggc gatttgaggg cacgggttcc ggagtgatag ttaccattac acctccggcc 180
aaggaggaat ccaccccacc ccc 203
<210> 178
<211> 310
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-49 effector putative tracrRNA
<400> 178
gattgcgcct cgatcgatgc tctatgagcc gctcgatcgt agaaaaatgg gtgagtttga 60
ttatctactt cgttagataa tgctgctttc cgaccctggc attctgtccg cccttgaagc 120
tgcttctcat ggactagcgt aagctcgttg gtaagaagga aaagtcataa tttaaagtca 180
cgtctttcta gtatgacata ggtgcgctcc cacgcaatat agggttcagc ttttatttta 240
taaaagtaga gactttcctc tagtgacagt gccgaaatga ccccgtgcga ggggtaacta 300
cctaagtttt 310
<210> 179
<211> 227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-51 effector putative tracrRNA
<400> 179
aacagcgccg cagttcatgt ttgttataaa cctctgtact gcgataaatg cgggttagtt 60
tgactgttgt gagacagtct tgctttctga ccctagtagc tgcccacctt gatgctgctg 120
ttcccagtga acaggaataa ggtgcgcccc cagtaataga ggtgcgggtt taccgcagtg 180
gtggctactg aatcacctcc gactaaggag gaatccacct taattat 227
<210> 180
<211> 380
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-52 effector putative tracrRNA
<400> 180
accggggatc gtcctggtga agggagagtt gctttggatc ggtcacaagc ttttccttaa 60
ctaattctca ctgactgact aggatgatcg agggggttat gttttaccac tgcaaggtgg 120
atactttcaa acccctgtgg tagctgctcg ctcctggtga ggtgccctga cacttcaccc 180
cactacagca atgtgtgtgg ctgtctggtt atgagagaag ttagggcata ggttcgttac 240
ctgcattcaa tcataaatta cgcgaccaga taagtgagta tgatccgcaa ggatctatat 300
gtctttagca aagaagtgct tctgctttgt tactggcgta gggcatggtt ctctaaagtg 360
gctaccgaac cttcccaatt 380
<210> 181
<211> 257
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64_56 effector putative tracrRNA
<400> 181
aacagcgccg cagttcatgc tcttctgagt ctctgtactg tgataaatct gggttagttt 60
aacggttgaa agaccgtttt gctttctgac cctggtagct gctcgctctt gatgctgctg 120
tcttttgaca ggataggtgc gctcccagca ataaagagtt aaagctgata aagcttgagc 180
cgttgtaaaa cggtggggtt tacctcagtg gtggctactg aatcaccccc ttcgtcgggg 240
gaaccctcct aaatatt 257
<210> 182
<211> 246
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-1 effector putative tracrRNA
<400> 182
tttagcgcac ttgttcgagt tcgtttgaac tgaacaaggg taagtatggg ccagtttaat 60
tgctttccgt cccaggatag ctgccagctt ctaccgtagg ttcgtcctgc aagtgatgct 120
aagtcgcgcc tagcatcaag gagctatgtc ttgattgtct tgggtgtccg ccctggatga 180
gttgaggtgt agatgcttct atcatggcag ctactaaacg ccccaagcaa ggggaaccca 240
tcttta 246
<210> 183
<211> 223
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-2 effector putative tracrRNA
<400> 183
aatagcgccg tagttcatgc ttgctaaagc ctctgaattg cgaaaagtcc gggttagtgc 60
tgtcggcaga cagcgttgct ttctgaccct ggtagctgcc caccccgatg ctgctgtccc 120
ttgcagacag gaaccaggtg cgcccccagt aataagggtg tgggtttacc acagtggtgg 180
ctactgaatc acctccgagc aaggaggaat ccaccttaac tat 223
<210> 184
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-9 effector target CRISPR repeat
<400> 184
gtctttcatc ctatctcgcg ccagatcgct tcctgcaacc c 41
<210> 185
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-12 effector target CRISPR repeat
<400> 185
gttgcaagcg cctccttggc tgttggtggg tggaaag 37
<210> 186
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-14 effector target CRISPR repeat
<400> 186
gttgcaatcg ccttcccaga gatgggtggg ctgaaag 37
<210> 187
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-15 effector target CRISPR repeat
<400> 187
gttacaatta ccctcccagc gttgggtggg ttgaaagg 38
<210> 188
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-16 effector target CRISPR repeat
<400> 188
aagttgcatc cgctttccag caaccagggc gggtgaaag 39
<210> 189
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-17 effector target CRISPR repeat
<400> 189
gttgcatccg ctttccagca accagggcgg gtgaaag 37
<210> 190
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-19 effector target CRISPR repeat
<400> 190
gtacccaaag ccttttttcc ttaagcctat ccg 33
<210> 191
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-25 effector target CRISPR repeat
<400> 191
gtttcaaccg ccatcccagc taggggt 27
<210> 192
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-27 effector target CRISPR repeat
<400> 192
agttgcatcc gctttccagc aaccagggcg ggtgaaag 38
<210> 193
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-28 effector target CRISPR repeat
<400> 193
gttgcatctg cttttcagca actagggcgg gggaaagc 38
<210> 194
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-29 effector target CRISPR repeat
<400> 194
ggcgcgatcg cctttatggg tacgggcaag ttgaaag 37
<210> 195
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-32 effector target CRISPR repeat
<400> 195
aagttgcatc cgctttccag caaccagggc gggtgaaagt t 41
<210> 196
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-44 effector target CRISPR repeat
<400> 196
gttgcctccc gcttcgaggc acgggaacga ttgaaag 37
<210> 197
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-46 effector target CRISPR repeat
<400> 197
gttgcctccc gcttcgaggc acgggaacga ttgaaag 37
<210> 198
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-49 effector target CRISPR repeat
<400> 198
gttgcaacac tccctgactg cctgacacaa atgcctcgaa agc 43
<210> 199
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-52 effector target CRISPR repeat
<400> 199
gtcgcaatga ctattttggc ttggggcgga atga 34
<210> 200
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-51 effector target CRISPR repeat
<400> 200
gtttcaacac ccctcccgaa gtggggcggg ttgaaag 37
<210> 201
<211> 261
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-6 active effector sgRNA
<220>
<221> modified_base
<222> (239)..(261)
<223> a, c, u, g, unknown or other
<400> 201
auaacagcgc cgcaggucau gccgucaaaa gccucugaac uguguuaaau ggggguuagu 60
uugacuguug aaagacaguu gugcuuucug acccugguag cugcccaccc ugaugcugcu 120
aucuuucggg auaggaauaa ggugcgcucc caguaauagg gguguagaug uacuacagug 180
guggcuacua aaucaccucc gaccaaggag gaauccaucc gaaaggaugg guugaaagnn 240
nnnnnnnnnn nnnnnnnnnn n 261
<210> 202
<211> 263
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-2 effector sgRNA
<220>
<221> modified_base
<222> (241)..(263)
<223> a, c, u, g, unknown or other
<400> 202
gaauuaauag cgccgccguu caugcuucua ggagccucug aaaggugaca aaugcggguu 60
aguuuggcug uugucagaca gucuugcuuu cugacccugg uagcugccca ccccgaagcu 120
gcuguuccuu gugaacagga auuaggugcg cccccaguaa uaaggguaug gguuuaccac 180
agugguggcu acugaaucac cuccgagcaa ggaggaaccc acugaaaggu ggguugaaag 240
nnnnnnnnnn nnnnnnnnnn nnn 263
<210> 203
<211> 265
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-4 effector sgRNA
<220>
<221> modified_base
<222> (243)..(265)
<223> a, c, u, g, unknown or other
<400> 203
gaaauagcgc cgcuuguuca ugcgcgaaag cgucucugaa caguguaaau guggguuagu 60
uugacugucg ugaagacggu cuugcuuucu gacccuggua gcugcccacc uugaagcugc 120
ugucucuugu agacaggaau caggugcgcc cccaguaaua uaggugcggg uuuaccgcag 180
ugguggcuac ccaaucaccu ccgagcaagg aggaacccac cuugaaagag gcggguugaa 240
agnnnnnnnn nnnnnnnnnn nnnnn 265
<210> 204
<211> 276
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-7 effector sgRNA
<220>
<221> modified_base
<222> (254)..(276)
<223> a, c, u, g, unknown or other
<400> 204
guaacaaaca gcgccgcagu ucaugcgucu uauggcgccu cugugcugug caaaaugugg 60
guuaguuuga cuguuggaag acagucuugc uuucugaccc ugguagcugc ccaccuugaa 120
gcugcuaucc cuuguggaua ggaaucaggu gcgcccccag uaauagaggu gcggguuuac 180
cgcaguggug gcuaccgaau caccuccgag caaggaggaa cccaccuuga aaaagcuuug 240
ggcggguuga aagnnnnnnn nnnnnnnnnn nnnnnn 276
<210> 205
<211> 246
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-1 effector sgRNA 1
<220>
<221> modified_base
<222> (224)..(246)
<223> a, c, u, g, unknown or other
<400> 205
gaugcuaagu cgcgccuagc aucaaggagc uaugucuuga uugucuuggg uguccgcccu 60
ggaugaguug agguguagau gcuucuauca uggcagcuac uaaacgcccc aagcaagggg 120
aacccaucuu uaauuuuggc aaaccgaagc gggggcaaaa ucuccaggag guucgccaaa 180
accuuugaaa cuccuuagcu ggaaauggcg augggguuga aagnnnnnnn nnnnnnnnnn 240
nnnnnn 246
<210> 206
<211> 274
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-1 effector sgRNA 2
<220>
<221> modified_base
<222> (252)..(274)
<223> a, c, u, g, unknown or other
<400> 206
cuuguucgag uucguuugaa cugaacaagg guaaguaugg gccaguuuaa uugcuuuccg 60
ucccaggaua gcugccagcu ucuaccguag guucguccug caagugaugc uaagucgcgc 120
cuagcaucaa ggagcuaugu cuugauuguc uugggugucc gcccuggaug aguugaggug 180
uagaugcuuc uaucauggca gcuacuaaac gccccaagca aggggaaccc aucgaaagau 240
gggguugaaa gnnnnnnnnn nnnnnnnnnn nnnn 274
<210> 207
<211> 60
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG110-1-6 effector crRNA
<220>
<221> modified_base
<222> (9)..(40)
<223> a, c, u, g, unknown or other
<400> 207
cugguaaann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn gugaccugcc gcauaggcag 60
<210> 208
<211> 59
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG110-2-6 effector crRNA
<220>
<221> modified_base
<222> (7)..(38)
<223> a, c, u, g, unknown or other
<400> 208
ccaagannnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnua ugaacugccg cauaggcag 59
<210> 209
<211> 227
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-4 effector putative tracrRNA
<400> 209
aauagcgccg cuuguucaug cgcgaaagcg ucucugaaca guguaaaugu ggguuaguuu 60
gacugucgug aagacggucu ugcuuucuga cccugguagc ugcccaccuu gaagcugcug 120
ucucuuguag acaggaauca ggugcgcccc caguaauaua ggugcggguu uaccgcagug 180
guggcuaccc aaucaccucc gagcaaggag gaacccaccu uaauuau 227
<210> 210
<211> 228
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-7 effector putative tracrRNA
<400> 210
aacagcgccg caguucaugc gucuuauggc gccucugugc ugugcaaaau guggguuagu 60
uugacuguug gaagacaguc uugcuuucug acccugguag cugcccaccu ugaagcugcu 120
aucccuugug gauaggaauc aggugcgccc ccaguaauag aggugcgggu uuaccgcagu 180
gguggcuacc gaaucaccuc cgagcaagga ggaacccacc uuaauuau 228
<210> 211
<211> 328
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-9 effector putative tracrRNA
<400> 211
gcugaaguua gucucuggau acugaaguca gugucuaggg acugaaguaa ggggagcuuu 60
acccgcaagg gauacuuucg acccccugua gcugcccgcu ccuggugggg ugcccugaca 120
cccgccucau uacagcaaug uaugacuguc ugggcuaaug aaagaaggau uagggacgca 180
gguucacgac cuacuucaau cauagucugu gcaacccaga uaagugagua ugacccgcaa 240
gggucuaaac gccuuuagua gaaugguucu uccaguuugu uaagggcagg gcuugguucu 300
ccaagguggc uacgaauucu ucucgauu 328
<210> 212
<211> 187
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-10 effector putative tracrRNA
<400> 212
gguagcgcug gagccacaua guucauaagc ucacgcuucu uggacuuccu guguucucua 60
aaacggguuc uguuuuaccc uuaccaaggg auacuuucag auccgaguag cugcaagcuc 120
auggcggagu guccccugac gcuuugccac cgucauagcg augugauggc cgucuggcgu 180
augaacg 187
<210> 213
<211> 326
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-12 effector putative tracrRNA
<400> 213
aauagcgccc cuaaucaaau cgaaggcguu ugaggacggg gaaaaugggu aaguuuccau 60
cgaaaggugg uucuuuucag cccuauguag ucccacuccc uuguggagug uuagcaucug 120
aggugccuag cacagcaaag ucucucagga gacggaguca aagcugggga acaaguauua 180
cgaacgaauc ucgcgauucu auuaguauac guaggucgcu cccaugcaac aagaugcuca 240
ucucucagca augaggguag ggaacguauc ccaaacacua caugaauagc ucgucgggcu 300
ugcccgguga guauccacca agccuu 326
<210> 214
<211> 311
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-13 effector putative tracrRNA
<400> 214
cgcuagguuu gccuuuucgc gcgcugcuga agcagugaaa aguuccgaca guuuaaaagu 60
ucuaacacuu uuacugcuuu ccgucgggag uaguuguccg cuucugcguu guugagaccg 120
aaguuugucc aggugauagg cagaacguug augcaacagg uagauagucg cgcucuauca 180
ggaagcuguu cuaguuauua guguucgugc acuaauaaag aggauacagg gauacaugug 240
guugugucca gcaauggcac aacagggcca cuacucgaag ccccgagcaa ggguugagcc 300
uacccaaauu u 311
<210> 215
<211> 342
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-14 effector putative tracrRNA
<400> 215
aacagcgccg caguuuaagc ucuauagccg cugaacugug aaaaaugugg gucaguuugg 60
ucguugcaag acgaucgugc uuuccgaccc uaguaacugu ccgcucacug acugccaucc 120
uggggcaaau cuucaaauuu uguguauuug uguggggaug gaaagcugca uuagucgauu 180
cucuuccucc aauguagcgu aggugcgcac ccagcagaag ugaguuaagc cuucacaaug 240
uggagguaca gaagcaucau cucuccauuu uuugguguag auggugugac ugaaguggua 300
guuaccgaau cgccccugau caagggggag cccuccauaa uu 342
<210> 216
<211> 297
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-15 effector putative tracrRNA
<400> 216
aaugacguuu guuucugugc gcgcugcuga agcagugaaa aauacggaca gucuaauuug 60
cuuuccgucc ggaguaguug uccgcuucug cguuguugga accgaaguuu guccagguga 120
uaggcggagu guuucggcaa cagauggaga gucgcaccuc uaucaggggg caguuuuagu 180
gguuaguguu uagcgcacua ucacuaggau acagggauac augugguagu gaccagagau 240
ggcacugcgg gaccgcuacu cgaagccccg aacaaggguu gagcuuaccc aaaucuu 297
<210> 217
<211> 226
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-16 effector putative tracrRNA
<400> 217
aauagcgccg caguuuaagc ucagcaagcc ucuggacugc gaaaaguaug ggguaguuug 60
accgucggua aacgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120
uucuuaacug ggaaucgaga ugaggugcgc ccccagcaaa agggaacggg uuuacuggag 180
ugguggucgc cgaaucaccc ccgagcaagg gggacucguc cuuugc 226
<210> 218
<211> 227
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-17 effector putative tracrRNA
<400> 218
aauagcgccg caguuuaagc ucaaugagcc ucuugacugc gaacaguaug ggguaguuug 60
accggcggua accgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120
uucucaaccg ggaaucgaga aucaggugcg cccccagcaa gagggaacgg guuuacugga 180
gugguggucg ccgaaucacc cccgagcaag ggggacucgu ccuuugc 227
<210> 219
<211> 227
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-19 effector putative tracrRNA
<400> 219
aauagcgccg caguuuaagc ucagcaagcc ucuggacugc gaaaaguaug ggguaguuug 60
accgucggua aacgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120
uucucaaccg ggaaucgaga aucaggugcg cccccagcaa gagggaacgg guuuacugga 180
gugguggucg ccgaaucacc cccgagcaag ggggacucgu ccuuugc 227
<210> 220
<211> 211
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-20 effector putative tracrRNA
<400> 220
aauagcgccg caguuuaagc ucaaugagcc ucuugacugc gaacaguaug ggguaguuug 60
accggcggua accgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120
uucucaaccg ggaaucgaga aucaggugcg cccccagcaa gagggaacgg guuuacugga 180
gugguggucg ccgaaucacc cccgagcaag g 211
<210> 221
<211> 222
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-21 effector putative tracrRNA
<400> 221
aauagcgccg caguucaugc uucuuugaag ccucugugcu gugcaaaaug uggguuaguu 60
uggcuguuga agaaacagcc uugcuuucug acccugguag cuguccaccc ugaagcugcu 120
auccccugug gauaggauag gugcgccccc agcaauaggg gagcggguau accgcagugg 180
uggcuacuga aucaccucca agcaaggagg aauccacuuu au 222
<210> 222
<211> 222
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-22 effector putative tracrRNA
<400> 222
aauagcgccg caguucaugc uucuuugaag ccucugugcu gugcaaaaug uggguuaguu 60
uggcuguuga agaaacagcc uugcuuucug acccugguag cuguccaccc ugaagcugcu 120
auccccugug gauaggauag gugcgccccc agcaauaggg gagcggguau accgcagugg 180
uggcuacuga aucaccucca agcaaggagg aauccacuuu au 222
<210> 223
<211> 248
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-24 effector putative tracrRNA
<400> 223
aaaagcgccg uagaacaugc ucacgccucu guucugcgaa aaauuagggu uuguuuggcu 60
gucugacagc agucuuacuu ucugucccua gaaucugacc acuccgaugc ugcuguugua 120
agugaacuug auugagcucg gacaccaugc aacaggauaa ggggcgcacc cagcaagaga 180
ggacggacuu accguagugu uggcuucuga agcaacuccg accaaggagu aguccaugca 240
uucaucau 248
<210> 224
<211> 277
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-25 effector putative tracrRNA
<400> 224
aaucgcgccg cacauucaug uuccuugaga accucugaau ugcgaaagug ugggcuaguu 60
uguucgcuug augcgaaugu gcuuucuggc ccugguagcu guccgcccug augcugauuu 120
cuacggguaa cuguaggaau gauuaacucg uucuauagac agguuucgug cuuucuauug 180
uaacgggguc ggugcgcucc cagcaauagg gguguggguc uacuacagug auggcuacug 240
aaucaccucc gagcaaggag gaauccaccu uaacuuu 277
<210> 225
<211> 226
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-27 effector putative tracrRNA
<400> 225
aauagcgccg caguuuaagc ucagcaagcc ucuggacugc gaaaaguaug ggguaguuug 60
accgucggua aacgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120
uucuuaacug ggaaucgaga ugaggugcgc ccccagcaag agggaacggg uuuacuggag 180
ugguggucgc cgaaucaccc ccgagcaagg gggacucguc cuuugc 226
<210> 226
<211> 226
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-28 effector putative tracrRNA
<400> 226
aauagcgccg caguuuaagc ucagcaagcc ucuggacugc gaaaaguaug ggguaguuug 60
accgucggua aacgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120
uucuuaacug ggaaucgaga ugaggugcgc ccccagcaag agggaacggg uuuacuggag 180
ugguggucgc cgaaucaccc ccgagcaagg gggacucguc cuuugc 226
<210> 227
<211> 255
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-29 effector putative tracrRNA
<400> 227
uagcgcacga accugacuag cgucauuacg augcgaguuc uggaaauggg acaguuucau 60
ugcuuuccgu cccuggcacu gccugcuuac ucacgaccac aaggagacaa uucagcgcug 120
ugaguucgcg auucucuacu guuuaugaca aacuaacguu ugucuggcag uacagcaaga 180
uuguguauca gaccauguuu ggcgaagaua cauggcaggc cgaaucgcca augaaaccag 240
cggacuuccc cuaau 255
<210> 228
<211> 226
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-32 effector putative tracrRNA
<400> 228
aauagcgccg caguuuaagc ucaaugagcc ucuugacugc gaacaguaug ggguaguuug 60
accggcggua accgguugug cuuucugccc cuggcgacug cccaccccga ugcugucgau 120
uucuuaacug ggaaucgaga ugaggugcgc ccccagcaag agggaacggg uuuacuggag 180
ugguggucgc cgaaucaccc ccgagcaagg gggacucguc cuuugc 226
<210> 229
<211> 203
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-44 effector putative tracrRNA
<400> 229
ucuagcgccg cagcucaugu cagcaauggc caauguguug ugcuaaaugc gagcuaguuu 60
gacugccugc uaagcagucu ugcuuucugg cucaggugac uauccaccca aaggucguug 120
gugcgcuggc gauuugaggg cacggguucc ggagugauag uuaccauuac accuccggcc 180
aaggaggaau ccaccccacc ccc 203
<210> 230
<211> 203
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-46 effector putative tracrRNA
<400> 230
ucuagcgccg cagcucaugu cagcaauggc caauguguug ugcuaaaugc gagcuaguuu 60
gacugccugc uaagcagucu ugcuuucugg cucaggugac uauccaccca aaggucguug 120
gugcgcuggc gauuugaggg cacggguucc ggagugauag uuaccauuac accuccggcc 180
aaggaggaau ccaccccacc ccc 203
<210> 231
<211> 310
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-49 effector putative tracrRNA
<400> 231
gauugcgccu cgaucgaugc ucuaugagcc gcucgaucgu agaaaaaugg gugaguuuga 60
uuaucuacuu cguuagauaa ugcugcuuuc cgacccuggc auucuguccg cccuugaagc 120
ugcuucucau ggacuagcgu aagcucguug guaagaagga aaagucauaa uuuaaaguca 180
cgucuuucua guaugacaua ggugcgcucc cacgcaauau aggguucagc uuuuauuuua 240
uaaaaguaga gacuuuccuc uagugacagu gccgaaauga ccccgugcga gggguaacua 300
ccuaaguuuu 310
<210> 232
<211> 227
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-51 effector putative tracrRNA
<400> 232
aacagcgccg caguucaugu uuguuauaaa ccucuguacu gcgauaaaug cggguuaguu 60
ugacuguugu gagacagucu ugcuuucuga cccuaguagc ugcccaccuu gaugcugcug 120
uucccaguga acaggaauaa ggugcgcccc caguaauaga ggugcggguu uaccgcagug 180
guggcuacug aaucaccucc gacuaaggag gaauccaccu uaauuau 227
<210> 233
<211> 380
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-52 effector putative tracrRNA
<400> 233
accggggauc guccugguga agggagaguu gcuuuggauc ggucacaagc uuuuccuuaa 60
cuaauucuca cugacugacu aggaugaucg aggggguuau guuuuaccac ugcaaggugg 120
auacuuucaa accccugugg uagcugcucg cuccugguga ggugcccuga cacuucaccc 180
cacuacagca augugugugg cugucugguu augagagaag uuagggcaua gguucguuac 240
cugcauucaa ucauaaauua cgcgaccaga uaagugagua ugauccgcaa ggaucuauau 300
gucuuuagca aagaagugcu ucugcuuugu uacuggcgua gggcaugguu cucuaaagug 360
gcuaccgaac cuucccaauu 380
<210> 234
<211> 257
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG64-56 effector putative tracrRNA
<400> 234
aacagcgccg caguucaugc ucuucugagu cucuguacug ugauaaaucu ggguuaguuu 60
aacgguugaa agaccguuuu gcuuucugac ccugguagcu gcucgcucuu gaugcugcug 120
ucuuuugaca ggauaggugc gcucccagca auaaagaguu aaagcugaua aagcuugagc 180
cguuguaaaa cggugggguu uaccucagug guggcuacug aaucaccccc uucgucgggg 240
gaacccuccu aaauauu 257
<210> 235
<211> 246
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-1 effector putative tracrRNA
<400> 235
uuuagcgcac uuguucgagu ucguuugaac ugaacaaggg uaaguauggg ccaguuuaau 60
ugcuuuccgu cccaggauag cugccagcuu cuaccguagg uucguccugc aagugaugcu 120
aagucgcgcc uagcaucaag gagcuauguc uugauugucu uggguguccg cccuggauga 180
guugaggugu agaugcuucu aucauggcag cuacuaaacg ccccaagcaa ggggaaccca 240
ucuuua 246
<210> 236
<211> 223
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG108-2 effector putative tracrRNA
<400> 236
aauagcgccg uaguucaugc uugcuaaagc cucugaauug cgaaaagucc ggguuagugc 60
ugucggcaga cagcguugcu uucugacccu gguagcugcc caccccgaug cugcuguccc 120
uugcagacag gaaccaggug cgcccccagu aauaagggug uggguuuacc acaguggugg 180
cuacugaauc accuccgagc aaggaggaau ccaccuuaac uau 223
<210> 237
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-9 effector crRNA
<400> 237
gucuuucauc cuaucucgcg ccagaucgcu uccugcaacc c 41
<210> 238
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-12 effector crRNA
<400> 238
guugcaagcg ccuccuuggc uguugguggg uggaaag 37
<210> 239
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-14 effector crRNA
<400> 239
guugcaaucg ccuucccaga gauggguggg cugaaag 37
<210> 240
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-15 effector crRNA
<400> 240
guuacaauua cccucccagc guuggguggg uugaaagg 38
<210> 241
<211> 39
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-16 effector crRNA
<400> 241
aaguugcauc cgcuuuccag caaccagggc gggugaaag 39
<210> 242
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-17 effector crRNA
<400> 242
guugcauccg cuuuccagca accagggcgg gugaaag 37
<210> 243
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-19 effector crRNA
<400> 243
guacccaaag ccuuuuuucc uuaagccuau ccg 33
<210> 244
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-25 effector crRNA
<400> 244
guuucaaccg ccaucccagc uaggggu 27
<210> 245
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-27 effector crRNA
<400> 245
aguugcaucc gcuuuccagc aaccagggcg ggugaaag 38
<210> 246
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-28 effector crRNA
<400> 246
guugcaucug cuuuucagca acuagggcgg gggaaagc 38
<210> 247
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-29 effector crRNA
<400> 247
ggcgcgaucg ccuuuauggg uacgggcaag uugaaag 37
<210> 248
<211> 41
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-32 effector crRNA
<400> 248
aaguugcauc cgcuuuccag caaccagggc gggugaaagu u 41
<210> 249
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-44 effector crRNA
<400> 249
guugccuccc gcuucgaggc acgggaacga uugaaag 37
<210> 250
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-46 effector crRNA
<400> 250
guugccuccc gcuucgaggc acgggaacga uugaaag 37
<210> 251
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-49 effector crRNA
<400> 251
guugcaacac ucccugacug ccugacacaa augccucgaa agc 43
<210> 252
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-52 effector crRNA
<400> 252
gucgcaauga cuauuuuggc uuggggcgga auga 34
<210> 253
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-51 effector crRNA
<400> 253
guuucaacac cccucccgaa guggggcggg uugaaag 37
<210> 254
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-56 effector crRNA
<400> 254
guuucaacaa ccaucccagc uagggguggg uugaaag 37
<210> 255
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-2 effector crRNA
<400> 255
guuucaacga ccaucccaac uagggguggg uugaaag 37
<210> 256
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-4 effector crRNA
<400> 256
guuucaacuu uccuuccagc uagaggcggg uugaaag 37
<210> 257
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-6 effector crRNA
<400> 257
guuucaacca ccaucucaac uagggauggg uugaaag 37
<210> 258
<211> 38
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-7 effector crRNA
<400> 258
guuucaacgc cccuucaagc uuugggcggg uugaaagc 38
<210> 259
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG64-13 effector crRNA
<400> 259
uggcaauugc ccuuccagug uugggugggu ugaaag 36
<210> 260
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG108-2 effector crRNA
<400> 260
guuucaacga ccaucccgac aagggguggg uugaaag 37
<210> 261
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG108-1 effector crRNA
<400> 261
guugcgaucg ccgcuccggu ggcgaugggg uugaaag 37
Claims (141)
- 카고(cargo) 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
재조합효소(recombinase) 또는 전위효소(transposase) 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
클래스 II 타입 II Cas 이펙터, 및 상기 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
상기 카고 뉴클레오타이드 서열을 상기 표적 핵산 부위로 끌어들이도록 구성된 상기 재조합효소 또는 전위효소 복합체
를 포함하는 시스템. - 제1항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
- 제1항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
- 제3항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
- 제6항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
- 제7항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 3'에 위치하는 것인 시스템.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 Tn7 타입 전위효소 복합체인 시스템.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된 것인 시스템.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 클래스 II 타입 II Cas 이펙터가 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개 또는 4개의 폴리펩티드(들)를 포함하는 것인 시스템.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 시스템.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제2항 내지 제14항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제2항 내지 제15항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 19 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 클래스 II 타입 II Cas 이펙터 및 상기 재조합효소 또는 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 시스템.
- 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 제1항 내지 제17항 중 어느 한 항의 시스템을 발현시키거나 제1항 내지 제17항 중 어느 한 항의 시스템을 세포에 도입하는 단계를 포함하는 방법.
- 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체
를 포함하는 시스템. - 제19항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
- 제19항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
- 제21항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
- 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터가 아닌 것인 시스템.
- 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
- 제19항 내지 제24항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
- 제19항 내지 제25항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
- 제26항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 5'에 위치하는 것인 시스템.
- 제19항 내지 제27항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된 것인 시스템.
- 제19항 내지 제28항 중 어느 한 항에 있어서, 상기 TnsA 서브유닛이 서열번호 7 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
- 제19항 내지 제29항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함하는 것인 시스템.
- 제19항 내지 제30항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 시스템.
- 제24항 내지 제31항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 20 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제24항 내지 제32항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 21 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제19항 내지 제33항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터가 아닌 것인 시스템.
- 제19항 내지 제34항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 시스템.
- 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 제19항 내지 제34항 중 어느 한 항의 시스템을 발현시키거나 제19항 내지 제34항 중 어느 한 항의 시스템을 세포에 도입하는 단계를 포함하는 방법.
- 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서,
카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을,
클래스 II 타입 II Cas 이펙터, 및 상기 표적 핵산 부위에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체;
상기 카고 뉴클레오타이드를 상기 표적 핵산 부위로 끌어들이도록 구성된 재조합효소 또는 전위효소 복합체; 및
상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산
과 접촉시키는 단계를 포함하는 방법. - 제37항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
- 제37항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
- 제39항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
- 제37항 내지 제40항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 방법.
- 제37항 내지 제41항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 방법.
- 제42항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 3'에 위치하는 것인 방법.
- 제37항 내지 제43항 중 어느 한 항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 Tn7 타입 전위효소 복합체인 시스템.
- 제37항 내지 제44항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 II Cas 이펙터에 결합하도록 구성된 것인 방법.
- 제37항 내지 제45항 중 어느 한 항에 있어서, 상기 클래스 II 타입 II Cas 이펙터가 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 방법.
- 제37항 내지 제46항 중 어느 한 항에 있어서, 상기 재조합효소 또는 전위효소 복합체가 서열번호 2 내지 5 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개 또는 4개의 폴리펩티드(들)를 포함하는 것인 방법.
- 제37항 내지 제47항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 방법.
- 제37항 내지 제48항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
- 제41항 내지 제49항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 17 및 18 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
- 제41항 내지 제50항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 19 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
- 제37항 내지 제51항 중 어느 한 항에 있어서, 상기 클래스 II 타입 II Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 방법.
- 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 방법으로서,
상기 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산을,
클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 적어도 하나의 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체;
상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체; 및
상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산
과 접촉시키는 단계를 포함하는 방법. - 제53항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
- 제53항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
- 제55항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
- 제53항 내지 제56항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 방법.
- 제53항 내지 제57항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 방법.
- 제58항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 3'에 위치하는 것인 방법.
- 제53항 내지 제59항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된 것인 방법.
- 제53항 내지 제60항 중 어느 한 항에 있어서, 상기 TnsA 서브유닛이 서열번호 7 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 방법.
- 제53항 내지 제61항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 8 내지 10 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함하는 것인 방법.
- 제53항 내지 제62항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 13 내지 16 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 방법.
- 제57항 내지 제63항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 20 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
- 제57항 내지 제64항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 21 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 방법.
- 제53항 내지 제65항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터가 아닌 것인 방법.
- 제53항 내지 제66항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 방법.
- 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
클래스 I 타입 I-F Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsA 서브유닛을 포함하는 Tn7 타입 전위효소 복합체
를 포함하는 시스템. - 제68항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
- 제68항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
- 제70항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
- 제68항 내지 제71항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
- 제68항 내지 제72항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
- 제68항 내지 제73항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
- 제74항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 3'에 위치하는 것인 시스템.
- 제74항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 5'에 위치하는 것인 시스템.
- 제68항 내지 제76항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 I 타입 I-F Cas 이펙터에 결합하도록 구성된 것인 시스템.
- 제68항 내지 제77항 중 어느 한 항에 있어서, 상기 클래스 I 타입 I-F Cas 이펙터가 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
- 제68항 내지 제78항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 44 내지 46 또는 51 내지 53 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 1개, 적어도 2개 또는 3개의 폴리펩티드(들)를 포함하는 것인 시스템.
- 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 제68항 내지 제79항 중 어느 한 항의 시스템을 발현시키거나 제68항 내지 제79항 중 어느 한 항의 시스템을 세포에 도입하는 단계를 포함하는 방법.
- 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsB, TnsC 및 TniQ 구성요소를 포함하는 Tn7 타입 전위효소 복합체
를 포함하고, 이때 (a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 폴리펩티드를 포함하거나;
(b) 상기 Tn7 타입 전위효소 복합체가 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 TnsB, TnsC 또는 TniQ 구성요소를 포함하는 것인 시스템. - 제81항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
- 제81항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
- 제83항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
- 제81항 내지 제84항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
- 제81항 내지 제85항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 TnsB, TnsC 또는 TniQ 구성요소를 포함하는 것인 시스템.
- 제81항 내지 제86항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터인 시스템.
- 제81항 내지 제87항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
- 제81항 내지 제88항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
- 제81항 내지 제89항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
- 제90항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 5'에 위치하는 것인 시스템.
- 제91항에 있어서, 상기 PAM 서열이 5'-nGTn-3' 또는 5'-nGTt-3'을 포함하는 것인 시스템.
- 제81항 내지 제92항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된 것인 시스템.
- 제81항 내지 제93항 중 어느 한 항에 있어서, 상기 TnsB, TnsC 및 TniQ 구성요소가 각각 서열번호 23 내지 25, 27 내지 29, 31 내지 33, 35 내지 37, 101 내지 103, 105 내지 107 또는 148 내지 150 중 어느 하나에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
- 제81항 내지 제94항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 시스템.
- 제81항 내지 제95항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
- 제88항 내지 제96항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 125, 127, 123, 129, 131, 133, 153 또는 134 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제88항 내지 제97항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 126, 155, 128, 124, 130, 132 또는 154 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제81항 내지 제97항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 시스템.
- 제81항 또는 제88항에 있어서,
(a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 22 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(b) 상기 좌측 재조합효소 서열이 서열번호 125 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(c) 상기 우측 재조합효소 서열이 서열번호 126 또는 155, 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
(d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 90의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 94, 112 또는 202 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 23 내지 25 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템. - 제81항 또는 제88항에 있어서,
(a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 26 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(b) 상기 좌측 재조합효소 서열이 서열번호 127 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(c) 상기 우측 재조합효소 서열이 서열번호 128 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 91, 156 또는 209 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 95, 113 또는 203 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 27 내지 29 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템. - 제81항 또는 제88항에 있어서,
(a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 60 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(b) 상기 좌측 재조합효소 서열이 서열번호 131 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(c) 상기 우측 재조합효소 서열이 서열번호 132 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 117, 161 또는 214 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 119의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 101 내지 103 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템. - 제81항 또는 제88항에 있어서,
(a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 147 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(b) 상기 좌측 재조합효소 서열이 서열번호 153 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(c) 상기 우측 재조합효소 서열이 서열번호 154 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 151, 181 또는 234 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 152 또는 254의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 148 내지 150 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템. - 제81항 또는 제88항에 있어서,
(a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 34 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(b) 상기 좌측 재조합효소 서열이 서열번호 129 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(c) 상기 우측 재조합효소 서열이 서열번호 130 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 93, 157 또는 210 중 어느 하나의 적어도 약 46개 내지 60개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 97, 114 또는 204 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 148 내지 150 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템. - 제81항, 제88항 및 제91항 중 어느 한 항에 있어서,
(a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 30 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(b) 상기 좌측 재조합효소 서열이 서열번호 123 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(c) 상기 우측 재조합효소 서열이 서열번호 124 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
(d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 92의 적어도 약 46개 내지 80개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 111 또는 201의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
(e) 상기 TnsB, TnsC 및 TniQ 구성요소가 서열번호 31, 32 및 33, 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하거나;
(f) 상기 PAM 서열이 5'-nGTn-3' 또는 5'-nGTt-3'을 포함하는 것인 시스템. - 카고 뉴클레오타이드 서열을 표적 핵산 부위로 전위시키는 시스템으로서,
Tn7 타입 전위효소 복합체와 상호작용하도록 구성된 카고 뉴클레오타이드 서열을 포함하는 제1 이중 가닥 핵산;
클래스 II 타입 V Cas 이펙터, 및 상기 표적 뉴클레오타이드 서열에 하이브리드화하도록 구성된 조작된 가이드 폴리뉴클레오타이드를 포함하는 Cas 이펙터 복합체; 및
상기 Cas 이펙터 복합체에 결합하도록 구성되고 TnsB 및 TnsC 구성요소를 포함하지만 TnsA 및/또는 TniQ 구성요소를 포함하지 않는 Tn7 타입 전위효소 복합체
를 포함하는 시스템. - 제106항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 비공유 결합하는 것인 시스템.
- 제106항에 있어서, 상기 전위효소 복합체가 상기 Cas 이펙터 복합체에 공유 결합하는 것인 시스템.
- 제108항에 있어서, 상기 전위효소 복합체가 단일 폴리펩티드에서 상기 Cas 이펙터 복합체에 융합되는 것인 시스템.
- 제106항 내지 제109항 중 어느 한 항에 있어서, 상기 Tn7 타입 전위효소 복합체가 서열번호 39, 40, 109 또는 110 중 어느 하나에 대해 적어도 80% 서열 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
- 제106항 내지 제110항 중 어느 한 항에 있어서, 상기 TnsB 구성요소가 서열번호 40 또는 109에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
- 제106항 내지 제111항 중 어느 한 항에 있어서, 상기 TnsC 구성요소가 서열번호 39 또는 110에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 폴리펩티드를 포함하는 것인 시스템.
- 제106항 내지 제112항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 Cas12k 이펙터인 시스템.
- 제106항 내지 제112항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터가 서열번호 38 또는 서열번호 108에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 시스템.
- 제106항 내지 제114항 중 어느 한 항에 있어서, 상기 카고 뉴클레오타이드 서열이 좌측 전위효소 인식 서열 및 우측 전위효소 인식 서열에 의해 플랭킹되는 것인 시스템.
- 제106항 내지 제115항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 제2 이중 가닥 핵산을 추가로 포함하는 시스템.
- 제106항 내지 제116항 중 어느 한 항에 있어서, 상기 표적 핵산 부위를 포함하는 상기 이중 가닥 핵산 또는 상기 시스템이 세포 내부에 있는 것인 시스템.
- 제106항 내지 제117항 중 어느 한 항에 있어서, 상기 표적 핵산 부위에 인접한 상기 Cas 이펙터 복합체와 호환되는 PAM 서열을 추가로 포함하는 시스템.
- 제118항에 있어서, 상기 PAM 서열이 상기 표적 핵산 부위의 5'에 위치하는 것인 시스템.
- 제106항 내지 제119항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 상기 클래스 II 타입 V Cas 이펙터에 결합하도록 구성된 것인 시스템.
- 제106항 내지 제120항 중 어느 한 항에 있어서, 상기 TnsB 및 TnsC 구성요소가 각각 서열번호 40 및 39 또는 109 및 110에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템.
- 제106항 내지 제121항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 시스템.
- 제106항 내지 제121항 중 어느 한 항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 115, 116, 205, 206, 261, 235, 260 또는 236 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제115항 내지 제123항 중 어느 한 항에 있어서, 상기 좌측 재조합효소 서열이 서열번호 134에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제115항 내지 제124항 중 어느 한 항에 있어서, 상기 우측 재조합효소 서열이 서열번호 135 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 시스템.
- 제106항 내지 제125항 중 어느 한 항에 있어서, 상기 클래스 II 타입 V Cas 이펙터 및 상기 Tn7 타입 전위효소 복합체가 약 10 킬로염기 미만을 포함하는 폴리뉴클레오타이드 서열에 의해 코딩되는 것인 시스템.
- 제106항 또는 제115항에 있어서,
(a) 상기 클래스 II 타입 V Cas 이펙터가 서열번호 38 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(b) 상기 좌측 재조합효소 서열이 서열번호 134 또는 이의 변이체에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나;
(c) 상기 우측 재조합효소 서열이 서열번호 135 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
(d) 상기 조작된 가이드 폴리뉴클레오타이드가 (i) 서열번호 182 또는 235의 적어도 약 46개 내지 80개의 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하거나, (ii) 서열번호 98, 115, 116, 205 또는 206의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하거나;
(e) 상기 TnsB 및 TnsC 구성요소가 서열번호 40 및 39 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 가진 폴리펩티드를 포함하는 것인 시스템. - 카고 뉴클레오타이드 서열을, 표적 뉴클레오타이드 서열을 포함하는 표적 핵산 부위로 전위시키는 방법으로서, 세포 내에서 제81항 내지 제127항 중 어느 한 항의 시스템을 발현시키거나 제81항 내지 제127항 중 어느 한 항의 시스템을 세포에 도입하는 단계를 포함하는 방법.
- RuvC 도메인 및 HNH 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 폴리뉴클레오타이드를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 엔도뉴클레아제가 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제가 서열번호 1 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 클래스 II 타입 II 엔도뉴클레아제이고, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- 제129항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 12 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 60개 내지 80개의 연속 뉴클레오타이드를 포함하는 것인 조작된 뉴클레아제 시스템.
- 제129항 또는 제130항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 11 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 엔도뉴클레아제가 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제가 서열번호 5에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V 엔도뉴클레아제이고, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- 제132항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 13 내지 16 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 엔도뉴클레아제가 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제가 서열번호 22, 26, 30, 34, 55 내지 89, 104 또는 147 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V-K 엔도뉴클레아제이고, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- 제134항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 90, 91, 92, 93, 117, 151, 156 내지 181 또는 209 내지 234 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- 제134항 또는 제135항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 서열 동일성을 가진 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- RuvC 도메인을 포함하는 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 엔도뉴클레아제가 배양되지 않은 미생물로부터 유래하고, 상기 엔도뉴클레아제가 서열번호 38 또는 서열번호 108 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 클래스 II 타입 V-K 엔도뉴클레아제이고, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- 제137항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 118, 182, 183, 235 또는 236 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 적어도 약 46개 내지 80개의 연속 뉴클레오타이드를 포함하는 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- 제137항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 111 내지 114 또는 201 내지 206, 255, 262, 256, 209, 257, 263, 258, 210, 115, 116, 205, 206, 261, 235, 260 또는 236 중 어느 하나 또는 이의 변이체의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- 서열번호 41 내지 43 또는 48 내지 50 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일성을 가진 서열을 포함하는 적어도 하나의 Cas6, Cas7 또는 Cas8 폴리펩티드를 포함하는 클래스 I 타입 I-F Cas 엔도뉴클레아제; 및 조작된 가이드 RNA를 포함하는 조작된 뉴클레아제 시스템으로서, 상기 조작된 가이드 RNA가 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA가 표적 핵산 서열에 하이브리드화하도록 구성된 스페이서 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
- 제140항에 있어서, 상기 조작된 가이드 폴리뉴클레오타이드가 서열번호 121, 122, 207 또는 208 중 어느 하나의 비-축퇴 뉴클레오타이드에 대해 적어도 80% 동일성을 가진 서열을 포함하는 것인 조작된 뉴클레아제 시스템.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063069703P | 2020-08-24 | 2020-08-24 | |
US63/069,703 | 2020-08-24 | ||
US202163186698P | 2021-05-10 | 2021-05-10 | |
US63/186,698 | 2021-05-10 | ||
US202163232593P | 2021-08-12 | 2021-08-12 | |
US63/232,593 | 2021-08-12 | ||
PCT/US2021/047195 WO2022046662A1 (en) | 2020-08-24 | 2021-08-23 | Systems and methods for transposing cargo nucleotide sequences |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230054457A true KR20230054457A (ko) | 2023-04-24 |
Family
ID=80353933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237010115A KR20230054457A (ko) | 2020-08-24 | 2021-08-23 | 카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20240301374A1 (ko) |
EP (1) | EP4200422A4 (ko) |
JP (1) | JP2023539237A (ko) |
KR (1) | KR20230054457A (ko) |
CN (1) | CN116438302A (ko) |
AU (1) | AU2021333586A1 (ko) |
BR (1) | BR112023003441A2 (ko) |
CA (1) | CA3190758A1 (ko) |
GB (1) | GB2615658A (ko) |
MX (1) | MX2023002281A (ko) |
WO (1) | WO2022046662A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20240145522A (ko) * | 2022-02-23 | 2024-10-07 | 메타지노미, 인크. | 융합 단백질 |
WO2023220599A2 (en) * | 2022-05-09 | 2023-11-16 | Cornell University | Adaptations for high efficiency and altered pam usage with tn7-crispr-cas transposition systems |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE202013012241U1 (de) * | 2012-05-25 | 2016-01-18 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
GB201514510D0 (en) * | 2015-08-14 | 2015-09-30 | Nemesis Bioscience Ltd | Delivery vehicle |
US20200002746A1 (en) * | 2017-02-14 | 2020-01-02 | Seqwell, Inc. | Compositions and methods for sequencing nucleic acids |
EP3704237A1 (en) * | 2017-11-02 | 2020-09-09 | Arbor Biotechnologies, Inc. | Novel crispr-associated transposon systems and components |
US20230193255A1 (en) * | 2018-11-16 | 2023-06-22 | The Regents Of The University Of California | Compositions and methods for delivering crispr/cas effector polypeptides |
US11384344B2 (en) * | 2018-12-17 | 2022-07-12 | The Broad Institute, Inc. | CRISPR-associated transposase systems and methods of use thereof |
-
2021
- 2021-08-23 JP JP2023513262A patent/JP2023539237A/ja active Pending
- 2021-08-23 BR BR112023003441A patent/BR112023003441A2/pt unknown
- 2021-08-23 EP EP21862499.7A patent/EP4200422A4/en active Pending
- 2021-08-23 CN CN202180072470.7A patent/CN116438302A/zh active Pending
- 2021-08-23 MX MX2023002281A patent/MX2023002281A/es unknown
- 2021-08-23 KR KR1020237010115A patent/KR20230054457A/ko active Search and Examination
- 2021-08-23 CA CA3190758A patent/CA3190758A1/en active Pending
- 2021-08-23 GB GB2304018.1A patent/GB2615658A/en active Pending
- 2021-08-23 WO PCT/US2021/047195 patent/WO2022046662A1/en active Application Filing
- 2021-08-23 AU AU2021333586A patent/AU2021333586A1/en active Pending
-
2023
- 2023-10-05 US US18/481,769 patent/US20240301374A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4200422A1 (en) | 2023-06-28 |
AU2021333586A9 (en) | 2024-02-08 |
WO2022046662A1 (en) | 2022-03-03 |
JP2023539237A (ja) | 2023-09-13 |
CA3190758A1 (en) | 2022-03-03 |
AU2021333586A1 (en) | 2023-04-27 |
BR112023003441A2 (pt) | 2023-05-02 |
MX2023002281A (es) | 2023-05-16 |
EP4200422A4 (en) | 2024-08-28 |
GB2615658A (en) | 2023-08-16 |
US20240301374A1 (en) | 2024-09-12 |
CN116438302A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7502537B2 (ja) | Ruvcドメインを有する酵素 | |
US20240301374A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
US20220298494A1 (en) | Enzymes with ruvc domains | |
US20230340481A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
WO2021178934A1 (en) | Class ii, type v crispr systems | |
WO2021202559A1 (en) | Class ii, type ii crispr systems | |
WO2021226369A1 (en) | Enzymes with ruvc domains | |
CN116615547A (zh) | 用于对货物核苷酸序列转座的系统和方法 | |
KR20240145522A (ko) | 융합 단백질 | |
KR20240145512A (ko) | 융합 단백질 | |
GB2617659A (en) | Enzymes with RUVC domains | |
KR20240150801A (ko) | 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법 | |
WO2023164591A2 (en) | Systems and methods for transposing cargo nucleotide sequences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |