KR20200039775A - 뉴클레오타이드 표적 인식을 이용한 표적 서열 특이적 개변 기술 - Google Patents
뉴클레오타이드 표적 인식을 이용한 표적 서열 특이적 개변 기술 Download PDFInfo
- Publication number
- KR20200039775A KR20200039775A KR1020207007763A KR20207007763A KR20200039775A KR 20200039775 A KR20200039775 A KR 20200039775A KR 1020207007763 A KR1020207007763 A KR 1020207007763A KR 20207007763 A KR20207007763 A KR 20207007763A KR 20200039775 A KR20200039775 A KR 20200039775A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- leu
- target
- glu
- arg
- Prior art date
Links
- 239000002773 nucleotide Substances 0.000 title claims abstract description 99
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 99
- 230000004048 modification Effects 0.000 title claims description 15
- 238000012986 modification Methods 0.000 title claims description 15
- 238000005516 engineering process Methods 0.000 title description 3
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 145
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 135
- 108020004414 DNA Proteins 0.000 claims abstract description 119
- 238000000034 method Methods 0.000 claims abstract description 103
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 89
- 230000000295 complement effect Effects 0.000 claims abstract description 37
- 230000008685 targeting Effects 0.000 claims abstract description 37
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 33
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 33
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 33
- 108091033409 CRISPR Proteins 0.000 claims abstract description 18
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract 12
- 230000014509 gene expression Effects 0.000 claims description 74
- 102000040430 polynucleotide Human genes 0.000 claims description 23
- 108091033319 polynucleotide Proteins 0.000 claims description 23
- 239000002157 polynucleotide Substances 0.000 claims description 23
- 239000013604 expression vector Substances 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 102000053602 DNA Human genes 0.000 claims description 9
- 238000003780 insertion Methods 0.000 claims description 9
- 230000037431 insertion Effects 0.000 claims description 9
- 238000006467 substitution reaction Methods 0.000 claims description 5
- 210000004027 cell Anatomy 0.000 description 98
- 235000018102 proteins Nutrition 0.000 description 79
- 239000013598 vector Substances 0.000 description 42
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 40
- 108010042407 Endonucleases Proteins 0.000 description 38
- 102100031780 Endonuclease Human genes 0.000 description 34
- 230000035772 mutation Effects 0.000 description 33
- 239000013612 plasmid Substances 0.000 description 33
- 230000001939 inductive effect Effects 0.000 description 32
- 241000588724 Escherichia coli Species 0.000 description 25
- 241000192710 Microcystis aeruginosa Species 0.000 description 25
- 238000010362 genome editing Methods 0.000 description 24
- 108090000765 processed proteins & peptides Proteins 0.000 description 24
- 238000003776 cleavage reaction Methods 0.000 description 23
- 230000007017 scission Effects 0.000 description 23
- 239000012634 fragment Substances 0.000 description 20
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 19
- 101150053283 IAA9 gene Proteins 0.000 description 16
- 125000003275 alpha amino acid group Chemical group 0.000 description 15
- 241000196324 Embryophyta Species 0.000 description 14
- 240000003768 Solanum lycopersicum Species 0.000 description 14
- 241000208125 Nicotiana Species 0.000 description 12
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 12
- 101150102092 ccdB gene Proteins 0.000 description 12
- 238000011144 upstream manufacturing Methods 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 101150108119 PDS gene Proteins 0.000 description 11
- 108020001507 fusion proteins Proteins 0.000 description 11
- 102000037865 fusion proteins Human genes 0.000 description 11
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 10
- 238000002715 modification method Methods 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 238000012546 transfer Methods 0.000 description 10
- 241000589158 Agrobacterium Species 0.000 description 9
- 241000282414 Homo sapiens Species 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 108091026890 Coding region Proteins 0.000 description 8
- 206010020649 Hyperkeratosis Diseases 0.000 description 8
- 238000001727 in vivo Methods 0.000 description 8
- 229930027917 kanamycin Natural products 0.000 description 8
- 229960000318 kanamycin Drugs 0.000 description 8
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 8
- 229930182823 kanamycin A Natural products 0.000 description 8
- 239000013600 plasmid vector Substances 0.000 description 8
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 7
- 108010076504 Protein Sorting Signals Proteins 0.000 description 7
- 108010008355 arginyl-glutamine Proteins 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- 241000219194 Arabidopsis Species 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 238000012300 Sequence Analysis Methods 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010062796 arginyllysine Proteins 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 230000001629 suppression Effects 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 108010001545 phytoene dehydrogenase Proteins 0.000 description 5
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 5
- WIIZWVCIJKGZOK-IUCAKERBSA-N 2,2-dichloro-n-[(1s,2s)-1,3-dihydroxy-1-(4-nitrophenyl)propan-2-yl]acetamide Chemical compound ClC(Cl)C(=O)N[C@@H](CO)[C@@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-IUCAKERBSA-N 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 4
- 101100290380 Caenorhabditis elegans cel-1 gene Proteins 0.000 description 4
- 241000701489 Cauliflower mosaic virus Species 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 241000207746 Nicotiana benthamiana Species 0.000 description 4
- 108091026822 U6 spliceosomal RNA Proteins 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 108020001580 protein domains Proteins 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 108700026220 vif Genes Proteins 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- 241000203069 Archaea Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 108010051696 Growth Hormone Proteins 0.000 description 3
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 3
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 3
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 3
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 3
- 239000006142 Luria-Bertani Agar Substances 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 3
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 3
- 102100038803 Somatotropin Human genes 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 239000000122 growth hormone Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 210000001082 somatic cell Anatomy 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 2
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 2
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 2
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 2
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 208000003322 Coinfection Diseases 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 230000008836 DNA modification Effects 0.000 description 2
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 2
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 2
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 2
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 2
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 2
- 201000004681 Psoriasis Diseases 0.000 description 2
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 2
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 2
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 2
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 108010025678 empty spiracles homeobox proteins Proteins 0.000 description 2
- 241001233957 eudicotyledons Species 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 238000007711 solidification Methods 0.000 description 2
- 230000008023 solidification Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- UZKQTCBAMSWPJD-UQCOIBPSSA-N trans-Zeatin Natural products OCC(/C)=C\CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-UQCOIBPSSA-N 0.000 description 2
- UZKQTCBAMSWPJD-FARCUNLSSA-N trans-zeatin Chemical compound OCC(/C)=C/CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-FARCUNLSSA-N 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- UZDMJOILBYFRMP-UHFFFAOYSA-N 2-[2-[2-[(2-amino-3-methylpentanoyl)amino]propanoylamino]propanoylamino]-3-methylpentanoic acid Chemical compound CCC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(=O)NC(C(O)=O)C(C)CC UZDMJOILBYFRMP-UHFFFAOYSA-N 0.000 description 1
- 241001135192 Acetohalobium arabaticum Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 1
- LBFXVAXPDOBRKU-LKTVYLICSA-N Ala-His-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LBFXVAXPDOBRKU-LKTVYLICSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- 241000147155 Ammonifex degensii Species 0.000 description 1
- 241000192537 Anabaena cylindrica Species 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- FSPQNLYOFCXUCE-BPUTZDHNSA-N Arg-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FSPQNLYOFCXUCE-BPUTZDHNSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 1
- QJWLLRZTJFPCHA-STECZYCISA-N Arg-Tyr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QJWLLRZTJFPCHA-STECZYCISA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 1
- RYKWOUUZJFSJOH-FXQIFTODSA-N Asp-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N RYKWOUUZJFSJOH-FXQIFTODSA-N 0.000 description 1
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- AKKUDRZKFZWPBH-SRVKXCTJSA-N Asp-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N AKKUDRZKFZWPBH-SRVKXCTJSA-N 0.000 description 1
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 1
- NONWUQAWAANERO-BZSNNMDCSA-N Asp-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 NONWUQAWAANERO-BZSNNMDCSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- IQCJOIHDVFJQFV-LKXGYXEUSA-N Asp-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O IQCJOIHDVFJQFV-LKXGYXEUSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- UXIPUCUHQBIQOS-SRVKXCTJSA-N Asp-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UXIPUCUHQBIQOS-SRVKXCTJSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 241000178334 Caldicellulosiruptor Species 0.000 description 1
- 241001522206 Clostridium algidicarnis Species 0.000 description 1
- 241000973884 Crinalium epipsammum Species 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- 241001263141 Cylindrospermum stagnale Species 0.000 description 1
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 1
- YZKOXEJTLWZOQL-GUBZILKMSA-N Cys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N YZKOXEJTLWZOQL-GUBZILKMSA-N 0.000 description 1
- VBPGTULCFGKGTF-ACZMJKKPSA-N Cys-Glu-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VBPGTULCFGKGTF-ACZMJKKPSA-N 0.000 description 1
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 1
- DRXOWZZHCSBUOI-YJRXYDGGSA-N Cys-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N)O DRXOWZZHCSBUOI-YJRXYDGGSA-N 0.000 description 1
- UEMWZFHQKFYFKZ-NYVOZVTQSA-N Cys-Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@H](CS)N)C(O)=O)=CNC2=C1 UEMWZFHQKFYFKZ-NYVOZVTQSA-N 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 1
- SSWAFVQFQWOJIJ-XIRDDKMYSA-N Gln-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N SSWAFVQFQWOJIJ-XIRDDKMYSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- DDNIZQDYXDENIT-FXQIFTODSA-N Gln-Glu-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N DDNIZQDYXDENIT-FXQIFTODSA-N 0.000 description 1
- LLRJEFPKIIBGJP-DCAQKATOSA-N Gln-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LLRJEFPKIIBGJP-DCAQKATOSA-N 0.000 description 1
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- FTTHLXOMDMLKKW-FHWLQOOXSA-N Gln-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTTHLXOMDMLKKW-FHWLQOOXSA-N 0.000 description 1
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- FGWRYRAVBVOHIB-XIRDDKMYSA-N Gln-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O FGWRYRAVBVOHIB-XIRDDKMYSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- NSEKYCAADBNQFE-XIRDDKMYSA-N Gln-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 NSEKYCAADBNQFE-XIRDDKMYSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- XIJOPMSILDNVNJ-ZVZYQTTQSA-N Glu-Val-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIJOPMSILDNVNJ-ZVZYQTTQSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 241001152403 Haloquadratum walsbyi Species 0.000 description 1
- 241000204930 Halorubrum lacusprofundi Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 1
- VOKCBYNCZVSILJ-KKUMJFAQSA-N His-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O VOKCBYNCZVSILJ-KKUMJFAQSA-N 0.000 description 1
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 1
- FRDFAWHTPDKRHG-ULQDDVLXSA-N His-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 FRDFAWHTPDKRHG-ULQDDVLXSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 1
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- SHVFUCSSACPBTF-VGDYDELISA-N Ile-Ser-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SHVFUCSSACPBTF-VGDYDELISA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 1
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- WPIKRJDRQVFRHP-TUSQITKMSA-N Leu-Trp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O WPIKRJDRQVFRHP-TUSQITKMSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- GFWLIJDQILOEPP-HSCHXYMDSA-N Lys-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N GFWLIJDQILOEPP-HSCHXYMDSA-N 0.000 description 1
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 1
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- UZVKFARGHHMQGX-IUCAKERBSA-N Met-Gly-Met Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCSC UZVKFARGHHMQGX-IUCAKERBSA-N 0.000 description 1
- XPCLRYNQMZOOFB-ULQDDVLXSA-N Met-His-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N XPCLRYNQMZOOFB-ULQDDVLXSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 1
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 1
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 1
- SBFPAAPFKZPDCZ-JYJNAYRXSA-N Met-Pro-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SBFPAAPFKZPDCZ-JYJNAYRXSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- VEKRTVRZDMUOQN-AVGNSLFASA-N Met-Val-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 VEKRTVRZDMUOQN-AVGNSLFASA-N 0.000 description 1
- 241001265502 Methanocaldococcus vulcanius Species 0.000 description 1
- 241000205263 Methanospirillum hungatei Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241000908263 Natrialba asiatica Species 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 1
- UEADQPLTYBWWTG-AVGNSLFASA-N Phe-Glu-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEADQPLTYBWWTG-AVGNSLFASA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- DZVXMMSUWWUIQE-ACRUOGEOSA-N Phe-His-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N DZVXMMSUWWUIQE-ACRUOGEOSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 1
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 1
- FRMKIPSIZSFTTE-HJOGWXRNSA-N Phe-Tyr-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FRMKIPSIZSFTTE-HJOGWXRNSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- ZBAGOWGNNAXMOY-IHRRRGAJSA-N Pro-Cys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZBAGOWGNNAXMOY-IHRRRGAJSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- IQAGKQWXVHTPOT-FHWLQOOXSA-N Pro-Lys-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O IQAGKQWXVHTPOT-FHWLQOOXSA-N 0.000 description 1
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 1
- SWRNSCMUXRLHCR-ULQDDVLXSA-N Pro-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 SWRNSCMUXRLHCR-ULQDDVLXSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- GNFHQWNCSSPOBT-ULQDDVLXSA-N Pro-Trp-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O GNFHQWNCSSPOBT-ULQDDVLXSA-N 0.000 description 1
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- HAUVENOGHPECML-BPUTZDHNSA-N Ser-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 HAUVENOGHPECML-BPUTZDHNSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 1
- 241000167564 Sulfolobus islandicus Species 0.000 description 1
- 241000192581 Synechocystis sp. Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241001673931 Thermacetogenium phaeum Species 0.000 description 1
- 241000205173 Thermofilum pendens Species 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- JMQUAZXYFAEOIH-XGEHTFHBSA-N Thr-Arg-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O JMQUAZXYFAEOIH-XGEHTFHBSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 1
- 241000078013 Trichormus variabilis Species 0.000 description 1
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- DXHHCIYKHRKBOC-BHYGNILZSA-N Trp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O DXHHCIYKHRKBOC-BHYGNILZSA-N 0.000 description 1
- DVIIYMVCSUQOJG-QEJZJMRPSA-N Trp-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DVIIYMVCSUQOJG-QEJZJMRPSA-N 0.000 description 1
- PVRRBEROBJQPJX-SZMVWBNQSA-N Trp-His-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PVRRBEROBJQPJX-SZMVWBNQSA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 1
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 1
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 1
- JTMZSIRTZKLBOA-NWLDYVSISA-N Trp-Thr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JTMZSIRTZKLBOA-NWLDYVSISA-N 0.000 description 1
- GDPDVIBHJDFRFD-RNXOBYDBSA-N Trp-Tyr-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GDPDVIBHJDFRFD-RNXOBYDBSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 1
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- ARSHSYUZHSIYKR-ACRUOGEOSA-N Tyr-His-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ARSHSYUZHSIYKR-ACRUOGEOSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- PHKQVWWHRYUCJL-HJOGWXRNSA-N Tyr-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PHKQVWWHRYUCJL-HJOGWXRNSA-N 0.000 description 1
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 1
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- NXPDPYYCIRDUHO-ULQDDVLXSA-N Tyr-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 NXPDPYYCIRDUHO-ULQDDVLXSA-N 0.000 description 1
- VKYDVKAKGDNZED-STECZYCISA-N Tyr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N VKYDVKAKGDNZED-STECZYCISA-N 0.000 description 1
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 1
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- HVRRJRMULCPNRO-BZSNNMDCSA-N Val-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 HVRRJRMULCPNRO-BZSNNMDCSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010007483 arginyl-leucyl-tyrosyl-glutamic acid Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012832 cell culture technique Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 101150025688 ggact gene Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 230000008076 immune mechanism Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 238000013492 plasmid preparation Methods 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
Abstract
표적 뉴클레오타이드 서열을 표적화하는 방법으로서, 세포 중에, (i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및 (ii) 상기 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA를 도입하는 것을 포함하는 방법 등이 제공된다.
Description
본 발명은, CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 타입 I-D 시스템의 뉴클레오타이드 표적 인식을 이용한, 표적 뉴클레오타이드 서열을 표적화하는 방법, 표적 뉴클레오타이드 서열을 특이적으로 개변하는 방법, 표적 유전자의 발현을 억제하는 방법, 및 해당 방법에 이용되는 Cas(CRISPR-associated(CRISPR 관련)) 단백질 및 가이드 RNA를 포함하는 복합체에 관한 것이다.
세균 및 고세균은, 바이러스 및 이종의 외래 플라스미드에 대한 적응 면역 기구로서 CRISPR 시스템을 갖고 있다. CRISPR 시스템은, 침입하는 DNA 서열에 대해서 상보성을 갖는 저분자의 RNA(가이드 RNA 또는 gRNA라고 칭한다)를 이용하여, 표적이 되는 외래 DNA에 대해서 타게팅과 분해를 촉진한다. 이 때, gRNA와 결합하여 복합체를 형성하는 Cas 단백질이 필요하다. CRISPR 시스템에는, 타입 I, 타입 II, 타입 III 및 타입 V 시스템이 존재한다. 어느 시스템도 Cas 단백질-gRNA 복합체가 표적 서열에 작용함으로써 바이러스 및 외래 플라스미드에 간섭 작용을 미친다. 타입 II 및 타입 V 시스템은, gRNA 결합성을 유지하는 단백질 도메인과 RuvC 유사 DNA 절단 단백질 도메인을 갖는 일체형 단백질에 의한, 표적 DNA 상의 DNA 이중쇄 절단이 간섭 작용의 메커니즘이다. 타입 III 시스템에 대해서는, 5 내지 8개의 Cas 단백질과 gRNA의 복합체가, 타입 II와는 달리, 표적 RNA 서열을 절단하는 것에 의해 간섭 작용을 가져옴이 인 비트로 및 인 비보에 있어서 증명되고 있다.
근년, CRISPR 타입 II 및 타입 V 시스템을 이용한 게놈 편집 기술이 개발되고, Cas 단백질로서 Cas9 및 Cpf1이 이용되고 있다. Cas9 및 Cpf1은, 표적 DNA를 인식하기 위해서, 표적 서열의 근방에 프로토스페이서 인접 모티프(PAM) 서열로 불리는 2 내지 5염기 정도의 서열을 필요로 한다. Cas9-gRNA 복합체 및 Cpf1-gRNA 복합체는, 인 비트로 및 인 비보에 있어서, PAM 서열 근방의 표적 부위에 DNA 이중쇄 절단을 일으키는, 서열 특이적인 RNA 유도성 엔도뉴클레아제임이 실증되어 있다.
한편, CRISPR 타입 I 시스템에 대해서는, 다양한 균류로부터 복수의 서브타입으로 분류되는 시스템이 게놈 서열로서 동정되어 있고, 타입 I-A, I-B, I-C, I-D, I-E, I-F, 및 I-U로서 분류·명명되어 있다. 이 중 대장균 유래의 타입 I-E시스템은 가장 연구가 진행되어 있고, 6개의 Cas 단백질(Cas3, Cse1, Cse2, Cas7, Cas5, Cas6e) 및 gRNA로 이루어지는 복합체가 표적 DNA 서열의 분해를 촉진함이 증명되어 있다. 그러나, 그 외의 서브타입의 간섭 작용에 대해서는, 일부의 서브타입(타입 I-C)을 제외하고, 필요한 Cas 단백질 구성 요소, gRNA 서열, 표적 DNA를 규정하는 PAM 서열 등에 대해 거의 해명되어 있지 않다. 또한, CRISPR 타입 I 시스템 유래의 Cas 단백질을 이용하는 기술로서, CRISPR 타입 I 시스템 유래의 Cas 단백질을 인코딩하는 재조합 핵산 분자를 이용하여 표적 유전자의 발현을 억제하는 방법(특허문헌 1)이나, CRISPR 타입 I 시스템 유래의 Cas 단백질과 다른 단백질의 복합체를 이용하여 표적 핵산을 개변하는 방법(특허문헌 2 및 특허문헌 3) 등의 보고는 있지만, CRISPR 타입 I 시스템 유래의 RNA 유도성 엔도뉴클레아제에 의해 표적 DNA 분자의 2본쇄를 절단하여 개변하는 기술에 대한 보고는 없다.
종래의 CRISPR 타입 II 및 타입 V 시스템에서는, 표적 특이성을 규정하는 2염기 내지 5염기 정도의 PAM 서열의 전후에 계속되는 약 20염기의 RNA 분자가 표적 타게팅에 이용된다고 하는 제한이 있기 때문에, 표적 디자인이 불가능한 유전자자리(locus)가 존재한다고 하는 점과, 유사한 서열을 절단한다고 하는 점에서 문제점을 갖고 있어, 이들 문제점을 갖지 않는 새로운 표적화 시스템 및 새로운 RNA 유도성 엔도뉴클레아제의 개발이 요망되고 있다.
상기의 과제를 해결하기 위하여, 본 발명자들은 예의 연구했다. 그 결과, 놀랄 만하게도, 종래부터 게놈 편집 기술에 이용되고 있는 CRISPR 타입 II 또는 타입 V RNA 유도성 엔도뉴클레아제보다도 긴 표적 서열을 갖는 신규한 표적화 시스템 및 신규한 RNA 유도성 엔도뉴클레아제를, CRISPR 타입 I-D로부터 발견하여, 표적 뉴클레오타이드 서열 상에 개변을 가능하게 하는 게놈 편집 기술에 이용할 수 있음을 발견하여, 본 발명을 완성시켰다.
즉, 본 발명은,
[1] 표적 뉴클레오타이드 서열을 표적화하는 방법으로서, 세포 중에,
(i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
를 도입하는 것을 포함하는 방법,
[2] 표적 뉴클레오타이드 서열을 개변하는 방법으로서, 세포 중에,
(i) CRISPR 타입 I-D 관련 단백질 Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
를 도입하는 것을 포함하는 방법,
[3] 표적 유전자의 발현을 억제하는 방법으로서, 세포 중에,
(i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 유전자의 서열의 적어도 일부에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
를 도입하는 것을 포함하는 방법,
[4] 상기 가이드 RNA가, 상기 표적 뉴클레오타이드 서열에 상보적인 20∼50염기로 이루어지는 서열을 포함하는, [1]∼[3] 중 어느 한 항에 기재된 방법,
[5] 상기 세포 중에 도너 폴리뉴클레오타이드를 도입하는 것을 추가로 포함하는, [2] 또는 [4]에 기재된 방법,
[6] 개변이 염기의 결실, 삽입, 또는 치환인, [2], [4] 및 [5] 중 어느 한 항에 기재된 방법,
[7] 상기 Cas5d가 프로토스페이서 인접 모티프(PAM) 서열로서 5'-GTH-3'(H=A, C, 또는 T)를 인식하는, [1]∼[6] 중 어느 한 항에 기재된 방법,
[8] (i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 및
(ii) 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA
를 포함하는 복합체,
[9] Cas3d 및 Cas10d를 추가로 포함하는, [8]에 기재된 복합체,
[10] 상기 가이드 RNA가, 상기 표적 뉴클레오타이드 서열에 상보적인 20∼50염기로 이루어지는 서열을 포함하는, [8] 또는 [9]에 기재된 복합체,
[11] (i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d를 인코딩하는 핵산, 및
(ii) 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA를 인코딩하는 DNA
를 포함하는 발현 벡터,
[12] Cas3d 및 Cas10d를 인코딩하는 핵산을 추가로 포함하는, [11]에 기재된 발현 벡터, 및
[13] [8]∼[10] 중 어느 한 항에 기재된 복합체를 인코딩하는 DNA 분자, 및
[14] 표적 뉴클레오타이드 서열을 표적화하기 위한,
(i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
의 사용,
[15] 표적 뉴클레오타이드 서열을 개변하기 위한,
(i) CRISPR 타입 I-D 관련 단백질 Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
의 사용,
[16] 표적 유전자의 발현을 억제하기 위한,
(i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 유전자의 서열의 적어도 일부에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
의 사용,
[17] 상기 가이드 RNA가, 상기 표적 뉴클레오타이드 서열에 상보적인 20∼50염기로 이루어지는 서열을 포함하는, [14]∼[16] 중 어느 한 항에 기재된 사용,
[18] 개변이 염기의 결실, 삽입, 또는 치환인, [15] 또는 [17]에 기재된 사용,
[19] 상기 Cas5d가 프로토스페이서 인접 모티프(PAM) 서열로서 5'-GTH-3'(H=A, C, 또는 T)를 인식하는, [14]∼[18] 중 어느 한 항에 기재된 사용,
[20] 표적 뉴클레오타이드 서열을 표적화하기 위한,
(i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 및
(ii) 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA
를 포함하는 복합체의 사용,
[21] 표적 뉴클레오타이드 서열을 개변하기 위한,
(i) CRISPR 타입 I-D 관련 단백질 Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d 및
(ii) 상기 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA
를 포함하는 복합체의 사용,
[22] 표적 유전자의 발현을 억제하기 위한,
(i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 및
(ii) 상기 표적 유전자의 서열의 적어도 일부에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA
를 포함하는 복합체의 사용, 및
[23] 상기 가이드 RNA가, 상기 표적 뉴클레오타이드 서열에 상보적인 20∼50염기로 이루어지는 서열을 포함하는, [20]∼[22] 중 어느 한 항에 기재된 복합체의 사용
을 제공한다.
CRISPR 타입 I-D(이하, "TiD"라고도 한다) 시스템이 이용하는 PAM 서열은, CRISPR 타입 II 및 타입 V 시스템이 이용하는 PAM 서열과 상이하다. 따라서, 본 발명에 의하면, CRISPR 타입 I-D의 Cas 단백질을 사용하므로, 종래의 CRISPR 타입 II 또는 타입 V RNA 유도성 엔도뉴클레아제를 이용하는 게놈 편집 기술에서는 디자인할 수 없었던 유전자자리를 표적으로 하는 것이 가능해졌다. 더욱이 본 발명에서는, 본 발명의 CRISPR 타입 I-D 유래 RNA 유도성 엔도뉴클레아제가 이용하는 PAM 서열은, CRISPR 타입 II 및 타입 V가 이용하는 PAM 서열보다도, 몇몇의 생물 게놈 서열 상에 있어서 많이 발견됨을 알 수 있었다. 따라서, 본 발명에 의하면, 종래의 CRISPR 타입 II 및 타입 V 시스템을 이용하는 게놈 편집 기술보다도, 많은 유전자 서열을 표적으로 하는 것이 가능하다. 또한 더욱이, 본 발명자들은, CRISPR 타입 I-D 시스템에 있어서의 gRNA가, 30염기 이상의 길이의 표적 서열을 표적화할 수 있음을 발견했다. 한편, CRISPR 타입 II 및 타입 V 시스템에 있어서의 gRNA가 표적화할 수 있는 서열의 길이는 약 20염기 전후이다. 따라서, 본 발명의 CRISPR 타입 I-D 시스템은, 종래 기술보다도 안정된 결합 특성과 표적 특이성을 나타낸다고 생각된다.
이리하여, 본 발명에 의해, 종래 기술에서는 표적으로 하는 것이 불가능한 유전자 영역 상에서의 변이 알렐의 제작, 전사 활성화 및 불활성화에 의한 유전자 발현 제어, DNA 수식/히스톤 수식 단백질 도메인의 표적화에 의한 에피게놈 개변을 실현하는 것이 가능해졌다.
도 1은 본 발명의 CRISPR 타입 I-D 시스템의 구성 및 표적 서열에의 타게팅과 절단 양식의 개략을 나타낸다.
도 2는 TiD를 이용한 대장균 게놈 편집용 벡터를 나타낸다: a) pEcTiD2 플라스미드의 구조; b) pEcTiD3 플라스미드의 구조. Pro: J23108 합성 프로모터, t1: 터미네이터 서열 STOP767, RBS: 리보좀 결합 서열, t2: 터미네이터 서열 STOP768(1), t3: 터미네이터 서열 TOP768(2), t7: T7 터미네이터 서열, 7d: Microcystis aeruginosa 유래의(이하, Ma라고 약칭한다) Cas7d, 6d: MaCas6d, 5d: MaCas5d, 3d: MaCas3d, 10d: MaCas10d, T7 pro: T7 프로모터, crRNA: TiD 유래 CRISPR 리피트 서열, Cm: 클로람페니콜 내성 유전자, p15A ori: p15A 플라스미드 유래 복제 오리진.
도 3은 pMW_ccdB 및 pMW_ccdB-PAM 라이브러리 플라스미드의 구조를 나타낸다: a) pMW_ccdB의 구조, t2: rrnB2 터미네이터 서열, t1: rrnB1 터미네이터 서열, PAM: 프로토스페이서 인접 모티프 서열, T7 pro: T7 프로모터, ccdB: ccdB 유전자, Km: 카나마이신 내성 유전자, pSC101 ori: pSC101 플라스미드 유래 복제 오리진; b) pMW_ccdB-PAM 플라스미드 라이브러리의 표적 서열, NNNN 개소에 랜덤한 4염기를 삽입하여, PAM 서열 스크리닝 라이브러리 플라스미드로 했다. 사각으로 둘러싼 영역은 T7 프로모터를, 밑줄은 TiD의 표적 서열을 나타낸다. 대문자는 ccdB 유전자자리를 나타낸다.
도 4는 TiD를 이용한 식물 게놈 편집용 벡터를 나타낸다: a) pEgPTiD1 플라스미드의 구조; b) 식물용 crRNA 발현 카세트의 구조; c) pEgPTiD2 플라스미드의 구조, RB: right border 서열, LB: left border 서열, 2x35S: 2x 콜리플라워 모자이크 바이러스 35S 유전자 프로모터 및 번역 인핸서 Ω 서열, 3d: 2xNLS(핵이행 시그널)를 인코딩하는 서열을 부가한 MaCas3d, 10d: 2xNLS를 부가한 MaCas10d, 7d: 2xNLS를 부가한 MaCas7d, 6d: 2xNLS를 부가한 MaCas6d, 5d: 2xNLS를 부가한 MaCas5d, 2A(1)∼2A(4): 자기 개열 펩타이드 2A 서열(1)∼(4), Ter: 애기장대(Arabidopsis) 열쇼크 단백질 18.2kDa 유전자 터미네이터, Km: 카나마이신 내성 유전자 발현 카세트, U6-26: 애기장대 U6 snRNA-26 유전자 프로모터, crRNA: TiD 유전자자리 유래 CRISPR 리피트 서열.
도 5a는 pEgPTiD2-pds를 이용한 담배 PDS 유전자의 변이 도입을 나타낸다: a) 담배 PDS 유전자 상의 표적 서열, 표적 서열 1은 제 3 엑손 상, 표적 서열 2는 제 6 엑손 상으로부터 선택했다. 패널 하단에 나타낸 표적 서열 중, 사각으로 둘러싼 부분은 PAM 서열을 나타내고, 밑줄 부분이 표적 서열을 나타낸다; b) 아그로인필트레이션법에 의한 pEgPTiD2-pds 및 GFP 발현 바이너리 벡터의 도입, pEgPTiD2-pds(1) 혹은 pEgPTiD-pds(2)를 보지하는 아그로박테리움과 GFP 발현 바이너리 플라스미드를 보지하는 아그로박테리움을 아그로인필트레이션법에 의해 감염시키고, GFP 발현이 확인되는 엽편을 절출하여, PDS 변이 도입 해석에 이용했다.
도 5b는 pEgPTiD2-pds를 이용한 담배 PDS 유전자의 변이 도입을 나타낸다: c) Cel-1 어세이에 의한 PDS 변이 도입 해석, 도 5a의 b)에 있어서 GFP 발현이 확인된 엽편 부분으로부터 게놈 DNA를 조제하여, Cel-1 어세이에 의해 변이 도입의 유무를 해석했다. 삼각표는, Cel-1 뉴클레아제에 의해 절단된 변이 PDS 유전자 단편을 나타낸다.
도 6은 pEgPTiD2-iaa9를 이용한 토마토 IAA9 유전자의 변이 도입을 나타낸다: a) 토마토 IAA9 유전자 상의 표적 서열, 표적 서열 1은 제 2 엑손 상으로부터 선택했다. 패널 하단에 나타낸 표적 서열 중, 사각으로 둘러싼 부분은 PAM 서열을 나타내고, 밑줄 부분이 표적 서열을 나타낸다; b) 아그로박테리움법에 의해 토마토 리프 디스크에 pEgPTiD2-iaa9를 도입하여, 형질 전환 캘러스(callus) 세포를 얻었다; c) PCR-RFLP법에 의한 변이 해석, pEgPTiD2-iaa9를 도입한 형질 전환 캘러스 세포로부터 조제한 게놈 DNA로부터 IAA9 표적 서열을 포함하는 영역을 PCR에 의해 증폭하여, AccI를 이용한 PCR-RFLP법에 의해 변이 해석을 행했다. 백색 삼각표는 야생형 유래의 AccI 절단 단편을 나타내고, 그 위의 삼각표는 AccI 절단을 받지 않는 변이 도입 단편을 나타낸다.
도 7은 pEcTiD2-iaa9 도입 캘러스에 있어서의 시퀀스법에 의한 변이 해석을 나타낸다. 상단이 야생형의 IAA9 서열을 나타내고, 밑줄은 표적 서열을 나타낸다. 사각으로 둘러싼 서열은 PAM 서열을 나타낸다. 변이가 생긴 부위를 삽입 기호 또는 하이픈으로 나타냈다. 하이픈은 염기 결실을 나타낸다.
도 8은 pEcTiD2-iaa9 도입 재생 식물체에 있어서의 변이 해석을 나타낸다. a) PCR-RFLP법에 의한 변이 해석. 백색 삼각표는 야생형 유래의 AccI 절단 단편을 나타내고, 그 위의 삼각표는 AccI 절단을 받지 않는 변이 도입 단편을 나타낸다. b) IAA9 유전자 파괴의 결과, 본엽 형태 이상을 나타내는 변이 도입 토마토 식물체의 사진.
도 9는 HEK293 세포주를 이용한 게놈 편집의 실험 스킴을 나타낸다.
도 10은 헤테로2본쇄 이동도 분석에 의한 변이 해석의 결과를 나타낸다. EMX1 유전자 상의 타겟 1 표적 서열을 포함하는 crRNA 및 TiD 유전자를 도입한 세포 유래의 게놈으로부터, 변이 서열 유래라고 생각되는 프래그먼트가 검출되었다(흑건선(黑鍵線)).
도 11은 헤테로2본쇄 이동도 분석에 의한 변이 해석의 결과를 나타낸다. EMX1 유전자 상의 타겟 2 표적 서열을 포함하는 crRNA 및 TiD 유전자를 도입한 세포 유래의 게놈으로부터, 변이 서열 유래라고 생각되는 프래그먼트가 검출되었다(흑건선).
도 12는 시퀀스 해석에 의한 변이 서열의 동정을 나타낸다. 흑색 배경 중의 백색 문자는 TiD가 인식하는 PAM(프로토스페이서 인접 서열), 흑색 테두리선 내의 서열은 표적 서열을 나타낸다. 하이픈(-)은 염기 결실을, 흑색 굵은 글씨 소문자 알파벳은 염기 삽입을 나타낸다. 각 서열의 우측에, 체세포 변이 효율(변이 서열이 확인된 클론수/해석 클론 총수)을 나타낸다.
도 13은 시퀀스 해석에 의한 변이 서열의 동정을 나타낸다. 흑색 배경 중의 백색 문자는 TiD가 인식하는 PAM(프로토스페이서 인접 서열), 흑색 테두리선 내의 서열은 표적 서열을 나타낸다. 하이픈(-)은 염기 결실을, 흑색 굵은 글씨 소문자 알파벳은 염기 삽입을 나타낸다. 각 서열의 우측에, 체세포 변이 효율(변이 서열이 확인된 클론수/해석 클론 총수)을 나타낸다.
도 2는 TiD를 이용한 대장균 게놈 편집용 벡터를 나타낸다: a) pEcTiD2 플라스미드의 구조; b) pEcTiD3 플라스미드의 구조. Pro: J23108 합성 프로모터, t1: 터미네이터 서열 STOP767, RBS: 리보좀 결합 서열, t2: 터미네이터 서열 STOP768(1), t3: 터미네이터 서열 TOP768(2), t7: T7 터미네이터 서열, 7d: Microcystis aeruginosa 유래의(이하, Ma라고 약칭한다) Cas7d, 6d: MaCas6d, 5d: MaCas5d, 3d: MaCas3d, 10d: MaCas10d, T7 pro: T7 프로모터, crRNA: TiD 유래 CRISPR 리피트 서열, Cm: 클로람페니콜 내성 유전자, p15A ori: p15A 플라스미드 유래 복제 오리진.
도 3은 pMW_ccdB 및 pMW_ccdB-PAM 라이브러리 플라스미드의 구조를 나타낸다: a) pMW_ccdB의 구조, t2: rrnB2 터미네이터 서열, t1: rrnB1 터미네이터 서열, PAM: 프로토스페이서 인접 모티프 서열, T7 pro: T7 프로모터, ccdB: ccdB 유전자, Km: 카나마이신 내성 유전자, pSC101 ori: pSC101 플라스미드 유래 복제 오리진; b) pMW_ccdB-PAM 플라스미드 라이브러리의 표적 서열, NNNN 개소에 랜덤한 4염기를 삽입하여, PAM 서열 스크리닝 라이브러리 플라스미드로 했다. 사각으로 둘러싼 영역은 T7 프로모터를, 밑줄은 TiD의 표적 서열을 나타낸다. 대문자는 ccdB 유전자자리를 나타낸다.
도 4는 TiD를 이용한 식물 게놈 편집용 벡터를 나타낸다: a) pEgPTiD1 플라스미드의 구조; b) 식물용 crRNA 발현 카세트의 구조; c) pEgPTiD2 플라스미드의 구조, RB: right border 서열, LB: left border 서열, 2x35S: 2x 콜리플라워 모자이크 바이러스 35S 유전자 프로모터 및 번역 인핸서 Ω 서열, 3d: 2xNLS(핵이행 시그널)를 인코딩하는 서열을 부가한 MaCas3d, 10d: 2xNLS를 부가한 MaCas10d, 7d: 2xNLS를 부가한 MaCas7d, 6d: 2xNLS를 부가한 MaCas6d, 5d: 2xNLS를 부가한 MaCas5d, 2A(1)∼2A(4): 자기 개열 펩타이드 2A 서열(1)∼(4), Ter: 애기장대(Arabidopsis) 열쇼크 단백질 18.2kDa 유전자 터미네이터, Km: 카나마이신 내성 유전자 발현 카세트, U6-26: 애기장대 U6 snRNA-26 유전자 프로모터, crRNA: TiD 유전자자리 유래 CRISPR 리피트 서열.
도 5a는 pEgPTiD2-pds를 이용한 담배 PDS 유전자의 변이 도입을 나타낸다: a) 담배 PDS 유전자 상의 표적 서열, 표적 서열 1은 제 3 엑손 상, 표적 서열 2는 제 6 엑손 상으로부터 선택했다. 패널 하단에 나타낸 표적 서열 중, 사각으로 둘러싼 부분은 PAM 서열을 나타내고, 밑줄 부분이 표적 서열을 나타낸다; b) 아그로인필트레이션법에 의한 pEgPTiD2-pds 및 GFP 발현 바이너리 벡터의 도입, pEgPTiD2-pds(1) 혹은 pEgPTiD-pds(2)를 보지하는 아그로박테리움과 GFP 발현 바이너리 플라스미드를 보지하는 아그로박테리움을 아그로인필트레이션법에 의해 감염시키고, GFP 발현이 확인되는 엽편을 절출하여, PDS 변이 도입 해석에 이용했다.
도 5b는 pEgPTiD2-pds를 이용한 담배 PDS 유전자의 변이 도입을 나타낸다: c) Cel-1 어세이에 의한 PDS 변이 도입 해석, 도 5a의 b)에 있어서 GFP 발현이 확인된 엽편 부분으로부터 게놈 DNA를 조제하여, Cel-1 어세이에 의해 변이 도입의 유무를 해석했다. 삼각표는, Cel-1 뉴클레아제에 의해 절단된 변이 PDS 유전자 단편을 나타낸다.
도 6은 pEgPTiD2-iaa9를 이용한 토마토 IAA9 유전자의 변이 도입을 나타낸다: a) 토마토 IAA9 유전자 상의 표적 서열, 표적 서열 1은 제 2 엑손 상으로부터 선택했다. 패널 하단에 나타낸 표적 서열 중, 사각으로 둘러싼 부분은 PAM 서열을 나타내고, 밑줄 부분이 표적 서열을 나타낸다; b) 아그로박테리움법에 의해 토마토 리프 디스크에 pEgPTiD2-iaa9를 도입하여, 형질 전환 캘러스(callus) 세포를 얻었다; c) PCR-RFLP법에 의한 변이 해석, pEgPTiD2-iaa9를 도입한 형질 전환 캘러스 세포로부터 조제한 게놈 DNA로부터 IAA9 표적 서열을 포함하는 영역을 PCR에 의해 증폭하여, AccI를 이용한 PCR-RFLP법에 의해 변이 해석을 행했다. 백색 삼각표는 야생형 유래의 AccI 절단 단편을 나타내고, 그 위의 삼각표는 AccI 절단을 받지 않는 변이 도입 단편을 나타낸다.
도 7은 pEcTiD2-iaa9 도입 캘러스에 있어서의 시퀀스법에 의한 변이 해석을 나타낸다. 상단이 야생형의 IAA9 서열을 나타내고, 밑줄은 표적 서열을 나타낸다. 사각으로 둘러싼 서열은 PAM 서열을 나타낸다. 변이가 생긴 부위를 삽입 기호 또는 하이픈으로 나타냈다. 하이픈은 염기 결실을 나타낸다.
도 8은 pEcTiD2-iaa9 도입 재생 식물체에 있어서의 변이 해석을 나타낸다. a) PCR-RFLP법에 의한 변이 해석. 백색 삼각표는 야생형 유래의 AccI 절단 단편을 나타내고, 그 위의 삼각표는 AccI 절단을 받지 않는 변이 도입 단편을 나타낸다. b) IAA9 유전자 파괴의 결과, 본엽 형태 이상을 나타내는 변이 도입 토마토 식물체의 사진.
도 9는 HEK293 세포주를 이용한 게놈 편집의 실험 스킴을 나타낸다.
도 10은 헤테로2본쇄 이동도 분석에 의한 변이 해석의 결과를 나타낸다. EMX1 유전자 상의 타겟 1 표적 서열을 포함하는 crRNA 및 TiD 유전자를 도입한 세포 유래의 게놈으로부터, 변이 서열 유래라고 생각되는 프래그먼트가 검출되었다(흑건선(黑鍵線)).
도 11은 헤테로2본쇄 이동도 분석에 의한 변이 해석의 결과를 나타낸다. EMX1 유전자 상의 타겟 2 표적 서열을 포함하는 crRNA 및 TiD 유전자를 도입한 세포 유래의 게놈으로부터, 변이 서열 유래라고 생각되는 프래그먼트가 검출되었다(흑건선).
도 12는 시퀀스 해석에 의한 변이 서열의 동정을 나타낸다. 흑색 배경 중의 백색 문자는 TiD가 인식하는 PAM(프로토스페이서 인접 서열), 흑색 테두리선 내의 서열은 표적 서열을 나타낸다. 하이픈(-)은 염기 결실을, 흑색 굵은 글씨 소문자 알파벳은 염기 삽입을 나타낸다. 각 서열의 우측에, 체세포 변이 효율(변이 서열이 확인된 클론수/해석 클론 총수)을 나타낸다.
도 13은 시퀀스 해석에 의한 변이 서열의 동정을 나타낸다. 흑색 배경 중의 백색 문자는 TiD가 인식하는 PAM(프로토스페이서 인접 서열), 흑색 테두리선 내의 서열은 표적 서열을 나타낸다. 하이픈(-)은 염기 결실을, 흑색 굵은 글씨 소문자 알파벳은 염기 삽입을 나타낸다. 각 서열의 우측에, 체세포 변이 효율(변이 서열이 확인된 클론수/해석 클론 총수)을 나타낸다.
본 발명은, CRISPR 타입 I-D 시스템을 이용한 게놈 편집 기술을 제공한다. 구체적으로는, 본 발명에서는, CRISPR 타입 I-D의 Cas 단백질 중, Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d가 사용된다. 본 발명에 있어서, CRISPR 타입 I-D 시스템은, Cas5d, Cas6d 및 Cas7d를 포함하는 표적 인식 모듈과 Cas3d 및 Cas10d를 포함하는 폴리뉴클레오타이드 절단 모듈을 포함함이 발견되었다.
즉, 본 발명의 동작 원리는 이하와 같다.
1) 표적 뉴클레오타이드 서열의 표적화(이하, "타게팅"이라고도 한다)에 필요한, 해당 표적 뉴클레오타이드 서열에 상보적인 서열과 CRISPR 타입 I-D 유전자자리에 존재하는 공통 반복 서열을 포함하는 gRNA,
2) 표적 뉴클레오타이드 서열의 근방에 존재하는 PAM 서열을 인식하는 Cas5d,
3) 상기 1)의 gRNA에 결합하고, 표적 뉴클레오타이드 서열의 타게팅에 필요한 Cas7d, 및
4) 상기 1)의 gRNA의 프로세싱을 행하는 Cas6d
를 포함하는 복합체, 및
5) 상기 1) 내지 4)를 포함하는 복합체에 상호작용하여, 표적 뉴클레오타이드 서열의 리모델링을 행하는 Cas10d와, 폴리뉴클레오타이드의 분해를 행하는 Cas3d를 포함하는 복합체
가 세포에 제공되고, 해당 세포에 있어서,
6) 상기 1) 내지 4)를 포함하는 복합체에 의한 표적 뉴클레오타이드 서열로의 타게팅, 즉,
7) 상기 4)의 Cas6d에 의해 상기 1)의 gRNA가 프로세싱되어 얻어지는 성숙형 gRNA와, 상기 2) 및 3)으로 이루어지는 복합체에 의한, 표적 뉴클레오타이드 서열로의 타게팅이 행해지고,
8) 상기 5)의 복합체에 의해, 표적 뉴클레오타이드 서열 상의 폴리뉴클레오타이드가 절단된다.
따라서, 본 발명은, CRISPR 타입 I-D 시스템을 이용한 표적 뉴클레오타이드 서열을 표적화하는 방법(이하, "본 발명의 표적 서열 타게팅 방법"이라고도 한다), 표적 뉴클레오타이드 서열을 개변하는 방법(이하, "본 발명의 표적 서열 개변 방법"이라고도 한다), 및 표적 유전자의 발현을 억제하는 방법(이하, "본 발명의 표적 유전자 발현 억제 방법"이라고도 한다)을 제공한다. 더욱이, 본 발명은, 이들 본 발명의 방법에 사용되는, CRISPR 타입 I-D 관련 Cas 단백질 및 gRNA를 포함하는 복합체(이하, "본 발명의 복합체"라고도 한다), 및 해당 복합체를 인코딩하는 핵산 분자를 포함하는 벡터를 제공한다.
(1) 세포
본 발명에 있어서, 세포는, 원핵세포 또는 진핵세포의 어느 세포여도 되고, 특별히 한정되지 않는다. 예를 들어, 세균, 고세균, 효모, 식물 세포, 곤충 세포, 동물 세포(예를 들어, 인간 세포, 비인간 세포, 비포유동물 척추동물 세포, 무척추동물 세포 등)를 들 수 있다.
(2) RNA 유도성 엔도뉴클레아제 및 Cas 단백질
본 발명에 있어서, "RNA 유도성 엔도뉴클레아제"란, 적어도 1개의 뉴클레아제 도메인, 및 gRNA와 결합하는 적어도 1개의 도메인을 포함하고, gRNA에 의해 표적 뉴클레오타이드 서열(또는 표적 뉴클레오타이드 부위)로 유도되는 엔도뉴클레아제를 말한다. 본 발명에서 사용되는 RNA 유도성 엔도뉴클레아제는, CRISPR 타입 I-D 유래의 RNA 유도성 엔도뉴클레아제이며, CRISPR 타입 I-D 관련 단백질 Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d를 포함한다. 본 발명에 있어서, Cas5d, Cas6d 및 Cas7d는, 표적 인식에 기여하는 "표적 인식 모듈"을 구성하고, Cas3d 및 Cas10d는, 폴리뉴클레오타이드의 절단에 기여하는 "폴리뉴클레오타이드 절단 모듈"을 구성함이 발견되었다. 즉, 본 발명에서 사용되는 RNA 유도성 엔도뉴클레아제는, Cas5d, Cas6d 및 Cas7d를 포함하는 표적 인식 모듈과, Cas3d 및 Cas10d를 포함하는 폴리뉴클레오타이드 절단 모듈을 포함한다.
본 발명에서 사용되는 Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d는, 어느 세균 또는 고세균 유래의 것이어도 되고, 예를 들어, Microcystis aeruginosa, Acetohalobium arabaticum, Ammonifex degensii, Anabaena cylindrica, Anabaena variabilis, Caldicellulosiruptor lactoaceticus, Caldilinea aerophila, Clostridium algidicarnis, Crinalium epipsammum, Cyanothece Sp., Cylindrospermum stagnale, Haloquadratum walsbyi, Halorubrum lacusprofundi, Methanocaldococcus vulcanius, Methanospirillum hungatei, Natrialba asiatica, Natronomonas pharaonis, Nostoc punctiforme, Phormidesmis priestleyi, Oscillatoria acuminata, Picrophilus torridus, Spirochaeta thermophila, Stanieria cyanosphaera, Sulfolobus acidocaldarius, Sulfolobus islandicus, Synechocystis Sp., Thermacetogenium phaeum, Thermofilum pendens 등의 균주 유래의 것이어도 된다. 상기 Cas 단백질의 아미노산 서열 및 뉴클레오타이드 서열 정보는, 예를 들어, NCBI GenBank 등의 공개된 데이터베이스로부터 입수 가능하다. 또한, 메타게놈 해석 등에 의해 얻어진 미생물 게놈 데이터로부터 BLAST 프로그램을 이용함으로써, 신규한 미생물종으로부터의 서열 취득도 가능하다. 상기 Cas 단백질을 인코딩하는 핵산은, 예를 들어, 아미노산 서열 정보를 기초로, 해당 핵산을 도입하는 숙주 세포에 있어서의 번역에 최적화된 코돈을 선택하고, 화학 합성 등에 의해 구축해도 된다. 숙주 세포에 있어서 사용 빈도가 높은 코돈을 사용하는 것에 의해, 단백질의 발현량을 증가시킬 수 있다. 상기 Cas 단백질은, 예를 들어, 아미노산 서열 정보를 기초로 화학 합성하거나, 또는 상기 Cas 단백질을 인코딩하는 핵산을 적당한 벡터 등을 개재시켜 세포 중에 도입하여, 해당 세포 중에서 산생시켜도 된다. 또한, Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d의 각 Cas 단백질은, 상기의 본 발명의 동작 원리에 있어서 기재한 각 Cas 단백질의 기능을 유지하는 한, 변이형 Cas 단백질이어도 된다.
(3) 가이드 RNA
본 발명에 있어서, 가이드 RNA(gRNA)는, 상기 표적 인식 모듈(Cas5d, Cas6d 및 Cas7d)과 복합체를 형성하여, 이들 Cas 단백질과 함께 표적 뉴클레오타이드 서열을 타게팅하는 분자이다. 본 발명에 있어서, gRNA는, 표적 인식 모듈의 Cas7d에 결합한다. 본 발명에 있어서, gRNA는, Cas5d, Cas6d 및 Cas7d를 포함하는 복합체에 결합하여, 해당 복합체를 표적 뉴클레오타이드 서열로 유도한다. 예를 들어, gRNA는, 상기 RNA 유도성 엔도뉴클레아제의 표적 인식 모듈에 결합하여, 해당 RNA 유도성 엔도뉴클레아제를 표적 뉴클레오타이드 서열로 유도한다. 또한, 상기 표적 인식 모듈이 상기 RNA 유도성 엔도뉴클레아제 이외의 융합 단백질의 일부로서 존재하는 경우, gRNA는, 해당 표적 인식 모듈에 결합하여, 당해 융합 단백질을 표적 뉴클레오타이드 서열로 유도한다.
gRNA는, 표적 뉴클레오타이드 서열과 염기쌍을 형성할 수 있도록 해당 표적 서열에 상보적인 서열, 및 해당 서열의 전후(5'말단측 및 3'말단측)에, CRISPR 타입 I-D 유전자자리에서 유래하는 공통 반복 서열을 포함한다. gRNA의 공통 반복 서열 부분은, 적어도 1개의 헤어핀 구조를 갖고 있어도 된다. 예를 들어, 표적 뉴클레오타이드 서열에 상보적인 서열의 5'말단 측에 있는 공통 반복 서열 부분이 헤어핀 구조를 갖고, 표적 뉴클레오타이드 서열에 상보적인 서열의 3'말단 측에 있는 공통 반복 서열 부분은 1본쇄여도 된다. 본 발명에 있어서, gRNA는, 바람직하게는 1개의 헤어핀 구조를 갖는다.
CRISPR 타입 I-D 유전자자리에서 유래하는 공통 반복 서열은, 타입 I-D 유전자군에 인접하는 gRNA 유전자 서열 영역으로부터, 탠덤 리피트 검색 프로그램을 이용하여 발견할 수 있다. gRNA에 포함되는 공통 반복 서열의 염기 길이는, 표적 인식 모듈과 상호작용하여 표적 뉴클레오타이드 서열을 타게팅한다고 하는 목적이 달성되는 한, 특별히 한정되지 않는다. 예를 들어, 표적 뉴클레오타이드 서열에 상보적인 서열의 전후의 공통 반복 서열이 각각, 약 10∼70염기 길이여도 되고, 예를 들어, 30∼50염기 길이여도 된다.
gRNA는, 표적 뉴클레오타이드 서열에 상보적인 약 10염기∼70염기로 이루어지는 서열을 포함할 수 있다. gRNA에 포함되는 표적 뉴클레오타이드 서열에 상보적인 서열은, 바람직하게는 20염기∼50염기, 보다 바람직하게는 25염기∼45염기로 이루어지는 서열, 더 바람직하게는 30염기∼40염기로 이루어지는 서열, 또한 더 바람직하게는 32염기∼37염기로 이루어지는 서열, 예를 들어, 32염기, 33염기, 34염기, 35염기, 36염기, 또는 37염기로 이루어지는 서열이다. 타게팅 가능한 표적 서열이 길수록, gRNA에 의한 표적 인식의 서열 특이성이 증가한다고 생각된다. 또한, 타게팅 가능한 표적 서열이 길수록, gRNA와 표적 서열 사이에 형성되는 염기쌍의 Tm치가 높아져, 표적 인식의 안정성이 증가한다고 생각된다. 종래의 게놈 편집 기술에 이용되는 RNA 유도성 엔도뉴클레아제(예를 들어, Cas9 및 Cpf1)에서는 gRNA가 표적화할 수 있는 서열의 길이는 약 20∼24염기이므로, 본 발명은, 종래법보다도 서열 특이성 및 안정성이 우수하다.
(4) 표적 뉴클레오타이드 서열
본 발명에 있어서, 표적 뉴클레오타이드 서열(본 명세서에 있어서, 간단히 "표적 서열"이라고도 한다)은, 임의의 핵산의 서열이며, 프로토스페이서 근접 모티프(PAM)의 근방에 위치하는 서열을 표적 서열로서 선택하는 것을 제외하고, 특별히 한정되지 않는다. 표적 뉴클레오타이드 서열은, 2본쇄 DNA 서열, 1본쇄 DNA 서열, 또는 RNA 서열의 어느 것이어도 된다. DNA로서는, 예를 들어, 진핵생물핵 게놈 DNA, 미토콘드리아 DNA, 플라스티드 DNA, 원핵생물 게놈 DNA, 파지 DNA, 혹은 플라스미드 DNA 등을 들 수 있다. 본 발명에 있어서, 표적 뉴클레오타이드 서열은, 바람직하게는, 게놈 상의 2본쇄 DNA이다. 한편, 본 명세서에 있어서, "근방에 위치한다"란, 인접하는 것, 및 가까이에 있는 것의 양쪽을 포함한다. 또한, 본 명세서에 있어서, "근방"이란, 인접하는 위치 또는 가까운 위치의 양쪽을 포함한다.
CRISPR 시스템의 표적 인식에 이용되는 PAM 서열은, CRISPR 시스템의 종류에 따라서 상이하다. 본 발명에서는, CRISPR 타입 I-D 시스템이 이용하는 PAM 서열이 5'-GTH-3'(H=A, C 또는 T)임을 명확히 했다(실시예 1). 바람직하게는, 상기 PAM 서열의 3'측 하류의 근방에 위치하는 서열을 표적 뉴클레오타이드 서열로서 선택한다. 예를 들어, 표적 뉴클레오타이드 서열은, 상기 PAM 서열의 근방에 위치하고, 또한 표적 유전자의 인트론 내, 코딩 영역 내, 비코딩 영역 내, 또는 제어 영역 내에 존재하는 서열이어도 된다. 표적 유전자는, 임의의 유전자이며, 수의(隨意)로 선택하면 된다.
종래의 게놈 편집 기술에서 사용되고 있는 Cas9 및 Cpf1의 PAM 서열은, 각각, 5'-NGG-3'(N=A, C, G 또는 T) 및 5'-TTTV-3'(V=A, C 또는 G)이다. 고등 식물의 게놈 서열 중에 있어서의, Cas9 및 Cpf1의 PAM 서열과 TiD의 PAM 서열의 출현 빈도(즉, CRISPR 시스템의 타겟 후보수)를 비교한 바, TiD의 PAM 서열 빈도가 가장 많아, Cas9 또는 Cpf1을 이용하는 종래의 게놈 편집 기술보다도 타겟수가 많음을 알 수 있었다(표 1).
(5) 본 발명의 표적 서열 타게팅 방법
본 발명의 표적 서열 타게팅 방법은, 상기 표적 인식 모듈(Cas5d, Cas6d 및 Cas7d)과 상기 gRNA를 상기 세포 중에 도입하는 것을 특징으로 한다. 즉, 본 발명의 표적 서열 타게팅 방법은, (i) Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및 (ii) 상기 gRNA, 또는 해당 gRNA를 인코딩하는 DNA를 상기 세포 중에 도입하는 것을 특징으로 한다. 본 발명의 표적 서열 타게팅 방법은, 인 비트로 및 인 비보의 어느 것으로 행해도 된다.
본 발명의 표적 서열 타게팅 방법에 있어서, 상기 표적 인식 모듈은, Cas5d, Cas6d 및 Cas7d를 포함하는 단리된 복합체로서 세포 중에 도입되어도 되고, 또는 Cas5d, Cas6d 및 Cas7d의 각각이 단리된 단백질로서 단독으로 세포 중에 도입되어도 된다. 또한, 본 발명의 표적 서열 타게팅 방법에 있어서, 상기 표적 인식 모듈은, 상기 Cas 단백질 Cas5d, Cas6d 및 Cas7d를 인코딩하는 핵산으로서 세포 중에 도입되어도 된다. 해당 핵산으로서는, 예를 들어, mRNA 등의 RNA, 또는 DNA를 들 수 있다.
상기 Cas 단백질을 인코딩하는 DNA는, 예를 들어, 벡터에 포함되어 있어도 되고, 해당 DNA 서열은, 바람직하게는, 프로모터 및 터미네이터 등의 조절 서열에 작동 가능하게 연결되어 있다. 상기 표적 인식 모듈을 도입하는 세포가 진핵세포인 경우, 바람직하게는, 상기 Cas 단백질을 인코딩하는 DNA에 핵이행 시그널 서열이 부가된다. 상기 Cas 단백질 Cas5d, Cas6d 및 Cas7d를 인코딩하는 DNA의 2 이상 또는 모두가 단일한 벡터 중에 포함되어 있어도 되고, 또는 따로따로의 벡터 중에 포함되어 있어도 된다. 벡터의 수, 및 각 벡터에 짜 넣는 DNA가 인코딩하는 Cas 단백질의 종류 및 조합에 제한은 없다. 상기 Cas 단백질을 인코딩하는 2 이상의 DNA가 하나의 벡터 중에 포함되는 경우, 이들 DNA 서열은, 폴리시스트로닉으로 발현하도록, 예를 들어 자기 개열형 펩타이드를 인코딩하는 서열 등을 개재시켜, 서로 연결되어 있어도 된다. 한편, 상기 Cas 단백질을 인코딩하는 2 이상의 DNA를 연결하는 차례는, 어느 것이어도 된다.
상기 gRNA는, RNA로서, 또는 gRNA를 인코딩하는 DNA로서 세포 중에 도입되어도 된다. gRNA를 인코딩하는 DNA는, 예를 들어, 벡터에 포함되어 있어도 되고, 해당 DNA 서열은, 바람직하게는, 프로모터 및 터미네이터 등의 조절 서열에 작동 가능하게 연결된다.
상기 Cas 단백질을 인코딩하는 DNA와 상기 gRNA를 인코딩하는 DNA는, 동일한 벡터 중에 포함되어 있어도 되고, 또는 따로따로의 벡터 중에 포함되어 있어도 된다. 예를 들어, Cas5d, Cas6d 및 Cas7d를 인코딩하는 DNA의 1 이상 또는 모두, 및 gRNA를 인코딩하는 DNA가 단일한 벡터 중에 포함되어 있어도 된다.
상기 프로모터 및 터미네이터 등의 조절 서열, 및 핵이행 시그널 서열은, 당해 분야에서 공지이며, 상기 표적 인식 모듈 및 상기 gRNA를 도입하는 세포가 유래하는 생물종에 따라서 적절히 선택할 수 있다. 도입에 이용하는 벡터도 또한, 도입하는 세포가 유래하는 생물종에 따라서 적절히 선택하면 되고, 특별히 한정되지 않는다. 예를 들어, 플라스미드 벡터, 바이러스 벡터, 파지미드, 코스미드, 인공/미니 염색체, 트랜스포존 등을 들 수 있다.
상기 표적 인식 모듈 및 gRNA의 세포 중으로의 도입은, 당해 분야에 알려진 여러 가지 수단에 의해 행할 수 있다. 예를 들어, 트랜스펙션, 예를 들어, 인산 칼슘 중개성 트랜스펙션, 일렉트로포레이션, 리포솜 트랜스펙션 등, 바이러스 형질 도입, 리포펙션, 유전자총, 마이크로인젝션, 아그로박테리움법, 아그로인필트레이션법, PEG-칼슘법 등을 들 수 있다.
상기 표적 인식 모듈 및 gRNA는, 동시에 또는 연속적으로 세포 중에 도입하면 된다. 또한, 상기 표적 인식 모듈을 구성하는 Cas5d, Cas6d 및 Cas7d, 또는 이들 각 Cas 단백질을 인코딩하는 핵산은, 동시에 또는 연속적으로 세포 중에 도입하면 된다. 예를 들어, 인 비트로 또는 인 비보에 있어서 각각 합성한 상기 Cas 단백질 Cas5d, Cas6d 및 Cas7d와 인 비트로 또는 인 비보에 있어서 합성한 gRNA를, 인 비트로에 있어서 인큐베이트하여 복합체를 형성시키고, 해당 복합체를 세포 중에 도입할 수 있다.
상기 표적 인식 모듈 및 gRNA의 도입 시, 세포는, 표적 뉴클레오타이드 서열의 타게팅에 적당한 조건하에서 배양된다. 그 다음에, 해당 세포는, 세포 증식 및 유지에 적당한 조건하에서 배양된다. 배양 조건은, 표적 인식 모듈 및 gRNA를 도입하는 세포가 유래하는 생물종에 적절한 배양 조건이면 되고, 예를 들어, 기지의 세포 배양 기술에 기초하여 당업자에 의해 적절히 결정 가능하다.
본 발명의 표적 서열 타게팅 방법에 의하면, gRNA와 표적 인식 모듈의 Cas7d가 결합하여 상기 표적 인식 모듈과 gRNA가 복합체를 형성하고, 동시에, 해당 gRNA가 표적 뉴클레오타이드 서열과 염기쌍을 형성하고, 해당 표적 인식 모듈이 표적 뉴클레오타이드 서열 근방의 PAM 서열을 인식하는 것에 의해, 서열 특이적으로 표적 뉴클레오타이드 서열을 표적화한다. 본 발명의 표적 서열 타게팅 방법에서는, 추가로 Cas10d를 세포 중에 도입해도 된다.
(6) 본 발명의 표적 서열 개변 방법
본 발명의 표적 서열 개변 방법은, 상기 RNA 유도성 엔도뉴클레아제와 상기 gRNA를 상기 세포 중에 도입하는 것을 특징으로 한다. 즉, 본 발명의 표적 서열 개변 방법은, 세포 중에, (i) Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d, 또는 이들 단백질을 인코딩하는 핵산, 및 (ii) 상기 gRNA 또는 해당 gRNA를 인코딩하는 DNA를 상기 세포 중에 도입하는 것을 특징으로 한다. 본 발명의 표적 서열 개변 방법은, 본 발명의 표적 서열 타게팅 방법에 의해 표적화한 뉴클레오타이드 서열을, 상기 폴리뉴클레오타이드 절단 모듈에 의해 절단하는 것을 포함한다. 본 발명의 표적 서열 개변 방법은, 인 비트로 및 인 비보의 어느 것으로 행해도 된다. 본 발명에 있어서, 개변에는, 적어도 1개의 뉴클레오타이드의 결실, 삽입, 또는 치환, 혹은 그들의 조합이 포함된다.
본 발명의 표적 서열 개변 방법에 있어서는, 상기의 RNA 유도성 엔도뉴클레아제 및 gRNA에 더하여, 도너 폴리뉴클레오타이드를 세포 중에 도입해도 된다. 도너 폴리뉴클레오타이드는, 표적 부위에 도입하고 싶은 개변을 포함하는 적어도 1개의 도너 서열을 포함한다. 도너 폴리뉴클레오타이드는, 도너 서열에 더하여, 해당 도너 서열의 양단에 표적 서열의 상류 및 하류의 서열과 상동성이 높은 서열(바람직하게는, 표적 서열의 상류 및 하류의 서열과 실질적으로 동일한 서열)을 포함하고 있어도 된다. 도너 폴리뉴클레오타이드는, 1본쇄 또는 2본쇄의 DNA여도 된다. 도너 폴리뉴클레오타이드는, 당해 분야에서 기지의 기술에 기초하여 당업자가 적절히 설계할 수 있다.
본 발명의 표적 서열 개변 방법에 있어서 도너 폴리뉴클레오타이드가 존재하지 않는 경우, 표적 뉴클레오타이드 서열에 있어서의 절단은, 비상동 말단 결합(NHEJ)에 의해 수복될 수 있다. NHEJ는 에러가 발생하기 쉬움이 알려져 있고, 적어도 1개의 뉴클레오타이드의 결실, 삽입, 또는 치환, 혹은 그들의 조합이 해당 절단의 수복 중에 일어날 수 있다. 이리하여, 해당 서열은, 표적 서열 부위에 있어서 개변되고, 그것에 의해, 프레임 시프트나 미성숙 종지 코돈을 유발하여, 표적 서열 영역이 인코딩하고 있는 유전자의 발현이 불활성화 또는 녹아웃될 수 있다.
본 발명의 표적 서열 개변 방법에 있어서 도너 폴리뉴클레오타이드가 존재하는 경우, 도너 폴리뉴클레오타이드의 도너 서열은, 절단된 표적 뉴클레오타이드 서열의 상동 재조합 수복(HDR)에 의해, 표적 서열 부위에 삽입되거나, 또는 표적 서열 부위가 도너 서열로 치환된다. 그 결과, 표적 서열 부위에 원하는 개변이 도입된다.
상기 RNA 유도성 엔도뉴클레아제는, Cas5d, Cas6d, Cas7d, Cas3d 및 Cas10d를 포함하는 단리된 복합체로서 세포 중에 도입되어도 되고, 또는 Cas5d, Cas6d, Cas7d, Cas3d 및 Cas10d의 각각이 단리된 단백질로서 단독으로 세포 중에 도입되어도 된다. 혹은, 상기 RNA 유도성 엔도뉴클레아제는, 상기 Cas 단백질 Cas5d, Cas6d, Cas7d, Cas3d 및 Cas10d를 인코딩하는 핵산으로서 세포 중에 도입되어도 된다. 해당 핵산으로서는, 예를 들어, mRNA 등의 RNA, 또는 DNA를 들 수 있다.
상기 Cas 단백질을 인코딩하는 DNA는, 예를 들어, 벡터에 포함되어 있어도 되고, 해당 DNA 서열은, 바람직하게는, 프로모터 및 터미네이터 등의 조절 서열에 작동 가능하게 연결되어 있다. 상기 RNA 유도성 엔도뉴클레아제를 도입하는 세포가 진핵세포인 경우, 바람직하게는, 상기 Cas 단백질을 인코딩하는 DNA에 핵이행 시그널 서열이 부가된다. 상기 Cas 단백질 Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d를 인코딩하는 DNA의 2 이상 또는 모두가 단일한 벡터 중에 포함되어 있어도 되고, 또는 따로따로의 벡터 중에 포함되어 있어도 된다. 벡터의 수, 및 각 벡터에 짜 넣는 DNA가 인코딩하는 Cas 단백질의 종류 및 조합에 제한은 없다. 상기 Cas 단백질을 인코딩하는 2 이상의 DNA가 하나의 벡터 중에 포함되는 경우, 이들 DNA 서열은, 폴리시스트로닉으로 발현하도록, 예를 들어 자기 개열형 펩타이드를 인코딩하는 서열 등을 개재시켜, 서로 연결되어 있어도 된다. 한편, 상기 Cas 단백질을 인코딩하는 2 이상의 DNA를 연결하는 차례는, 어느 것이어도 된다.
상기 gRNA는, RNA로서, 또는 gRNA를 인코딩하는 DNA로서 세포 중에 도입되어도 된다. gRNA를 인코딩하는 DNA는, 예를 들어, 벡터에 포함되어 있어도 되고, 해당 DNA 서열은, 바람직하게는, 프로모터 및 터미네이터 등의 조절 서열에 작동 가능하게 연결된다.
상기 Cas 단백질을 인코딩하는 DNA와 상기 gRNA를 인코딩하는 DNA는, 동일한 벡터 중에 포함되어 있어도 되고, 또는 따로따로의 벡터 중에 포함되어 있어도 된다. 예를 들어, Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d의 각각을 인코딩하는 모든 DNA, 및 gRNA를 인코딩하는 DNA가 단일한 벡터 중에 포함되어 있어도 된다.
상기 프로모터 및 터미네이터 등의 조절 서열, 및 핵이행 시그널 서열은, 당해 분야에서 공지이며, 상기 RNA 유도성 엔도뉴클레아제 및 상기 gRNA를 도입하는 세포의 종류에 따라서 적절히 선택할 수 있다. 도입에 이용하는 벡터도 또한, 도입하는 세포의 종류에 따라서 적절히 선택하면 되고, 특별히 한정되지 않는다. 예를 들어, 플라스미드 벡터, 바이러스 벡터, 파지미드, 코스미드, 인공/미니 염색체, 트랜스포존 등을 들 수 있다.
상기 RNA 유도성 엔도뉴클레아제, gRNA, 및 도너 폴리뉴클레오타이드의 세포 중으로의 도입은, 당해 분야에 알려진 여러 가지 수단에 의해 행할 수 있다. 예를 들어, 트랜스펙션, 예를 들어, 인산 칼슘 중개성 트랜스펙션, 일렉트로포레이션, 리포솜 트랜스펙션 등, 바이러스 형질 도입, 리포펙션, 유전자총, 마이크로인젝션, 아그로박테리움법, 아그로인필트레이션법, PEG-칼슘법 등을 들 수 있다.
상기 RNA 유도성 엔도뉴클레아제, gRNA, 및 도너 폴리뉴클레오타이드는, 동시에 또는 연속적으로 세포 중에 도입하면 된다. 또한, 상기 RNA 유도성 엔도뉴클레아제를 구성하는 Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d, 또는 이들 각 Cas 단백질을 인코딩하는 핵산은, 동시에 또는 연속적으로 세포 중에 도입하면 된다.
상기 RNA 유도성 엔도뉴클레아제 및 gRNA, 또는 RNA 유도성 엔도뉴클레아제, gRNA 및 도너 폴리뉴클레오타이드의 도입 시, 세포는, 표적 서열 부위에서의 절단에 적당한 조건하에서 배양된다. 그 다음에, 해당 세포는, 세포 증식 및 유지에 적당한 조건하에서 배양된다. 배양 조건은, RNA 유도성 엔도뉴클레아제 및 gRNA, 또는 RNA 유도성 엔도뉴클레아제, gRNA 및 도너 폴리뉴클레오타이드를 도입하는 세포가 유래하는 생물종에 적절한 배양 조건이면 되고, 예를 들어, 기지의 세포 배양 기술에 기초하여 당업자에 의해 적절히 결정 가능하다.
본 발명의 표적 서열 개변 방법에 의하면, gRNA가 표적 뉴클레오타이드 서열과 염기쌍을 형성함과 동시에, RNA 유도성 엔도뉴클레아제의 표적 인식 모듈과의 상호작용에 의해, 해당 RNA 유도성 엔도뉴클레아제를 해당 표적 서열 부위로 유도하고, 그 다음에, 해당 RNA 유도성 엔도뉴클레아제의 절단 모듈이 해당 표적 서열 부위에 있어서의 서열을 절단하고, 해당 절단 서열의 수복 시에, 표적 서열이 개변된다. 예를 들어, 본 발명의 표적 서열 개변 방법은, 게놈 상의 표적 뉴클레오타이드 서열의 개변을 위해서 이용할 수 있고, 해당 방법에 의해 게놈 상의 2본쇄 DNA가 절단되어, 표적 부위가 개변된다.
(7) 본 발명의 표적 유전자 발현 억제 방법
본 발명의 표적 유전자 발현 억제 방법은, 상기 표적 인식 모듈(Cas5d, Cas6d 및 Cas7d)과 상기 gRNA를 상기 세포 중에 도입하는 것을 특징으로 한다. 즉, 본 발명의 표적 서열 타게팅 방법은, (i) Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및 (ii) 상기 gRNA, 또는 해당 gRNA를 인코딩하는 DNA를 상기 세포 중에 도입하는 것을 특징으로 한다. 본 발명의 표적 유전자 발현 억제 방법에서는, 표적 뉴클레오타이드 서열로서 표적 유전자의 서열의 적어도 일부의 서열이 선택되어, 해당 서열에 상보적인 서열을 포함하는 gRNA를 사용한다. 본 발명의 표적 유전자 발현 억제 방법은, 본 발명의 표적 서열 타게팅 방법에 의해 뉴클레오타이드 서열을 표적화할 때에, 표적 인식 모듈과 gRNA의 복합체가 표적 서열에 결합하는 것에 의해, 해당 표적 서열을 포함하는 유전자의 발현이 억제되는 것을 포함한다. 본 발명의 표적 유전자 발현 억제 방법은, 인 비트로 및 인 비보의 어느 것으로 행해도 된다. 본 발명의 표적 유전자 발현 억제 방법에 의하면, 표적 유전자 서열은 절단되지 않지만, 상기 표적 인식 모듈과 gRNA의 복합체가 표적 뉴클레오타이드 서열에 결합하는 것에 의해, 해당 표적 서열을 포함하는 유전자 영역의 기능 또는 해당 유전자의 발현이 저해된다.
상기 표적 인식 모듈 및 gRNA, 그들의 세포 중으로의 도입 방법, 및 도입 시 및 도입 후의 세포 배양 등에 대해서는, 상기 "(5) 본 발명의 표적 서열 타게팅 방법"에 있어서 기재한 바와 같다. 본 발명의 표적 유전자 발현 억제 방법에서는, 추가로 Cas10d를 세포 중에 도입해도 된다.
(8) 본 발명의 복합체
본 발명의 복합체는, 상기 CRISPR 타입 I-D Cas 단백질 및 상기 gRNA를 포함한다. 본 발명은, 특히, 상기 표적 인식 모듈과 상기 gRNA를 포함하는 복합체, 및 상기 RNA 유도성 엔도뉴클레아제와 gRNA를 포함하는 복합체를 제공한다. 더 구체적으로는, Cas5d, Cas6d 및 Cas7d와 gRNA를 포함하는 복합체, 및 Cas5d, Cas6d, Cas7d, Cas3d 및 Cas10d와 gRNA를 포함하는 복합체를 제공한다. 더욱이, 상기 복합체를 인코딩하는 DNA 분자도 제공된다. 본 발명의 복합체는, 상기한 본 발명의 표적 서열 개변 방법, 표적 유전자 발현 억제 방법, 및 표적 서열 타게팅 방법에 사용할 수 있다. RNA 유도성 엔도뉴클레아제(Cas5d, Cas6d, Cas7d, Cas3d 및 Cas10d를 포함하는 복합체)와 gRNA를 포함하는 복합체를 세포에 도입하여, 해당 세포 내에서 해당 복합체를 기능시키는 것에 의해, 해당 세포의 게놈 상의 표적 서열을 개변할 수 있다. 또한, 표적 인식 모듈(Cas5d, Cas6d 및 Cas7d를 포함하는 복합체)과 gRNA를 포함하는 복합체를 세포에 도입하여, 해당 세포 내에서 해당 복합체를 기능시키는 것에 의해, 해당 세포 중의 표적 서열을 표적화할 수 있고, 또한, 해당 표적 서열 영역이 인코딩하는 유전자의 발현을 억제할 수 있다. 상기 표적 인식 모듈과 gRNA를 포함하는 복합체는, 추가로 Cas10d를 포함하고 있어도 된다.
본 발명의 복합체는, 통상적 방법에 의해, 인 비트로 또는 인 비보로 제조할 수 있다. 예를 들어, 상기 RNA 유도성 엔도뉴클레아제 또는 상기 표적 인식 모듈을 구성하는 Cas 단백질을 인코딩하는 핵산, 및 gRNA 또는 gRNA를 인코딩하는 DNA를 세포 중에 도입하여, 해당 세포 내에서 복합체를 형성시켜도 된다.
본 발명의 복합체의 예로서 한정하는 것은 아니지만, Microcystis aeruginosa의 Cas5d(서열 번호 1), Cas6d(서열 번호 2) 및 Cas7d(서열 번호 3)와, GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC(서열 번호 6; N은, 표적 뉴클레오타이드 서열에 상보적인 서열을 구성하는 임의의 뉴클레오타이드이다)로 나타나는 서열로 이루어지는 gRNA를 포함하는 복합체, 및 Microcystis aeruginosa의 Cas5d(서열 번호 1), Cas6d(서열 번호 2), Cas7d(서열 번호 3), Cas3d(서열 번호 4) 및 Cas10d(서열 번호 5)와, GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC(서열 번호 6; N은, 표적 뉴클레오타이드 서열에 상보적인 서열을 구성하는 임의의 뉴클레오타이드이다)로 나타나는 서열로 이루어지는 gRNA를 포함하는 복합체를 들 수 있다. 상기 gRNA의 서열 중, N의 수는 10∼70의 범위에서 변경해도 되고, 바람직하게는 20∼50, 보다 바람직하게는 25∼45, 더 바람직하게는 30∼40, 또한 더 바람직하게는 32∼37의 범위에서 변경해도 된다.
(9) 본 발명의 발현 벡터
본 발명은 더욱이, Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d를 포함하는 RNA 유도성 엔도뉴클레아제를 인코딩하는 핵산, 및 표적 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA를 인코딩하는 DNA를 포함하는 발현 벡터, 및 CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d를 인코딩하는 핵산, 및 표적 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA를 인코딩하는 DNA를 포함하는 발현 벡터를 제공한다.
본 발명의 벡터는, 상기 "(5) 본 발명의 표적 서열 타게팅 방법", "(6) 본 발명의 표적 서열 개변 방법", 및 "(7) 본 발명의 표적 유전자 발현 억제 방법"에 기재한 바와 같은, 상기 Cas 단백질 및 gRNA를 세포 중에 도입하기 위한 벡터이다. 해당 벡터의 도입 후, 해당 세포 중에서 상기 Cas 단백질 및 gRNA를 발현한다. 본 발명의 벡터는, 또한, 상기 gRNA에 포함되는 표적 서열을, 제한 부위를 포함하는 임의의 서열로 바꾼 벡터여도 된다. 이와 같은 벡터는, 해당 임의의 서열 부위에 원하는 표적 뉴클레오타이드 서열을 짜 넣어 사용된다. 해당 임의의 서열로서는, 예를 들어, CRISPR 타입 I-D의 유전자자리에 있는 스페이서 서열 또는 그 일부여도 된다.
(10) 본 발명의 표적 인식 모듈을 포함하는 융합 단백질
본 발명은, 더욱이, 상기 표적 인식 모듈 및 기능성 폴리펩타이드를 포함하는 융합 단백질을 제공한다. 해당 융합 단백질 및 상기 gRNA를 세포 중에 도입하면, 표적 인식 모듈 및 gRNA의 작용에 의해 융합 단백질이 세포 중의 표적 뉴클레오타이드 서열 또는 표적 유전자로 유도되어 상기 기능성 폴리펩타이드의 작용에 의해 해당 표적 뉴클레오타이드 서열 또는 표적 유전자가 개변 또는 수식된다. 따라서, 본 발명은 더욱이, 상기 융합 단백질 및 상기 gRNA를 세포 중에 도입하는 것을 특징으로 하는, 표적 뉴클레오타이드 서열 또는 표적 유전자의 개변 또는 수식 방법을 제공한다. 더욱이, 본 발명에서는, 상기 융합 단백질과 상기 gRNA를 포함하는 복합체도 제공된다.
상기 기능성 폴리펩타이드는, 표적 서열에 대해서 어떠한 기능을 나타내는 폴리펩타이드이며, 또한 Cas3d 및 Cas10d 이외의 폴리펩타이드이다. 상기 기능성 폴리펩타이드로서는, 예를 들어, 한정하는 것은 아니지만, 제한 효소, 전사 인자, DNA 메틸화 효소, 히스톤 아세틸화 효소, 형광 단백질, 및 폴리뉴클레오타이드 절단 모듈로서 제한 효소의 뉴클레오타이드 절단 모듈, 유전자 발현 조절 모듈로서 전사 인자의 전사 활성화 모듈 및 전사 억제 모듈, 에피게놈 수식 모듈로서, DNA 메틸화 효소의 메틸화 모듈 및 히스톤 아세틸화 효소의 아세틸화 모듈 등을 들 수 있다. 형광 단백질로서는, 예를 들어, GFP를 들 수 있다. 예를 들어, 상기 표적 인식 모듈과 폴리뉴클레오타이드 절단 모듈을 포함하는 융합 단백질은, gRNA와 함께 세포 중에 도입하는 것에 의해, 본 발명의 표적 서열 개변 방법과 마찬가지로, 표적 서열을 개변할 수 있다. 예를 들어, 상기 표적 인식 모듈과 유전자 발현 조절 모듈 또는 에피게놈 수식 모듈을 포함하는 융합 단백질은, gRNA와 함께 세포 중에 도입하는 것에 의해, 표적 서열을 수식하여, 표적 유전자의 발현을 조절할 수 있다. 예를 들어, 상기 표적 인식 모듈과 형광 단백질을 포함하는 융합 단백질은, gRNA와 함께 세포 중에 도입하는 것에 의해, 표적 서열 근방을 형광 표지화할 수 있다.
이하에, 본 발명의 실시예를 나타냈다. 단, 본 발명은 이들 실시예로 한정되지 않는다.
실시예
실시의 일 형태로서, Microcystis aeruginosa 유래의 CRISPR 타입 I-D(이하, "TiD"라고도 한다) 유전자자리 유래의 유전자군(Cas3d, Cas5d, Cas6d, Cas7d, Cas10d)을, 클론화하여 이용했다. 실시예 중의 DNA 서열의 가공 및 구축 조작에는, 인공 유전자 화학 합성, PCR법, 제한 효소 처리, 라이게이션, Gibson Assembly법의 어느 것을 이용했다. 또한, 염기 서열의 결정에는 산가법 혹은 차세대 시퀀스법을 이용했다.
실시예 1. 대장균에 있어서의 게놈 편집
본 실시예에서는, 대표적인 세균의 모델 생물인 대장균에 있어서 본 발명의 기술이 유효하게 기능함을 실증했다.
(1) TiD 유전자 발현 플라스미드의 구축
Microcystis aeruginosa(이하, "M. aeruginosa"라고도 한다)의 CRISPR 타입 I-D 유전자자리(이하, "TiD 유전자자리"라고도 한다) 유래의 유전자군을 클론화했다. TiD 유전자자리로부터 M. aeruginosa 유래의 Cas5d, Cas6d, Cas7d, Cas3d 및 Cas10d의 아미노산 서열 정보를 기초로, 각 Cas 단백질을 인코딩하는 대장균 코돈형의 서열(서열 번호 7∼11)을 인공 화학 합성했다. 각 유전자의 상류에 J23108 합성 프로모터(서열 번호 12), 혹은 합성 리보좀 결합 서열(서열 번호 13)을, 각 유전자의 하류에 터미네이터 서열(서열 번호 14∼17)을 부여한 DNA 단편을 플라스미드 벡터 pACYC184(Nippon gene사제)에 연결하여, pEcTiD1을 구축했다. 추가로 M. aeruginosa 유래의 CRISPR 타입 I-D 유전자자리의 근방에 존재하는 CRISPR 리피트 서열(crRNA, 서열 번호 18)을 추출하여, T7 프로모터(서열 번호 19)의 제어하에 crRNA 발현 카세트(서열 번호 20)를 합성했다. crRNA 발현 카세트에는 본 실시예의 표적 서열이 되는 대장균 ccdB 유전자의 프로모터 영역 서열을 포함하고 있다. crRNA 발현 카세트 서열을 pEcTiD1에 조합하여, pEcTiD2(도 2a)를 구축했다. 또한, DNA 이중쇄 절단을 수반하지 않는 게놈 편집을 행하는 TiD 발현 플라스미드 벡터로서, Cas5d, Cas6d 및 Cas7d 유전자 발현 카세트를 포함하는 pEcTiD3의 구축을 행했다(도 2b). 본 실시예에서 사용한 프로모터, 터미네이터, CRISPR 리피트 서열, 및 crRNA 발현 카세트 서열을 표 2에 나타낸다.
(2) 프로토스페이서 인접 모티프(PAM) 라이브러리의 구축
본 실시예에 있어서는, 표적 DNA로서 대장균 ccdB 유전자의 상류에 T7 프로모터 서열을 연결한 합성 ccdB 유전자 카세트(서열 번호 21)(표 3)를 이용하여, ccdB 유전자 상류의 T7프로모터 영역을 포함하는 35염기를 TiD의 표적 서열로 했다. 합성 ccdB 유전자 카세트를 플라스미드 벡터 pMW219(Nippon gene사제)의 멀티클로닝 사이트에 연결하여, pMW_ccdB1을 구축했다(도 3a).
CRISPR 시스템은, 표적 서열 근방에 위치하는 프로토스페이서 인접 모티프(PAM) 서열을 인식하여, 표적 서열과 gRNA를 개재시켜 결합한다. 그러나, 본 실시예에 이용한 M. aeruginosa TiD의 PAM 서열은 불명했었기 때문에, 우선, M. aeruginosa TiD의 PAM 서열의 결정을 행하기 위한 PAM 서열 라이브러리 플라스미드의 구축을 행했다. pMW_ccdB1의 T7 프로모터 상류에 랜덤인 4염기의 서열을 인공 화학 DNA 합성 및 PCR법을 이용하여 도입했다(도 3b). 구축한 pMW_ccdB-PAM 라이브러리 플라스미드는 CcdB 내성을 유지하는 대장균 ccdB 내성 세포주(Thermo Fisher Scientific사제)에 도입한 후, 대량 플라스미드 조제를 행했다.
(3) M. aeruginosa TiD 시스템에 있어서의 PAM 서열의 결정
pMW_ccdB-PAM 라이브러리 플라스미드 상의 T7 프로모터 영역과 상보적인 35 염기 서열을 짜 넣은 pEcTiD3-T7을 이용하여, TiD에 있어서의 PAM 서열 결정을 행했다. pEcTiD3-T7을 대장균 BL21AI주(Thermo Fisher Scientific사제)에 도입하여, ccdB 유전자 게놈 편집용 대장균 호스트주로 했다. BL21AI[pEcTiD3-T7]주는, 표적 서열 인식에 필요한 Cas5d, Cas6d 및 Cas7d 단백질을 산생한다. Cas5d/Cas6d/Cas7d-crRNA 복합체는, 적절한 PAM 서열에 인접하는 표적 서열을 인식하여, 표적 서열의 절단은 행하지 않지만, 표적 서열에 결합하는 것에 의해 표적 서열로 한 T7 프로모터의 기능을 저해한다.
BL21AI주에 도입한 pMW-ccdB-PAM의 ccdB 발현은 아라비노스 첨가 배지에 있어서 유도되고, CcdB 내성을 가지지 않는 BL21AI주는 사멸한다. 미리 TiD 발현 플라스미드를 도입한 BL21AI주에 pMW_ccdB-PAM 라이브러리 플라스미드를 도입하면, TiD가 인식하는 적절한 PAM 서열을 가지는 pMW_ccdB-PAM 라이브러리 플라스미드의 T7 프로모터 상에, pEcTiD3 플라스미드로부터 발현하는 Cas5d/Cas6d/Cas7-crRNA가 결합함으로써, CcdB 단백질 산생이 저해되기 때문에, 대장균 세포는 생육하는 것이 가능해진다. 생육되어 온 대장균 콜로니로부터 pMW_ccdB-PAM 라이브러리 플라스미드를 조제하고, PAM 서열을 시퀀스 해석하는 것에 의해 M. aeruginosa TiD의 PAM 서열이 결정된다.
대량 플라스미드 조제를 행한 pMW_ccdB-PAM 라이브러리 플라스미드를, 케미컬 컨피텐트 셀법에 의해 BL21AI[pEcTiD3-T7]주에 도입했다. pMW_ccdB-PAM 라이브러리 플라스미드 및 pEcTiD3-T7을 보지하는 BL21AI 세포는, 25mg/L 클로람페니콜, 25mg/L 카나마이신 및 1% 글루코스를 포함하는 LB 한천 배지 상에서 선발했다. 얻어진 대장균 콜로니 중 약 1x107 콜로니를 회수하여, 항생 물질 및 글루코스를 포함하지 않는 LB 액체 배지로 수회 세정을 행한 후, 1% 아라비노스를 포함하는 LB 액체 배지에 1x106/mL가 되도록 재현탁했다. 현탁균액은 37℃, 2시간 침투 배양하여, 아라비노스에 의한 T7 프로모터의 발현 제어하에 있는 crRNA 및 ccdB의 발현 유도를 행한 후, 200μL의 균체액을 25mg/L 클로람페니콜, 25mg/L 카나마이신 및 1% 아라비노스를 포함하는 LB 한천 배지에 도포하고, 37℃에서 하룻밤 배양하여 얻어진 균체 콜로니를 회수했다. 회수된 약 500주의 콜로니로부터 플라스미드를 조제하여, PAM 서열 근방의 시퀀스 해석을 행했다. TiD 발현 플라스미드의 존재하에서 레스큐된 pMW_ccdB-PAM 라이브러리 플라스미드의 PAM 서열은, 5'-NGTH-3'(N=A, C, G 또는 T; H=A, C 또는 T)의 서열을 포함하고, 사용 빈도는 NGTA가 28%, NGTC가 33%, NGTT가 38%였다. 따라서, TiD가 이용하는 PAM 서열은, 5'-GTH-3'(H=A, C 또는 T)임을 알 수 있었다.
(4) 대장균에 있어서의 게놈 편집
pEcTiD3-T7과 pMW_ccdB-PAM 라이브러리 플라스미드를 이용하여 결정한 3종의 PAM 서열을 포함하는 pMW_ccdB-PAMgta, pMW_ccdB-PAMgtc 및 pMW_ccdB-PAMgtt를 구축하고, 각각 pEcTiD2-T7과 함께 BL21AI주에 도입했다. pMW_ccdB-PAMgta/pEcTiD2-T7, pMW_ccdB-PAMgtc/pEcTiD2-T7 및 pMW_ccdB-PAMgtt/pEcTiD2-T7을 보지하는 BL21AI주를 25mg/L 클로람페니콜, 25mg/L 카나마이신 및 1% 글루코스를 포함하는 LB 한천 배지 상에서 선발하고, 각각의 균주에 도입한 플라스미드가 포함되는 것을 시퀀스 해석에 의해 확인했다. 그 다음에, 올바른 플라스미드를 보지하는 BL21AI주를 25mg/L 클로람페니콜, 25mg/L 카나마이신 및 1% 아라비노스를 포함하는 LB 한천 배지에 도포하고, 37℃에서 하룻밤 배양한 바, 모든 균주에 있어서 생육이 확인되지 않아, Cas3 및 Cas10d의 존재하에 의한 플라스미드 DNA의 이중쇄 절단에 의한 것이라고 생각되었다.
실시예 2. 고등 식물에 있어서의 게놈 편집
본 실시예에서는, 고등 진핵생물의 게놈 편집의 실시예의 일 형태로서, Nicotiana benthamiana 및 Solanum lycopersicum에 있어서 본 발명의 기술이 유효하게 기능함을 실증했다.
(1) 고등식물 세포에 있어서의 TiD 유전자 발현 바이너리 벡터의 구축
M. aeruginosa 유래의 TiD 유전자자리로부터 Cas5d, Cas6d, Cas7d, Cas3d 및 Cas10d의 아미노산 서열 정보를 기초로, 애기장대 및 담배에 있어서의 코돈 빈도를 참조하여, 각 Cas 단백질을 인코딩하는 쌍자엽 식물 코돈형의 서열을 인공 화학 합성했다. 각 유전자의 5'측 상류에는, 탠덤으로 정렬된 2개의 핵이행 시그널을 포함하는 핵이행 시그널 서열(서열 번호 22, 서열 번호 23)을 부여하고, 추가로 각 유전자 사이를 자기 개열 펩타이드 2A 서열(서열 번호 24∼28)에 의해 연결한 DNA 단편을 제작했다. 2A 펩타이드 서열에 의해 연결한 5개의 TiD 유전자 단편의 5'측 상류에, 콜리플라워 모자이크 바이러스 35S 유전자 프로모터를 탠덤으로 2개 정렬하고 추가로 번역 인핸서 Ω 서열을 부가한 프로모터 서열(2x35S 프로모터; 서열 번호 29)을, 또한 3'측 하류에 애기장대 열쇼크 단백질 18.2kDa 유전자 터미네이터 서열(서열 번호 30)을 연결한 TiD 유전자 발현 카세트를 제작했다. TiD 유전자 발현 카세트를 바이너리 플라스미드 벡터 pCAMBIA2300에 클론화하여, pEgPTiD1을 구축했다(도 4a). 식물용 crRNA 발현 카세트에는, 2개의 crRNA 서열 사이에, 임의의 35염기 서열을 연결할 수 있도록 2개소의 제한 효소 BsaI 사이트를 포함하는 스페이서 서열을 배치한 DNA를 인공 화학 합성했다(서열 번호 31). 발현 제어 서열로서 5'측 상류에 애기장대 U6 snRNA-26 유전자의 프로모터 서열(서열 번호 32)을, 또한 3'측 하류에 폴리 T 서열을 부가한 식물용 crRNA 발현 카세트를 구축했다(도 4b). 식물용 crRNA 발현 카세트를 pEgPTiD1의 RB 서열과 2x35S 프로모터의 사이에 연결하여, pEgPTiD2를 구축하여, 식물 게놈 편집용의 TiD 유전자 발현 바이너리 플라스미드 벡터로 했다(도 4c). pEgPTiD1 및 pEgPTiD2 중에 있어서의, 핵이행 시그널이 부가된 각 Cas 단백질을 인코딩하는 쌍자엽 식물 코돈형의 서열을 서열 번호 33∼37에 나타낸다. 본 실시예에서 사용한 핵이행 시그널 서열, 자기 개열 펩타이드 2A 서열, 프로모터, 터미네이터, 및 crRNA 발현 카세트 서열을 표 4에 나타낸다.
[표 4-1]
[표 4-2]
(2) Nicotiana benthamiana에 있어서의 게놈 편집
담배에 있어서의 실시예에 있어서는, 표적 서열 및 해당 서열에 도입하는 변이로서, 피토엔 불포화화 효소(PDS) 유전자를 선택했다(도 5a의 a). 담배 PDS 유전자 중의 제 3 엑손으로부터 표적 서열 1(Target 1, 서열 번호 38)을 선택하고, 인공 화학 합성에 의해 식물용 crRNA 발현 카세트에 짜 넣은, pEgPTiD2-pds(1)을 구축했다. 마찬가지로, 제 6 엑손으로부터 표적 서열 2(Target 2, 서열 번호 39)를 선택하고, 인공 화학 합성에 의해 식물용 crRNA 발현 카세트에 짜 넣은, pEgPTiD2-pds(2)를 구축했다. 구축한 바이너리 벡터는, 각각 Agrobacterium tumefaciens GV2260주에 도입했다. 담배 PDS를 표적으로 하는 TiD 발현 벡터의 담배 세포로의 도입은, 아그로인필트레이션법에 의해 행했다. pEgPTiD2-pds(1) 혹은 pEgPTiD2-pds(2)를 보지하는 아그로박테리움 균주와 GFP 발현 바이너리 벡터를 보지하는 아그로박테리움 균주를 각각 배양하고, 벤타미아나 담배 본엽에 공감염을 행했다(도 5a의 b). 공감염 후, 3일 경과 후의 엽편에 있어서 GFP 형광을 발하는 영역으로부터 조제한 게놈 DNA를 주형으로 하여, 표적 서열을 포함하는 300∼500bp의 PDS 유전자 단편을 PCR 증폭했다. 증폭한 PCR 단편을 이용하여 Cel-1 어세이를 행하여, PDS 유전자 상에 도입된 변이의 유무를 해석했다. 컨트롤로서 GFP 발현 바이너리 벡터만을 도입한 담배 엽편을 이용했다. GFP 발현 벡터만을 도입했을 경우에는, PDS 유전자 상에 변이는 확인되지 않았지만, pEgPTiD2-pds 및 GFP 발현 벡터를 동시에 도입했을 경우에는, 각각의 PDS 유전자의 표적 서열 상에 변이 도입이 확인되었다(도 5b의 c). 표적 서열 1 및 2를 표 5에 나타낸다.
(3) Solanum lycopersicum에 있어서의 게놈 편집
토마토에 있어서의 실시예에 있어서는, 표적 서열 및 해당 서열에 도입하는 변이로서, Aux/IAA 전사 인자 IAA9 유전자를 선택했다(도 6a). 토마토 IAA9 유전자 중의 제 2 엑손으로부터 표적 서열 1(서열 번호 40)(표 6)을 선택하고, 인공 화학 합성에 의해 식물용 crRNA 발현 카세트에 짜 넣은, pEgPTiD2-iaa9를 구축했다. 구축한 바이너리 벡터는, Agrobacterium tumefaciens GV2260주에 도입했다. 토마토 IAA9 유전자를 표적으로 하는 TiD 발현 벡터의 토마토 세포로의 도입은, 토마토 자엽 유래의 리프 디스크를 가지고 있던 아그로박테리움법에 의해 행했다. 아그로박테리움과 공존 배양한 리프 디스크를 100mg/L 카나마이신 및 1.5mg/L t-제아틴을 포함하는 MS 고화 배지 상에서 배양하는 것에 의해, pEgPTiD2-iaa9 상의 T-DNA 영역의 유전자 도입이 생긴 캘러스를 얻었다(도 6b). IAA9의 표적 서열에는 제한 효소 AccI의 인식 서열이 존재하고, TiD에 의한 게놈 편집의 결과, 변이가 도입되면 AccI 인식 부위가 소실된다. 이것을 이용하여 AccI를 이용한 PCR-제한 효소 길이 다형(RFLP) 해석에 의해, IAA9의 표적 서열에 생긴 변이 해석을 행했다. 얻어진 형질 전환 캘러스로부터 조제한 게놈 DNA를 주형으로 하여, IAA9의 표적 서열을 포함하는 약 300b 영역을 PCR에 의해 증폭했다. PCR 단편을 AccI에 의해 제한 효소 절단을 행한 바, pEgPTiD2-iaa9를 도입한 캘러스 배양물 유래 PCR 단편 중에는, IAA9 표적 서열에 변이 도입이 일어난 결과, AccI에 의해 절단을 받지 않는 서열이 포함되어 있음을 알 수 있었다(도 6c). pEgPTiD2-iaa9 도입을 행한 캘러스 유래의 PCR 단편의 염기 서열을 결정한 바, IAA9의 표적 서열 상의 PAM 서열의 직후에 1b로부터 4b까지의 염기 결실형 혹은 염기 삽입형의 변이가 도입되어 있음이 분명해졌다(도 7).
pEgPTiD2-iaa9 도입을 행한 캘러스를, 추가로 100mg/L 카나마이신 및 1.0mg/L t-제아틴을 포함하는 MS 고화 배지 상에서 배양을 계속하여, 형질 전환 재분화 슛(shoot)을 얻었다. 얻어진 재분화 슛으로부터 조제한 게놈 DNA를 주형으로 하여, AccI에 의한 PCR-RFLP 해석을 행한 바, 도 8a에 나타내는 바와 같이, AccI에 의한 절단을 받지 않는 PCR 단편, 즉 IAA9 표적 서열에 변이가 거의 100% 도입된 형질 전환 재분화 슛이 얻어졌다. 재생시킨 14개체의 형질 전환 재생 슛 중, 13개체에 있어서 도 8a에 나타내는 바와 같이 되고, 이들로부터 재생한 식물 개체에서는, IAA9 유전자의 결손에 의한 표현형의 하나인, 토마토 본엽이 단엽 형상을 나타냈다. 이상과 같이, TiD를 이용한 게놈 편집에 의해, 고효율로 변이 도입이 가능함이 나타났다.
실시예 3. 고등동물에 있어서의 게놈 편집
본 실시예에서는, 고등동물에 있어서의 게놈 편집의 실시예의 일 형태로서, 인간 배성 신(腎)세포 유래 세포주 HEK293 세포에 있어서 본 발명의 기술이 유효하게 기능함을 실증했다.
(1) 고등동물 세포에 있어서의 TiD 유전자 발현 벡터의 구축
M. aeruginosa 유래의 TiD 유전자자리로부터 Cas5d, Cas6d, Cas7d, Cas3d 및 Cas10d의 아미노산 서열 정보를 기초로, 각 Cas 단백질을 인코딩하는 유전자 서열을 인공 화학 합성했다. 각 유전자의 5'측 상류에는, 탠덤으로 정렬된 2개의 핵이행 시그널을 포함하는 핵이행 시그널 서열(서열 번호 22, 서열 번호 23)을 부여하고, 추가로 각 유전자 사이를 자기 개열 펩타이드 2A 서열(서열 번호 24∼28)에 의해 연결한 DNA 단편을 제작했다. 2A 펩타이드 서열에 의해 연결한 5개의 TiD 유전자 단편의 5'측 상류에, 사이토메갈로바이러스 인핸서 + 닭 β-엑틴 유전자 프로모터 하이브리드 서열(CBh 프로모터; 서열 번호 41)을, 또한 3'측 하류에 소 유래 성장 호르몬 유전자 터미네이터 서열(bGH 터미네이터 서열 번호 42)을 연결한 TiD 유전자 발현 카세트를 제작하여, pCR8TOPO 벡터(서모 피셔 사이언티픽사제)에 연결한 pCR_hTiD를 구축했다. crRNA 발현 카세트로서, 2개의 crRNA 서열 사이에, 임의의 35염기 서열을 연결할 수 있도록 2개소의 제한 효소 BsaI 사이트를 포함하는 스페이서 서열을 배치한 DNA(서열 번호 31)를 인공 화학 합성했다. 발현 제어 서열로서 5'측 상류에 인간 U6 snRNA 유전자의 프로모터 서열(서열 번호 43)을, 또한 3'측 하류에 폴리 T 서열을 부가하여, pCR8TOPO 벡터(서모 피셔 사이언티픽사제)에 연결한 pCR_crRNA를 구축했다. pCR_hTiD 중에 있어서의 핵이행 시그널이 부가된 각 Cas 단백질을 인코딩하는 서열을 서열 번호 33∼37에 나타낸다. CBh 프로모터, bGH 터미네이터, 및 인간 U6 snRNA 유전자 프로모터 서열을 표 7에 나타낸다.
(2) 동물 배양 세포에 있어서의 게놈 편집
동물 배양 세포에 있어서의 실시예로서, 세포주에 인간 배성 신세포 유래 세포주(HEK293 세포주)를 이용하고, 표적 서열 및 해당 서열에 도입하는 변이로서, EMX1 유전자를 선택했다. EMX1 유전자 중의 표적 서열로서 타겟 1(서열 번호 44) 및 타겟 2(서열 번호 45)를 선택하고, 인공 화학 합성에 의해, 상기 (1)에서 제작한 인간 배양 세포용 crRNA 발현 카세트에 짜 넣은, 타겟 1을 포함하는 pUC_crRNA-T1 및 타겟 2를 포함하는 pUC_crRNA-T2를 구축했다. 구축한 플라스미드 벡터는 각각 대장균 HST08주(다카라 바이오사제)에 있어서 증폭하고 PureYield(등록상표) Plasmid Miniprep System(프로메가사제)을 이용하여 정제를 행했다. 정제한 플라스미드 중, pCR_hTiD 및 pUC_crRNA-T1의 혼합물 혹은, pCR_hTiD 및 pUC_crRNA-T2의 혼합물을 각각 HEK293 세포주에 트랜스펙션하여, 도입했다. 플라스미드 벡터 도입 3일째에 있어서의 세포주를 회수하고, Blood&Cell Culture DNA Mini Kit(키아겐사제)를 이용하여 게놈 DNA를 조제했다. 조제한 게놈 DNA를 주형으로 하여 타겟 1 및 타겟 2를 포함하는 게놈 서열 영역을 PCR에 의해 증폭하고, 자동 전기 영동 장치 MultiNA(시마즈 제작소제)를 이용한 헤테로2본쇄 이동도 분석에 의해 변이 해석을 행했다. 또한, 증폭한 PCR 단편을 pNEB193 벡터(New England Biolab사제)에 클론화하고, 시퀀스 해석에 의해 변이 서열을 동정했다. 체세포 변이 효율은, 각각 변이 서열이 확인된 클론수/해석 클론 총수에 의해 산출했다. 컨트롤로서 플라스미드 미도입, 혹은 pCR_hTiD, pUC_crRNA-T1 또는 pUC_crRNA-T2를 단독으로 도입한 세포주를 이용하여, 마찬가지로 변이 해석을 행했다. 도 9에 HEK293 세포주를 이용한 게놈 편집의 실험 스킴을 나타낸다.
도 10 및 도 11에, pCR_hTiD 및 pUC_crRNA-T1의 혼합물 또는 pCR_hTiD 및 pUC_crRNA-T2의 혼합물을 트랜스펙션한 HEK293 세포주, 또는 플라스미드를 도입하지 않았던 HEK293 세포주(컨트롤)의 결과를 나타낸다. 도 10 및 도 11에 나타내는 바와 같이, pCR_hTiD 및 pUC_crRNA-T1의 혼합물 혹은, pCR_hTiD 및 pUC_crRNA-T2의 혼합물을 트랜스펙션한 HEK293 세포주에서는, 표적 서열 상에 변이가 도입되었다고 생각되는 피크가 검출되었다. 한편, 컨트롤의 플라스미드 미도입 세포주에서는, 변이 도입이라고 생각되는 피크는 검출되지 않았다. 또한, pCR_hTiD, pUC_crRNA-T1 혹은 pUC_crRNA-T2를 각각 단독으로 트랜스펙션한 세포로부터 얻은 DNA에서도, 플라스미드 미도입 세포주를 이용했을 경우와 마찬가지로, 변이 도입이라고 생각되는 피크는 얻어지지 않았다.
또한, 변이 도입이라고 생각되는 피크가 헤테로2본쇄 이동도 분석에 의해 검출된 서열 샘플을 플라스미드 벡터에 클론화하고, 시퀀스 해석한 결과, 도 12 및 도 13에 나타내는 바와 같이, 타겟 1 및 타겟 2 상에 결실 혹은 삽입형의 변이가 도입되고 있음이 분명해졌다.
본 발명에 의하면, 종래의 CRISPR 타입 II 혹은 타입 V 유래 RNA 유도성 엔도뉴클레아제를 이용하는 게놈 편집 기술에서는 표적으로 할 수 없었던 유전자 서열을 표적으로 하는 것이 가능해졌다. 즉 본 발명에 의해, 종래 기술에서는 타게팅 불가능한 유전자 영역 상에서의 변이 알렐의 제작, 전사 활성화 및 불활성화에 의한 유전자 발현 제어, DNA 수식/히스톤 수식 단백질 도메인의 타게팅에 의한 에피게놈 개변을 실현하는 것이 가능해졌다.
SEQ ID NO: 1; Microcystis aeruginosa Cas5d amino acid sequence
SEQ ID NO: 2; Microcystis aeruginosa Cas6d amino acid sequence
SEQ ID NO: 3; Microcystis aeruginosa Cas7d amino acid sequence
SEQ ID NO: 4; Microcystis aeruginosa Cas3d amino acid sequence
SEQ ID NO: 5; Microcystis aeruginosa Cas10d amino acid sequence
SEQ ID NO: 6; TiDcrRNA containing direct repeat (37b) and spacer (35b of N). N is any nucleotide constituting a complementary sequence to a target nucleotide sequence.
SEQ ID NO: 7; Cas5d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 8; Cas6d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 9; Cas7d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 10; Cas3d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 11; Cas10d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 12; J23108 synthesis promoter
SEQ ID NO: 13; Ribosomal binding sequence
SEQ ID NO: 14; Terminator sequence STOP767
SEQ ID NO: 15; Terminator sequence STOP768(1)
SEQ ID NO: 16; Terminator sequence TOP768(2)
SEQ ID NO: 17; T7 terminator sequence
SEQ ID NO: 18; CRISPR repeat sequence
SEQ ID NO: 19; T7 promoter sequence
SEQ ID NO: 20; crRNA expression cassette
SEQ ID NO: 21; Synthesis cccdB gene expression cassette
SEQ ID NO: 22; Nuclear localizing signal (NLS) amino acid sequence
SEQ ID NO: 23; NLS nucleotide sequence
SEQ ID NO: 24; Self-cleaving peptide 2A amino acid sequence
SEQ ID NO: 25; Self-cleaving peptide 2A(1) coding sequence
SEQ ID NO: 26; Self-cleaving peptide 2A(2) coding sequence
SEQ ID NO: 27; Self-cleaving peptide 2A(3) coding sequence
SEQ ID NO: 28; Self-cleaving peptide 2A(4) coding sequence
SEQ ID NO: 29; 2 x cauliflower mosaic virus 35S gene promoter + omega sequence
SEQ ID NO: 30; Arabidopsis shock protein 18.2kDa gene terminator
SEQ ID NO: 31; crRNA expression cassette
SEQ ID NO: 32; Arabidopsis U6 snRNA-26 gene promoter sequence
SEQ ID NO: 33; 2xNLS + Cas5d
SEQ ID NO: 34; 2xNLS + Cas6d
SEQ ID NO: 35; 2xNLS + Cas7d
SEQ ID NO: 36; 2xNLS + Cas3d
SEQ ID NO: 37; 2xNLS + Cas10d
SEQ ID NO: 38; Target sequence 1 on tobacco PDS gene
SEQ ID NO: 39; Target sequence 2 on tobacco PDS gene
SEQ ID NO: 40; Target sequence on tomato IAA9 gene
SEQ ID NO: 41; Cytomegalovirus enhancer + universal chicken beta-actin gene hybrid promoter
SEQ ID NO: 42; Bovine-derived growth hormone gene terminator sequence
SEQ ID NO: 43; Human U6 snRNA gene promoter
SEQ ID NO: 44; Target 1 sequence on human EMX1 gene
SEQ ID NO: 45; Target 2 sequence on human EMX1 gene
SEQ ID NO: 2; Microcystis aeruginosa Cas6d amino acid sequence
SEQ ID NO: 3; Microcystis aeruginosa Cas7d amino acid sequence
SEQ ID NO: 4; Microcystis aeruginosa Cas3d amino acid sequence
SEQ ID NO: 5; Microcystis aeruginosa Cas10d amino acid sequence
SEQ ID NO: 6; TiDcrRNA containing direct repeat (37b) and spacer (35b of N). N is any nucleotide constituting a complementary sequence to a target nucleotide sequence.
SEQ ID NO: 7; Cas5d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 8; Cas6d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 9; Cas7d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 10; Cas3d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 11; Cas10d nucleotide sequence for expression in Escherichia coli
SEQ ID NO: 12; J23108 synthesis promoter
SEQ ID NO: 13; Ribosomal binding sequence
SEQ ID NO: 14; Terminator sequence STOP767
SEQ ID NO: 15; Terminator sequence STOP768(1)
SEQ ID NO: 16; Terminator sequence TOP768(2)
SEQ ID NO: 17; T7 terminator sequence
SEQ ID NO: 18; CRISPR repeat sequence
SEQ ID NO: 19; T7 promoter sequence
SEQ ID NO: 20; crRNA expression cassette
SEQ ID NO: 21; Synthesis cccdB gene expression cassette
SEQ ID NO: 22; Nuclear localizing signal (NLS) amino acid sequence
SEQ ID NO: 23; NLS nucleotide sequence
SEQ ID NO: 24; Self-cleaving peptide 2A amino acid sequence
SEQ ID NO: 25; Self-cleaving peptide 2A(1) coding sequence
SEQ ID NO: 26; Self-cleaving peptide 2A(2) coding sequence
SEQ ID NO: 27; Self-cleaving peptide 2A(3) coding sequence
SEQ ID NO: 28; Self-cleaving peptide 2A(4) coding sequence
SEQ ID NO: 29; 2 x cauliflower mosaic virus 35S gene promoter + omega sequence
SEQ ID NO: 30; Arabidopsis shock protein 18.2kDa gene terminator
SEQ ID NO: 31; crRNA expression cassette
SEQ ID NO: 32; Arabidopsis U6 snRNA-26 gene promoter sequence
SEQ ID NO: 33; 2xNLS + Cas5d
SEQ ID NO: 34; 2xNLS + Cas6d
SEQ ID NO: 35; 2xNLS + Cas7d
SEQ ID NO: 36; 2xNLS + Cas3d
SEQ ID NO: 37; 2xNLS + Cas10d
SEQ ID NO: 38; Target sequence 1 on tobacco PDS gene
SEQ ID NO: 39; Target sequence 2 on tobacco PDS gene
SEQ ID NO: 40; Target sequence on tomato IAA9 gene
SEQ ID NO: 41; Cytomegalovirus enhancer + universal chicken beta-actin gene hybrid promoter
SEQ ID NO: 42; Bovine-derived growth hormone gene terminator sequence
SEQ ID NO: 43; Human U6 snRNA gene promoter
SEQ ID NO: 44; Target 1 sequence on human EMX1 gene
SEQ ID NO: 45; Target 2 sequence on human EMX1 gene
SEQUENCE LISTING
<110> Tokushima University
<120> Target sequence-specific alteration technique using nucleotide
target recognition
<130> 674277
<150> JP2017-158876
<151> 2017-08-21
<150> JP2017-236518
<151> 2017-12-08
<160> 45
<170> PatentIn version 3.5
<210> 1
<211> 224
<212> PRT
<213> Microcystis aeruginosa
<400> 1
Met Val His Ile Tyr Ser Cys Gln Leu Glu Leu His Asp Ser Leu Tyr
1 5 10 15
Tyr Ala Thr Arg Glu Ile Gly Arg Leu Tyr Glu Ser Glu Pro Val Ile
20 25 30
His Asn Tyr Ala Leu Cys Tyr Ala Leu Gly Leu Val Asn Ser Asp Ser
35 40 45
Tyr Arg Tyr Phe Cys Ser Glu Gln Ile Pro Gln Tyr Gln Glu His Leu
50 55 60
Asn Pro Leu Asn Glu Glu Lys Ile Tyr Val Thr Pro Ala Arg Ala Ile
65 70 75 80
Ala His Thr Ala Val Leu Asn Thr Trp Lys Tyr Ala Asn Asn Asn Tyr
85 90 95
His Val Glu Met Glu Lys Thr Gln Lys Asn Ile Pro Ser Phe Gly Arg
100 105 110
Ala Lys Glu Ile Ala Pro Glu Ser Ile Phe Glu Cys Phe Ile Ile Ser
115 120 125
His His Pro Leu Gln Leu Pro Lys Trp Ile Arg Leu Gly Lys Trp Met
130 135 140
Ser Lys Ala Glu Val Lys Leu Thr Glu Leu Ser Leu Ser Lys Gln Lys
145 150 155 160
Glu Asp Leu Phe Ile Tyr Pro Tyr Pro Leu Asn Pro Leu Asp Val Met
165 170 175
Phe Thr His Gln Val Ile Gly Tyr Asp Val Ile Asn Met Pro Pro Val
180 185 190
Ser Leu Ile Arg Asn Val Arg Met Arg Gly Glu Tyr Tyr Gln Ile Ser
195 200 205
Asp Arg Pro Asp Leu Lys Ile Pro Ala Arg Leu Ser Tyr His Phe Gly
210 215 220
<210> 2
<211> 277
<212> PRT
<213> Microcystis aeruginosa
<400> 2
Met Pro Tyr Ser Leu Val Leu Asn Leu Thr Pro Arg Ser Pro Ile Tyr
1 5 10 15
Pro Asn Phe Leu Thr Gly Arg His Leu His Ala Leu Phe Leu Thr Leu
20 25 30
Val Ser Ser Val Asp Gln Glu Leu Gly Asn Ile Leu His Thr Ala Glu
35 40 45
Ala Asp Lys Ala Phe Thr Leu Ser Pro Leu Gln Met Gln Ser Gly Gly
50 55 60
Lys Thr Ile Asn Ser Pro Gln Trp Arg His Glu Arg Glu Ile Ala Ser
65 70 75 80
Glu Thr Pro Cys Trp Trp Arg Ile Ser Leu Leu Asp Asp Arg Leu Phe
85 90 95
Gly Lys Leu Thr Ser Leu Trp Leu Asn Leu Asn Pro Lys Gln Pro Trp
100 105 110
His Leu Gly Ser Ala Asp Leu Val Ile Thr Ser Val Leu Ala Thr Pro
115 120 125
Gln Ser Val Gln Pro Trp Ala Asn Ser Cys Thr Tyr Gln Tyr Leu Tyr
130 135 140
Glu Asn Ala Ser Glu Thr Asn Arg Glu Phe Asp Phe Leu Phe Ala Thr
145 150 155 160
Pro Val Thr Phe Arg Gln Gly Lys Phe Asp Ser Ala Leu Pro Thr Arg
165 170 175
Glu Leu Val Phe Asn Ser Leu Leu Gly Arg Trp Asn Arg Tyr Ser Gly
180 185 190
Ile Pro Phe Asp Ser Ile Ala Leu Glu Ser Ile Phe Pro Ser Phe Phe
195 200 205
Asp Ile Gln Thr Lys Leu Ala Asp Glu Ala Tyr Lys Asn Gln Ser Ile
210 215 220
Gly Cys Val Gly Glu Ile His Tyr Arg Leu Leu Gly Glu Val Glu Pro
225 230 235 240
Ala Lys Ile Lys Ala Ile Asn Ala Leu Ala Asp Phe Ala Leu Tyr Ala
245 250 255
Gly Val Gly Arg Lys Thr Thr Met Gly Met Gly Met Thr Arg Arg Ile
260 265 270
Ser Lys Asp Lys Arg
275
<210> 3
<211> 332
<212> PRT
<213> Microcystis aeruginosa
<400> 3
Thr Phe Leu Thr Ser Val Asp Ala Lys Phe Phe His Ser Glu Ile Pro
1 5 10 15
Tyr Lys Pro Met Gly Lys Tyr Val His Phe Leu Thr Ile Arg Val Thr
20 25 30
Glu Ser Tyr Pro Leu Phe Gln Thr Asp Gly Glu Leu Asn Lys Ala Arg
35 40 45
Val Arg Ala Gly Ile Asp Ser Lys Lys Thr Ile Ser Arg Leu Ser Met
50 55 60
Phe Lys Arg Lys Gln Ser Thr Pro Glu Arg Leu Val Gly Arg Glu Leu
65 70 75 80
Leu Arg Asn Tyr Gly Leu Ile Thr Ala Glu Glu Cys Glu Tyr Asn Val
85 90 95
Lys Phe Ala Met Asn Asn Ala Asp Cys Ile Ile Tyr Gly Phe Ala Ile
100 105 110
Gly Asp Ser Gly Ser Glu Lys Ser Lys Val Val Val Asp Thr Ala Phe
115 120 125
Ser Ile Thr Pro Phe Asp Glu Ser His Glu Ser Phe Thr Leu Asn Ala
130 135 140
Pro Tyr Glu Asn Gly Thr Met Ala Ser Lys Gly Glu Asn Asn Thr Lys
145 150 155 160
Val Gly Glu Val Thr Ser Arg Ile Asn Gln Gln Asp His Ile Arg Pro
165 170 175
Gln Val Phe Phe Pro Ser Ile Val Thr Leu Lys Asp Pro Thr Glu Ala
180 185 190
Ser Phe Leu Tyr Val Phe Asn Asn Ile Leu Arg Thr Arg His Tyr Gly
195 200 205
Ala Gln Thr Thr Arg Thr Gly Arg Val Arg Asn Glu Leu Ile Gly Val
210 215 220
Ile Phe Ala Asp Gly Glu Ile Val Ser Asn Leu Arg Trp Thr Gln Ala
225 230 235 240
Ile Tyr Asp Arg Leu Pro Asp Glu Val Leu His Ser Ile Asp Pro Leu
245 250 255
Asp Glu Asp Leu Val Met Glu Lys Ala Thr Glu Ala Ile Gln Ala Leu
260 265 270
Met Ala Glu Glu Phe Ile Val His Thr Asp Phe Ile Gly Glu Asn Phe
275 280 285
Gln Pro Leu Leu Thr Glu Val Lys Thr Leu Thr Gly Thr Glu Ala Gly
290 295 300
Ile Leu Ser Val Leu Asp Gln Ala Asn Lys Glu Ser Lys Lys Tyr Phe
305 310 315 320
Glu Gln Tyr Ile Glu Lys Lys Lys Ala Glu Lys Lys
325 330
<210> 4
<211> 721
<212> PRT
<213> Microcystis aeruginosa
<400> 4
Met Gly Asn Tyr Gln Val Thr Leu Lys Pro Val Tyr Ser Cys Pro Ala
1 5 10 15
Asp Glu Ile Pro Asp Gly Ile Lys Val Pro Gln Gly Trp Arg Leu Ser
20 25 30
Trp His Gln Val Glu Thr Trp Lys Ala Leu Asn Asp Pro Asp Ile Asp
35 40 45
Val Ile Phe Asn Thr Ala Met Thr Gly Asp Gly Lys Ser Leu Ala Ala
50 55 60
Tyr Leu Arg Thr Leu Gln Gly Tyr Phe Pro Ile Met Gly Leu Tyr Pro
65 70 75 80
Thr Asn Glu Leu Ala Arg Asp Gln Arg Gly Gln Ile Glu Ala Tyr Ile
85 90 95
Gln Arg Phe Gln Pro Thr Asp Gln Pro Arg Val Asn Leu Leu Thr Gly
100 105 110
Pro Glu Leu Glu Leu Tyr Ala Glu Arg Asp Gly Lys Thr Lys Ala Ile
115 120 125
Ala Leu Glu Thr Arg Ser Lys Gln Ser Glu Ile Leu Leu Thr Asn Pro
130 135 140
Asp Ile Phe His Tyr Leu His Arg Ala Ala Tyr Leu Thr Pro Tyr Asp
145 150 155 160
Asn Pro Asp Gln Leu Trp Asn Arg Ile Asp Lys His Phe Asp Leu Phe
165 170 175
Leu Phe Asp Glu Phe His Val Phe Gly Thr Pro Gln Val Ala Ser Ile
180 185 190
Ile Asn Thr Met Leu Leu Ile Arg Arg Ala Asn Arg Gly Lys Arg Tyr
195 200 205
Leu Phe Leu Ser Ala Thr Pro Asp Glu Gly Leu Leu Lys Arg Leu Asp
210 215 220
Lys Ala Gly Phe Arg Tyr Arg Ser Ile Asp Pro Val Arg Glu Gly Lys
225 230 235 240
Tyr Arg Phe Pro Asp Thr Pro Glu Glu Ala Asn Ser Leu Ala Gln Gln
245 250 255
Gly Trp Arg Gln Val Thr Ser Glu Ile Glu Leu Ser Phe Ile Pro Leu
260 265 270
Pro Ser Ser Phe Gln Thr Ser Glu Asn Trp Leu Lys Glu Asn Lys Glu
275 280 285
Arg Ile Leu Asp Tyr Phe Lys Arg Tyr Pro Gly Ser Lys Gly Ala Ile
290 295 300
Ile Leu Asn Ser Ile Ala Ser Val Lys Arg Leu Leu Pro Ile Phe Arg
305 310 315 320
Glu Leu Leu Ala Thr Ile Gly Leu Thr Val Gly Glu Asn Thr Gly Leu
325 330 335
Ser Gly Thr Arg Glu Lys Leu Ala Ser Leu Asn Arg Asp Leu Val Ile
340 345 350
Gly Thr Ser Thr Ile Asp Val Gly Val Asp Phe Lys Ile Asn Phe Leu
355 360 365
Ile Phe Glu Ser Ser Asp Ala Gly Asn Phe Ile Gln Arg Phe Gly Arg
370 375 380
Leu Gly Arg His Ser Gly Tyr Asp Arg Lys Gly Thr Ala Val Lys Phe
385 390 395 400
Thr Asn Phe Thr Ala Ile Ala Leu Val Pro Lys Phe Phe Leu Glu Arg
405 410 415
Leu Phe Glu Lys Lys Asp Ala Pro Leu Gln Val Gly Glu Arg Tyr Asp
420 425 430
Arg Ile Gln Leu Gln Glu Ala Ile Lys Ser Asn Tyr Arg His Ile Asn
435 440 445
Asn Phe Glu Gly Tyr Tyr Gln Arg Trp Gly Ala Val Gln Ser Phe Gln
450 455 460
Leu Trp Trp Asn Leu Gly Ser Pro Lys Ile Lys Ser Gln Tyr Gly Glu
465 470 475 480
Ser Arg Gln Lys Phe Gln Gln Glu Cys Glu Glu Val Phe Asp Thr Ser
485 490 495
Leu Lys Arg Val Ala Gly Arg Val Lys Gly Trp Ala Asp Glu Trp Lys
500 505 510
Glu Leu Ser Gly Lys Asn Gly Asn Pro Ile Phe Glu Asp Ala Ser Ser
515 520 525
Phe Arg Gly Ser Ser Pro Leu Leu Cys Gly Leu Tyr Asp Ser Thr Glu
530 535 540
Pro Glu Glu Cys Asp Arg Phe Lys Thr Tyr Asp Leu Pro Ser Ile Leu
545 550 555 560
Gly Asn Leu Glu Val Glu Val Trp Arg Lys Gly Glu Phe Lys Arg Gln
565 570 575
Ile Glu Ala Thr Lys Thr Pro Ile Ala Arg Arg Arg Phe Asp Tyr Cys
580 585 590
Leu Ala Phe Leu Asn Leu Lys Gly Tyr Arg Glu Glu Arg Leu Asn Trp
595 600 605
Arg Phe Thr Tyr Asp Gly Asp Leu Gly Glu Ile Ala Ser Ala Trp Lys
610 615 620
Val Gln Val Leu Thr Gly Ile Gly Val Trp Gln Pro Asp Asn Pro Trp
625 630 635 640
Leu Asp Arg Ile Ser Arg Glu Leu Arg Asp Leu Ala Leu Val Ser Phe
645 650 655
Val Phe Ala Tyr Pro Val Ala Ala Val Arg Gln Arg Leu Gln Leu Pro
660 665 670
Met His Phe Gly Ile Tyr Pro Ile Ser Asp Glu Ser Ser Leu His Ser
675 680 685
Pro Leu Ser Pro Tyr Ser Ile Ala Ile Gly Gln Ala Ala Leu Leu Leu
690 695 700
Asp Thr Leu Ala His Arg Phe Lys Gly Lys Gly Gly Glu Val Trp Ile
705 710 715 720
Cys
<210> 5
<211> 1156
<212> PRT
<213> Microcystis aeruginosa
<400> 5
Met Pro Lys Lys Gln Lys Lys Leu Glu Glu Thr Gly Gln Leu Asn Leu
1 5 10 15
Phe Asp Asn Thr Thr Glu Ile Asp Asp Glu Asp Leu Asp Phe Glu Phe
20 25 30
Glu Asp Ile Asp Leu Glu Ser Leu Val Ser Glu Asp Leu Gly Ile Thr
35 40 45
Glu Ser Val Ser Asp Arg Arg Val Glu Thr Val Arg Gln Leu Leu Thr
50 55 60
Leu Lys Leu Leu Arg Glu Ala Ile Arg Ala Glu Asn Pro Asp Asp Arg
65 70 75 80
Val Met Ala Asp Phe Ala Glu Met Val Leu Pro Asn Leu Leu Arg Leu
85 90 95
Ala Ile Gly Val Thr Ala Lys Gly Gly Asn Phe Ile Glu Ala Val Asp
100 105 110
Arg Gly Arg Glu Leu Arg Asn Lys Pro Lys Ala Lys Arg Asp Asn Ala
115 120 125
Gly Asp Gln Ser Leu Asn Thr His Leu Leu Asn Gly Leu Phe Pro Ala
130 135 140
Asn Leu Ile Glu Lys Arg Leu Gln Lys Leu Asn Thr Thr Val Arg Arg
145 150 155 160
Ile Ile Lys Glu Phe Glu Arg Arg Leu Ala Ile Ala Gly Phe Leu Val
165 170 175
His Asp Phe Glu Lys Phe Ser Tyr Asp Arg Phe Pro Ser Met Ser Glu
180 185 190
Arg Tyr Ile Gln Ile Gln Arg Asp Phe Ile Gln Asp Pro Phe Lys Asn
195 200 205
Gln Asp Pro Arg Lys Leu Ser Arg Glu Glu His Arg Glu Ile Leu Gln
210 215 220
Val Leu Ile Pro Glu Leu Gly Leu Asp Arg Phe Leu Phe Pro Asp Asn
225 230 235 240
Pro Glu Arg Trp Leu Glu Tyr Leu Asp Asp Leu Leu Tyr Ile Ala Lys
245 250 255
Asn Thr Gln Arg Arg Asn Asp Thr Asp Leu Asn Thr Ser Glu Asp Gly
260 265 270
Leu Asn Val Arg Leu Asn Asp Arg Val Ile Glu Ser Leu Cys Asp Leu
275 280 285
Ala Cys Leu Ala Asp Arg Leu Ala Ser Ile Ile Lys His Pro His Asp
290 295 300
Ala Glu Lys Ala Ser Leu Gln Asp Leu Leu Tyr Ser Leu Ser Asp Gly
305 310 315 320
Glu Leu Lys Phe Thr Tyr His Ser Ile Ala Glu Asn Arg Gly Val Leu
325 330 335
Thr Asn Val Leu Asn Asn Ala Val Met Glu Ala His Gln Glu Leu Asp
340 345 350
Tyr Gln Pro Leu Leu Tyr Leu Pro Thr Gly Val Val Tyr Ile Ala Pro
355 360 365
Lys Asn Ala Pro Glu Val Ser Leu Glu Thr Leu Pro Asn Arg Val Val
370 375 380
Asp Thr Ile Lys Ser Leu Cys Ser Gly Glu Leu Gln Arg Lys Gln Thr
385 390 395 400
Gly Phe Gly Arg Asp Gly Lys Gly Met Lys Tyr Ala Asp Tyr Tyr Ser
405 410 415
Gln Phe Phe Asp Asp Ala Gly Leu Met Arg Ala Ala Leu Asn Ala Thr
420 425 430
Leu Arg Ile Leu Gly Asp Asn Lys Ala Ser Val Ala Arg Ser Arg Gly
435 440 445
Glu Asn Leu Ile Lys Phe Gln Gln Gln Gly Val Leu Pro Thr Asp Tyr
450 455 460
Asp Phe His Cys Glu Asp Asp Ile Arg Ile Asp Arg Leu Ala Glu Phe
465 470 475 480
Gly Asp Val Val Thr Arg Lys Ile Trp Gly Asp Arg Leu Glu Lys Ile
485 490 495
Glu Gln Ala Arg Lys Leu Gln Lys Asn Leu Pro Ala Pro Pro Asp Leu
500 505 510
Asp Leu Ile Ser Glu Ile Ala His Tyr Trp Asn Leu Glu Asn Tyr Leu
515 520 525
Pro Gln Ile Arg Ala Ile Lys Arg Ile Asn Glu Ser Leu Lys Glu Leu
530 535 540
Lys Leu Lys Gly Asn Thr Gly Gly Val Pro Tyr Glu Trp Tyr Tyr Leu
545 550 555 560
Ala Ala Gln Tyr Leu Lys Gln His Pro Gly Ile Glu Asp Ile Arg Pro
565 570 575
Val Ala Glu Asp Leu Ile Ala Phe Leu Ala Ala Lys Ile Ala Ala Ile
580 585 590
Val Ala Gly Tyr Asn Leu Pro Asp Gly Trp Glu Asp Leu Arg Glu Trp
595 600 605
Val Asn Gln Val Val Gln Leu Pro Gly Arg Glu Leu Ala His Ser Ile
610 615 620
Glu Thr Phe Gln Lys Glu Leu Asn His Tyr Asn Ala Ala Lys Lys Gln
625 630 635 640
Gly Arg Gly Arg Gln Leu Leu Cys Ser Ile Ser His Ser Pro Tyr Ser
645 650 655
Val Ser Glu Gln Met Glu Ser Ala Val Leu Phe Thr Pro Gln Val Tyr
660 665 670
Thr Asn Lys Gln Met Leu Ala Gly Ser Asn Ala Lys Arg Asn Ile Ser
675 680 685
Ser Ile Ala Gly Thr Glu Met Met Leu Arg Gln Ile Leu Met Asn Gln
690 695 700
Thr Gln Ala Val Gly Lys Arg Phe Glu Asp Gly Lys Tyr Arg Tyr Leu
705 710 715 720
Tyr Phe Tyr Pro Thr Tyr Tyr Phe Thr Pro Glu Thr Asn Ser Phe Leu
725 730 735
Gln Lys Ala Tyr Ala Asn Ile Ala Gln Thr Arg Phe Asp Ser Ser Ile
740 745 750
Lys Leu His Phe Val Asp Lys Asn Leu Val Ala Asn Phe Asp Arg Thr
755 760 765
Arg Tyr Gln Ser Val Asp Ser Phe Leu Ile Asp Glu Lys Leu Arg Gln
770 775 780
Lys Lys Glu Thr Ile Asn Glu Glu Glu Asp Gly Lys Lys Asp Arg Thr
785 790 795 800
Phe Lys Leu Ser Tyr Pro Glu Asp Lys Pro Leu Thr Phe Tyr Phe Met
805 810 815
Ala Leu Pro Pro Gly Arg Asn Pro Thr Asp Thr Glu Ser Trp Val Met
820 825 830
Pro Ala Trp Leu Gly Leu Ala Phe Pro Met Ile Leu Asp Val Lys Thr
835 840 845
Val Val Ser Glu Ser Pro Ile Pro Pro Tyr Arg Asp Gly Ala Glu Phe
850 855 860
Glu Glu Thr Val Phe Leu Asp Ser Ala Pro Gln Ala Ile Arg Ser Leu
865 870 875 880
Thr Arg Cys Asp Arg Phe Arg Leu Asp Arg Val Leu Asn Pro Trp Gln
885 890 895
Asp Asn Asp Gly Lys Lys Tyr Ser Ala Pro Leu Asn Thr Leu Thr Ala
900 905 910
Ala Tyr Ser Ile His Leu Asp Val Asn Ser Lys Gln Gly Lys Thr Gly
915 920 925
Tyr Asp Pro Asn Trp Gly Lys Leu Thr Glu Leu Ala Ile Asn Leu Glu
930 935 940
Thr Ser Pro Leu Tyr Val Phe His Tyr Phe Lys Gln Trp Lys Arg Gly
945 950 955 960
Lys Asp Ala Asp Ile Pro Ser Ala Asn Arg Ile Ala Leu Tyr Leu Tyr
965 970 975
Asp Phe Tyr Pro Cys Phe Asp Pro Tyr Val Gln Ala Asn Arg Thr Asn
980 985 990
Leu Thr Ile Asp Met Thr Ala Glu Ser Pro Leu Asn His Pro Lys Asn
995 1000 1005
Leu Thr Glu Leu Tyr Arg Gln Phe Tyr Arg Ala Lys Ser Ser Lys
1010 1015 1020
Gly Lys Pro Ile Lys Ala Asn Ala Ile Leu Lys Pro Ile Asp Glu
1025 1030 1035
Ala Ala Asp Ile Ile Leu Lys Ala Asp Lys Ala Ile Ser Asp Asp
1040 1045 1050
Leu Thr Ser Leu Val Ala Ala Arg Leu Phe Lys Leu Met Asp Arg
1055 1060 1065
Val Arg Ser Gln Thr Ala Glu Gly Arg Tyr Val Ile Lys Glu Arg
1070 1075 1080
Asp Gln Glu Arg Glu Lys Ile Leu Asp Phe Ala Lys Tyr Phe Val
1085 1090 1095
Lys Asn Val Phe Glu Glu Ser Phe Glu Ser Asp Arg Ala Arg Leu
1100 1105 1110
Ala Gly Arg Gln Leu Asn Ile Ile Arg Asp Thr Cys Glu Phe Leu
1115 1120 1125
Tyr Arg Leu Glu Met Asp Lys Glu Arg Arg Gln Arg Gln Val Gln
1130 1135 1140
Pro Leu Asp Thr Ser Asn Ser Ser Ser Glu Glu Glu Glu
1145 1150 1155
<210> 6
<211> 109
<212> RNA
<213> Artificial
<220>
<223> TiDcrRNA
<220>
<221> misc_feature
<222> (38)..(72)
<223> n is a, c, g, or u
<400> 6
guuccaauua aucuuaagcc cuauuaggga uugaaacnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnguuccaau uaaucuuaag cccuauuagg gauugaaac 109
<210> 7
<211> 675
<212> DNA
<213> Artificial
<220>
<223> Cas5d nucleotide sequence for expression in Escherichia coli
<400> 7
atggtgcata tttatagctg ccagctggaa ctgcatgata gcctgtatta tgcgacccgc 60
gaaattggcc gcctgtatga aagcgaaccg gtgattcata actatgcgct gtgctatgcg 120
ctgggcctgg tgaacagcga tagctatcgc tatttctgca gcgaacagat tccgcagtat 180
caggaacatc tgaacccgct gaacgaagaa aaaatttatg tgaccccggc gcgcgcgatt 240
gcgcataccg cggtgctgaa cacctggaaa tatgcgaaca acaactatca tgtggaaatg 300
gaaaaaaccc agaaaaacat tccgagcttc ggccgcgcga aagaaattgc gccggaaagc 360
attttcgaat gcttcattat tagccatcat ccgctgcagc tgccgaaatg gattcgcctg 420
ggcaaatgga tgagcaaagc ggaagtgaaa ctgaccgaac tgagcctgag caaacagaaa 480
gaagatctgt tcatttatcc gtatccgctg aacccgctgg atgtgatgtt cacccatcag 540
gtgattggct atgatgtgat taacatgccg ccggtgagcc tgattcgcaa cgtgcgcatg 600
cgcggcgaat attatcagat tagcgatcgc ccggatctga aaattccggc acgtctgagc 660
tatcatttcg gctaa 675
<210> 8
<211> 834
<212> DNA
<213> Artificial
<220>
<223> Cas6d nucleotide sequence for expression in Escherichia coli
<400> 8
atgccgtata gcctggtgct gaacctgacc ccgcgcagcc cgatttatcc gaacttcctg 60
accggccgcc atctgcatgc gctgttcctg accctggtga gcagcgtgga tcaggaactg 120
ggcaacattc tgcataccgc ggaagcggat aaagcgttca ccctgagccc gctgcagatg 180
cagagcggcg gcaaaaccat taacagcccg cagtggcgcc atgaacgcga aattgcgagc 240
gaaaccccgt gctggtggcg cattagcctg ctggatgatc gcctgttcgg caaactgacc 300
agcctgtggc tgaacctgaa cccgaaacag ccgtggcatc tgggcagcgc ggatctggtg 360
attaccagcg tgctggcgac cccgcagagc gtgcagccgt gggcgaacag ctgcacctat 420
cagtatctgt atgaaaacgc gagcgaaacc aaccgcgaat tcgatttcct gttcgcgacc 480
ccggtgacct tccgccaggg caaattcgat agcgcgctgc cgacccgcga actggtgttc 540
aacagcctgc tgggccgctg gaaccgctat agcggcattc cgttcgatag cattgcgctg 600
gaaagcattt tcccgagctt cttcgatatt cagaccaaac tggcggatga agcgtataaa 660
aaccagagca ttggctgcgt gggcgaaatt cattatcgcc tgctgggcga agtggaaccg 720
gcgaaaatta aagcgattaa cgcgctggcg gatttcgcgc tgtatgcggg cgtgggccgc 780
aaaaccacca tgggcatggg catgacccgc cgcattagca aagataaacg ctaa 834
<210> 9
<211> 1002
<212> DNA
<213> Artificial
<220>
<223> Cas7d nucleotide sequence for expression in Escherichia coli
<400> 9
atgaccttcc tgaccagcgt ggatgcgaaa ttcttccata gcgaaattcc gtataaaccg 60
atgggcaaat atgtgcattt cctgaccatt cgcgtgaccg aaagctatcc gctgttccag 120
accgatggcg aactgaacaa agcgcgcgtg cgcgcgggca ttgacagcaa gaaaaccatt 180
agccgcctga gcatgttcaa acgcaaacag agcaccccgg aacgcctggt gggccgcgaa 240
ctgctgcgca actatggcct gattaccgcg gaagaatgcg aatataacgt gaaattcgcg 300
atgaacaacg cggattgcat tatttatggc ttcgcgattg gcgatagcgg cagcgaaaaa 360
agcaaagtgg tggtggatac cgcgttcagc attaccccgt tcgatgaaag ccatgagagc 420
ttcaccctga acgcgccgta tgaaaacggc acgatggcga gcaaaggcga aaacaacacc 480
aaagtgggcg aagtgaccag ccgcattaac cagcaggatc atattcgccc gcaggtgttc 540
ttcccgagca ttgtgaccct gaaagatccg accgaagcga gcttcctgta tgtgttcaac 600
aacattctgc gcacccgcca ttatggcgcg cagaccaccc gcaccggccg cgtgcgcaac 660
gaactgattg gcgtgatttt cgcggatggc gaaattgtga gcaacctgcg ctggacccag 720
gcgatttatg atcgcctgcc ggatgaagtg ctgcatagca ttgatccgct ggatgaagat 780
ctggtgatgg aaaaagcgac cgaagcgatt caggcgctga tggcggaaga atttattgtg 840
cataccgatt tcattggcga aaacttccag ccgctgctga ccgaagtgaa aaccctgacc 900
ggcaccgaag cgggcattct gagcgtgctg gatcaggcga acaaagaaag caaaaaatat 960
ttcgaacagt atattgaaaa gaaaaaggcg gaaaagaaat aa 1002
<210> 10
<211> 2166
<212> DNA
<213> Artificial
<220>
<223> Cas3d nucleotide sequence for expression in Escherichia coli
<400> 10
atgggaaact atcaggtgac tcttaagcca gtgtattctt gcccagctga cgagatccca 60
gacggaatca aggtgccaca gggatggaga ctttcttggc accaggtgga gacttggaag 120
gctcttaacg acccagacat cgacgtgatc ttcaacactg ctatgactgg agacggaaag 180
tctcttgctg cttatcttag aactcttcag ggatatttcc caatcatggg actttatcca 240
actaacgagc ttgctagaga tcagagagga cagatcgagg cttatatcca gagattccag 300
ccaactgacc agccaagagt gaaccttctt actggaccag agcttgagct ttatgctgag 360
agagacggaa agactaaggc tatcgctctt gagactagat ctaagcagtc tgagatcctt 420
cttactaacc cagacatctt ccactatctt cacagagctg cttatcttac tccatatgac 480
aacccagacc agctttggaa cagaatcgac aagcacttcg accttttcct tttcgacgag 540
ttccacgtgt tcggaactcc acaggtggct tctatcatca acactatgct tcttatcaga 600
agagctaaca gaggaaagag atatcttttc ctttctgcta ctccagacga gggacttctt 660
aagagacttg acaaggctgg attcagatat agatctatcg acccagtgag agagggaaag 720
tatagattcc cagacactcc agaggaggct aactctcttg ctcagcaggg atggagacag 780
gtgacttctg agatcgagct ttctttcatc ccacttccat cttctttcca gacttctgag 840
aactggctta aggagaacaa ggagagaatc cttgactatt tcaagagata tccaggatct 900
aagggagcta tcatccttaa ctctatcgct tctgtgaaga gacttcttcc aatcttcaga 960
gagcttcttg ctactatcgg acttactgtg ggagagaaca ctggactttc tggaactaga 1020
gagaaacttg cttctcttaa cagagatctt gtgatcggaa cttctactat cgacgtggga 1080
gtggacttca agatcaactt ccttatcttc gagtcttctg acgctggaaa cttcatccag 1140
agattcggaa gacttggaag acactctgga tatgacagaa agggaactgc tgtgaagttc 1200
actaacttca ctgctatcgc tcttgtgcca aagttcttcc ttgagagact tttcgagaag 1260
aaggacgctc cacttcaggt gggagagaga tatgacagaa tccagcttca ggaggctatc 1320
aagtctaact atagacacat caacaacttc gagggatatt atcagagatg gggagctgtg 1380
cagtctttcc agctttggtg gaaccttgga tctccaaaga tcaagtctca gtatggagag 1440
tcaagacaga agttccagca ggagtgcgag gaggtgttcg acacttctct taagagagtg 1500
gctggaagag tgaagggatg ggctgacgag tggaaggagc tttctggaaa gaacggaaac 1560
ccaatcttcg aggacgcttc ttctttcaga ggatcttctc cacttctttg cggactttat 1620
gactctactg agccagagga gtgcgacaga ttcaagactt atgaccttcc atctatcctt 1680
ggaaaccttg aggtggaggt gtggagaaag ggagagttca agagacagat cgaggctact 1740
aagactccaa tcgctagaag aagattcgac tattgccttg ctttccttaa ccttaaggga 1800
tatagagagg agagacttaa ctggagattc acttatgacg gagatcttgg agagatcgct 1860
tctgcttgga aggtgcaggt gcttactgga atcggagtgt ggcagccaga caacccttgg 1920
cttgacagaa tctcaagaga gcttagagat cttgctcttg tgtctttcgt gttcgcttat 1980
ccagtggctg ctgtgagaca gagacttcag cttccaatgc acttcggaat ctatccaatc 2040
tctgacgagt cttctcttca ctctccactt tctccatatt ctatcgctat cggacaggct 2100
gctcttcttc ttgacactct tgctcacaga ttcaagggaa agggaggaga ggtgtggatc 2160
tgctag 2166
<210> 11
<211> 3471
<212> DNA
<213> Artificial
<220>
<223> Cas10d nucleotide sequence for expression in Escherichia coli
<400> 11
atgccaaaga agcagaagaa gcttgaggag actggacagc ttaacctttt cgacaacact 60
actgagatcg acgacgagga ccttgacttc gagttcgagg acatcgacct tgagtctctt 120
gtgtctgagg accttggaat cactgagtct gtgtctgaca gaagagtgga gactgtgaga 180
cagcttctta ctcttaagct tcttagagag gctatcagag ctgagaaccc agacgacaga 240
gtgatggctg acttcgctga gatggtgctt ccaaaccttc ttagacttgc tatcggagtg 300
actgctaagg gaggaaactt catcgaggct gtggacagag gaagagagct tagaaacaag 360
ccaaaggcta agagagacaa cgctggagat cagtctctta acactcacct tcttaacgga 420
cttttcccag ctaaccttat cgagaagaga cttcagaagc ttaacactac tgtgagaaga 480
atcatcaagg agttcgagag aagacttgct atcgctggat tccttgtgca cgacttcgag 540
aagttctctt atgacagatt cccatctatg tctgagagat atatccagat ccagagagac 600
ttcatccagg acccattcaa gaaccaggac ccaagaaagc tttcaagaga ggagcacaga 660
gagatccttc aggtgcttat cccagagctt ggacttgaca gattcctttt cccagacaac 720
ccagagagat ggcttgagta tcttgacgac cttctttata tcgctaagaa cactcagaga 780
agaaacgaca ctgaccttaa cacttctgag gacggactta acgtgagact taacgacaga 840
gtgatcgagt ctctttgcga ccttgcttgc cttgctgaca gacttgcttc tatcatcaag 900
cacccacacg acgctgagaa ggcttctctt caggaccttc tttattctct ttctgacgga 960
gagcttaagt tcacttatca ctctatcgct gagaacagag gagtgcttac taacgtgctt 1020
aacaacgctg tgatggaggc tcaccaggag cttgactatc agccacttct ttatcttcca 1080
actggagtgg tgtatatcgc tccaaagaac gctccagagg tgtctcttga gactcttcca 1140
aacagagtgg tggacactat caagtctctt tgctctggag agcttcagag aaagcagact 1200
ggattcggaa gagacggaaa gggtatgaag tatgctgact attattctca gttcttcgac 1260
gacgctggac ttatgagagc tgctcttaac gctactctta gaatccttgg agacaacaag 1320
gcttctgtgg ctagatctag aggagagaac cttatcaagt tccagcagca gggagtgctt 1380
ccaactgact atgacttcca ctgcgaggac gacatcagaa tcgacagact tgctgagttc 1440
ggagacgtgg tgactagaaa gatctgggga gacagacttg agaagatcga gcaggctaga 1500
aagcttcaga agaaccttcc agctccacca gaccttgacc ttatctctga gatcgctcac 1560
tattggaacc ttgagaacta tcttccacag atcagagcta tcaagagaat caacgagtct 1620
cttaaggagc ttaagcttaa gggaaacact ggaggagtgc catatgagtg gtattatctt 1680
gctgctcagt atcttaagca gcacccagga atcgaggaca tcagaccagt ggctgaggac 1740
cttatcgctt tccttgctgc taagatcgct gctatcgtgg ctggatataa ccttccagac 1800
ggatgggagg accttagaga gtgggtgaac caggtggtgc agcttccagg aagagagctt 1860
gctcactcta tcgagacttt ccagaaggag cttaaccact ataacgctgc taagaagcag 1920
ggaagaggaa gacagcttct ttgctctatc tctcactctc catattctgt gtctgagcag 1980
atggagtctg ctgtgctttt cactccacag gtgtatacta acaagcagat gcttgctgga 2040
tctaacgcta agagaaacat ctcttctatc gctggaactg agatgatgct tagacagatc 2100
cttatgaacc agactcaggc tgtgggaaag agattcgagg acggaaagta tagatatctt 2160
tatttctatc caacttatta tttcactcca gagactaact ctttccttca gaaggcttat 2220
gctaacatcg ctcagactag attcgactct tctatcaagc ttcacttcgt ggacaagaac 2280
cttgtggcta acttcgacag aactagatat cagtctgtgg actctttcct tatcgacgag 2340
aagcttagac agaagaagga gactatcaac gaggaggagg acggaaagaa ggacagaact 2400
ttcaagcttt cttatccaga ggacaagcca cttactttct atttcatggc tcttccacca 2460
ggaagaaacc caactgacac tgagtcttgg gtaatgccag cttggcttgg acttgctttc 2520
ccaatgatcc ttgacgtgaa gactgtggtg tctgagtctc caatcccacc atatagagac 2580
ggagctgagt tcgaggagac tgtgttcctt gactctgctc cacaggctat cagatctctt 2640
actagatgcg acagattcag acttgacaga gtgcttaacc cttggcagga caacgacgga 2700
aagaagtatt ctgctccact taacactctt actgctgctt attctatcca ccttgacgtg 2760
aactctaagc agggaaagac tggatatgac ccaaactggg gaaagcttac tgagcttgct 2820
atcaaccttg agacttctcc actttatgtg ttccactatt tcaagcagtg gaagagagga 2880
aaggacgctg acatcccatc tgctaacaga atcgctcttt atctttatga cttctatcca 2940
tgcttcgacc catatgtgca ggctaacaga actaacctta ctatcgacat gactgctgag 3000
tctccactta accacccaaa gaaccttact gagctttata gacagttcta tagagctaag 3060
tcttctaagg gaaagccaat caaggctaac gctatcctta agccaatcga cgaggctgct 3120
gacatcatcc ttaaggctga caaggctatc tctgacgacc ttacttctct tgtggctgct 3180
agacttttca agcttatgga cagagtgaga tctcagactg ctgagggaag atatgtgatc 3240
aaggagagag atcaggagag agagaagatc cttgacttcg ctaagtattt cgtgaagaac 3300
gtgttcgagg agtctttcga gtctgacaga gctagacttg ctggaagaca gcttaacatc 3360
atcagagaca cttgcgagtt cctttataga cttgagatgg acaaggagag aagacagaga 3420
caggtgcagc cacttgacac ttctaactct tcttctgagg aggaggagta a 3471
<210> 12
<211> 35
<212> DNA
<213> Artificial
<220>
<223> J23108 synthesis promoter
<400> 12
ctgacagcta gctcagtcct aggtataatg ctagc 35
<210> 13
<211> 36
<212> DNA
<213> Artificial
<220>
<223> Ribosomal binding sequence
<400> 13
aataattttg tttaacttta agaaggagat atacat 36
<210> 14
<211> 24
<212> DNA
<213> Artificial
<220>
<223> Terminator sequence STOP767
<400> 14
agatcctgta aaacgacggc cagt 24
<210> 15
<211> 19
<212> DNA
<213> Artificial
<220>
<223> Terminator sequence STOP768(1)
<400> 15
cgccagggtt ttcccagtc 19
<210> 16
<211> 19
<212> DNA
<213> Artificial
<220>
<223> Terminator sequence TOP768(2)
<400> 16
cgccagggtt ttcccagtc 19
<210> 17
<211> 47
<212> DNA
<213> Artificial
<220>
<223> T7 terminator sequence
<400> 17
tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttg 47
<210> 18
<211> 37
<212> DNA
<213> Artificial
<220>
<223> CRISPR repeat sequence
<400> 18
gttccaatta atcttaagcc ctattaggga ttgaaac 37
<210> 19
<211> 19
<212> DNA
<213> Artificial
<220>
<223> T7 promoter sequence
<400> 19
taatacgact cactatagg 19
<210> 20
<211> 109
<212> DNA
<213> Artificial
<220>
<223> crRNA expression cassette
<400> 20
gttccaatta atcttaagcc ctattaggga ttgaaacggt aataatacga ctcactatag 60
ggagaaagga tcgttccaat taatcttaag ccctattagg gattgaaac 109
<210> 21
<211> 581
<212> DNA
<213> Artificial
<220>
<223> Synthesis cccdB gene expression cassette
<400> 21
aggctttaat acgactcact atagggagaa aggatccata aaggaggtaa ataatgaagc 60
agcgtattac agtgacagtt gacagcgaca gctatcagtt gctcaaggca tatatgatgt 120
caatatctcc ggtctggtaa gcacaaccat gcagaatgaa gcccgtcgtc tgcgtgccga 180
acgctggaaa gcggaaaatc aggaagggat ggctgaggtc gcccggttta ttgaaatgaa 240
cggctctttt gctgacgaga acagggactg gtgaaatgca gtttaaggtt tacacctata 300
aaagagagag ccgttatcgt ctgtttgtgg atgtacagag tgatattatt gacacgcccg 360
ggcgacggat ggtgatcccc ctggccagtg cacgtctgct gtcagataaa gtctcccgtg 420
aactttaccc ggtggtgcat atcggggatg aaagctggcg catgatgacc accgatatgg 480
ccagtgtgcc ggtctccgtt atcggggaag aagtggctga tctcagccac cgcgaaaatg 540
acatcaaaaa cgccattaac ctgatgttct ggggaatata a 581
<210> 22
<211> 18
<212> PRT
<213> Artificial
<220>
<223> Nuclear localizing signal (NLS) amino acid sequence
<400> 22
Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val
1 5 10 15
Ser Gly
<210> 23
<211> 54
<212> DNA
<213> Artificial
<220>
<223> NLS nucleotide sequence
<400> 23
gacccaaaga agaagcggaa ggtagaccct aagaagaagc gcaaggtttc tgga 54
<210> 24
<211> 20
<212> PRT
<213> Artificial
<220>
<223> Self-cleaving peptide 2A amino acid sequence
<400> 24
Gly Ser Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
1 5 10 15
Asn Pro Gly Pro
20
<210> 25
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Self-cleaving peptide 2A(1) coding sequence
<400> 25
ggctctgagg gcagaggcag cctgctgacc tgcggcgacg tggaggaaaa ccctggccct 60
<210> 26
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Self-cleaving peptide 2A(2) coding sequence
<400> 26
gggtctgagg gacgcggctc cctgctcacc tgtggagatg tggaagagaa cccaggcccc 60
<210> 27
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Self-cleaving peptide 2A(3) coding sequence
<400> 27
ggttctgaag gcagaggctc tctgctgaca tgtggggatg tggaggaaaa tcctggccct 60
<210> 28
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Self-cleaving peptide 2A(4) coding sequence
<400> 28
ggatccgagg gcagaggaag tctgctaaca tgcggtgacg ttgaggagaa tcccgggcca 60
<210> 29
<211> 820
<212> DNA
<213> Artificial
<220>
<223> 2 x cauliflower mosaic virus 35S gene promoter + omega sequence
<400> 29
gccaacatgg tggagcacga cactctcgtc tactccaaga atatcaaaga tacagtctca 60
gaagaccaaa gggctattga gacttttcaa caaagggtaa tatcgggaaa cctcctcgga 120
ttccattgcc cagctatctg tcacttcatc aaaaggacag tagaaaagga aggtggcacc 180
tacaaatgcc atcattgcga taaaggaaag gctatcgttc aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgaa catggtggag cacgacactc tcgtctactc 360
caagaatatc aaagatacag tctcagaaga ccaaagggct attgagactt ttcaacaaag 420
ggtaatatcg ggaaacctcc tcggattcca ttgcccagct atctgtcact tcatcaaaag 480
gacagtagaa aaggaaggtg gcacctacaa atgccatcat tgcgataaag gaaaggctat 540
cgttcaagat gcctctgccg acagtggtcc caaagatgga cccccaccca cgaggagcat 600
cgtggaaaaa gaagacgttc caaccacgtc ttcaaagcaa gtggattgat gtgatatctc 660
cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata 720
aggaagttca tttcatttgg agaggccggt ctagagtatt tttacaacaa ttaccaacaa 780
caacaaacaa caaacaacat tacaattact atttacaatt 820
<210> 30
<211> 447
<212> DNA
<213> Artificial
<220>
<223> Arabidopsis shock protein 18.2kDa gene terminator
<400> 30
atatgaagat gaagatgaaa tatttggtgt gtcaaataaa aagcttgtgt gcttaagttt 60
gtgttttttt cttggcttgt tgtgttatga atttgtggct ttttctaata ttaaatgaat 120
gtaagatctc attataatga ataaacaaat gtttctataa tccattgtga atgttttgtt 180
ggatctcttc tgcagcatat aactactgta tgtgctatgg tatggactat ggaatatgat 240
taaagataag atgggctcat agagtaaaac gaggcgaggg acctataaac ctcccttcat 300
catgctattt catgatctat tttataaaat aaagatgtag aaaaaagtaa gcgtaataac 360
cgcaaaacaa atgatttaaa acatggcaca taatgaggag attaagttcg gtttacgttt 420
attttagtac taattgtaac gtgagac 447
<210> 31
<211> 97
<212> DNA
<213> Artificial
<220>
<223> crRNA expression cassette
<400> 31
gttccaatta atcttaagcc ctattaggga ttgaaacgga gaccctcaat tgtcggtctc 60
gttccaatta atcttaagcc ctattaggga ttgaaac 97
<210> 32
<211> 448
<212> DNA
<213> Artificial
<220>
<223> Arabidopsis U6 snRNA-26 gene promoter sequence
<400> 32
aagcttcgtt gaacaacgga aactcgactt gccttccgca caatacatca tttcttctta 60
gctttttttc ttcttcttcg ttcatacagt ttttttttgt ttatcagctt acattttctt 120
gaaccgtagc tttcgttttc ttctttttaa ctttccattc ggagtttttg tatcttgttt 180
catagtttgt cccaggatta gaatgattag gcatcgaacc ttcaagaatt tgattgaata 240
aaacatcttc attcttaaga tatgaagata atcttcaaaa ggcccctggg aatctgaaag 300
aagagaagca ggcccattta tatgggaaag aacaatagta tttcttatat aggcccattt 360
aagttgaaaa caatcttcaa aagtcccaca tcgcttagat aagaaaacga agctgagttt 420
atatacagct agagtcgaag tagtgatt 448
<210> 33
<211> 723
<212> DNA
<213> Artificial
<220>
<223> 2xNLS + Cas5d
<400> 33
gacccaaaga agaagcggaa ggtagaccct aagaagaagc gcaaggtttc tggagtgcac 60
atctattctt gccagcttga gcttcacgac tctctttatt atgctactag agagatcgga 120
agactttatg agtctgagcc agtgatccac aactatgctc tttgctatgc tcttggactt 180
gtgaactctg actcttatag atatttctgc tctgagcaga tcccacagta tcaggagcac 240
cttaacccac ttaacgagga gaagatctat gtgactccag ctagagctat cgctcacact 300
gctgtgctta acacttggaa gtatgctaac aacaactatc acgtggagat ggagaagact 360
cagaagaaca tcccatcttt cggaagagct aaggagatcg ctccagagtc tatcttcgag 420
tgcttcatca tctctcacca cccacttcag cttccaaagt ggatcagact tggaaagtgg 480
atgtctaagg ctgaggtgaa gcttactgag ctttctcttt ctaagcagaa ggaggacctt 540
ttcatctatc catatccact taacccactt gacgtgatgt tcactcacca ggttatcgga 600
tatgacgtga tcaacatgcc accagtgtct cttatcagaa acgtgagaat gagaggagag 660
tattatcaga tctctgacag accagacctt aagatcccag ctagactttc ttatcacttc 720
gga 723
<210> 34
<211> 882
<212> DNA
<213> Artificial
<220>
<223> 2xNLS + Cas6d
<400> 34
gacccaaaga agaagcggaa ggtagaccct aagaagaagc gcaaggtttc tggaccatat 60
tctcttgtgc ttaaccttac tccaagatct ccaatctatc caaacttcct tactggaaga 120
caccttcacg ctcttttcct tactcttgtg tcttctgtgg accaggagct tggaaacatc 180
cttcacactg ctgaggctga caaggctttc actctttctc cacttcagat gcagtctgga 240
ggaaagacta tcaactctcc acagtggaga cacgagagag agatcgcttc tgagactcca 300
tgctggtgga gaatctctct tcttgacgac agacttttcg gaaagcttac ttctctttgg 360
cttaacctta acccaaagca gccttggcac cttggatctg ctgaccttgt gatcacttct 420
gtgcttgcta ctccacagtc tgtgcagcct tgggctaact cttgcactta tcagtatctt 480
tatgagaacg cttctgagac taacagagag ttcgacttcc ttttcgctac tccagtgact 540
ttcagacagg gaaagttcga ctctgctctt ccaactagag agcttgtgtt caactctctt 600
cttggaagat ggaacagata ttctggaatc ccattcgact ctatcgctct tgagtctatc 660
ttcccatctt tcttcgacat ccagactaag cttgctgacg aggcttataa gaaccagtct 720
atcggatgcg tgggagagat ccactataga cttcttggag aggtggagcc agctaagatc 780
aaggctatca acgctcttgc tgacttcgct ctttatgctg gagtgggaag aaagactact 840
atgggaatgg gaatgactag aagaatctct aaggacaaga ga 882
<210> 35
<211> 1053
<212> DNA
<213> Artificial
<220>
<223> 2xNLS + Cas7d
<400> 35
gacccaaaga agaagcggaa ggtagaccct aagaagaagc gcaaggtttc tggaactttc 60
cttacttctg tggacgctaa gttcttccac tctgagatcc catataagcc aatgggaaag 120
tatgtgcact tccttactat cagagtgact gagtcttatc cacttttcca gactgacgga 180
gagcttaaca aggctagagt gagagctgga atcgactcta agaagactat ctcaagactt 240
tctatgttca agagaaagca gtctactcca gagagacttg tgggaagaga gcttcttaga 300
aactatggac ttatcactgc tgaggagtgc gagtataacg tgaagttcgc tatgaacaac 360
gctgactgca tcatctatgg attcgctatc ggagactctg gatctgagaa gtctaaggtg 420
gtggtggaca ctgctttctc tatcactcca ttcgacgagt ctcacgagtc tttcactctt 480
aacgctccat atgagaacgg aactatggct tctaagggag agaacaacac taaggtggga 540
gaggtgactt caagaatcaa ccagcaggac cacatcagac cacaggtgtt cttcccatct 600
atcgtgactc ttaaggaccc aactgaggct tctttccttt atgtgttcaa caacatcctt 660
agaactagac actatggtgc tcagactact agaactggaa gagtgagaaa cgagcttatc 720
ggagtgatct tcgctgacgg agagatcgtg tctaacctta gatggactca ggctatctat 780
gacagacttc cagacgaggt gcttcactct atcgacccac ttgacgagga ccttgtgatg 840
gagaaggcta ctgaggctat ccaggctctt atggctgagg agttcatcgt gcacactgac 900
ttcatcggag agaacttcca gccacttctt actgaggtga agactcttac tggaactgag 960
gctggaatcc tttctgtgct tgaccaggct aacaaggagt ctaagaagta tttcgagcag 1020
tatatcgaga agaagaaggc tgagaagaag taa 1053
<210> 36
<211> 2217
<212> DNA
<213> Artificial
<220>
<223> 2xNLS + Cas3d
<400> 36
atggacccaa agaagaagcg gaaggtagac cctaagaaga agcgcaaggt ttctggagga 60
aactatcagg tgactcttaa gccagtgtat tcttgcccag ctgacgagat cccagacgga 120
atcaaggtgc cacagggatg gagactttct tggcaccagg tggagacttg gaaggctctt 180
aacgacccag acatcgacgt gatcttcaac actgctatga ctggagacgg aaagtctctt 240
gctgcttatc ttagaactct tcagggatat ttcccaatca tgggacttta tccaactaac 300
gagcttgcta gagatcagag aggacagatc gaggcttata tccagagatt ccagccaact 360
gaccagccaa gagtgaacct tcttactgga ccagagcttg agctttatgc tgagagagac 420
ggaaagacta aggctatcgc tcttgagact agatctaagc agtctgagat ccttcttact 480
aacccagaca tcttccacta tcttcacaga gctgcttatc ttactccata tgacaaccca 540
gaccagcttt ggaacagaat cgacaagcac ttcgaccttt tccttttcga cgagttccac 600
gtgttcggaa ctccacaggt ggcttctatc atcaacacta tgcttcttat cagaagagct 660
aacagaggaa agagatatct tttcctttct gctactccag acgagggact tcttaagaga 720
cttgacaagg ctggattcag atatagatct atcgacccag tgagagaggg aaagtataga 780
ttcccagaca ctccagagga ggctaactct cttgctcagc agggatggag acaggtgact 840
tctgagatcg agctttcttt catcccactt ccatcttctt tccagacttc tgagaactgg 900
cttaaggaga acaaggagag aatccttgac tatttcaaga gatatccagg atctaaggga 960
gctatcatcc ttaactctat cgcttctgtg aagagacttc ttccaatctt cagagagctt 1020
cttgctacta tcggacttac tgtgggagag aacactggac tttctggaac tagagagaaa 1080
cttgcttctc ttaacagaga tcttgtgatc ggaacttcta ctatcgacgt gggagtggac 1140
ttcaagatca acttccttat cttcgagtct tctgacgctg gaaacttcat ccagagattc 1200
ggaagacttg gaagacactc tggatatgac agaaagggaa ctgctgtgaa gttcactaac 1260
ttcactgcta tcgctcttgt gccaaagttc ttccttgaga gacttttcga gaagaaggac 1320
gctccacttc aggtgggaga gagatatgac agaatccagc ttcaggaggc tatcaagtct 1380
aactatagac acatcaacaa cttcgaggga tattatcaga gatggggagc tgtgcagtct 1440
ttccagcttt ggtggaacct tggatctcca aagatcaagt ctcagtatgg agagtcaaga 1500
cagaagttcc agcaggagtg cgaggaggtg ttcgacactt ctcttaagag agtggctgga 1560
agagtgaagg gatgggctga cgagtggaag gagctttctg gaaagaacgg aaacccaatc 1620
ttcgaggacg cttcttcttt cagaggatct tctccacttc tttgcggact ttatgactct 1680
actgagccag aggagtgcga cagattcaag acttatgacc ttccatctat ccttggaaac 1740
cttgaggtgg aggtgtggag aaagggagag ttcaagagac agatcgaggc tactaagact 1800
ccaatcgcta gaagaagatt cgactattgc cttgctttcc ttaaccttaa gggatataga 1860
gaggagagac ttaactggag attcacttat gacggagatc ttggagagat cgcttctgct 1920
tggaaggtgc aggtgcttac tggaatcgga gtgtggcagc cagacaaccc ttggcttgac 1980
agaatctcaa gagagcttag agatcttgct cttgtgtctt tcgtgttcgc ttatccagtg 2040
gctgctgtga gacagagact tcagcttcca atgcacttcg gaatctatcc aatctctgac 2100
gagtcttctc ttcactctcc actttctcca tattctatcg ctatcggaca ggctgctctt 2160
cttcttgaca ctcttgctca cagattcaag ggaaagggag gagaggtgtg gatctgc 2217
<210> 37
<211> 3519
<212> DNA
<213> Artificial
<220>
<223> 2xNLS + Cas10d
<400> 37
gacccaaaga agaagcggaa ggtagaccct aagaagaagc gcaaggtttc tggaccaaag 60
aagcagaaga agcttgagga gactggacag cttaaccttt tcgacaacac tactgagatc 120
gacgacgagg accttgactt cgagttcgag gacatcgacc ttgagtctct tgtgtctgag 180
gaccttggaa tcactgagtc tgtgtctgac agaagagtgg agactgtgag acagcttctt 240
actcttaagc ttcttagaga ggctatcaga gctgagaacc cagacgacag agtgatggct 300
gacttcgctg agatggtgct tccaaacctt cttagacttg ctatcggagt gactgctaag 360
ggaggaaact tcatcgaggc tgtggacaga ggaagagagc ttagaaacaa gccaaaggct 420
aagagagaca acgctggaga tcagtctctt aacactcacc ttcttaacgg acttttccca 480
gctaacctta tcgagaagag acttcagaag cttaacacta ctgtgagaag aatcatcaag 540
gagttcgaga gaagacttgc tatcgctgga ttccttgtgc acgacttcga gaagttctct 600
tatgacagat tcccatctat gtctgagaga tatatccaga tccagagaga cttcatccag 660
gacccattca agaaccagga cccaagaaag ctttcaagag aggagcacag agagatcctt 720
caggtgctta tcccagagct tggacttgac agattccttt tcccagacaa cccagagaga 780
tggcttgagt atcttgacga ccttctttat atcgctaaga acactcagag aagaaacgac 840
actgacctta acacttctga ggacggactt aacgtgagac ttaacgacag agtgatcgag 900
tctctttgcg accttgcttg ccttgctgac agacttgctt ctatcatcaa gcacccacac 960
gacgctgaga aggcttctct tcaggacctt ctttattctc tttctgacgg agagcttaag 1020
ttcacttatc actctatcgc tgagaacaga ggagtgctta ctaacgtgct taacaacgct 1080
gtgatggagg ctcaccagga gcttgactat cagccacttc tttatcttcc aactggagtg 1140
gtgtatatcg ctccaaagaa cgctccagag gtgtctcttg agactcttcc aaacagagtg 1200
gtggacacta tcaagtctct ttgctctgga gagcttcaga gaaagcagac tggattcgga 1260
agagacggaa agggtatgaa gtatgctgac tattattctc agttcttcga cgacgctgga 1320
cttatgagag ctgctcttaa cgctactctt agaatccttg gagacaacaa ggcttctgtg 1380
gctagatcta gaggagagaa ccttatcaag ttccagcagc agggagtgct tccaactgac 1440
tatgacttcc actgcgagga cgacatcaga atcgacagac ttgctgagtt cggagacgtg 1500
gtgactagaa agatctgggg agacagactt gagaagatcg agcaggctag aaagcttcag 1560
aagaaccttc cagctccacc agaccttgac cttatctctg agatcgctca ctattggaac 1620
cttgagaact atcttccaca gatcagagct atcaagagaa tcaacgagtc tcttaaggag 1680
cttaagctta agggaaacac tggaggagtg ccatatgagt ggtattatct tgctgctcag 1740
tatcttaagc agcacccagg aatcgaggac atcagaccag tggctgagga ccttatcgct 1800
ttccttgctg ctaagatcgc tgctatcgtg gctggatata accttccaga cggatgggag 1860
gaccttagag agtgggtgaa ccaggtggtg cagcttccag gaagagagct tgctcactct 1920
atcgagactt tccagaagga gcttaaccac tataacgctg ctaagaagca gggaagagga 1980
agacagcttc tttgctctat ctctcactct ccatattctg tgtctgagca gatggagtct 2040
gctgtgcttt tcactccaca ggtgtatact aacaagcaga tgcttgctgg atctaacgct 2100
aagagaaaca tctcttctat cgctggaact gagatgatgc ttagacagat ccttatgaac 2160
cagactcagg ctgtgggaaa gagattcgag gacggaaagt atagatatct ttatttctat 2220
ccaacttatt atttcactcc agagactaac tctttccttc agaaggctta tgctaacatc 2280
gctcagacta gattcgactc ttctatcaag cttcacttcg tggacaagaa ccttgtggct 2340
aacttcgaca gaactagata tcagtctgtg gactctttcc ttatcgacga gaagcttaga 2400
cagaagaagg agactatcaa cgaggaggag gacggaaaga aggacagaac tttcaagctt 2460
tcttatccag aggacaagcc acttactttc tatttcatgg ctcttccacc aggaagaaac 2520
ccaactgaca ctgagtcttg ggtaatgcca gcttggcttg gacttgcttt cccaatgatc 2580
cttgacgtga agactgtggt gtctgagtct ccaatcccac catatagaga cggagctgag 2640
ttcgaggaga ctgtgttcct tgactctgct ccacaggcta tcagatctct tactagatgc 2700
gacagattca gacttgacag agtgcttaac ccttggcagg acaacgacgg aaagaagtat 2760
tctgctccac ttaacactct tactgctgct tattctatcc accttgacgt gaactctaag 2820
cagggaaaga ctggatatga cccaaactgg ggaaagctta ctgagcttgc tatcaacctt 2880
gagacttctc cactttatgt gttccactat ttcaagcagt ggaagagagg aaaggacgct 2940
gacatcccat ctgctaacag aatcgctctt tatctttatg acttctatcc atgcttcgac 3000
ccatatgtgc aggctaacag aactaacctt actatcgaca tgactgctga gtctccactt 3060
aaccacccaa agaaccttac tgagctttat agacagttct atagagctaa gtcttctaag 3120
ggaaagccaa tcaaggctaa cgctatcctt aagccaatcg acgaggctgc tgacatcatc 3180
cttaaggctg acaaggctat ctctgacgac cttacttctc ttgtggctgc tagacttttc 3240
aagcttatgg acagagtgag atctcagact gctgagggaa gatatgtgat caaggagaga 3300
gatcaggaga gagagaagat ccttgacttc gctaagtatt tcgtgaagaa cgtgttcgag 3360
gagtctttcg agtctgacag agctagactt gctggaagac agcttaacat catcagagac 3420
acttgcgagt tcctttatag acttgagatg gacaaggaga gaagacagag acaggtgcag 3480
ccacttgaca cttctaactc ttcttctgag gaggaggag 3519
<210> 38
<211> 35
<212> DNA
<213> Nicotiana benthamiana
<400> 38
tgggtggttt gtctacagca aaatatctgg cagat 35
<210> 39
<211> 35
<212> DNA
<213> Nicotiana benthamiana
<400> 39
aaatttgcta ttggactctt gccagcaatg cttgg 35
<210> 40
<211> 35
<212> DNA
<213> Solanum lycopersicum
<400> 40
tacctggatc tcagtctccc gaaagaggtg aggag 35
<210> 41
<211> 811
<212> DNA
<213> Artificial
<220>
<223> Cytomegalovirus enhancer + universal chicken beta-actin gene hybrid promoter
<400> 41
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 120
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 180
cgtcaatgac ggtaaatggc ccgcctggca ttgtgcccag tacatgacct tatgggactt 240
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtcg aggtgagccc 300
cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 360
tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggggggc gcgcgccagg 420
cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa 480
tcagagcggc gcgctccgaa agtttccttt tatggcgagg cggcggcggc ggcggcccta 540
taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg ctgccttcgc cccgtgcccc 600
gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact gaccgcgtta ctcccacagg 660
tgagcgggcg ggacggccct tctcctccgg gctgtaatta gctgagcaag aggtaagggt 720
ttaagggatg gttggttggt ggggtattaa tgtttaatta cctggagcac ctgcctgaaa 780
tcactttttt tcaggttgga ccggtgccac c 811
<210> 42
<211> 223
<212> DNA
<213> Artificial
<220>
<223> Bovine-derived growth hormone gene terminator sequence
<400> 42
gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 60
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 120
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 180
gcaaggggga ggattgggaa gagaatagca ggcatgctgg gga 223
<210> 43
<211> 249
<212> DNA
<213> Artificial
<220>
<223> Human U6 snRNA gene promoter
<400> 43
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacacc 249
<210> 44
<211> 35
<212> DNA
<213> Homo sapiens
<400> 44
ccagaaccgg aggacaaagt acaaacggca gaagc 35
<210> 45
<211> 35
<212> DNA
<213> Homo sapiens
<400> 45
gatgtgatgg gagcccttct tcttctgctc ggact 35
Claims (13)
- 표적 뉴클레오타이드 서열을 표적화하는 방법으로서, 세포 중에,
(i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
를 도입하는 것을 포함하는 방법. - 표적 뉴클레오타이드 서열을 개변하는 방법으로서, 세포 중에,
(i) CRISPR 타입 I-D 관련 단백질 Cas3d, Cas5d, Cas6d, Cas7d 및 Cas10d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
를 도입하는 것을 포함하는 방법. - 표적 유전자의 발현을 억제하는 방법으로서, 세포 중에,
(i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 또는 이들 단백질을 인코딩하는 핵산, 및
(ii) 상기 표적 유전자의 서열의 적어도 일부에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA, 또는 해당 가이드 RNA를 인코딩하는 DNA
를 도입하는 것을 포함하는 방법. - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
상기 가이드 RNA가, 상기 표적 뉴클레오타이드 서열에 상보적인 20∼50염기로 이루어지는 서열을 포함하는, 방법. - 제 2 항 또는 제 4 항에 있어서,
상기 세포 중에 도너 폴리뉴클레오타이드를 도입하는 것을 추가로 포함하는, 방법. - 제 2 항, 제 4 항 및 제 5 항 중 어느 한 항에 있어서,
개변이 염기의 결실, 삽입, 또는 치환인, 방법. - 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
상기 Cas5d가 프로토스페이서 인접 모티프(PAM) 서열로서 5'-GTH-3'(H=A, C, 또는 T)를 인식하는, 방법. - (i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d, 및
(ii) 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA
를 포함하는 복합체. - 제 8 항에 있어서,
Cas3d 및 Cas10d를 추가로 포함하는, 복합체. - 제 8 항 또는 제 9 항에 있어서,
상기 가이드 RNA가, 상기 표적 뉴클레오타이드 서열에 상보적인 20∼50염기로 이루어지는 서열을 포함하는, 복합체. - (i) CRISPR 타입 I-D 관련 단백질 Cas5d, Cas6d 및 Cas7d를 인코딩하는 핵산, 및
(ii) 표적 뉴클레오타이드 서열에 상보적인 서열 및 해당 서열의 전후에 CRISPR 유전자자리에서 유래하는 공통 반복 서열을 포함하는 가이드 RNA를 인코딩하는 DNA
를 포함하는 발현 벡터. - 제 11 항에 있어서,
Cas3d 및 Cas10d를 인코딩하는 핵산을 추가로 포함하는, 발현 벡터. - 제 8 항 내지 제 10 항 중 어느 한 항에 기재된 복합체를 인코딩하는 DNA 분자.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2017-158876 | 2017-08-21 | ||
JP2017158876 | 2017-08-21 | ||
JPJP-P-2017-236518 | 2017-12-08 | ||
JP2017236518 | 2017-12-08 | ||
PCT/JP2018/030607 WO2019039417A1 (ja) | 2017-08-21 | 2018-08-20 | ヌクレオチド標的認識を利用した標的配列特異的改変技術 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200039775A true KR20200039775A (ko) | 2020-04-16 |
KR102626503B1 KR102626503B1 (ko) | 2024-01-17 |
Family
ID=65438898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207007763A KR102626503B1 (ko) | 2017-08-21 | 2018-08-20 | 뉴클레오타이드 표적 인식을 이용한 표적 서열 특이적 개변 기술 |
Country Status (13)
Country | Link |
---|---|
US (1) | US20210363520A1 (ko) |
EP (1) | EP3674404A4 (ko) |
JP (2) | JP7017259B2 (ko) |
KR (1) | KR102626503B1 (ko) |
CN (1) | CN111247247A (ko) |
AU (1) | AU2018321021B2 (ko) |
BR (1) | BR112020003439A2 (ko) |
CA (1) | CA3073372A1 (ko) |
IL (1) | IL272688A (ko) |
MX (1) | MX2020001998A (ko) |
NZ (1) | NZ762361A (ko) |
SG (1) | SG11202001471SA (ko) |
WO (1) | WO2019039417A1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11807869B2 (en) * | 2017-06-08 | 2023-11-07 | Osaka University | Method for producing DNA-edited eukaryotic cell, and kit used in the same |
WO2020122104A1 (ja) * | 2018-12-11 | 2020-06-18 | 国立大学法人京都大学 | ゲノムdnaに欠失を誘導する方法 |
JP7489112B2 (ja) | 2019-03-14 | 2024-05-23 | 国立大学法人徳島大学 | Crisprタイプi-dシステムを利用した標的配列改変技術 |
CN113646429A (zh) | 2019-04-05 | 2021-11-12 | 国立大学法人大阪大学 | 敲入细胞的制作方法 |
KR102550308B1 (ko) * | 2020-09-29 | 2023-06-30 | 경상국립대학교산학협력단 | SlHKT1;2 유전자 교정에 의해 내염성이 증가된 유전체 교정 토마토 식물체의 제조 방법 및 상기 방법에 의해 제조된 내염성이 증가된 유전체 교정 토마토 식물체 |
WO2022075419A1 (ja) | 2020-10-08 | 2022-04-14 | 国立大学法人徳島大学 | Crisprタイプi-dシステムを利用した標的ヌクレオチド配列改変技術 |
CN112921038B (zh) * | 2021-02-23 | 2022-08-02 | 安徽农业大学 | 同源重组机制介导的精准序列替换基因编辑方法及其元件结构 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015503535A (ja) | 2011-12-30 | 2015-02-02 | ヴァーヘニンヘン ウニフェルジテイト | 改変されたcascadeリボ核タンパク質およびそれらの用途 |
WO2015155686A2 (en) | 2014-04-08 | 2015-10-15 | North Carolina State University | Methods and compositions for rna-directed repression of transcription using crispr-associated genes |
WO2017043573A1 (ja) | 2015-09-09 | 2017-03-16 | 国立大学法人神戸大学 | 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体 |
WO2017066497A2 (en) * | 2015-10-13 | 2017-04-20 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
LT3152312T (lt) * | 2014-06-06 | 2020-04-27 | Regeneron Pharmaceuticals, Inc. | Tikslinio lokuso modifikavimo būdai ir kompozicijos |
PT3155099T (pt) * | 2014-06-23 | 2018-04-20 | Regeneron Pharma | Montagem de dna mediada por nuclease |
US11807869B2 (en) * | 2017-06-08 | 2023-11-07 | Osaka University | Method for producing DNA-edited eukaryotic cell, and kit used in the same |
-
2018
- 2018-08-20 AU AU2018321021A patent/AU2018321021B2/en active Active
- 2018-08-20 WO PCT/JP2018/030607 patent/WO2019039417A1/ja unknown
- 2018-08-20 KR KR1020207007763A patent/KR102626503B1/ko active IP Right Grant
- 2018-08-20 SG SG11202001471SA patent/SG11202001471SA/en unknown
- 2018-08-20 NZ NZ762361A patent/NZ762361A/en unknown
- 2018-08-20 CN CN201880068289.7A patent/CN111247247A/zh active Pending
- 2018-08-20 CA CA3073372A patent/CA3073372A1/en active Pending
- 2018-08-20 JP JP2019537609A patent/JP7017259B2/ja active Active
- 2018-08-20 US US16/640,521 patent/US20210363520A1/en active Pending
- 2018-08-20 BR BR112020003439-8A patent/BR112020003439A2/pt unknown
- 2018-08-20 MX MX2020001998A patent/MX2020001998A/es unknown
- 2018-08-20 EP EP18847639.4A patent/EP3674404A4/en active Pending
-
2020
- 2020-02-16 IL IL272688A patent/IL272688A/en unknown
-
2021
- 2021-10-20 JP JP2021171578A patent/JP7054283B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015503535A (ja) | 2011-12-30 | 2015-02-02 | ヴァーヘニンヘン ウニフェルジテイト | 改変されたcascadeリボ核タンパク質およびそれらの用途 |
WO2015155686A2 (en) | 2014-04-08 | 2015-10-15 | North Carolina State University | Methods and compositions for rna-directed repression of transcription using crispr-associated genes |
WO2017043573A1 (ja) | 2015-09-09 | 2017-03-16 | 国立大学法人神戸大学 | 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体 |
WO2017066497A2 (en) * | 2015-10-13 | 2017-04-20 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
Non-Patent Citations (1)
Title |
---|
Makarova 등, Cell, Vol. 168, (2017.02.23.)* * |
Also Published As
Publication number | Publication date |
---|---|
CA3073372A1 (en) | 2019-02-28 |
AU2018321021A1 (en) | 2020-03-26 |
IL272688A (en) | 2020-04-30 |
JP2022009293A (ja) | 2022-01-14 |
AU2018321021B2 (en) | 2022-10-06 |
JPWO2019039417A1 (ja) | 2020-11-26 |
MX2020001998A (es) | 2020-10-05 |
SG11202001471SA (en) | 2020-03-30 |
JP7054283B2 (ja) | 2022-04-13 |
KR102626503B1 (ko) | 2024-01-17 |
CN111247247A (zh) | 2020-06-05 |
US20210363520A1 (en) | 2021-11-25 |
JP7017259B2 (ja) | 2022-02-08 |
BR112020003439A2 (pt) | 2020-08-25 |
EP3674404A1 (en) | 2020-07-01 |
WO2019039417A1 (ja) | 2019-02-28 |
NZ762361A (en) | 2024-03-22 |
EP3674404A4 (en) | 2021-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102626503B1 (ko) | 뉴클레오타이드 표적 인식을 이용한 표적 서열 특이적 개변 기술 | |
CN106922154B (zh) | 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑 | |
AU2016274452B2 (en) | Thermostable Cas9 nucleases | |
US11220693B2 (en) | Method for converting monocot plant genome sequence in which nucleic acid base in targeted DNA sequence is specifically converted, and molecular complex used therein | |
AU2021231074C1 (en) | Class II, type V CRISPR systems | |
WO2018188571A1 (zh) | 基因组编辑系统和方法 | |
EP2796558A1 (en) | Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants | |
CN109689875B (zh) | 基因组编辑系统和方法 | |
JP7489112B2 (ja) | Crisprタイプi-dシステムを利用した標的配列改変技術 | |
WO2022075419A1 (ja) | Crisprタイプi-dシステムを利用した標的ヌクレオチド配列改変技術 | |
AU2022284808A1 (en) | Class ii, type v crispr systems | |
EP4179078A1 (en) | Methods for modulating cas-effector activity | |
JP7353602B1 (ja) | ゲノム編集方法およびゲノム編集用組成物 | |
EP3225686B1 (en) | Novel homing endonuclease derived from arabidopsis thaliana |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |