KR20210126042A - 유전자 편집에서 비의도적 돌연변이의 억제 - Google Patents
유전자 편집에서 비의도적 돌연변이의 억제 Download PDFInfo
- Publication number
- KR20210126042A KR20210126042A KR1020217028085A KR20217028085A KR20210126042A KR 20210126042 A KR20210126042 A KR 20210126042A KR 1020217028085 A KR1020217028085 A KR 1020217028085A KR 20217028085 A KR20217028085 A KR 20217028085A KR 20210126042 A KR20210126042 A KR 20210126042A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- lys
- arg
- ser
- ala
- Prior art date
Links
- 238000010362 genome editing Methods 0.000 title claims description 23
- 230000035772 mutation Effects 0.000 title abstract description 61
- 230000001629 suppression Effects 0.000 title 1
- 239000012634 fragment Substances 0.000 claims abstract description 126
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 94
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 94
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 93
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 88
- 230000007017 scission Effects 0.000 claims abstract description 79
- 108091005804 Peptidases Proteins 0.000 claims abstract description 48
- 239000004365 Protease Substances 0.000 claims abstract description 48
- 230000003197 catalytic effect Effects 0.000 claims abstract description 37
- 230000002401 inhibitory effect Effects 0.000 claims abstract description 37
- 108010076818 TEV protease Proteins 0.000 claims description 84
- 108090000623 proteins and genes Proteins 0.000 claims description 77
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 75
- 102000004169 proteins and genes Human genes 0.000 claims description 73
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 69
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 68
- 102000005381 Cytidine Deaminase Human genes 0.000 claims description 67
- 238000000034 method Methods 0.000 claims description 60
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 claims description 45
- 210000004027 cell Anatomy 0.000 claims description 40
- 125000006850 spacer group Chemical group 0.000 claims description 36
- 229940122135 Deaminase inhibitor Drugs 0.000 claims description 33
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 32
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 claims description 28
- 150000007523 nucleic acids Chemical group 0.000 claims description 26
- 230000027455 binding Effects 0.000 claims description 23
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 22
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 20
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 20
- 230000000295 complement effect Effects 0.000 claims description 20
- 102000040430 polynucleotide Human genes 0.000 claims description 20
- 108091033319 polynucleotide Proteins 0.000 claims description 20
- 239000002157 polynucleotide Substances 0.000 claims description 20
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 19
- -1 NmCas9 Proteins 0.000 claims description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 239000003112 inhibitor Substances 0.000 claims description 18
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 claims description 17
- 239000002773 nucleotide Substances 0.000 claims description 17
- 125000003729 nucleotide group Chemical group 0.000 claims description 17
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 claims description 16
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 claims description 16
- 102100034349 Integrase Human genes 0.000 claims description 16
- 102100024364 Disintegrin and metalloproteinase domain-containing protein 8 Human genes 0.000 claims description 15
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 claims description 15
- 125000000539 amino acid group Chemical group 0.000 claims description 15
- 102000039446 nucleic acids Human genes 0.000 claims description 15
- 108020004707 nucleic acids Proteins 0.000 claims description 15
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 claims description 14
- 102100038955 Proprotein convertase subtilisin/kexin type 9 Human genes 0.000 claims description 14
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 claims description 13
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 claims description 13
- 239000002245 particle Substances 0.000 claims description 13
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 claims description 12
- 101100272670 Aromatoleum evansii boxB gene Proteins 0.000 claims description 12
- 108020004705 Codon Proteins 0.000 claims description 12
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 claims description 12
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 claims description 12
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 claims description 12
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 claims description 12
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 claims description 12
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 claims description 12
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 claims description 12
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 claims description 12
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 claims description 12
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 claims description 12
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 claims description 10
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 claims description 10
- 101710091045 Envelope protein Proteins 0.000 claims description 10
- 101710188315 Protein X Proteins 0.000 claims description 10
- 230000009977 dual effect Effects 0.000 claims description 10
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 claims description 9
- 241000282414 Homo sapiens Species 0.000 claims description 9
- 230000008685 targeting Effects 0.000 claims description 9
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 claims description 8
- 102100032123 AMP deaminase 1 Human genes 0.000 claims description 8
- 102100032897 AMP deaminase 2 Human genes 0.000 claims description 8
- 102100032898 AMP deaminase 3 Human genes 0.000 claims description 8
- 102100025976 Adenosine deaminase 2 Human genes 0.000 claims description 8
- 101710142940 Adenosine deaminase 2 Proteins 0.000 claims description 8
- 102100032578 Adenosine deaminase domain-containing protein 1 Human genes 0.000 claims description 8
- 102100032577 Adenosine deaminase domain-containing protein 2 Human genes 0.000 claims description 8
- 102100034326 Adenosine deaminase-like protein Human genes 0.000 claims description 8
- 101000775844 Homo sapiens AMP deaminase 1 Proteins 0.000 claims description 8
- 101000797458 Homo sapiens AMP deaminase 2 Proteins 0.000 claims description 8
- 101000797462 Homo sapiens AMP deaminase 3 Proteins 0.000 claims description 8
- 101000797006 Homo sapiens Adenosine deaminase domain-containing protein 1 Proteins 0.000 claims description 8
- 101000796996 Homo sapiens Adenosine deaminase domain-containing protein 2 Proteins 0.000 claims description 8
- 101000780272 Homo sapiens Adenosine deaminase-like protein Proteins 0.000 claims description 8
- 101000799048 Homo sapiens Probable inactive tRNA-specific adenosine deaminase-like protein 3 Proteins 0.000 claims description 8
- 101000799160 Homo sapiens tRNA-specific adenosine deaminase 1 Proteins 0.000 claims description 8
- 101000799057 Homo sapiens tRNA-specific adenosine deaminase 2 Proteins 0.000 claims description 8
- 102100034006 Probable inactive tRNA-specific adenosine deaminase-like protein 3 Human genes 0.000 claims description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 8
- 101710199622 tRNA-specific adenosine deaminase Proteins 0.000 claims description 8
- 102100034113 tRNA-specific adenosine deaminase 1 Human genes 0.000 claims description 8
- 102100034045 tRNA-specific adenosine deaminase 2 Human genes 0.000 claims description 8
- 230000003612 virological effect Effects 0.000 claims description 8
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 claims description 7
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 claims description 7
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 claims description 7
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 claims description 7
- 101000910045 Streptococcus thermophilus (strain ATCC BAA-491 / LMD-9) CRISPR-associated endonuclease Cas9 2 Proteins 0.000 claims description 7
- 210000004899 c-terminal region Anatomy 0.000 claims description 7
- 101000860104 Leptotrichia wadei (strain F0279) CRISPR-associated endoribonuclease Cas13a Proteins 0.000 claims description 6
- 241000700605 Viruses Species 0.000 claims description 6
- 102100030088 ATP-dependent RNA helicase A Human genes 0.000 claims description 5
- 101001098868 Homo sapiens Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 claims description 4
- 241000725303 Human immunodeficiency virus Species 0.000 claims description 4
- 241000713869 Moloney murine leukemia virus Species 0.000 claims description 4
- 230000000415 inactivating effect Effects 0.000 claims description 4
- 229940035893 uracil Drugs 0.000 claims description 4
- 229940113491 Glycosylase inhibitor Drugs 0.000 claims description 3
- 241000723838 Turnip mosaic virus Species 0.000 claims description 3
- 241000907316 Zika virus Species 0.000 claims description 3
- 241000271566 Aves Species 0.000 claims description 2
- 101000777691 Mus musculus Cytidine and dCMP deaminase domain-containing protein 1 Proteins 0.000 claims description 2
- 101000912065 Mus musculus Cytidine deaminase Proteins 0.000 claims description 2
- 206010051141 Myeloblastoma Diseases 0.000 claims description 2
- 239000003795 chemical substances by application Substances 0.000 claims description 2
- 102000053786 human PCSK9 Human genes 0.000 claims description 2
- 101000777693 Homo sapiens Cytidine and dCMP deaminase domain-containing protein 1 Proteins 0.000 claims 1
- 101000912053 Homo sapiens Cytidine deaminase Proteins 0.000 claims 1
- 108091028113 Trans-activating crRNA Proteins 0.000 claims 1
- 210000005260 human cell Anatomy 0.000 claims 1
- 108010091748 peptide A Proteins 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000001976 improved effect Effects 0.000 abstract description 13
- 230000002829 reductive effect Effects 0.000 abstract description 12
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 abstract 1
- 239000013612 plasmid Substances 0.000 description 146
- 235000018102 proteins Nutrition 0.000 description 64
- 108020004414 DNA Proteins 0.000 description 63
- 108010050848 glycylleucine Proteins 0.000 description 47
- 102000053602 DNA Human genes 0.000 description 46
- 108020004682 Single-Stranded DNA Proteins 0.000 description 45
- 230000000694 effects Effects 0.000 description 41
- 108010034529 leucyl-lysine Proteins 0.000 description 35
- 238000012761 co-transfection Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 33
- 108010040030 histidinoalanine Proteins 0.000 description 28
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 27
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 27
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 26
- 229940123974 Cytidine deaminase inhibitor Drugs 0.000 description 26
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 25
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 24
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 24
- 230000037429 base substitution Effects 0.000 description 24
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 24
- 108010026333 seryl-proline Proteins 0.000 description 24
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 23
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 23
- 229920002401 polyacrylamide Polymers 0.000 description 23
- 102000004196 processed proteins & peptides Human genes 0.000 description 23
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 22
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 22
- 108010092854 aspartyllysine Proteins 0.000 description 22
- 108010069495 cysteinyltyrosine Proteins 0.000 description 22
- 108010064235 lysylglycine Proteins 0.000 description 21
- 108010054155 lysyllysine Proteins 0.000 description 21
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 20
- 229920001184 polypeptide Polymers 0.000 description 20
- 108091033409 CRISPR Proteins 0.000 description 19
- 108010044940 alanylglutamine Proteins 0.000 description 19
- 108010060199 cysteinylproline Proteins 0.000 description 19
- VEWZSFGRQDUAJM-YJRXYDGGSA-N Thr-Cys-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O VEWZSFGRQDUAJM-YJRXYDGGSA-N 0.000 description 18
- 108010025306 histidylleucine Proteins 0.000 description 18
- 108010057821 leucylproline Proteins 0.000 description 18
- 102100031780 Endonuclease Human genes 0.000 description 17
- 108010012058 leucyltyrosine Proteins 0.000 description 17
- 108010062796 arginyllysine Proteins 0.000 description 16
- 108010073969 valyllysine Proteins 0.000 description 16
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 15
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 15
- 108010005233 alanylglutamic acid Proteins 0.000 description 15
- 235000001014 amino acid Nutrition 0.000 description 15
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 14
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 14
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 14
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 14
- 102000048415 human APOBEC3B Human genes 0.000 description 14
- 108010003700 lysyl aspartic acid Proteins 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- NIELFHOLFTUZME-HJWJTTGWSA-N Arg-Phe-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NIELFHOLFTUZME-HJWJTTGWSA-N 0.000 description 13
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 13
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 13
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 13
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 13
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 13
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 12
- 101710180553 Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 description 12
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 12
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 108010027338 isoleucylcysteine Proteins 0.000 description 12
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 11
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 11
- KWHFUMYCSPJCFQ-NGTWOADLSA-N Ile-Thr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N KWHFUMYCSPJCFQ-NGTWOADLSA-N 0.000 description 11
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 11
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 11
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 11
- 108010087924 alanylproline Proteins 0.000 description 11
- 229940024606 amino acid Drugs 0.000 description 11
- 108010047857 aspartylglycine Proteins 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 108010079547 glutamylmethionine Proteins 0.000 description 11
- 108010092114 histidylphenylalanine Proteins 0.000 description 11
- 108010017391 lysylvaline Proteins 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 10
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 10
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 10
- RKQAYOWLSFLJEE-SVSWQMSJSA-N Ile-Thr-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N RKQAYOWLSFLJEE-SVSWQMSJSA-N 0.000 description 10
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 10
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 10
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 10
- QEFHBVDWKFFKQI-PMVMPFDFSA-N Phe-His-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QEFHBVDWKFFKQI-PMVMPFDFSA-N 0.000 description 10
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 10
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 10
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 10
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 10
- 108010078144 glutaminyl-glycine Proteins 0.000 description 10
- 108010018006 histidylserine Proteins 0.000 description 10
- 108010009298 lysylglutamic acid Proteins 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 9
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 9
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 9
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 9
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 9
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 9
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 9
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 9
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 9
- OEDPLIBVQGRKGZ-AVGNSLFASA-N Cys-Tyr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O OEDPLIBVQGRKGZ-AVGNSLFASA-N 0.000 description 9
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 9
- 101710121996 Hexon protein p72 Proteins 0.000 description 9
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 9
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 9
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 9
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 9
- 101710125418 Major capsid protein Proteins 0.000 description 9
- 102100039373 Membrane cofactor protein Human genes 0.000 description 9
- UJDMTKHGWSBHBX-IHRRRGAJSA-N Met-Cys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UJDMTKHGWSBHBX-IHRRRGAJSA-N 0.000 description 9
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 9
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 9
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 9
- WECYCNFPGZLOOU-FXQIFTODSA-N Pro-Asn-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O WECYCNFPGZLOOU-FXQIFTODSA-N 0.000 description 9
- NGNNPLJHUFCOMZ-FXQIFTODSA-N Pro-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 NGNNPLJHUFCOMZ-FXQIFTODSA-N 0.000 description 9
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 9
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 9
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 9
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 9
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 9
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 9
- ZLMFVXMJFIWIRE-FHWLQOOXSA-N Val-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N ZLMFVXMJFIWIRE-FHWLQOOXSA-N 0.000 description 9
- 108010008355 arginyl-glutamine Proteins 0.000 description 9
- 108010068265 aspartyltyrosine Proteins 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 108010085325 histidylproline Proteins 0.000 description 9
- 238000007619 statistical method Methods 0.000 description 9
- 108010003137 tyrosyltyrosine Proteins 0.000 description 9
- IEAUDUOCWNPZBR-LKTVYLICSA-N Ala-Trp-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IEAUDUOCWNPZBR-LKTVYLICSA-N 0.000 description 8
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 8
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 8
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 8
- XXAOXVBAWLMTDR-ZLUOBGJFSA-N Asn-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N XXAOXVBAWLMTDR-ZLUOBGJFSA-N 0.000 description 8
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 8
- 108091079001 CRISPR RNA Proteins 0.000 description 8
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 8
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 8
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 8
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 8
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 8
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 8
- 108010065920 Insulin Lispro Proteins 0.000 description 8
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 8
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 8
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 8
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 8
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 8
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 8
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 8
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 8
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 8
- 108010047562 NGR peptide Proteins 0.000 description 8
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 8
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 8
- RJBFAHKSFNNHAI-XKBZYTNZSA-N Thr-Gln-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O RJBFAHKSFNNHAI-XKBZYTNZSA-N 0.000 description 8
- DNCUODYZAMHLCV-XGEHTFHBSA-N Thr-Pro-Cys Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N)O DNCUODYZAMHLCV-XGEHTFHBSA-N 0.000 description 8
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 8
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 8
- ZMKDQRJLMRZHRI-ACRUOGEOSA-N Tyr-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N ZMKDQRJLMRZHRI-ACRUOGEOSA-N 0.000 description 8
- 108010047495 alanylglycine Proteins 0.000 description 8
- 108010077245 asparaginyl-proline Proteins 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 8
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 108010010147 glycylglutamine Proteins 0.000 description 8
- 231100000350 mutagenesis Toxicity 0.000 description 8
- 108010012581 phenylalanylglutamate Proteins 0.000 description 8
- 108010031719 prolyl-serine Proteins 0.000 description 8
- 230000001960 triggered effect Effects 0.000 description 8
- 108010080629 tryptophan-leucine Proteins 0.000 description 8
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 7
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 7
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 7
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 7
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 7
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 7
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 7
- WTJBVCUCLWFGAH-JUKXBJQTSA-N His-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WTJBVCUCLWFGAH-JUKXBJQTSA-N 0.000 description 7
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 7
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 7
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 7
- RNYLNYTYMXACRI-VFAJRCTISA-N Leu-Thr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O RNYLNYTYMXACRI-VFAJRCTISA-N 0.000 description 7
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 7
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 7
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 7
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 7
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 7
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 7
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 7
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 7
- 108091027544 Subgenomic mRNA Proteins 0.000 description 7
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 7
- SFSZDJHNAICYSD-PMVMPFDFSA-N Tyr-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CC4=CC=C(C=C4)O)N SFSZDJHNAICYSD-PMVMPFDFSA-N 0.000 description 7
- 108010060035 arginylproline Proteins 0.000 description 7
- 230000004186 co-expression Effects 0.000 description 7
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 7
- 230000009615 deamination Effects 0.000 description 7
- 238000006481 deamination reaction Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 108010028295 histidylhistidine Proteins 0.000 description 7
- 238000013507 mapping Methods 0.000 description 7
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 6
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 6
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 6
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 6
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 6
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 6
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 6
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 6
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 6
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 6
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 6
- MFMDKTLJCUBQIC-MXAVVETBSA-N Cys-Phe-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MFMDKTLJCUBQIC-MXAVVETBSA-N 0.000 description 6
- 102100037964 E3 ubiquitin-protein ligase RING2 Human genes 0.000 description 6
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 6
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 6
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 6
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 6
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 6
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 6
- 101001095815 Homo sapiens E3 ubiquitin-protein ligase RING2 Proteins 0.000 description 6
- VCYVLFAWCJRXFT-HJPIBITLSA-N Ile-Cys-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N VCYVLFAWCJRXFT-HJPIBITLSA-N 0.000 description 6
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 6
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 6
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 6
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 6
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 6
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 6
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 6
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 6
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 6
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 6
- LUYURUYVNYGKGM-RCWTZXSCSA-N Met-Pro-Thr Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUYURUYVNYGKGM-RCWTZXSCSA-N 0.000 description 6
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 6
- 108010003201 RGH 0205 Proteins 0.000 description 6
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 6
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 6
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 6
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 6
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 6
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 6
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 6
- 229940104302 cytosine Drugs 0.000 description 6
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 6
- 108010089804 glycyl-threonine Proteins 0.000 description 6
- 230000005764 inhibitory process Effects 0.000 description 6
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 6
- 108010038320 lysylphenylalanine Proteins 0.000 description 6
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 6
- 108010025488 pinealon Proteins 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- 229930024421 Adenine Natural products 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 5
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 5
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 5
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 5
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 5
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 5
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 5
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 5
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 5
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 5
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 5
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 5
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 5
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 5
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 5
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 5
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 5
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 5
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 5
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 5
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 5
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 5
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 5
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 5
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 5
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 5
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 5
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 5
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 5
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 5
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 5
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 5
- PIHFVNPEAHFNLN-KKUMJFAQSA-N Leu-Cys-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N PIHFVNPEAHFNLN-KKUMJFAQSA-N 0.000 description 5
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 5
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 5
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 5
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 5
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 5
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 5
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 5
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 5
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 5
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 5
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 5
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 5
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 5
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 5
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 5
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 5
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 5
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 5
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 5
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 5
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 5
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 5
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 5
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 5
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 5
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 5
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 5
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 5
- SNJAPSVIPKUMCK-NWLDYVSISA-N Trp-Glu-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SNJAPSVIPKUMCK-NWLDYVSISA-N 0.000 description 5
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 5
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 5
- FZADUTOCSFDBRV-RNXOBYDBSA-N Tyr-Tyr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 FZADUTOCSFDBRV-RNXOBYDBSA-N 0.000 description 5
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 5
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 5
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 5
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 5
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 5
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 5
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 5
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 5
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 229960000643 adenine Drugs 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 5
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 5
- 108010087823 glycyltyrosine Proteins 0.000 description 5
- 102000049338 human APOBEC3F Human genes 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000030648 nucleus localization Effects 0.000 description 5
- 108010070643 prolylglutamic acid Proteins 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 5
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 5
- 108010038745 tryptophylglycine Proteins 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 4
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 4
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 4
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 4
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 4
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 4
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 4
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 4
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 4
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 4
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 4
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 4
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 4
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 4
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 4
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 4
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 4
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 4
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 4
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 4
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 4
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 4
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 4
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 4
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 4
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 4
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 4
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 4
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 4
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 4
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 4
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 4
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 4
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 4
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 4
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 4
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 4
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 4
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 4
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 4
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 4
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 4
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 4
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 4
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 4
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 4
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 4
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 4
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 4
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 4
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 4
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 4
- PJERDVUTUDZPGX-ZKWXMUAHSA-N Asp-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O PJERDVUTUDZPGX-ZKWXMUAHSA-N 0.000 description 4
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 4
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 4
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 4
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 4
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 4
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 4
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 4
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 4
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 4
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 4
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 4
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 4
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 4
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 4
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 4
- 102100021277 Beta-secretase 2 Human genes 0.000 description 4
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 4
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 4
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 4
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 4
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 4
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 4
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 4
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 4
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 4
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 4
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 4
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 4
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 4
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 4
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 4
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 4
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 4
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 4
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 4
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 4
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 4
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 4
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 4
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 4
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 4
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 4
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 4
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 4
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 4
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 4
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 4
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 4
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 4
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 4
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 4
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 4
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 4
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 4
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 4
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 4
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 4
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 4
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 4
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 4
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 4
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 4
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 4
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 4
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 4
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 4
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 4
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 4
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 4
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 4
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 4
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 4
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 description 4
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 4
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 4
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 4
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 4
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 4
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 4
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 4
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 4
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 4
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 4
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 4
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 4
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 4
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 4
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 4
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 4
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 4
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 4
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 4
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 4
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 4
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 4
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 4
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 4
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 4
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 4
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 4
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 4
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 4
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 4
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 4
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 4
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 4
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 4
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 4
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 4
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 4
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 4
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 4
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 4
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 4
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 4
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 4
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 4
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 4
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 4
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 4
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 4
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 4
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 4
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 4
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 4
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 4
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 4
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 4
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 4
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 4
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 4
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 4
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 4
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 4
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 4
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 4
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 4
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 4
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 4
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 4
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 4
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 4
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 4
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 4
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 4
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 4
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 4
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 4
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 4
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 4
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 4
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 4
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 4
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 4
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 4
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 4
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 4
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 4
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 4
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 4
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 4
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 4
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 4
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 4
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 4
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 4
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 4
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 4
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 4
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 4
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 4
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 4
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 4
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 4
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 4
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 4
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 4
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 4
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 4
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 4
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 4
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 4
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 4
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 4
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 4
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 4
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 4
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 4
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 4
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 4
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 4
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 4
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 4
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 4
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 4
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 4
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 4
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 4
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 4
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 4
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 4
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 4
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 4
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 4
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 4
- 238000000692 Student's t-test Methods 0.000 description 4
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 4
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 4
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 4
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 4
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 4
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 4
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 4
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 4
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 4
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 4
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 4
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 4
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 4
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 4
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 4
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 4
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 4
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 4
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 4
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 4
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 4
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 4
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 4
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 4
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 4
- OGXQLUCMJZSJPW-LYSGOOTNSA-N Trp-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O OGXQLUCMJZSJPW-LYSGOOTNSA-N 0.000 description 4
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 4
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 4
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 4
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 4
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 4
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 4
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 4
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 4
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 4
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 4
- AKKYBQGHUAWPJR-MNSWYVGCSA-N Tyr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)O AKKYBQGHUAWPJR-MNSWYVGCSA-N 0.000 description 4
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 4
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 4
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 4
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 4
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 4
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 4
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 4
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 4
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 4
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 4
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 4
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 4
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 4
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 4
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 4
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 4
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 4
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 4
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 4
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 4
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 4
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 4
- 108010081404 acein-2 Proteins 0.000 description 4
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 238000011835 investigation Methods 0.000 description 4
- 108010000761 leucylarginine Proteins 0.000 description 4
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 4
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 230000006780 non-homologous end joining Effects 0.000 description 4
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 108010077112 prolyl-proline Proteins 0.000 description 4
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 4
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 3
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 3
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 3
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 3
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 3
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 3
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 3
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 3
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 3
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 3
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 3
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 3
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 3
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 3
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 3
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 3
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 3
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 3
- 238000010453 CRISPR/Cas method Methods 0.000 description 3
- BBQIWFFTTQTNOC-AVGNSLFASA-N Cys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N BBQIWFFTTQTNOC-AVGNSLFASA-N 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 3
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 3
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 3
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 3
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 3
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 3
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 3
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 3
- YZPVGIVFMZLQMM-YUMQZZPRSA-N Gly-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN YZPVGIVFMZLQMM-YUMQZZPRSA-N 0.000 description 3
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 3
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 3
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 3
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 3
- CSRRMQFXMBPSIL-SIXJUCDHSA-N His-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N CSRRMQFXMBPSIL-SIXJUCDHSA-N 0.000 description 3
- PDLQNLSEJXOQNQ-IHPCNDPISA-N His-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CN=CN1 PDLQNLSEJXOQNQ-IHPCNDPISA-N 0.000 description 3
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 3
- 102000007330 LDL Lipoproteins Human genes 0.000 description 3
- 108010007622 LDL Lipoproteins Proteins 0.000 description 3
- 108010001831 LDL receptors Proteins 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 3
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 3
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 3
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 3
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 3
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 3
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 3
- 101100489911 Mus musculus Apobec3 gene Proteins 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- 101150094724 PCSK9 gene Proteins 0.000 description 3
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 3
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 3
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 3
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 3
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 3
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 3
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 3
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 3
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 3
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 3
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 3
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 3
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 3
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 3
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 3
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 3
- WTXQBCCKXIKKHB-JYJNAYRXSA-N Tyr-Arg-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WTXQBCCKXIKKHB-JYJNAYRXSA-N 0.000 description 3
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 3
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 3
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 3
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 3
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 3
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 201000004440 congenital dyserythropoietic anemia Diseases 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 210000003722 extracellular fluid Anatomy 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 2
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 2
- 101710159080 Aconitate hydratase A Proteins 0.000 description 2
- 101710159078 Aconitate hydratase B Proteins 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 2
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 2
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 2
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- ZVWXMTTZJKBJCI-BHDSKKPTSA-N Ala-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 ZVWXMTTZJKBJCI-BHDSKKPTSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 2
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 2
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 2
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 2
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 2
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 2
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 2
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 2
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 2
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 2
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 2
- JBQORRNSZGTLCV-WDSOQIARSA-N Arg-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 JBQORRNSZGTLCV-WDSOQIARSA-N 0.000 description 2
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 2
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 2
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- LWXJVHTUEDHDLG-XUXIUFHCSA-N Asn-Leu-Leu-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LWXJVHTUEDHDLG-XUXIUFHCSA-N 0.000 description 2
- ZVUMKOMKQCANOM-AVGNSLFASA-N Asn-Phe-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVUMKOMKQCANOM-AVGNSLFASA-N 0.000 description 2
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 2
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 2
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 2
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 2
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 2
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 2
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- AMRANMVXQWXNAH-ZLUOBGJFSA-N Asp-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O AMRANMVXQWXNAH-ZLUOBGJFSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 2
- UBPMOJLRVMGTOQ-GARJFASQSA-N Asp-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)C(=O)O UBPMOJLRVMGTOQ-GARJFASQSA-N 0.000 description 2
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 2
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 2
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- XMTDCXXLDZKAGI-ACZMJKKPSA-N Cys-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XMTDCXXLDZKAGI-ACZMJKKPSA-N 0.000 description 2
- DCJNIJAWIRPPBB-CIUDSAMLSA-N Cys-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N DCJNIJAWIRPPBB-CIUDSAMLSA-N 0.000 description 2
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 2
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 2
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 2
- XMVZMBGFIOQONW-GARJFASQSA-N Cys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)C(=O)O XMVZMBGFIOQONW-GARJFASQSA-N 0.000 description 2
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 2
- TXGDWPBLUFQODU-XGEHTFHBSA-N Cys-Pro-Thr Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O TXGDWPBLUFQODU-XGEHTFHBSA-N 0.000 description 2
- IRDBEBCCTCNXGZ-AVGNSLFASA-N Cys-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O IRDBEBCCTCNXGZ-AVGNSLFASA-N 0.000 description 2
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 241000214054 Equine rhinitis A virus Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 2
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 2
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 2
- SXIJQMBEVYWAQT-GUBZILKMSA-N Gln-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXIJQMBEVYWAQT-GUBZILKMSA-N 0.000 description 2
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 2
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 2
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 2
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 2
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 2
- DAAUVRPSZRDMBV-KBIXCLLPSA-N Gln-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DAAUVRPSZRDMBV-KBIXCLLPSA-N 0.000 description 2
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 2
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 2
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 2
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 2
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 2
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 2
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 2
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 2
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 2
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 2
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 2
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 2
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 2
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 2
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 2
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 2
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 2
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 2
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 2
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 2
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 2
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 2
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 2
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 2
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 2
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 2
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 2
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 2
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 2
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 2
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 2
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 2
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 2
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 2
- 101000742736 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3G Proteins 0.000 description 2
- 101100135844 Homo sapiens PCSK9 gene Proteins 0.000 description 2
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 2
- LNJLOZYNZFGJMM-DEQVHRJGSA-N Ile-His-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N LNJLOZYNZFGJMM-DEQVHRJGSA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 2
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 2
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 2
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 2
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 2
- GPXFZVUVPCFTMG-AVGNSLFASA-N Leu-Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C GPXFZVUVPCFTMG-AVGNSLFASA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 2
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 2
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 2
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- JLYUZRKPDKHUTC-WDSOQIARSA-N Leu-Pro-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JLYUZRKPDKHUTC-WDSOQIARSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 2
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 2
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 2
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 2
- QQYRCUXKLDGCQN-SRVKXCTJSA-N Lys-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N QQYRCUXKLDGCQN-SRVKXCTJSA-N 0.000 description 2
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- 108010003266 Lys-Leu-Tyr-Asp Proteins 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 2
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010066154 Nuclear Export Signals Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 2
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 2
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 2
- UEHNWRNADDPYNK-DLOVCJGASA-N Phe-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N UEHNWRNADDPYNK-DLOVCJGASA-N 0.000 description 2
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 2
- ZZVUXQCQPXSUFH-JBACZVJFSA-N Phe-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ZZVUXQCQPXSUFH-JBACZVJFSA-N 0.000 description 2
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 2
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 2
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 2
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 2
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 2
- DIZLUAZLNDFDPR-CIUDSAMLSA-N Pro-Cys-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 DIZLUAZLNDFDPR-CIUDSAMLSA-N 0.000 description 2
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 2
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 2
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 2
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 2
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 2
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 2
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 2
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 2
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 2
- FYXCBXDAMPEHIQ-FHWLQOOXSA-N Pro-Trp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O FYXCBXDAMPEHIQ-FHWLQOOXSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- 108010044159 Proprotein Convertases Proteins 0.000 description 2
- 102000006437 Proprotein Convertases Human genes 0.000 description 2
- 101710105008 RNA-binding protein Proteins 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 2
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 2
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 2
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 2
- BVLGVLWFIZFEAH-BPUTZDHNSA-N Ser-Pro-Trp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BVLGVLWFIZFEAH-BPUTZDHNSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 2
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 2
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 2
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 2
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 2
- PKUJMYZNJMRHEZ-XIRDDKMYSA-N Trp-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKUJMYZNJMRHEZ-XIRDDKMYSA-N 0.000 description 2
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 2
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 2
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 2
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 2
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 2
- YTHWAWACWGWBLE-MNSWYVGCSA-N Trp-Tyr-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 YTHWAWACWGWBLE-MNSWYVGCSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 2
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 2
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 2
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 2
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 2
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 2
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 2
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 2
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 2
- SRWWRLKBEJZFPW-IHRRRGAJSA-N Val-Cys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SRWWRLKBEJZFPW-IHRRRGAJSA-N 0.000 description 2
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- MJXNDRCLGDSBBE-FHWLQOOXSA-N Val-His-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N MJXNDRCLGDSBBE-FHWLQOOXSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 2
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 2
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 2
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 208000031753 acute bilirubin encephalopathy Diseases 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 230000006229 amino acid addition Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 108020001778 catalytic domains Proteins 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 102000048646 human APOBEC3A Human genes 0.000 description 2
- 102000043429 human APOBEC3D Human genes 0.000 description 2
- 102000054962 human APOBEC3G Human genes 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000005783 single-strand break Effects 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- SUQWGICKJIJKNO-IHRRRGAJSA-N (2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]acetyl]amino]pentanedioic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O SUQWGICKJIJKNO-IHRRRGAJSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 1
- 108010044087 AS-I toxin Proteins 0.000 description 1
- 108700040115 Adenosine deaminases Proteins 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- PWYFCPCBOYMOGB-LKTVYLICSA-N Ala-Gln-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PWYFCPCBOYMOGB-LKTVYLICSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- AETQNIIFKCMVHP-UVBJJODRSA-N Ala-Trp-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AETQNIIFKCMVHP-UVBJJODRSA-N 0.000 description 1
- PXAFZDXYEIIUTF-LKTVYLICSA-N Ala-Trp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXAFZDXYEIIUTF-LKTVYLICSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- RYRQZJVFDVWURI-SRVKXCTJSA-N Arg-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N RYRQZJVFDVWURI-SRVKXCTJSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- OCDJOVKIUJVUMO-SRVKXCTJSA-N Arg-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N OCDJOVKIUJVUMO-SRVKXCTJSA-N 0.000 description 1
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 1
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 1
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 1
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- STHNZYKCJHWULY-AVGNSLFASA-N Arg-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O STHNZYKCJHWULY-AVGNSLFASA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 1
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 1
- QGNXYDHVERJIAY-ACZMJKKPSA-N Asn-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGNXYDHVERJIAY-ACZMJKKPSA-N 0.000 description 1
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 1
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 1
- OGMDXNFGPOPZTK-GUBZILKMSA-N Asn-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N OGMDXNFGPOPZTK-GUBZILKMSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 1
- GYOHQKJEQQJBOY-QEJZJMRPSA-N Asn-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N GYOHQKJEQQJBOY-QEJZJMRPSA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- FVKHEKVYFTZWDX-GHCJXIJMSA-N Asn-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FVKHEKVYFTZWDX-GHCJXIJMSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 1
- OSZBYGVKAFZWKC-FXQIFTODSA-N Asn-Pro-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O OSZBYGVKAFZWKC-FXQIFTODSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 1
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 1
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 1
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- AKKUDRZKFZWPBH-SRVKXCTJSA-N Asp-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N AKKUDRZKFZWPBH-SRVKXCTJSA-N 0.000 description 1
- WDMNFNXKGSLIOB-GUBZILKMSA-N Asp-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N WDMNFNXKGSLIOB-GUBZILKMSA-N 0.000 description 1
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- YODBPLSWNJMZOJ-BPUTZDHNSA-N Asp-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N YODBPLSWNJMZOJ-BPUTZDHNSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- NVMMUAUTQCWYHD-ABHRYQDASA-N Asp-Val-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 NVMMUAUTQCWYHD-ABHRYQDASA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241001265879 Bacillus phage AR9 Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000702198 Bacillus virus PBS1 Species 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 1
- OJQJUQUBJGTCRY-WFBYXXMGSA-N Cys-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CS)N OJQJUQUBJGTCRY-WFBYXXMGSA-N 0.000 description 1
- LRZPRGJXAZFXCR-DCAQKATOSA-N Cys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N LRZPRGJXAZFXCR-DCAQKATOSA-N 0.000 description 1
- HQZGVYJBRSISDT-BQBZGAKWSA-N Cys-Gly-Arg Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQZGVYJBRSISDT-BQBZGAKWSA-N 0.000 description 1
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 1
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 1
- RRJOQIBQVZDVCW-SRVKXCTJSA-N Cys-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N RRJOQIBQVZDVCW-SRVKXCTJSA-N 0.000 description 1
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 1
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 1
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 1
- RWVBNRYBHAGYSG-GUBZILKMSA-N Cys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N RWVBNRYBHAGYSG-GUBZILKMSA-N 0.000 description 1
- OZSBRCONEMXYOJ-AVGNSLFASA-N Cys-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N OZSBRCONEMXYOJ-AVGNSLFASA-N 0.000 description 1
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- UBHPUQAWSSNQLQ-DCAQKATOSA-N Cys-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O UBHPUQAWSSNQLQ-DCAQKATOSA-N 0.000 description 1
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 1
- JTEGHEWKBCTIAL-IXOXFDKPSA-N Cys-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N)O JTEGHEWKBCTIAL-IXOXFDKPSA-N 0.000 description 1
- LHRCZIRWNFRIRG-SRVKXCTJSA-N Cys-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O LHRCZIRWNFRIRG-SRVKXCTJSA-N 0.000 description 1
- LLUXQOVDMQZMPJ-KKUMJFAQSA-N Cys-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CS)CC1=CC=C(O)C=C1 LLUXQOVDMQZMPJ-KKUMJFAQSA-N 0.000 description 1
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 1
- 102100026846 Cytidine deaminase Human genes 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 1
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 1
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 1
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 1
- ALUBSZXSNSPDQV-WDSKDSINSA-N Gln-Cys-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ALUBSZXSNSPDQV-WDSKDSINSA-N 0.000 description 1
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- PDXIOFXRBVDSHD-JBACZVJFSA-N Gln-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CCC(=O)N)N PDXIOFXRBVDSHD-JBACZVJFSA-N 0.000 description 1
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 1
- QFXNFFZTMFHPST-DZKIICNBSA-N Gln-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)N)N QFXNFFZTMFHPST-DZKIICNBSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- OKQLXOYFUPVEHI-CIUDSAMLSA-N Gln-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N OKQLXOYFUPVEHI-CIUDSAMLSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- NSEKYCAADBNQFE-XIRDDKMYSA-N Gln-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 NSEKYCAADBNQFE-XIRDDKMYSA-N 0.000 description 1
- FTMLQFPULNGION-ZVZYQTTQSA-N Gln-Val-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FTMLQFPULNGION-ZVZYQTTQSA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- YVYVMJNUENBOOL-KBIXCLLPSA-N Glu-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YVYVMJNUENBOOL-KBIXCLLPSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- LGWUJBCIFGVBSJ-CIUDSAMLSA-N Glu-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LGWUJBCIFGVBSJ-CIUDSAMLSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 1
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 1
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 1
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 1
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- LEGMTEAZGRRIMY-ZKWXMUAHSA-N Gly-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN LEGMTEAZGRRIMY-ZKWXMUAHSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- IDNNYVGVSZMQTK-IHRRRGAJSA-N His-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N IDNNYVGVSZMQTK-IHRRRGAJSA-N 0.000 description 1
- YJBMLTVVVRJNOK-SRVKXCTJSA-N His-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N YJBMLTVVVRJNOK-SRVKXCTJSA-N 0.000 description 1
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 1
- VHHYJBSXXMPQGZ-AVGNSLFASA-N His-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N VHHYJBSXXMPQGZ-AVGNSLFASA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 1
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 1
- ZUELLZFHJUPFEC-PMVMPFDFSA-N His-Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 ZUELLZFHJUPFEC-PMVMPFDFSA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- FWWJVUFXUQOEDM-WDSOQIARSA-N His-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N FWWJVUFXUQOEDM-WDSOQIARSA-N 0.000 description 1
- 108010061805 His-Trp-Arg-Arg Proteins 0.000 description 1
- LNVILFYCPVOHPV-IHPCNDPISA-N His-Trp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O LNVILFYCPVOHPV-IHPCNDPISA-N 0.000 description 1
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 1
- SYVMEYAPXRRXAN-MXAVVETBSA-N Ile-Cys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SYVMEYAPXRRXAN-MXAVVETBSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 1
- BKPPWVSPSIUXHZ-OSUNSFLBSA-N Ile-Met-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N BKPPWVSPSIUXHZ-OSUNSFLBSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 1
- QKIBIXAQKAFZGL-GUBZILKMSA-N Leu-Cys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QKIBIXAQKAFZGL-GUBZILKMSA-N 0.000 description 1
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 1
- SNOUHRPNNCAOPI-SZMVWBNQSA-N Leu-Trp-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SNOUHRPNNCAOPI-SZMVWBNQSA-N 0.000 description 1
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- ZAWOJFFMBANLGE-CIUDSAMLSA-N Lys-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N ZAWOJFFMBANLGE-CIUDSAMLSA-N 0.000 description 1
- AIPHUKOBUXJNKM-KKUMJFAQSA-N Lys-Cys-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O AIPHUKOBUXJNKM-KKUMJFAQSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- DKTNGXVSCZULPO-YUMQZZPRSA-N Lys-Gly-Cys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O DKTNGXVSCZULPO-YUMQZZPRSA-N 0.000 description 1
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 1
- PRCHKVGXZVTALR-KKUMJFAQSA-N Lys-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N PRCHKVGXZVTALR-KKUMJFAQSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- AHFOKDZWPPGJAZ-SRVKXCTJSA-N Lys-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N AHFOKDZWPPGJAZ-SRVKXCTJSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- URBJRJKWSUFCKS-AVGNSLFASA-N Lys-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N URBJRJKWSUFCKS-AVGNSLFASA-N 0.000 description 1
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- XFANQCRHTMOEAP-WDSOQIARSA-N Lys-Pro-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XFANQCRHTMOEAP-WDSOQIARSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 1
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 1
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 1
- YCUSPBPZVJDMII-YUMQZZPRSA-N Met-Gly-Glu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O YCUSPBPZVJDMII-YUMQZZPRSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 1
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 1
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 1
- MPCKIRSXNKACRF-GUBZILKMSA-N Met-Pro-Asn Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O MPCKIRSXNKACRF-GUBZILKMSA-N 0.000 description 1
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- KZKVVWBOGDKHKE-QTKMDUPCSA-N Met-Thr-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 KZKVVWBOGDKHKE-QTKMDUPCSA-N 0.000 description 1
- AOLKTFKKSSMRTA-WDSOQIARSA-N Met-Trp-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N AOLKTFKKSSMRTA-WDSOQIARSA-N 0.000 description 1
- FAKYXUOUQCRGMO-FDARSICLSA-N Met-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCSC)N FAKYXUOUQCRGMO-FDARSICLSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- PHJUFDQVVKVOPU-ULQDDVLXSA-N Phe-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=CC=C1)N PHJUFDQVVKVOPU-ULQDDVLXSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- OKQQWSNUSQURLI-JYJNAYRXSA-N Phe-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N OKQQWSNUSQURLI-JYJNAYRXSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- APXXVISUHOLGEE-ILWGZMRPSA-N Phe-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=CC=C4)N)C(=O)O APXXVISUHOLGEE-ILWGZMRPSA-N 0.000 description 1
- WDOCBGZHAQQIBL-IHPCNDPISA-N Phe-Trp-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 WDOCBGZHAQQIBL-IHPCNDPISA-N 0.000 description 1
- BTAIJUBAGLVFKQ-BVSLBCMMSA-N Phe-Trp-Val Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C(C)C)C(O)=O)C1=CC=CC=C1 BTAIJUBAGLVFKQ-BVSLBCMMSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 1
- IPVPGAADZXRZSH-RNXOBYDBSA-N Phe-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IPVPGAADZXRZSH-RNXOBYDBSA-N 0.000 description 1
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- FKKHDBFNOLCYQM-FXQIFTODSA-N Pro-Cys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O FKKHDBFNOLCYQM-FXQIFTODSA-N 0.000 description 1
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 1
- OGRYXQOUFHAMPI-DCAQKATOSA-N Pro-Cys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O OGRYXQOUFHAMPI-DCAQKATOSA-N 0.000 description 1
- ZBAGOWGNNAXMOY-IHRRRGAJSA-N Pro-Cys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZBAGOWGNNAXMOY-IHRRRGAJSA-N 0.000 description 1
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101710110363 Putative adenosine/adenine deaminase Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 1
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 1
- 108091027568 Single-stranded nucleotide Proteins 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- XIHGJKFSIDTDKV-LYARXQMPSA-N Thr-Phe-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIHGJKFSIDTDKV-LYARXQMPSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- AXEJRUGTOJPZKG-XGEHTFHBSA-N Thr-Val-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O AXEJRUGTOJPZKG-XGEHTFHBSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 1
- LHHDBONOFZDWMW-AAEUAGOBSA-N Trp-Asp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LHHDBONOFZDWMW-AAEUAGOBSA-N 0.000 description 1
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 1
- XEHGAHOCTDKOKP-XIRDDKMYSA-N Trp-Cys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XEHGAHOCTDKOKP-XIRDDKMYSA-N 0.000 description 1
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 1
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 1
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- FEZASNVQLJQBHW-CABZTGNLSA-N Trp-Gly-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O)=CNC2=C1 FEZASNVQLJQBHW-CABZTGNLSA-N 0.000 description 1
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 1
- NOBINHCGDUHOBV-NAZCDGGXSA-N Trp-His-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NOBINHCGDUHOBV-NAZCDGGXSA-N 0.000 description 1
- OCCYDHCUKXRPSJ-SXNHZJKMSA-N Trp-Ile-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OCCYDHCUKXRPSJ-SXNHZJKMSA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 1
- YTYHAYZPOARHAP-HOCLYGCPSA-N Trp-Lys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N YTYHAYZPOARHAP-HOCLYGCPSA-N 0.000 description 1
- OWSRIUBVJOQHNY-IHPCNDPISA-N Trp-Lys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N OWSRIUBVJOQHNY-IHPCNDPISA-N 0.000 description 1
- KWTRGSQOQHZKIA-PMVMPFDFSA-N Trp-Lys-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CCCCN)C(O)=O)C1=CC=C(O)C=C1 KWTRGSQOQHZKIA-PMVMPFDFSA-N 0.000 description 1
- BUWIKRJTARQGNZ-IHPCNDPISA-N Trp-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BUWIKRJTARQGNZ-IHPCNDPISA-N 0.000 description 1
- UQHPXCFAHVTWFU-BVSLBCMMSA-N Trp-Phe-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UQHPXCFAHVTWFU-BVSLBCMMSA-N 0.000 description 1
- GNCPKOZDOCQRAF-BPUTZDHNSA-N Trp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GNCPKOZDOCQRAF-BPUTZDHNSA-N 0.000 description 1
- HHPSUFUXXBOFQY-AQZXSJQPSA-N Trp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O HHPSUFUXXBOFQY-AQZXSJQPSA-N 0.000 description 1
- UOXPLPBMEPLZBW-WDSOQIARSA-N Trp-Val-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 UOXPLPBMEPLZBW-WDSOQIARSA-N 0.000 description 1
- BABINGWMZBWXIX-BPUTZDHNSA-N Trp-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BABINGWMZBWXIX-BPUTZDHNSA-N 0.000 description 1
- WGBFZZYIWFSYER-BVSLBCMMSA-N Trp-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N WGBFZZYIWFSYER-BVSLBCMMSA-N 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 1
- IUQDEKCCHWRHRW-IHPCNDPISA-N Tyr-Asn-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IUQDEKCCHWRHRW-IHPCNDPISA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 1
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 1
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- FJBCEFPCVPHPPM-STECZYCISA-N Tyr-Ile-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O FJBCEFPCVPHPPM-STECZYCISA-N 0.000 description 1
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- SCZJKZLFSSPJDP-ACRUOGEOSA-N Tyr-Phe-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SCZJKZLFSSPJDP-ACRUOGEOSA-N 0.000 description 1
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 1
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- AKRHKDCELJLTMD-BVSLBCMMSA-N Tyr-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N AKRHKDCELJLTMD-BVSLBCMMSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- JOQSQZFKFYJKKJ-GUBZILKMSA-N Val-Arg-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JOQSQZFKFYJKKJ-GUBZILKMSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 1
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 1
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 230000037437 driver mutation Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010056787 lysyl-arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010059573 lysyl-lysyl-glycyl-glutamic acid Proteins 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000007758 minimum essential medium Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 230000004144 purine metabolism Effects 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/503—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses
- C12N9/506—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses derived from RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/85—Fusion polypeptide containing an RNA binding domain
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21111—Aqualysin 1 (3.4.21.111)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/22—Cysteine endopeptidases (3.4.22)
- C12Y304/22044—Nuclear-inclusion-a endopeptidase (3.4.22.44)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Virology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mycology (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
오프-표적 돌연변이가 감소되거나 또는 전무한 염기 편집을 수행하는데 유용한 융합 단백질 및 관련 분자를 제공한다. 융합 단백질은 핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 핵염기 디아미나제 억제성 도메인을 포함하는 제2 단편, 및 제1 단편 및 제2 단편 사이의 프로테아제 절단 부위를 포함할 수 있다. 또한 안정성이 개선된 프라임 편집 가이드 RNA를 포함하는 개선된 프라임 편집 시스템이 제공된다.
Description
게놈 편집은 조작된 뉴클레아제 (분자 가위)를 사용하여 살아있는 유기체의 게놈에 DNA를 삽입, 결실 또는 치환시키는 유전자 조작의 한 유형이다. 세포 및 살아있는 유기체의 게놈을 유전자 조작하기 위해 게놈 편집 도구를 이용하는 것은 생명 과학 연구, 생명공학/농업 기술 개발 및 가장 중요하게는 약학/임상 혁신에서 광범위한 적용분야를 갖는다. 예를 들어, 게놈 편집은 유전자 질환의 근간이 되고 살아있는 유기체에서 이들 질환의 완전한 치유를 이끄는 드라이버 돌연변이를 교정하는데 사용될 수 있다. 게놈 편집은 또한 작물의 게놈을 조작하고, 작물의 수율을 증가시키고, 환경 오염 또는 병원체 감염에 대해 작물 내성을 부여하는데 사용될 수 있다. 또한, 정확한 게놈 편집을 통한 미생물 게놈 형질전환은 재생가능한 생물-에너지의 개발에서 매우 중요하다.
CRISPR/Cas (군집된 규칙적으로 산재된 짧은 회문식 반복부 (Clustered regularly interspaced short palindromic repeats)/CRISPR-연관 단백질) 시스템은 이의 유례없는 편집 효율, 편이성 및 살아있는 유기체에서 잠재적 적용성에 대한 이의 개념 때문에 가장 강력한 게놈 편집 도구였다. 가이드 RNA (gRNA)에 의해 유도되어, Cas 뉴클레아제는 다양한 세포 (세포주 및 살아있는 유기체 유래 세포 둘 모두) 내 표적화된 게놈 부위에서 DNA 이중 가닥 파손 (DSB)을 생성시킬 수 있다. 그 다음으로 이들 DSB는 바람직한 게놈 편집을 수행하는데 이용될 수 있는 내생성 DNA 복구 시스템을 통해서 복구된다.
일반적으로, 2종의 주요 DNA 복구 경로는 DSB, 비-상동성 말단 결합 (NHEJ) 및 상동성-지정 복구 (HDR)를 통해 활성화될 수 있다. NHEJ는 DSB 주변 게놈 DNA 영역에 무작위 삽입/결실 (indel)을 도입시킬 수 있어서, 오픈 리딩 프레임 (ORF) 이동 및 궁극적으로 유전자 불활성화를 야기시킬 수 있다. 대조적으로, HDR이 촉발될 때, 표적 부위에서 게놈 DNA 서열은 유전자 돌연변이의 교정을 일으킬 수 있는, 상동성 재조합 기전을 통해서 외생성 도너 DNA 주형의 서열로 치환될 수 있다. 그러나, HDR-매개 유전자 교정의 실제 효율이 낮은데 (정상적으로 < 5%) 상동성 재조합의 발생은 세포 유형-특이적이고 세포 주기-의존적이고 NHEJ가 HDR에 비해서 더 빈번하게 촉발되기 때문이다. 그러므로 HDR의 상대적으로 낮은 효율은 정밀 유전자 요법 (질환-구동 유전자 교정) 분야에서 CRISRP/Cas 게놈 편집 도구의 번역을 제한한다.
CRISPR/Cas 시스템을 APOBEC (apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like) AID (activation-induced cytidine deaminase) 패밀리와 통합시키는 염기 편집자 (BE)는 CRISPR/Cas-매개 유전자 교정의 효율을 상당히 증강시킨 것이 최근에 개발되었다. Cas9 닉카제 (nCas9) 또는 촉매적 데드 Cpf1 (dCas12a로도 공지된 dCpf1)과의 융합을 통해서, APOBEC/AID 패밀리 구성원의 시토신 (C) 탈아미노화 활성은 게놈 내 표적 염기로 고의적으로 유도시킬 수 있고 이들 염기에서 C에서 티민 (T)으로의 치환을 촉매할 수 있다.
그러나, APOBEC/AID 패밀리 구성원은 단일 가닥 DNA (ssDNA) 영역 내 C에서 T로의 염기 치환 돌연변이를 유도시킬 수 있으므로, 현행 염기 편집 시스템의 특이성이 손상되어서, 예를 들어, 치료 목적으로 인간 질환에서 일어나는 T에서 C로의 돌연변이를 복원시키기 위해 BE를 사용하는 적용성을 제한한다. 그런 이유로, 다른 ssDNA 영역에서 C에서 T 돌연변이를 초래하지 않지만, 표적 영역 내 시토신을 특이적으로 편집할 수 있는 신규 BE의 생성이 바람직하다. 이러한 신규 BE는 다양한 살아있는 유기체에서 보다 특이적인 염기 편집을 수행할 수 있게 할 것이다. 중요한 것은, 이러한 BE의 높은 특이성이 특히 질환-관련 T에서 C 돌연변이의 복원을 포함한 유전자 요법에서, 잠재적 임상 해석을 촉진하게 될 것이다.
일부 구현예에서, 본 개시는 현재 염기 편집자에 일반적인 오프-표적 돌연변이의 감소 또는 없음을 야기시키는 게놈 편집에 유용한 염기 편집자를 제공한다. 일정 구현예에서, 핵염기 디아미나제 억제제는 게놈 편집에 관여되는 핵염기 디아미나제에 절단가능하게 융합된다. 핵염기 디아미나제 억제제의 존재 하에서, 핵염기 디아미나제는 뉴클레오티드 분자와 반응할 수 없다 (덜 반응할 수 있다). 표적 편집 위치에서, 핵염기 디아미나제 억제제는 절단되어 이후에 바람직하게 편집을 수행할 수 있는 완전하게 활성인 핵염기 디아미나제를 방출할 수 있다.
따라서, 일 구현예에서, 핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 핵염기 디아미나제 억제제를 포함하는 제2 단편, 및 제1 단편 및 제2 단편 사이의 프로테아제 절단 부위를 포함하는 융합 단백질을 제공한다.
일부 구현예에서, 핵염기 디아미나제는 아데노신 디아미나제이다. 일부 구현예에서, 아데노신 디아미나제는 tRNA-특이적 아데노신 디아미나제 (TadA), 아데노신 디아미나제 tRNA 특이적 1 (ADAT1), 아데노신 디아미나제 tRNA 특이적 2 (ADAT2), 아데노신 디아미나제 tRNA 특이적 3 (ADAT3), 아데노신 디아미나제 RNA 특이적 B1 (ADARB1), 아데노신 디아미나제 RNA 특이적 B2 (ADARB2), 아데노신 모노포스페이트 디아미나제 1 (AMPD1), 아데노신 모노포스페이트 디아미나제 2 (AMPD2), 아데노신 모노포스페이트 디아미나제 3 (AMPD3), 아데노신 디아미나제 (ADA), 아데노신 디아미나제 2 (ADA2), 아데노신 디아미나제 유사 (ADAL), 아데노신 디아미나제 도메인 함유 1 (ADAD1), 아데노신 디아미나제 도메인 함유 2 (ADAD2), 아데노신 디아미나제 RNA 특이적 (ADAR) 및 아데노신 디아미나제 RNA 특이적 B1 (ADARB1)로 이루어진 군으로부터 선택된다.
일부 구현예에서, 핵염기 디아미나제는 시티딘 디아미나제이다. 일부 구현예에서, 시티딘 디아미나제는 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)로 이루어진 군으로부터 선택된다. 일부 구현예에서, 시티딘 디아미나제는 인간 또는 마우스 시티딘 디아미나제이다. 일부 구현예에서, 촉매 도메인은 마우스 A3 시티딘 디아미나제 도메인 1 (CDA1) 또는 인간 A3B 시티딘 디아미나제 도메인 2 (CDA2)이다.
일부 구현예에서, 핵염기 디아미나제 억제제는 핵염기 디아미나제의 억제성 도메인이다. 일부 구현예에서, 핵염기 디아미나제 억제제는 시티딘 디아미나제의 억제성 도메인이다. 일부 구현예에서, 핵염기 디아미나제 억제제는 아데노신 디아미나제의 억제성 도메인이다. 일부 구현예에서, 핵염기 디아미나제 억제제는 SEQ ID NO: 1-2 및 표 1 및 2 (SEQ ID NO: 48-135)로부터 선택되는 아미노산 서열, 또는 SEQ ID NO: 1-2 및 표 1 및 2로부터 선택되는 임의의 아미노산 서열과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 핵염기 디아미나제 억제제는 SEQ ID NO:1의 아미노산 서열, SEQ ID NO:1의 아미노산 잔기 AA76-AA149 또는 SEQ ID NO:2의 아미노산 서열을 포함한다.
일부 구현예에서, 제1 단편은 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 더 포함한다. 일부 구현예에서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, xSpCas9, SpCas9-NG, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택된다.
일부 구현예에서, 프로테아제 절단 부위는 TuMV 프로테아제, PPV 프로테아제, PVY 프로테아제, ZIKV 프로테아제 및 WNV 프로테아제로 이루어진 군으로부터 선택되는 프로테아제의 프로테아제 절단 부위이다.
일부 구현예에서, 프로테아제 절단 부위는 자가-절단 부위이다. 일부 구현예에서, 프로테아제 절단 부위는 TEV 프로테아제 절단 부위이다. 일부 구현예에서, 융합 단백질은 TEV 프로테아제 또는 이의 단편을 포함하는 제3 단편을 더 포함한다. 일부 구현예에서, 제3 단편은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편을 포함한다.
다른 구현예에서, 또한, 시티딘 디아미나제 또는 이의 촉매 도메인, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 제1 TEV 프로테아제 단편을 포함하는 제1 단편, 시티딘 디아미나제 억제제, 및 TEV 제1 단편 및 제2 단편 사이의 프로테아제 절단 부위를 포함하는 제2 단편을 포함하는 융합 단백질로서, 제1 TEV 프로테아제 단편은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 것인, 융합 단백질이 제공된다.
일부 구현예에서, 융합 단백질은 우라실 글리코실라제 억제제 (UGI)를 더 포함한다. 일부 구현예에서, 시티딘 디아미나제 억제제, TEV 프로테아제 절단 부위, 시티딘 디아미나제 또는 이의 촉매 도메인, Cas 단백질, 및 제1 TEV 프로테아제 단편은 N-말단에서 C-말단으로 배열된다. 일부 구현예에서, 제1 TEV 프로테아제 단편은 TEV 프로테아제의 N-말단 도메인 (SEQ ID NO:3) 또는 C-말단 도메인 (SEQ ID NO:4)이다. 일부 구현예에서, TEV 프로테아제 절단 부위는 SEQ ID NO:5의 아미노산 잔기를 갖는다.
일 구현예에서, 세포 내 표적 부위에서 게놈 편집을 수행하기 위한 방법이 더 제공되고, 방법은 세포로 (a) 본 개시의 융합 단백질, (b) 표적 부위를 표적화하는 가이드 RNA 또는 표적 부위를 표적화하는 crRNA로서, 태그 서열을 더 포함하는 것인 가이드 RNA 또는 crRNA, 및 (c) 태그 서열에 결합할 수 있는 RNA 인식 펩티드에 커플링된 제2 TEV 프로테아제 단편을 도입시키는 단계를 포함한다.
일부 구현예에서, 하나 이상의 분자는 그 분자를 코딩하는 폴리뉴클레오티드에 의해 세포로 도입된다. 일부 구현예에서, 제1 TEV 프로테아제 단편 및 제2 TEV 프로테아제 단편은, 상호작용할 때, TEV 프로테아제 절단 부위를 절단시킬 수 있다. 일부 구현예에서, 제2 TEV 프로테아제 단편은 RNA 인식 펩티드에 융합된다.
일부 구현예에서, 태그 서열은 MS2 서열 (SEQ ID NO:16)을 포함한다. 일부 구현예에서, RNA 인식 펩티드는 MS2 외피 단백질 (MCP, SEQ ID NO:22)을 포함한다. 일부 구현예에서, 태그 서열은 PP7 서열 (SEQ ID NO:18)을 포함하고 RNA 인식 펩티드는 PP7 외피 단백질 (PCP, SEQ ID NO: 23)을 포함하거나, 또는 태그 서열은 boxB 서열 (SEQ ID NO:20)을 포함하고 RNA 인식 펩티드는 boxB 외피 단백질 (N22p, SEQ ID NO:24)을 포함한다.
또한 일 구현예에서, (a) 본 개시의 융합 단백질, 및 (b) RNA 서열에 결합할 수 있는 RNA 인식 펩티드에 커플링된 제2 TEV 프로테아제 단편을 포함하는, 유전자 편집을 수행하기 위한 키트 또는 패키지가 제공된다.
또 다른 구현예는 제1 시티딘 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 및 제2 시티딘 디아미나제의 억제성 도메인을 포함하는 제2 단편을 포함하는 융합 단백질을 제공하고, 제1 시티딘 디아미나제는 제2 시티딘 디아미나제와 동일하거나 또는 상이하다.
다른 구현예에서, 핵염기 디아미나제 또는 이의 촉매 도메인, 핵염기 디아미나제 억제제, 제1 RNA 인식 펩티드, 및 핵염기 디아미나제 또는 이의 촉매 도메인 및 핵염기 디아미나제 억제제 사이에 TEV 프로테아제 절단 부위를 포함하는 제1 단편을 포함하는 융합 단백질이 제공된다.
일부 구현예에서, 융합 단백질은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편, 및 제2 RNA 인식 펩티드를 포함하는 제2 단편을 더 포함한다. 일부 구현예에서, 융합 단백질은 제1 단편 및 제2 단편 사이에 자가-절단 부위를 더 포함한다.
일부 구현예에서, 융합 단백질은 제2 TEV 프로테아제 단편을 포함하는 제3 단편을 더 포함하고, 제1 TEV 프로테아제 단편은 제2 TEV 프로테아제 단편의 존재 하에서 TEV 프로테아제 부위를 절단할 수 있다. 일부 구현예에서, 융합 단백질은 제2 단편 및 제3 단편 사이의 제2 자가-절단 부위를 더 포함하고, 제2 자가-절단 부위의 절단 시에, 융합 단백질은 임의의 RNA 인식 펩티드에 융합되지 않은 제2 TEV 프로테아제 단편을 방출한다.
일 구현예에서, 또한 제1 PAM 부위에 근접한 표적 핵산 서열에 상보성인 서열을 갖는 제1 스페이서를 포함하는 표적 단일 가이드 RNA, 제2 PAM 부위에 근접한 제2 핵산 서열에 상보성인 서열을 갖는 제2 스페이서를 포함하는 헬퍼 단일 가이드 RNA, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 핵염기 디아미나제를 포함하는 이중 가이드 RNA 시스템이 제공되고, 제2 PAM 부위는 제1 PAM 부위로부터 34 내지 91 염기이다. 일부 구현예에서, 제2 스페이서는 8-15 염기 길이이다. 일부 구현예에서, 제2 스페이서는 9-12 염기 길이이다.
일 구현예에서, 5'에서 3' 방향으로, 제1 스템 루프 부분, 제2 스템 루프 부분, 제3 스템 루프 부분, 및 제4 스템 루프 부분을 포함하는 스캐폴드를 포함하는 가이드 RNA를 제공하고, 제3 스템 루프는 그 안에 5 염기쌍을 포함한다. 다른 구현예에서, 본 개시는 위치 45 및 55의 염기 사이에 염기쌍을 도입시켜서 SEQ ID NO:31로부터 유래된 스캐폴드를 포함하는 가이드 RNA를 제공한다. 일부 구현예에서, 스캐폴드는 SEQ ID NO:32-43으로 이루어진 군으로부터 선택되는 서열을 포함한다. 일부 구현예에서, 가이드 RNA는 적어도 100, 또는 120 뉴클레오티드 길이이다.
다른 구현예는 세포 내 표적 부위에서 유전자 편집을 수행하기 위한 방법을 제공하고, 방법은 세포로, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 코딩하는 제1 구성체가 밀봉된 제1 바이러스 입자, 및 RNA 인식 펩티드에 융합된 역전사효소를 코딩하는 제2 구성체가 밀봉된 제2 바이러스 입자를 도입시키는 단계를 포함한다.
일부 구현예에서, 제2 구성체는 RNA 인식 펩티드가 결합되는 RNA 인식 부위를 포함하는 가이드 RNA를 더 코딩한다. 일부 구현예에서, Cas 단백질은 SpCas9-NG (SEQ ID NO:46) 또는 xSpCas9 (SEQ ID NO:47)이다.
본 개시의 융합 단백질을 코딩하는 폴리뉴클레오티드, 폴리뉴클레오티드를 함유하는 구성체, 폴리뉴클레오티드 또는 구성체를 함유하는 세포, 및 임의의 상기를 포함하는 조성물이 제한없이 또한 제공된다.
도 1A-C: Sa-SITE31 ssDNA 영역 내 현행 BE에 의해 야기된 비의도적 염기 치환. 1A: Sa-sgSITE31 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE31의 공-발현을 예시하는 개략도. 1B: Sa-sgSITE31을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드 또는 빈 벡터의 공-형질감염을 예시하는 개략도. 1C: BE3 및 hA3A-BE3에 의해 초래된 비의도적 염기 치환. 점선 박스는 Sa-sgSITE31 표적 부위에서의 비의도적 염기 치환의 위치를 나타낸다.
도 2A-C: Sa-SITE42 ssDNA 영역내 현형 BE에 의해 초래된 비의도적 염기 치환. 2A: Sa-sgSITE42 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE42의 공-발현을 예시하는 개략도. 2B: Sa-sgSITE42를 발현하는 플라스미드 SaD10A 닉카제를 발현하는 플라스미드와 BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드 또는 빈 벡터의 공-형질감염을 예시하는 개략도. 2C: BE3 및 hA3A-BE3에 의해 초래된 비의도적 염기 치환. 점선 박스는 Sa-sgSITE42 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다.
도 3A-C: Sa-F1 ssDNA 영역 내 현재 BE에 의해 초래된 비의도적 염기 치환. 3A: Sa-sgF1 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgF1의 공-발현을 예시하는 개략도. 3B: Sa-sgF1을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드 또는 빈 벡터의 공-형질감염을 예시하는 개략도. 3C: BE3 및 hA3A-BE3에 의해 초래된 비의도적 염기 치환. 점선 박스는 Sa-sgF1 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다.
도 4A-C: mA3CDA2는 TET1 영역 내 C에서 T 염기 편집 활성을 억제한다. 4A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 4B: sgTET1을 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 4C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 5A-C: mA3CDA2는 RNF2 영역 내 C에서 T 염기 편집 활성을 억제한다. 5A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 5B: sgRNF2를 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 5C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 6A-C: mA3CDA2는 SITE3 영역 내 C에서 T 염기 편집 활성을 억제한다. 6A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 6B: sgSITE3을 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 6C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 7A-C: hA3BCDA1은 TET1 영역에서 C에서 T 염기 편집 활성을 억제한다. 7A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 7B: sgTET1을 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 7C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 8A-C: hA3BCDA1은 RNF2 영역 내 C에서 T 염기 편집 활성을 억제한다. 8A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 8B: sgRNF2를 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 8C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 9A-C: hA3BCDA1은 SITE3 영역 내 C에서 T 염기 편집 활성을 억제한다. 9A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 9B: sgSITE3을 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 9C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 10A-C: FANCF 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 10A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 10B: sgFANCF를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 10C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgFANCF 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 11A-C: SITE2 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 11A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 11B: sgSITE2를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196를 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 11C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgSITE2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 12A-C: SITE4 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 12A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 12B: sgSITE4를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 12C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgSITE4 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 13A-B: FANCF 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 13A: sgFANCF를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 13B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgFANCF 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 14A-B: SITE2 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 14A: sgSITE2를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 14B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgSITE2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 15A-B: SITE4 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 15A: sgSITE4를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 15B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgSITE4 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 16A-B: BEsafe 및 BE3 또는 hA3A-BE3의 작업 과정을 예시하는 개략도. 16A: BEsafe는 온-표적 부위에서 C에서 T 염기 편집을 유도하고 미관련 ssDNA 영역 내에서 돌연변이 초래를 피한다. 16B: BE3 또는 hA3A-BE3은 온-표적 부위에서 C에서 T 염기 편집을 유도하지만 미관련 ssDNA 영역 내에서 C에서 T 돌연변이를 초래한다.
도 17A-D: 미관련 Sa-SITE31 ssDNA 영역 내 및 TET1 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 17A: Sa-sgSITE31 온-표적 부위에서 ssDNA의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE31의 공-발현을 예시하는 개략도. 17B: Sa-sgSITE31을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgTET1을 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgTET1 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgTET1 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 17C: 미관련 Sa-SITE31 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgSITE31 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 17D: TET1 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율 비교. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 18A-D: 미관련 Sa-SITE32 ssDNA 영역 내 및 RNF2 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 18A: Sa-sgSITE32 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE32의 공-발현을 예시하는 개략도. 18B: Sa-sgSITE32를 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgRNF2를 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgRNF2 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgRNF2 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 18C: 미관련 Sa-SITE32 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgSITE32 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 18D: RNF2 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율의 비교. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 19A-D: 미관련 Sa-F1 ssDNA 영역 내 및 SITE3 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 19A: Sa-sgF1 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgF1의 공-발현을 예시하는 개략도. 19B: Sa-sgF1을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgSITE3을 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgSITE3 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgSITE3 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 19C: 미관련 Sa-F1 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgF1 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 19D: SITE3 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율의 비교. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 20a-f: 시티딘 디아미나제 억제제의 확인. 20a: 개략도는 단일- 또는 이중- CDA 도메인을 갖는 APOBEC 패밀리 구성원 (좌측) 및 이중-도메인 APOBEC의 1 또는 2개 CDA로 구축된 쌍형성 염기 편집자 (우측)를 예시한다. 20b: 하나의 대표적인 게놈 유전자좌에서 표시된 BE에 의해 유도된 편집 빈도. 20c: 단일-CDA-함유 BE에 의해 유도된 것을 100%로 설정한, 정규화 편집 빈도의 통계 분석. (b)에 도시된 26개 편집가능 시토신 부위에서 3회 독립 실험으로부터 n = 78. 20d: 개략도는 mA3CDA1-nSpCas9-BE의 N-말단과 상이한 시티딘 디아미나제 억제제 (CDI)의 접합을 예시한다. 20e: 하나의 대표적인 게놈 유전자좌에서 표시된 BE에 의해 유도된 편집 빈도. 20f: CDI 없는 BE에 의해 유도된 것을 100%로 설정한, 정규화 편집 빈도의 통계 분석. (e)에 도시된 19개 편집가능한 시토신 부위에서 3회 독립 실험으로부터 n = 57. (b), (e) 평균 ± s.d. 는 3회 독립 실험에 의한다. NT, 비-형질감염 대조군. (c), (f) P 값, 단측 스튜던트 t-검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 21a-f: mA3CDI의 접합은 sgRNA-독립적 OTss 부위에서 비의도적 염기 편집을 감소시켰다. 21a: 개략도는 BE3은 C에서 T 돌연변이를 유도하지만, CDI-접합된 iBE1은 sgRNA-독립적 OTss 부위에서 휴지 상태로 남아 있는다는 것을 예시한다. 21b: nSaCas9-생성된 SSB에 의해 촉발된 ssDNA 영역 내 BE3 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 21c: BE3에 의해 유도된 것을 100%로 설정한, (b)에 도시된 4개 ssDNA 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 12. 21d: 개략도는 CDI의 sgRNA-매개 절단이 온-표적 부위에서 iBE의 편집 활성을 복원시킨다는 것을 예시한다. 21e: 온-표적 부위에서 BE3 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 21f: BE3에 의해 유도된 것을 100%로 설정한, (e)에 도시된 4개 온-표적 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 12. (c), (f) 평균 ± s.d.는 3회 독립 실험에 의하였다. (d), (g) P 값, 단측 스튜던트 t 검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 22a-e: neSpCas9는 OTsg 부위에서 iBE1의 비의도적 편집을 감소시켰다. 22a: 개략도는 iBE2가 아닌 iBE1이 sgRNA와 부분적으로 상보성인 OTsg 부위에서 C에서 T 편집을 유도시킨다는 것을 예시한다. 22b: 표시된 OTsg 부위에서 표적화-특이성-개선된 iBE 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 22c: iBE1에 의해 유도된 것을 100%로 설정한, (b)에서 사용된 2개 sgRNA에 대한 OTsg 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 6. 22d: 온-표적 부위에서 표적화-특이성-개선된 iBE 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 22e: iBE1에 의해 유도된 것을 100%로 설정한, (d)에 도시된 6개 온-표적 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 18. (b), (d) 평균 ± s.d.는 3회 독립 실험에 의하였다. (c), (e) P 값, 단측 스튜던트 t 검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 23a-e: hA3A-BE3 및 iBE2에 의해 유도된 염기 편집의 비교. 23a: 대표적인 OTss, OTsg, 및 온-표적 부위에서 hA3A-BE3 및 iBE2에 의해 유도된 C에서 T 편집 빈도의 비교. 23b-c: hA3A-BE3에 의해 유도된 것을 100%로 설정한, (a)에서 사용된 3개 sgRNA에 대한 OTss, OTsg (b) 및 온-표적 (c) 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 9. 23d: hA3A-BE3에 의해 유도된 것을 1로 설정한, (a)에서 사용된 3개 sgRNA에 대한 OTss 및 OTsg 부위에서 총 편집 빈도에 대한 온-표적화 빈도의 정규화 비율의 통계 분석. 3회 독립 실험으로부터 n = 9. 23e: 개략도는 iBE2가 OTss 또는 OTsg 부위가 아닌 온-표적 부위에서 특이적 염기 편집을 유도하는 반면, hA3A-BE3은 온-표적 부위 및 OTss와 OTsg 부위 둘 모두에서 염기 편집을 유도한다는 것을 예시한다. (a) 평균 ± s.d.는 3회 독립 실험에 의하였다. (b-d) P 값, 단측 스튜던트 t 검정. 중앙 및 IQR이 도시된다.
도 24A-B. 개략도는 isplitBE 및 정규 염기 편집자의 작업 과정을 예시한다. 24A: isplitBE는 오직 온-표적 부위에서 C에서 T 염기 편집을 유도하고 sgRNA의 스페이서 영역에 대해 서열 유사성을 갖는 오프-표적 부위 (OTsg)에서 또는 미관련 오프-표적 ssDNA 영역 (OTss) 내에서 돌연변이의 초래를 피한다. 24B: BE3 또는 hA3A-BE3은 온-표적 부위에서 C에서 T 염기 편집을 유도하지만 OTss 및 OTsg 영역 내 C에서 T 돌연변이를 초래한다.
도 25. 온-표적 부위에서 시티딘 디아미나제 억제제 (mA3CDA2)를 제거하기 위한 상이한 전략을 예시하는 개략도.
도 26A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 EMX1-ON, Sa-SITE31-OTss 및 EMX1-OTsg 부위에서 C에서 T 편집. 26A: Sa-sgSITE31을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시하는 개략도. 26B: EMX1-ON, Sa-SITE31-OTss 및 EMX1-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온-부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서는 편집을 유도하지 않았다.
도 27A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위에서 C에서 T 편집. 27A: 개략도는 Sa-sgVEGFA-7을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시한다. 27B: FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온 (ON) 부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서 편집을 유도하지 않았다.
도 28A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 V1B-ON, Sa-SITE42-OTss 및 V1B-OTsg 부위에서 C에서 T 편집. 28A: Sa-sgSITE42를 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시하는 개략도. 28B: V1B-ON, Sa-SITE42-OTss 및 V1B-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온 (ON) 부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서 편집을 유도하지 않았다.
도 29A-C. 염기 편집 효율에 대한 헬퍼 sgRNA (hsgRNA) 및 sgRNA 사이 거리의 효과. 29A: DNTET1, EMX1 및 FANCF 부위에서 hsgRNA 및 sgRNA 사이 거리를 예시하는 개략도. 29B: 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도. 29C: hsgRNA 및 sgRNA 사이 거리의 효과 요약. 최고 염기 편집 효율에 대한 거리 범위는 hsgRNA의 PAM에서 sgRNA의 PAM 까지 -91 내지 -34 bp이다.
도 30A-C. 염기 편집 효율에 대한 hsgRNA 스페이서 길이의 효과. 30A: DNEMX1, FANCF 및 V1A 부위에서 상이한 스페이서 길이를 갖는 sgRNA 및 hsgRNA의 공-형질감염을 예시하는 개략도. 30B: hsgRNA 및 sgRNA의 표적 부위에서 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도. 30C: hsgRNA 스페이서 길이 효과의 통계 분석. 10-bp 스페이서를 갖는 hsgRNA의 사용은 hsgRNA 표적 부위에서 편집 효율을 상당히 감소시키지만 sgRNA 표적 부위에서의 편집 효율은 유지시킨다.
도 31. isplitBE-rA1 및 BE3의 편집 효율의 비교. 상이한 표적 부위에서 표시된 염기 편집자에 의해 유도된 편집 빈도.
도 32A-C. isplitBE-rA1 및 BE3에 의해 유도된 게놈-와이드 C에서 T 돌연변이의 비교. 32A: 야생형 293FT 세포 및 APOBEC3 녹아웃 293FT 세포 (293FT-A3KO)에서 mRNA 발현 수준. 32B: 염기 편집자에 의해 유도된 게놈-와이드 C에서 T 돌연변이를 결정하는 절차를 예시하는 개략도. 32C: 온-표적 편집 효율 (좌측) 및 Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-rA1에 의해 유도된 게놈-와이드 C에서 T 돌연변이의 수.
도 33A-C. isplitBE-mA3, BE3 및 hA3A-BE3-Y130F (Y130F)에 의해 유도된 전사체-와이드 C에서 U 돌연변이의 비교. 33A: Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 전사체-와이드 C에서 U 돌연변이의 수. 33B: Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 RNA C에서 U 편집 빈도. 33C: BE3 복제물 1 및 isplitBE-mA3 복제물 1에 의해 유도된 RNA C에서 U 편집의 분포.
도 34A-D. 인간 PCSK9 유전자 내 isplitBE-mA3에 의해 유도된 중지 코돈. 34A: sgRNA 및 hsgRNA와 isplitBE-mA3 및 nCas9의 공-형질감염을 예시하는 개략도. 34B-34D: 표시된 부위에서 isplitBE-mA3에 의해 유도된 편집 효율.
도 35A-B. 아데닌 염기 편집자 (ABE)의 편집 효율에 대한 mA3CDA2의 억제 효과. 35A: sgRNA, 및 mA3CDA2와 융합되거나 또는 그렇지 않은 ABE의 공-형질감염을 예시하는 개략도. 35B: RNF2 및 FANCF 부위에서 표시된 ABE에 의해 유도된 편집 효율.
도 36A-G. 프라임 편집 가이드 RNA (pegRNA)의 조작에 의해 증강된 프라임 편집. 36A: 증강된 pegRNA (epegRNA)의 스템 안정성을 증가시키기 위한 RNA 염기쌍의 변화를 예시하는 개략도. 36B: sgRNA를 닉킹하는, PE2와, pegRNA 또는 epegRNA-GC의 공-형질감염을 예시하는 개략도. 36C-36D: pegRNA 및 epegRNA-GC로 유도된 프라임 편집 효율의 비교. 36E: 증강된 pegRNA (epegRNA)의 스템 안정성을 증강시키기 위한 RNA 염기쌍의 변화를 예시하는 개략도. 36F: sgRNA를 닉킹하는, PE2와, pegRNA 또는 epegRNA-CG의 공-형질감염을 예시하는 개략도. 36G: pegRNA 및 epegRNA-CG로 유도된 프라임 편집 효율의 비교.
도 37A-B. 상이한 Cas9 단백질을 함유하는 PE의 사용에 의한 프라임 편집 시스템. 37A: sgRNA를 닉킹하는, pegRNA와 PE2-NG 또는 xPE2의 공-형질감염을 예시하는 개략도. 37B: PE2-NG 및 xPE2에 의해 유도된 프라임 편집 효율.
도 38A-C. 분할 프라임 편집 (분할-PE) 시스템. 38A: PE 및 분할-PE 시스템의 작업 과정을 예시하는 개략도. 38B: PE 및 분할-PE 시스템의 공-형질감염을 예시하는 개략도. 38C: EMX1 부위에서 PE 및 분할-PE 시스템에 의해 유도된 편집 효율.
도 39A-C. mA3CDA2 코어 영역과 다른 시티딘 디아미나제 도메인의 정렬.
도 40A-D. hA3BCDA1과 다른 시티딘 디아미나제 도메인의 정렬.
도 2A-C: Sa-SITE42 ssDNA 영역내 현형 BE에 의해 초래된 비의도적 염기 치환. 2A: Sa-sgSITE42 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE42의 공-발현을 예시하는 개략도. 2B: Sa-sgSITE42를 발현하는 플라스미드 SaD10A 닉카제를 발현하는 플라스미드와 BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드 또는 빈 벡터의 공-형질감염을 예시하는 개략도. 2C: BE3 및 hA3A-BE3에 의해 초래된 비의도적 염기 치환. 점선 박스는 Sa-sgSITE42 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다.
도 3A-C: Sa-F1 ssDNA 영역 내 현재 BE에 의해 초래된 비의도적 염기 치환. 3A: Sa-sgF1 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgF1의 공-발현을 예시하는 개략도. 3B: Sa-sgF1을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드 또는 빈 벡터의 공-형질감염을 예시하는 개략도. 3C: BE3 및 hA3A-BE3에 의해 초래된 비의도적 염기 치환. 점선 박스는 Sa-sgF1 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다.
도 4A-C: mA3CDA2는 TET1 영역 내 C에서 T 염기 편집 활성을 억제한다. 4A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 4B: sgTET1을 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 4C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 5A-C: mA3CDA2는 RNF2 영역 내 C에서 T 염기 편집 활성을 억제한다. 5A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 5B: sgRNF2를 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 5C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 6A-C: mA3CDA2는 SITE3 영역 내 C에서 T 염기 편집 활성을 억제한다. 6A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 6B: sgSITE3을 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 6C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 7A-C: hA3BCDA1은 TET1 영역에서 C에서 T 염기 편집 활성을 억제한다. 7A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 7B: sgTET1을 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 7C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 8A-C: hA3BCDA1은 RNF2 영역 내 C에서 T 염기 편집 활성을 억제한다. 8A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 8B: sgRNF2를 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 8C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 9A-C: hA3BCDA1은 SITE3 영역 내 C에서 T 염기 편집 활성을 억제한다. 9A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 9B: sgSITE3을 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 9C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 10A-C: FANCF 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 10A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 10B: sgFANCF를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 10C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgFANCF 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 11A-C: SITE2 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 11A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 11B: sgSITE2를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196를 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 11C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgSITE2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 12A-C: SITE4 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 12A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 12B: sgSITE4를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 12C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgSITE4 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 13A-B: FANCF 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 13A: sgFANCF를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 13B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgFANCF 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 14A-B: SITE2 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 14A: sgSITE2를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 14B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgSITE2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 15A-B: SITE4 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 15A: sgSITE4를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 15B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgSITE4 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 16A-B: BEsafe 및 BE3 또는 hA3A-BE3의 작업 과정을 예시하는 개략도. 16A: BEsafe는 온-표적 부위에서 C에서 T 염기 편집을 유도하고 미관련 ssDNA 영역 내에서 돌연변이 초래를 피한다. 16B: BE3 또는 hA3A-BE3은 온-표적 부위에서 C에서 T 염기 편집을 유도하지만 미관련 ssDNA 영역 내에서 C에서 T 돌연변이를 초래한다.
도 17A-D: 미관련 Sa-SITE31 ssDNA 영역 내 및 TET1 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 17A: Sa-sgSITE31 온-표적 부위에서 ssDNA의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE31의 공-발현을 예시하는 개략도. 17B: Sa-sgSITE31을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgTET1을 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgTET1 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgTET1 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 17C: 미관련 Sa-SITE31 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgSITE31 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 17D: TET1 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율 비교. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 18A-D: 미관련 Sa-SITE32 ssDNA 영역 내 및 RNF2 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 18A: Sa-sgSITE32 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE32의 공-발현을 예시하는 개략도. 18B: Sa-sgSITE32를 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgRNF2를 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgRNF2 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgRNF2 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 18C: 미관련 Sa-SITE32 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgSITE32 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 18D: RNF2 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율의 비교. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 19A-D: 미관련 Sa-F1 ssDNA 영역 내 및 SITE3 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 19A: Sa-sgF1 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgF1의 공-발현을 예시하는 개략도. 19B: Sa-sgF1을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgSITE3을 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgSITE3 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgSITE3 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 19C: 미관련 Sa-F1 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgF1 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 19D: SITE3 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율의 비교. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 20a-f: 시티딘 디아미나제 억제제의 확인. 20a: 개략도는 단일- 또는 이중- CDA 도메인을 갖는 APOBEC 패밀리 구성원 (좌측) 및 이중-도메인 APOBEC의 1 또는 2개 CDA로 구축된 쌍형성 염기 편집자 (우측)를 예시한다. 20b: 하나의 대표적인 게놈 유전자좌에서 표시된 BE에 의해 유도된 편집 빈도. 20c: 단일-CDA-함유 BE에 의해 유도된 것을 100%로 설정한, 정규화 편집 빈도의 통계 분석. (b)에 도시된 26개 편집가능 시토신 부위에서 3회 독립 실험으로부터 n = 78. 20d: 개략도는 mA3CDA1-nSpCas9-BE의 N-말단과 상이한 시티딘 디아미나제 억제제 (CDI)의 접합을 예시한다. 20e: 하나의 대표적인 게놈 유전자좌에서 표시된 BE에 의해 유도된 편집 빈도. 20f: CDI 없는 BE에 의해 유도된 것을 100%로 설정한, 정규화 편집 빈도의 통계 분석. (e)에 도시된 19개 편집가능한 시토신 부위에서 3회 독립 실험으로부터 n = 57. (b), (e) 평균 ± s.d. 는 3회 독립 실험에 의한다. NT, 비-형질감염 대조군. (c), (f) P 값, 단측 스튜던트 t-검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 21a-f: mA3CDI의 접합은 sgRNA-독립적 OTss 부위에서 비의도적 염기 편집을 감소시켰다. 21a: 개략도는 BE3은 C에서 T 돌연변이를 유도하지만, CDI-접합된 iBE1은 sgRNA-독립적 OTss 부위에서 휴지 상태로 남아 있는다는 것을 예시한다. 21b: nSaCas9-생성된 SSB에 의해 촉발된 ssDNA 영역 내 BE3 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 21c: BE3에 의해 유도된 것을 100%로 설정한, (b)에 도시된 4개 ssDNA 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 12. 21d: 개략도는 CDI의 sgRNA-매개 절단이 온-표적 부위에서 iBE의 편집 활성을 복원시킨다는 것을 예시한다. 21e: 온-표적 부위에서 BE3 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 21f: BE3에 의해 유도된 것을 100%로 설정한, (e)에 도시된 4개 온-표적 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 12. (c), (f) 평균 ± s.d.는 3회 독립 실험에 의하였다. (d), (g) P 값, 단측 스튜던트 t 검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 22a-e: neSpCas9는 OTsg 부위에서 iBE1의 비의도적 편집을 감소시켰다. 22a: 개략도는 iBE2가 아닌 iBE1이 sgRNA와 부분적으로 상보성인 OTsg 부위에서 C에서 T 편집을 유도시킨다는 것을 예시한다. 22b: 표시된 OTsg 부위에서 표적화-특이성-개선된 iBE 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 22c: iBE1에 의해 유도된 것을 100%로 설정한, (b)에서 사용된 2개 sgRNA에 대한 OTsg 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 6. 22d: 온-표적 부위에서 표적화-특이성-개선된 iBE 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 22e: iBE1에 의해 유도된 것을 100%로 설정한, (d)에 도시된 6개 온-표적 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 18. (b), (d) 평균 ± s.d.는 3회 독립 실험에 의하였다. (c), (e) P 값, 단측 스튜던트 t 검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 23a-e: hA3A-BE3 및 iBE2에 의해 유도된 염기 편집의 비교. 23a: 대표적인 OTss, OTsg, 및 온-표적 부위에서 hA3A-BE3 및 iBE2에 의해 유도된 C에서 T 편집 빈도의 비교. 23b-c: hA3A-BE3에 의해 유도된 것을 100%로 설정한, (a)에서 사용된 3개 sgRNA에 대한 OTss, OTsg (b) 및 온-표적 (c) 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 9. 23d: hA3A-BE3에 의해 유도된 것을 1로 설정한, (a)에서 사용된 3개 sgRNA에 대한 OTss 및 OTsg 부위에서 총 편집 빈도에 대한 온-표적화 빈도의 정규화 비율의 통계 분석. 3회 독립 실험으로부터 n = 9. 23e: 개략도는 iBE2가 OTss 또는 OTsg 부위가 아닌 온-표적 부위에서 특이적 염기 편집을 유도하는 반면, hA3A-BE3은 온-표적 부위 및 OTss와 OTsg 부위 둘 모두에서 염기 편집을 유도한다는 것을 예시한다. (a) 평균 ± s.d.는 3회 독립 실험에 의하였다. (b-d) P 값, 단측 스튜던트 t 검정. 중앙 및 IQR이 도시된다.
도 24A-B. 개략도는 isplitBE 및 정규 염기 편집자의 작업 과정을 예시한다. 24A: isplitBE는 오직 온-표적 부위에서 C에서 T 염기 편집을 유도하고 sgRNA의 스페이서 영역에 대해 서열 유사성을 갖는 오프-표적 부위 (OTsg)에서 또는 미관련 오프-표적 ssDNA 영역 (OTss) 내에서 돌연변이의 초래를 피한다. 24B: BE3 또는 hA3A-BE3은 온-표적 부위에서 C에서 T 염기 편집을 유도하지만 OTss 및 OTsg 영역 내 C에서 T 돌연변이를 초래한다.
도 25. 온-표적 부위에서 시티딘 디아미나제 억제제 (mA3CDA2)를 제거하기 위한 상이한 전략을 예시하는 개략도.
도 26A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 EMX1-ON, Sa-SITE31-OTss 및 EMX1-OTsg 부위에서 C에서 T 편집. 26A: Sa-sgSITE31을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시하는 개략도. 26B: EMX1-ON, Sa-SITE31-OTss 및 EMX1-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온-부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서는 편집을 유도하지 않았다.
도 27A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위에서 C에서 T 편집. 27A: 개략도는 Sa-sgVEGFA-7을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시한다. 27B: FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온 (ON) 부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서 편집을 유도하지 않았다.
도 28A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 V1B-ON, Sa-SITE42-OTss 및 V1B-OTsg 부위에서 C에서 T 편집. 28A: Sa-sgSITE42를 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시하는 개략도. 28B: V1B-ON, Sa-SITE42-OTss 및 V1B-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온 (ON) 부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서 편집을 유도하지 않았다.
도 29A-C. 염기 편집 효율에 대한 헬퍼 sgRNA (hsgRNA) 및 sgRNA 사이 거리의 효과. 29A: DNTET1, EMX1 및 FANCF 부위에서 hsgRNA 및 sgRNA 사이 거리를 예시하는 개략도. 29B: 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도. 29C: hsgRNA 및 sgRNA 사이 거리의 효과 요약. 최고 염기 편집 효율에 대한 거리 범위는 hsgRNA의 PAM에서 sgRNA의 PAM 까지 -91 내지 -34 bp이다.
도 30A-C. 염기 편집 효율에 대한 hsgRNA 스페이서 길이의 효과. 30A: DNEMX1, FANCF 및 V1A 부위에서 상이한 스페이서 길이를 갖는 sgRNA 및 hsgRNA의 공-형질감염을 예시하는 개략도. 30B: hsgRNA 및 sgRNA의 표적 부위에서 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도. 30C: hsgRNA 스페이서 길이 효과의 통계 분석. 10-bp 스페이서를 갖는 hsgRNA의 사용은 hsgRNA 표적 부위에서 편집 효율을 상당히 감소시키지만 sgRNA 표적 부위에서의 편집 효율은 유지시킨다.
도 31. isplitBE-rA1 및 BE3의 편집 효율의 비교. 상이한 표적 부위에서 표시된 염기 편집자에 의해 유도된 편집 빈도.
도 32A-C. isplitBE-rA1 및 BE3에 의해 유도된 게놈-와이드 C에서 T 돌연변이의 비교. 32A: 야생형 293FT 세포 및 APOBEC3 녹아웃 293FT 세포 (293FT-A3KO)에서 mRNA 발현 수준. 32B: 염기 편집자에 의해 유도된 게놈-와이드 C에서 T 돌연변이를 결정하는 절차를 예시하는 개략도. 32C: 온-표적 편집 효율 (좌측) 및 Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-rA1에 의해 유도된 게놈-와이드 C에서 T 돌연변이의 수.
도 33A-C. isplitBE-mA3, BE3 및 hA3A-BE3-Y130F (Y130F)에 의해 유도된 전사체-와이드 C에서 U 돌연변이의 비교. 33A: Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 전사체-와이드 C에서 U 돌연변이의 수. 33B: Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 RNA C에서 U 편집 빈도. 33C: BE3 복제물 1 및 isplitBE-mA3 복제물 1에 의해 유도된 RNA C에서 U 편집의 분포.
도 34A-D. 인간 PCSK9 유전자 내 isplitBE-mA3에 의해 유도된 중지 코돈. 34A: sgRNA 및 hsgRNA와 isplitBE-mA3 및 nCas9의 공-형질감염을 예시하는 개략도. 34B-34D: 표시된 부위에서 isplitBE-mA3에 의해 유도된 편집 효율.
도 35A-B. 아데닌 염기 편집자 (ABE)의 편집 효율에 대한 mA3CDA2의 억제 효과. 35A: sgRNA, 및 mA3CDA2와 융합되거나 또는 그렇지 않은 ABE의 공-형질감염을 예시하는 개략도. 35B: RNF2 및 FANCF 부위에서 표시된 ABE에 의해 유도된 편집 효율.
도 36A-G. 프라임 편집 가이드 RNA (pegRNA)의 조작에 의해 증강된 프라임 편집. 36A: 증강된 pegRNA (epegRNA)의 스템 안정성을 증가시키기 위한 RNA 염기쌍의 변화를 예시하는 개략도. 36B: sgRNA를 닉킹하는, PE2와, pegRNA 또는 epegRNA-GC의 공-형질감염을 예시하는 개략도. 36C-36D: pegRNA 및 epegRNA-GC로 유도된 프라임 편집 효율의 비교. 36E: 증강된 pegRNA (epegRNA)의 스템 안정성을 증강시키기 위한 RNA 염기쌍의 변화를 예시하는 개략도. 36F: sgRNA를 닉킹하는, PE2와, pegRNA 또는 epegRNA-CG의 공-형질감염을 예시하는 개략도. 36G: pegRNA 및 epegRNA-CG로 유도된 프라임 편집 효율의 비교.
도 37A-B. 상이한 Cas9 단백질을 함유하는 PE의 사용에 의한 프라임 편집 시스템. 37A: sgRNA를 닉킹하는, pegRNA와 PE2-NG 또는 xPE2의 공-형질감염을 예시하는 개략도. 37B: PE2-NG 및 xPE2에 의해 유도된 프라임 편집 효율.
도 38A-C. 분할 프라임 편집 (분할-PE) 시스템. 38A: PE 및 분할-PE 시스템의 작업 과정을 예시하는 개략도. 38B: PE 및 분할-PE 시스템의 공-형질감염을 예시하는 개략도. 38C: EMX1 부위에서 PE 및 분할-PE 시스템에 의해 유도된 편집 효율.
도 39A-C. mA3CDA2 코어 영역과 다른 시티딘 디아미나제 도메인의 정렬.
도 40A-D. hA3BCDA1과 다른 시티딘 디아미나제 도메인의 정렬.
정의
용어 "하나" 또는 "한" 독립체는 하나 이상의 그 독립체를 의미한다는 것을 유의하며, 예를 들어, "한 항체"는 하나 이상의 항체를 나타낸다는 것을 이해한다. 이와 같이, 용어 "하나" (또는 "한"), "하나 이상", 및 "적어도 하나"는 본 명세서에서 상호교환적으로 사용될 수 있다.
본 명세서에서 사용되는 용어 "폴리펩티드"는 단수의 "폴리펩티드"를 비롯하여, 다수의 "폴리펩티드"를 포괄하고자 하고, 아미드 결합 (펩티드 결합으로도 알려짐)에 의해 선형으로 연결된 단량체 (아미노산)로 구축된 분자를 의미한다. 용어 "폴리펩티드"는 둘 이상의 아미노산의 임의 사슬 또는 사슬들을 의미하고, 산물의 특별한 길이를 의미하지 않는다. 따라서, 둘 이상의 아미노산의 사슬 또는 사슬들을 지칭하기 위해 사용되는, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, "단백질", "아미노산 사슬" 또는 임의의 다른 용어는 "폴리펩티드"의 정의 내에 포함되고, 용어 "폴리펩티드"는 임의의 이들 용어 대신에, 또는 상호교환적으로 사용될 수 있다. 용어 "폴리펩티드"는 또한 제한없이 글리코실화, 아세틸화, 인산화, 아미드화, 기지의 보호/차단 기에 의한 유도체화, 단백질가수분해 절단, 또는 비천연 발생 아미노산에 의한 변형을 포함한, 폴리펩티드의 발현후 변형 산물을 의미하고자 한다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래될 수 있거나 또는 재조합 기술에 의해 생산될 수 있지만, 반드시 지정된 핵산 서열로부터 번역되는 것은 아니다. 이것은 화학 합성을 포함한, 임의 방식으로 생성될 수 있다.
"상동성" 또는 "동일성" 또는 "유사성"은 2개 펩티드 간 또는 2개 핵산 분자 간 서열 유사성을 의미한다. 상동성은 비교의 목적을 위해 정렬할 수 있는 각 서열 내 위치를 비교하여 결정할 수 있다. 비교된 서열 내 위치가 동일한 염기 또는 아미노산에 의해 점유될 때, 그 분자는 그 위치에서 상동성이다. 서열 간 상동성의 정도는 서열이 공유하는 일치하거나 또는 상동성인 위치의 수의 함수이다. "미관련" 또는 "비-상동성" 서열은 40% 미만의 동일성을 공유하지만, 바람직하게 본 개시의 서열 중 하나와 25% 미만의 동일성이다.
폴리뉴클레오티드 또는 폴리뉴클레오티드 영역 (또는 폴리펩티드 또는 폴리펩티드 영역)은, 정렬했을 때, 염기 (또는 아미노산)의 백분율이 2개 서열을 비교했을 때 동일하다는 것을 의미하는, 다른 서열에 대한 "서열 동일성"의 일정 백분율 (예를 들어, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%)을 갖는다. 이러한 정렬 및 상동성 또는 서열 동일성 백분율은 당분야에 공지된 소프트웨어 프로그램, 예를 들어, [Ausubel et al. eds. (2007) Current Protocols in Molecular Biology]에 기술된 것을 사용해 결정될 수 있다. 바람직하게, 디폴트 매개변수가 정렬에 사용된다. 다른 정렬 프로그램은 디폴트 매개변수를 사용하는, BLAST이다.
용어 "동등한 핵산 또는 폴리뉴클레오티드"는 핵산 또는 이의 상보체의 뉴클레오티드 서열과 일정 정도의 상동성, 또는 서열 동일성을 갖는 뉴클레오티드 서열을 갖는 핵산을 의미한다. 이중 가닥 핵산의 상동성은 일정 정도의 상동성을 갖는 뉴클레오티드 서열 또는 이의 상보체를 갖는 핵산을 포함하고자 한다. 일 양태에서, 핵산의 상동성은 핵산 또는 이의 상보체와 혼성화할 수 있다. 유사하게, "동등한 폴리펩티드"는 기준 폴리펩티드의 아미노산 잔기와 일정 정도의 상동성, 또는 서열 동일성을 갖는 폴리펩티드를 의미한다. 일부 양태에서, 서열 동일성은 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99%이다. 일부 양태에서, 동등한 폴리펩티드 또는 폴리뉴클레오티드는 기준 폴리펩티드 또는 폴리뉴클레오티드와 비교하여 1, 2, 3, 4, 또는 5 첨가, 결실, 치환, 및 그들 조합을 갖는다. 일부 양태에서, 동등한 서열은 기준 서열의 활성 (예를 들어, 에피토프-결합) 또는 구조 (예를 들어, 염-브릿지)를 보유한다.
폴리뉴클레오티드에 적용시 용어 "코딩한다"는 이의 천연 상태에서 또는 당업자에게 충분히 공지된 방법으로 조작했을 때, 폴리펩티드에 대한 mRNA 및/또는 이의 단편을 생산하도록 전사 및/또는 번역될 수 있다면, 폴리펩티드를 "코딩한다"고 할 수 있는 폴리뉴클레오티드를 의미한다. 안티센스 가닥은 이러한 핵산의 상보체이고, 코딩 서열은 그로부터 추론될 수 있다.
무작위 삽입 및 결실을 감소시키기 위한 핵염기 디아미나제 억제제의 사용
실험예 및 도 1-3에 도시된 바와 같이, 현재 통상적으로 사용되는 염기 편집자 BE3 및 hA3A-BE3은 오프-표적 단일 가닥 DNA 영역 내에서 C에서 T 돌연변이를 유도시켰다.
그러나, 놀랍게도, mA3-BE3 내에서 마우스 APOBEC3 (mA3)의 사용 (도 4B, 5B, 6B)이 일반적으로 시험된 표적 부위에서 C에서 T 편집을 유도하지 않았다는 것을 발견하였다 (도 4C, 5C, 6C). mA3은 2개 시티딘 디아미나제 (CDA) 도메인, CDA1 및 CDA2를 갖는다 (도 4A, 5A, 6A). CDA2 도메인이 전체-길이 mA3으로부터 제거되었을 때, 최종 염기 편집자 mA3CDA1-BE3 (도 4B, 5B, 6B)은 실질적 C에서 T 편집을 유도하였다 (도 4C, 5C, 6C). 이들 결과는 mA3-CDA2 도메인이 염기 편집의 억제제인 것을 의미한다.
또한 놀랍게도, mA3-CDA2 도메인은 mA3-CDA1의 염기 편집 활성을 억제할 수 있을 뿐만 아니라, 또한 다른 핵염기 디아미나제를 억제할 수 있다. 예를 들어, mA3-CDA2가 3종의 활성 BE, mA3CDA1-BE3, BE3 및 hA3A-BE3의 각각의 N-말단에 융합되었을 때, 융합 단백질 mA3rev-BE3, mA3-CDA2-BE3 및 mA3-CDA2-hA3A-BE3 (도 4B, 5B, 6B)은 염기 편집 효율을 분명하게 감소시켰다 (도 4C, 5C, 6C).
게다가, 융합 단백질로부터 mA3-CDA2의 절단이 염기 편집 효율을 복원하였고 (도 4C, 5C, 6C), mA3-CDA2의 억제가 BE와 이의 공유 연결과 연관된다는 것을 시사한다.
mA3과 유사하게, 인간 APOBEC3B (hA3B)은 또한 2개 시티딘 디아미나제 (CDA) 도메인, CDA1 및 CDA2 (도 7A, 8A, 9A)를 갖는다. hA3B-BE3 내 전체-길이 hA3B의 도입 (도 7B, 8B, 9B)은 오직 3개의 시험된 표적 부위에서 비교적 낮은 수준의 C에서 T 편집을 유도하였다 (도 7C, 8C, 9C). 그러나, hA3B-CDA1 도메인을 결실시켜서 생성된, hA3B-CDA2-BE3 (도 7B, 8B, 9B)은 더 높은 C에서 T 편집을 유도하였다 (도 7C, 8C, 9C). 이들 결과는 hA3B-CDA1이 염기 편집의 다른 억제제이고 hA3B-CDA1의 억제는 BE와 이의 공유 연결과 연관된다는 것을 의미한다.
mA3-CDA2 및 hA3B-CDA1의 서열을 사용하여, 본 발명자는 단백질 데이터베이스에서 추가의 핵염기 디아미나제 억제제/도메인을 확인할 수 있었다. 표 1은 mA3-CDA2 코어 서열에 상동성인 상당한 서열을 갖는 44개 단백질/도메인을 표시하고 (도 39), 표 2는 hA3B-CDA1에 상동성인 유의한 서열을 갖는 43 단백질/도메인을 표시한다 (도 40). 모든 이들 단백질 및 도메인을 비롯하여, 그들 변이체 및 동등물은 핵염기 디아미나제 억제 활성을 갖는다고 여겨진다.
융합 단백질
이들 놀랍고 기대되는 발견을 기반으로, 융합 단백질은 개선된 염기 편집 특이성 및 효율을 갖는 염기 편집자를 생성시키는데 사용될 수 있는 것이 디자인된다. 일 구현예에서, 본 개시는 핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 핵염기 디아미나제 억제제를 포함하는 제2 단편, 및 제1 단편 및 제2 단편 사이에 프로테아제 절단 부위를 포함하는 융합 단백질을 제공한다.
이러한 융합 단백질을 도입시킨 염기 편집자는 편집 능력이 감소되었거나 또는 심지어 전무하고, 따라서 감소된 오프-표적 돌연변이를 생성시키게 되거나 또는 전혀 생성시키지 않을 것이다. 프로테아제 절단 부위의 절단 및 표적 부위에서 융합 단백질로부터 핵염기 디아미나제 억제제의 방출 시에 표적 부위에 있는 염기 편집자는 표적 부위를 효율적으로 편집할 수 있을 것이다.
본 명세서에서 사용되는 용어 "핵염기 디아미나제"는 핵염기 예컨대 시티딘, 데옥시시티딘, 아데노신 및 데옥시아데노신의 가수분해 탈아미노화를 촉매하는 효소 그룹을 지칭한다. 핵염기 디아미나제의 비제한적인 예는 시티딘 디아미나제 및 아데노신 디아미나제를 포함한다.
"시티딘 디아미나제"는 각각 시티딘 및 데옥시시티딘의 우리딘 및 데옥시우리딘으로의 비가역적 가수분해 탈아미노화를 촉매하는 효소를 지칭한다. 시티딘 디아미나제는 세포 피리미딘 풀을 유지시킨다. 시티딘 디아미나제의 패밀리는 APOBEC ("아포지질단백질 B mRNA 편집 효소, 촉매적 폴리펩티드-유사")이다. 이러한 패밀리의 구성원은 C에서 U 편집 효소이다. 일부 APOBEC 패밀리 구성원은 2개 도메인을 갖는데, APOBEC 유사 단백질의 한 도메인은 촉매 도메인인 한편, 나머지 도메인은 슈도촉매 도메인이다. 보다 특히, 촉매 도메인은 아연 의존적 시티딘 디아미나제 도메인이고 시티딘 탈아미노화에 중요하다. APOBEC-1에 의한 RNA 편집은 동종이량체화를 필요로 하고 이러한 복합체는 RNA 결합 단백질과 상호작용하여 에디토솜 (editosome)을 형성한다.
APOBEC 단백질의 비제한적인 예는 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4, 및 활성화-유도 (시티딘) 디아미나제 (AID)를 포함한다.
APOBEC 단백질의 다양한 돌연변이체는 또한 염기 편집자에 상이한 편집 특징을 일으키는 것으로도 알려져 있다. 예를 들어, 인간 APOBEC3A 경우, 일정 돌연변이체 (예를 들어, W98Y, Y130F, Y132D, W104A, D131Y 및 P134Y)는 심지어 편집 효율 또는 편집창의 관점에서 야생형 인간 APOBEC3A를 능가한다. 따라서, 용어 APOBEC 및 이의 패밀리 구성원의 각각은 또한 상응하는 야생형 APOBEC 단백질 또는 촉매 도메인과 일정 수준 (예를 들어, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%)의 서열 동일성을 가지고 시티딘 탈아미노화 활성을 보유하는 변이체 및 돌연변이체를 포괄한다. 변이체 및 돌연변이체는 아미노산 첨가, 결실, 및/또는 치환을 갖게 유도될 수 있다. 일부 구현예에서, 이러한 치환은 보존성 치환이다.
아데노신 아미노히드롤라제, 또는 ADA라고도 알려진, "아데노신 디아미나제"는 푸린 물질대사에 관여하는 효소 (EC 3.5.4.4)이다. 이것은 음식물로부터 아데노신의 분해 및 조직 내 핵산의 턴오버에 필요하다.
아데노신 디아미나제의 비제한적인 예는 tRNA-특이적 아데노신 디아미나제 (TadA), 아데노신 디아미나제 tRNA 특이적 1 (ADAT1), 아데노신 디아미나제 tRNA 특이적 2 (ADAT2), 아데노신 디아미나제 tRNA 특이적 3 (ADAT3), 아데노신 디아미나제 RNA 특이적 B1 (ADARB1), 아데노신 디아미나제 RNA 특이적 B2 (ADARB2), 아데노신 모노포스페이트 디아미나제 1 (AMPD1), 아데노신 모노포스페이트 디아미나제 2 (AMPD2), 아데노신 모노포스페이트 디아미나제 3 (AMPD3), 아데노신 디아미나제 (ADA), 아데노신 디아미나제 2 (ADA2), 아데노신 디아미나제 유사 (ADAL), 아데노신 디아미나제 도메인 함유 1 (ADAD1), 아데노신 디아미나제 도메인 함유 2 (ADAD2), 아데노신 디아미나제 RNA 특이적 (ADAR) 및 아데노신 디아미나제 RNA 특이적 B1 (ADARB1)을 포함한다.
핵염기 디아미나제의 일부는 단일, 촉매 도메인을 갖지만, 다른 것들은 또한 본 발명자가 최근에 발견한, 다른 도메인, 예컨대 억제성 도메인을 갖는다. 그러므로, 일부 구현예에서, 제1 단편은 오직 촉매 도메인, 예컨대 mA3-CDA1 및 hA3B-CDA2를 포함한다. 일부 구현예에서, 제1 단편은 적어도 촉매 도메인의 촉매 코어를 포함한다. 예를 들어, 실험예에서 입증되는 바와 같이, mA3-CDA1이 잔기 196/197에서 절단되었을 때, CDA1 도메인은 여전히 실질적 편집 표율을 유지하였다 (도 10C, 11C, 12C).
본 개시는 상응하는 핵염기 디아미나제의 억제성 도메인인, 2개 핵염기 디아미나제 억제제, mA3-CDA2 및 hA3B-CDA1을 시험하였다. 추가적인 핵염기 디아미나제 억제제 및 억제성 도메인은 또한 단백질 데이터베이스에서 확인하였다 (표 1 및 2 참조). 그들의 생물학적 동등물 (예를 들어, 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99%, 99.5% 서열 동일성을 갖거나, 또는 1, 2, 또는 3 아미노산 첨가/결실/치환을 갖고, 핵염기 디아미나제 억제제 활성을 가짐)은 또한 보존성 아미노산 치환같이, 당분야에 공지된 방법으로 제조될 수 있다. "핵염기 디아미나제 억제제"는 따라서, 핵염기 디아미나제의 디아미나제 활성을 억제하는 단백질 또는 단백질 도메인을 의미한다. 일부 구현예에서, 제2 단편은 적어도 억제성 단백질/도메인의 억제성 코어를 포함한다. 예를 들어, 실험예에서 입증되는 바와 같이, mA3-CDA2가 잔기 334-429를 보유했을 때, CDA2가 여전히 염기 편집의 억제 효과를 가졌다 (도 13B, 14B, 15B).
일부 구현예에서, 융합 단백질은 임의로 제1 단편 내에, 핵염기 디아미나제 또는 이의 촉매 도메인 옆에, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 더 포함한다.
용어 "Cas 단백질" 또는 "군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질"은 스트렙토코커스 피오게네스 (Streptococcus pyogenes)를 비롯한, 다른 박테리아에서 CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) 적응 면역 시스템과 연관된 RNA-가이드된 DNA 엔도뉴클레아제 효소를 지칭한다. Cas 단백질은 Cas9 단백질, Cas12a (Cpf1) 단백질, Cas12b (이전에 C2c1로 공지) 단백질, Cas13 단백질, 및 다른 조작된 대응물을 포함한다. Cas 단백질의 예는 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, RanCas13b 및 하기 표 A에 제공된 것들을 포함한다.
제1 단편 및 제2 단편 사이의 프로테아제 절단 부위는 임의의 프로테아제에 대한 임의의 기지 프로테아제 절단 부위 (펩티드)일 수 있다. 프로테아제의 비제한적인 예는 TEV 프로테아제, TuMV 프로테아제, PPV 프로테아제, PVY 프로테아제, ZIKV 프로테아제 및 WNV 프로테아제를 포함한다. 예시적인 프로테아제 및 그들 상응하는 절단 부위의 단백질 서열은 표 B에 제공된다.
일부 구현예에서, 프로테아제 절단 부위는 자가-절단 펩티드, 예컨대 2A 펩티드이다. "2A 펩티드"는 진핵생물 세포에서 번역 동안 폴리펩티드의 "절단"을 매개하는 18-22 아미노산-길이 바이러스 올리고펩티드이다. 명칭 "2A"는 바이러스 게놈의 특별한 영역을 지칭하고 상이한 바이러스 2A는 일반적으로 그들이 유래된 바이러스 뒤에 명명된다. 최초로 발견된 2A는 F2A (구제역 바이러스)였고, 그 이후에 E2A (말 비염 A 바이러스), P2A (돼지 테스코바이러스-1 2A), 및 T2A (토세아 아시그나 바이러스 2A)가 또한 동정되었다. 2A 펩티드의 몇몇 비제한적인 예는 SEQ ID NO:26-28로 제공된다.
일부 구현예에서, 프로테아제 절단 부위는 TEV 프로테아제에 대한 절단 부위 (예를 들어, SEQ ID NO:5)이다. 일부 구현예에서, 융합 단백질은 TEV 프로테아제 또는 이의 단편을 포함하는 제3 단편을 더 포함한다. 일부 구현예에서, 활성이 아닌 융합 단백질 내 TEV 프로테아제 단편은 그 자체로 TEV 절단 부위를 절단할 수 없다. 그러나, TEV 프로테아제의 나머지 부분의 존재 하에서, 이러한 단편은 절단을 실행할 수 있을 것이다. 하기에 더욱 기술하는 바와 같이, 이러한 배열은 염기 편집 능력의 추가적인 제어 및 탄성을 제공한다. TEV 단편은 TEV N-말단 도메인 (예를 들어, SEQ ID NO:3) 또는 TEV C-말단 도메인 (예를 들어, SEQ ID NO:4)일 수 있다.
단편의 다양한 배열을 만들 수 있다. 비제한적인 예는 N-말단 측면에서 C-말단 측면으로, 다음을 포함한다:
(1) 제1 단편 (예를 들어, 촉매 도메인) - 프로테아제 절단 부위 - 제2 단편 (예를 들어, 억제성 도메인);
(2) 제1 단편 (예를 들어, 촉매 도메인 및 Cas 단백질) - 프로테아제 절단 부위 - 제2 단편 (예를 들어, 억제성 도메인);
(3) 제1 단편 (예를 들어, 촉매 도메인, Cas 단백질 및 TEV N-말단 도메인) - 프로테아제 절단 부위 (예를 들어, TEV 절단 부위) - 제2 단편 (예를 들어, 억제성 도메인);
(4) 제2 단편 (예를 들어, 억제성 도메인) - 프로테아제 절단 부위 (예를 들어, TEV 절단 부위) - 제1 단편 (예를 들어, 촉매 도메인, Cas 단백질 및 TEV N-말단 도메인); 및
(5) 제2 단편 (예를 들어, 억제성 도메인) - 프로테아제 절단 부위 (예를 들어, TEV 절단 부위) - 제1 단편 (예를 들어, Cas 단백질, 촉매 도메인, 및 TEV C-말단 도메인).
일부 구현예에서, 제1 핵염기 디아미나제 (예를 들어, 시티딘 디아미나제) 또는 이의 촉매 도메인을 포함하는 제1 단편, 및 제2 핵염기 디아미나제의 억제성 도메인을 포함하는 제2 단편을 포함하는 융합 단백질을 제공하고, 제1 핵염기 디아미나제는 제2 핵염기 디아미나제와 상이하다. 일부 구현예에서, 제1 및 제2 핵염기 디아미나제의 각각은 인간 및 마우스 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)의 군으로부터 독립적으로 선택된다.
융합 단백질은 다른 단편, 예컨대 우라실 DNA 글리코실라제 억제제 (UGI) 및 핵 국재화 서열 (NLS)을 포함할 수 있다.
바실러스 서브틸리스 (Bacillus subtilis ) 박테리오파지 PBS1로부터 제조될 수 있는 "우라실 글리코실라제 억제제" (UGI)는 이. 콜라이 (E. coli) 우라실-DNA 글리코실라제 (UDG)를 비롯한 다른 종 유래 UDG를 억제하는 소형 단백질 (9.5 KDa)이다. UDG의 억제는 1:1 UDG:UGI 화학양론의 가역적 단백질 결합에 의해 일어난다. UGI는 UDG-DNA 복합체를 해리시킬 수 있다. UGI의 비제한적인 예는 바실러스 파지 AR9 (YP_009283008.1)에서 발견된다. 일부 구현예에서, UGI는 SEQ ID NO:25의 아미노산 서열을 포함하거나 또는 SEQ ID NO:25와 적어도 적어도 70%, 75%, 80%, 85%, 90% 또는 95% 서열 동일성을 갖고 우라실 글리코실라제 억제 활성을 유지한다.
융합 단백질은, 일부 구현예에서, 하나 이상의 핵 국재화 서열 (NLS)을 포함할 수 있다.
"핵 국재화 신호 또는 서열" (NLS)은 핵 수송을 통해 세포 핵으로 이입을 위한 단백질을 태그하는 아미노산 잔기이다. 전형적으로, 이러한 신호는 단백질 표면 상에 노출된 양으로 하전된 리신 또는 아르기닌의 하나 이상의 짧은 서열로 이루어진다. 상이한 핵 국재화 단백질은 동일한 NLS를 공유할 수 있다. NLS는 핵 외부의 단백질을 표적화하는, 핵 이출 신호 (NES)의 반대 기능을 갖는다. NLS의 비제한적인 예는 내부 SV40 핵 국재화 서열 (iNLS)이다.
일부 구현예에서, 펩티드 링커는 임의로 융합 단백질 내 단편 각각 사이에 제공된다. 일부 구현예에서, 펩티드 링커는 1 내지 100 아미노산 잔기 (또는 제한없이, 3-20, 4-15)를 갖는다. 일부 구현예에서, 펩티드 링커의 아미노산 잔기의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% 또는 90%는 알라닌, 글리신, 시스테인, 및 세린으로 이루어진 군으로부터 선택되는 아미노산 잔기이다.
본 개시의 임의의 융합 단백질의 경우에, 이의 생물학적 동등물이 또한 제공된다. 일부 구현예에서, 생물학적 동등물은 기준 융합 단백질과 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 갖는다. 바람직하게, 생물학적 동등물은 기준 융합 단백질의 바람직한 활성을 유지하였다. 일부 구현예에서, 생물학적 동등물은 1, 2, 3, 4, 5, 또는 그 이상의 아미노산 첨가, 결실, 치환, 이의 조합을 포함하여 유래된다. 일부 구현예에서, 치환은 보존성 아미노산 치환이다.
"보존성 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 치환되는 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 패밀리는 염기성 측쇄 (예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 비하전 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지 측쇄 (예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 포함하여, 당분야에 정의되어 있다. 따라서, 면역글로불린 폴리펩티드 내 불필수 아미노산 잔기는 바람직하게 동일 측쇄 패밀리로부터의 다른 아미노산 잔기로 치환된다. 다른 구현예에서, 아미노산의 스트링은 측쇄 패밀리 구성원의 조성 및/또는 순서가 상이한 구조적으로 유사한 스트링으로 치환될 수 있다.
보존성 아미노산 치환의 비제한적인 예는 하기 표에 제공되고, 여기서 0 이상의 유사성 점수는 2개 아미노산 간 보존성 치환을 의미한다.
융합 단백질의 온-표적 활성화
본 개시는 또한 핵염기 디아미나제 또는 이의 촉매 도메인 및 억제제 둘 모두를 포함하는, 본 개시의 융합 단백질이 이의 활성이 바람직한 경우에 활성화되는 조성물 및 방법을 제공한다. 기술은 도 16에 예시되어 있다.
예시적인 구성에서, 융합 단백질 (A)은 (a) 핵염기 디아미나제 (예를 들어, 시티딘 디아미나제) 또는 이의 촉매 도메인과, 임의로 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 제1 TEV 프로테아제 단편을 포함하는 제1 단편, (b) 핵염기 디아미나제 억제제를 포함하는 제2 단편, 및 (c) 제1 단편 및 제2 단편 사이의 TEV 프로테아제 절단 부위를 포함한다. 일부 구현예에서, 제1 TEV 프로테아제 단편은 단독으로 TEV 프로테아제 절단 부위를 절단시킬 수 없다.
융합 단백질이 세포 내에서 유전자 편집을 수행하기 위하여, 시험관내 또는 생체내에서 사용될 때, 2종의 추가 분자가 도입될 수 있다. 일례에서, 하나의 분자 (B)는 RNA 인식 펩티드에 의해 인식될 수 있는 태그 서열을 더 도입시킨 단일 가이드 RNA (sgRNA)이다. 대안적으로, sgRNA는 표적 부위를 표적화하는 crRNA 및 CRISPR RNA (crRNA) 단독으로, 또는 트랜스-활성화 (trans-activating) CRISPR RNA (tracrRNA)와 조합하여, 교체될 수 있다. 태그 서열 및 상응하는 RNA 인식 펩티드의 예는 MS2/MS2 외피 단백질 (MCP), PP7/PP7 외피 단백질 (PCP), 및 boxB/boxB 외피 단백질 (N22p)을 포함하고, 이의 서열을 표 B에 제공된다. 분자 (B)는 RNA 분자를 코딩하는 DNA 서열로서 제공될 수 있다.
다른 추가 분자 (C)는, 일부 구현예에서, RNA 인식 펩티드 (예를 들어, MCP, PCP, N22p)에 커플링된 제2 TEV 프로테아제 단편을 포함한다. 제1 TEV 단편 및 제2 TEV 단편은, 일부 구현예에서, 함께 존재할 때, TEV 프로테아제 부위를 절단할 수 있다.
이러한 동시-존재는 태그 서열-RNA 인식 단백질 상호작용에 의해 분자 (B)에 대한 분자 (C) 결합을 통해 촉발시킬 수 있다. 한편, 융합 단백질 (A) 및 분자 (B)는 유전자 편집을 위한 표적 게놈 유전자좌에 둘 모두가 존재할 것이다. 그러므로, 분자 (B)는 융합 단백질 (A)로부터의 TEV 프로테아제 단편 및 분자 (C) 둘 모두를 함께 있게 하여, TEV 프로테아제를 활성화시키게 되어, 융합 단백질로부터 핵염기 디아미나제 억제제의 제거 및 염기 편집자의 활성화를 초래한다. 이러한 활성화는 오프-표적 단일 가닥 DNA 영역이 아닌, 오직 표적 게놈 부위에서만 일어난다는 것을 쉽게 이해할 수 있다. 이와 같이, 염기 편집은 (도 17-19에서 입증된 바와 같이) sgRNA가 결합하지 않는 단일 가닥 DNA 영역에서 일어나지 않는다.
"가이드 RNA"는 상보성 표적 DNA 서열에 결합하는 비-코딩 짧은 RNA 서열이다. 가이드 RNA는 먼저 Cas 효소에 결합하고 gRNA 서열은 DNA 상의 특이적 위치와의 쌍형성을 통해 복합체를 가이드하며, 여기서 Cas는 표적 DNA 가닥을 절단하여 이의 엔도뉴클레아제 활성을 수행한다. "단일 가이드 RNA"는 종종 단순하게 "가이드 RNA"라고도 하며, 단일 구성체로서 crRNA 및 tracrRNA 둘 모두로 이루어진 합성 또는 발현 단일 가이드 RNA (sgRNA)를 지칭한다. tracrRNA 부분은 Cas 엔도뉴클레아제 활성을 담당하고 crRNA 부분은 표적 특이적 DNA 영역에 결합한다. 그러므로, 트랜스 활성화 RNA (tracrRNA, 또는 스캐폴드 영역) 및 crRNA는 2개의 핵심 성분이고 sgRNA의 형성을 일으키는 테트라루프에 의해 연결된다.
가이드 RNA의 스캐폴드는 그 자체로 스템-루프 구조를 가지며 엔도뉴클레아제 효소에 부착된다. 전형적인 스캐폴드는 도 36A (위)에 예시된 바와 같은 구조를 갖는데, 이 구조는 5'에서 3' 말단으로, (a) 반복 영역, (b) 테트라루프, (c) 반복 영역에 적어도 부분적으로 상보성인 안티-반복부, (d) 스템 루프 1, (e) 링커, (f) 스템 루프 2, 및 (g) 스템 루프 3을 포함한다. 스캐폴드 서열은 일반적으로 보존되지만, 스템 루프 1 및 스템 루프 3의 루프는 상이한 서열을 가질 수 있다. 보다 중요하게, 테트라루프 및 스템 루프 2의 루프는 훨씬 더 긴 서열로 전체적으로 치환될 수 있다. 서열 예컨대 RNA 태그 (예를 들어, MS2, PP7, boxB)가 여기에 삽입될 수 있어서, 상응하는 인식 펩티드에 의해 인식될 수 있다. 스캐폴드 서열의 예는 하기에 표시된다.
이들 예의 스캐폴드 서열을 참조하여, 위치 1-12의 단편 (예를 들어, GUUUUAGAGCUA, SEQ ID NO:197; GUUUGAGAGCUA, SEQ ID NO:198)은 위치 17-30 (예를 들어, UAGCAAGUUAAAAU, SEQ ID NO:199)을 포함하는, 안티-반복부를 갖는 약 8-12 염기쌍을 형성하는, 반복 영역을 나타낸다. 그들 사이의 GAAA 루프 (SEQ ID NO:200)는 테트라루프이다. SEQ ID NO:17에 표시된 바와 같이, 이러한 전체 루프는 MS2 서열로 치환될 수 있다. 스템 루프 1은 대체로 위치 31-39를 포함하고 소형 루프 (예를 들어, 제한없이, UA, AU, AA, 또는 UU)를 포함한다. 스템 루프 1은 일반적으로 스템 내에 3-4 염기쌍을 갖는다. 위치 48-61 (예를 들어, AACUUGAAAAAGUG, SEQ ID NO:201)을 포함하는, 스템 루프 2는 일반적으로 스템 내에 4 염기쌍, 및 전체로 치환될 수 있는 GAAA (SEQ ID NO:200) 루프를 포함한다. 나머지, 위치 62-76 (예를 들어, GCACCGAGUCGGUGC, SEQ ID NO:202; GCACCGAUUCGGUGC; SEQ ID NO:203)은 일반적으로 스템 내에 4 염기쌍을 포함하는, 스템 루프 3을 구성한다. 소형 루프 (여기 예에서 U 및 G)는 임의의 뉴클레오티드일 수 있다.
따라서, 스캐폴드의 서열은 다음과 같이 표시될 수 있다:
여기서 N은 임의 염기를 나타내고, X1 및 X2는 2-50 염기 길이의 임의 뉴클레오티드 서열을 표시한다. 용어 "가이드 RNA" 및 "단일 가이드 RNA"는 RNA 내 하나 이상의 루프에 삽입되는, 추가 서열, 예컨대 MS2, PP7 및 boxB를 포함하는 것을 포괄한다.
핵염기 디아미나제, 촉매 도메인, 핵염기 디아미나제 억제제, 및 Cas 단백질의 다양한 구현예 및 예가 본 개시에서 제공된다. 예를 들어, 핵염기 디아미나제는 시티딘 디아미나제 및 아데노신 디아미나제일 수 있다. 시티딘 디아미나제의 비제한적인 예는 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4, 및 활성화-유도 (시티딘) 디아미나제를 포함한다.
아데노신 디아미나제의 비제한적인 예는 tRNA-특이적 아데노신 디아미나제 (TadA), 아데노신 디아미나제 tRNA 특이적 1 (ADAT1), 아데노신 디아미나제 tRNA 특이적 2 (ADAT2), 아데노신 디아미나제 tRNA 특이적 3 (ADAT3), 아데노신 디아미나제 RNA 특이적 B1 (ADARB1), 아데노신 디아미나제 RNA 특이적 B2 (ADARB2), 아데노신 모노포스페이트 디아미나제 1 (AMPD1), 아데노신 모노포스페이트 디아미나제 2 (AMPD2), 아데노신 모노포스페이트 디아미나제 3 (AMPD3), 아데노신 디아미나제 (ADA), 아데노신 디아미나제 2 (ADA2), 아데노신 디아미나제 유사 (ADAL), 아데노신 디아미나제 도메인 함유 1 (ADAD1), 아데노신 디아미나제 도메인 함유 2 (ADAD2), 아데노신 디아미나제 RNA 특이적 (ADAR) 및 아데노신 디아미나제 RNA 특이적 B1 (ADARB1)을 포함한다.
Cas 단백질의 예는 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, RHA FnCas9, 및 KKH SaCas9 및 표 A에 제공된 것을 포함한다.
융합 단백질은 다른 단편, 예컨대 우라실 DNA 글리코실라제 억제제 (UGI) 및 핵 국재화 서열 (NLS)을 포함할 수 있고, 이의 각각은 본 명세서에서 논의된다.
본 개시에 기술된 염기 편집자 및 염기 편집 방법은 다양한 진핵생물의 게놈에서 높은-특이성 및 높은-효율 염기 편집을 수행하기 위해 적용될 수 있다.
본 개시는 조성물 및 방법을 제공한다. 이러한 조성물은 융합 단백질의 유효량, 및 허용가능한 담체를 포함한다. 일부 구현예에서, 조성물은 표적 DNA에 대해 바람직한 상보성을 갖는 가이드 RNA를 더 포함한다. 이러한 조성물은 샘플에서 염기 편집을 위해 사용될 수 있다.
융합 단백질 및 조성물은 염기 편집을 위해 사용될 수 있다. 일 구현예에서, 표적 폴리뉴클레오티드를 편집하기 위한 방법에 제공되고, 방법은 표적 폴리뉴클레오티드에, 본 개시의 융합 단백질 및 표적 폴리뉴클레오티드에 대해 적어도 부분적인 서열 상보성을 갖는 가이드 RNA를 접촉시키는 단계를 포함하고, 여기서 편집은 표적 폴리뉴클레오티드 내 시토신 (C)의 탈아미노화를 포함한다.
일 구현예에서, 샘플에서 핵산 서열 상의 시토신을 편집하는 방법을 제공한다. 일부 구현예에서, 방법은 샘플을 본 개시의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오티드를 접촉시키는 단계를 포함한다. 일부 구현예에서, 적합한 가이드 RNA가 더 첨가된다. 가이드 RNA의 디자인은 당업자가 쉽게 이용가능하다.
융합 단백질 (및 가이드 RNA) 및 표적 폴리뉴클레오티드 간 접촉은 생체 내, 특히 세포 배양일 수 있다. 접촉이 생체외, 또는 생체내일 때, 융합 단백질은 임상적/치료적 유의성을 나타낼 수 있다. 생체내 접촉은 살아있는 대상체, 예컨대 제한없이, 인간, 동물, 효모, 식물, 박테리아, 바이러스에 대한 투여일 수 있다.
유도 및 분할 염기 편집자의 구성
구성체의 다양한 구성을 시험하여 유도 및 분할 염기 편집자 (isplitBE) 디자인 (도 24)을 구현하였다. 시험된 구성 (도 25) 중에서, 실시예 3의 쌍 9는 우수한 편집 효율 및 최소화된 오프-표적 편집 (상당히 개선된 특이성)을 나타내었다. 쌍 9는 헬퍼 sgRNA (hsgRNA)가 주요 표적 부위에 근접한 부위를 표적화하는데 사용되는, 이중 sgRNA 시스템을 적용한다. 이러한 이중 표적화는 특이성을 개선시킨다 (도 32-33).
쌍 9의 구성 (도 25-28)에서, 핵염기 디아미나제 억제제는 오직 sgRNA 둘 모두가 표적 서열에 결합할 때만 방출되어서, 핵염기 디아미나제가 오프-표적 부위에서 편집되지 않는다는 것을 보장한다. 구성 쌍 9는 예를 들어, 2개의 별도 구성체로부터 생산될 수 있는, 6개의 상이한 분자를 포함한다 (도 26A 및 34A).
제1 분자는 일반 비히클, AAV에 패키징을 위해 적합한 크기를 갖는, 단지 Cas 단백질을 포함할 수 있다. 제2 분자는 특히, 핵염기 디아미나제 (예를 들어, APOBEC), 핵염기 디아미나제 억제제 (예를 들어, mA3-CDA2), 및 RNA 인식 펩티드 (예를 들어, MCP)를 포함한다. 프로테아제 절단 부위 (예를 들어, TEV 부위)는 핵염기 디아미나제 및 핵염기 디아미나제 억제제 사이에 삽입되고, 적절한 시기/위치에서 핵염기 디아미나제 억제제의 제거를 가능하게 한다. 임의로, 제2 분자는 UGI를 더 포함한다.
제3 분자는 상이한 RNA 인식 펩티드 (예를 들어, N22p)에 융합된 프로테아제 (예를 들어, TEVc)의 불활성화 부분 간 융합체이다. 제4 분자는 제1 부분과 조합하여, 제2 분자로부터 핵염기 디아미나제 억제제를 제거시키기 위한 프로테아제 활성을 수행할 수 있는, 독립형 TEVn이다.
제5 분자는 제2 분자 내 RNA 인식 펩티드에 의해 인식가능한 RNA 인식 부위 (예를 들어, MS2)를 함유하는 헬퍼 sgRNA이다. 제6 분자는 제3 분자 내 RNA 인식 펩티드에 의해 인식가능한 RNA 인식 부위 (예를 들어, boxB)를 함유하는 정규 sgRNA이다.
게놈 (또는 RNA) 내 올바른 표적 부위에서, hsgRNA 및 sgRNA 둘 모두가 결합될 것이고, 각각은 Cas 단백질을 결합 부위로 동원시킨다. hsgRNA는 또한 MS2-MCP 결합에 의해서 제2 분자를 동원할 것이고, sgRNA는 boxB-N22p 결합에 의해서 제3 분자에 결합할 것이다. 그러므로, 제3 분자의 TEVc는 TEV 부위와 접촉된다. 독립형 TEVn이 전체 세포에서 존재하므로, 이것이 또한 여기에 존재할 수 있고, TEVc가 활성이고 분자 2의 핵염기 디아미나제로부터 핵염기 디아미나제 억제제를 절단하여서, 핵염기 디아미나제를 활성화시키는 것을 보장한다.
hsgRNA 결합 부위 및 정규 sgRNA 결합 부위 간 최적 거리는 34-91 bp (PAM에서 PAM)이고, hsgRNA가 상류에 있는 것을 더욱 발견하였다.
게다가, hsgRNA 및 정규 sgRNA 둘 모두의 적절한 결합이 정규 sgRNA에 대한 표적 부위 내 의도된 편집에 필요하지만, hsgRNA에 대한 표적 부위 내 편집이 바람직하지는 않다. hsgRNA (스페이서는 표적 상보성 영역임)의 스페이서 길이가 8-15 염기일 때, 이러한 hsgRNA는 결합 특이성을 보장하지만, hsgRNA 표적 부위에서의 편집을 상당히 감소시키는 이중 인식을 제공하기에 여전히 충분하다는 것을 본 명세서에서 발견하였다.
그러므로, 본 개시의 일 구현예에 따라서, 핵염기 디아미나제 또는 이의 촉매 도메인, 핵염기 디아미나제 억제제, 제1 RNA 인식 펩티드, 및 핵염기 디아미나제 또는 이의 촉매 도메인 및 핵염기 디아미나제 억제제 사이의 TEV 프로테아제 절단 부위를 포함하는 제1 단편을 포함하는 융합 단백질을 제공한다.
일부 구현예에서, 융합 단백질은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편, 및 제2 RNA 인식 펩티드를 포함하는 제2 단편을 더 포함한다. 일부 구현예에서, 융합 단백질은 제1 단편 및 제2 단편 사이에 자가-절단 부위를 더 포함한다.
일부 구현예에서, 융합 단백질은 제2 TEV 프로테아제 단편을 포함하는 제3 단편을 더 포함하고, 여기서 제1 TEV 프로테아제 단편은 제2 TEV 프로테아제 단편의 존재 하에서 TEV 프로테아제 부위를 절단할 수 있다. 일부 구현예에서, 융합 단백질은 제2 단편 및 제3 단편 사이에 제2 자가-절단 부위를 더 포함하고, 제2 자가-절단 부위의 절단 시에, 융합 단백질은 임의의 RNA 인식 펩티드에 융합되지 않은 제2 TEV 프로테아제 단편을 방출한다.
또한, 일 구현예에서, 제1 PAM 부위에 근접한 표적 핵산 서열에 상보성인 서열을 갖는 제1 스페이서를 포함하는 표적 단일 가이드 RNA, 제2 PAM 부위에 근접한 제2 핵산 서열에 상보성인 서열을 갖는 제2 스페이서를 포함하는 헬퍼 단일 가이드 RNA, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 핵염기 디아미나제를 포함하는, 이중 가이드 RNA 시스템을 제공한다.
일부 구현예에서, 제2 PAM 부위는 제2 PAM 부위로부터 150 염기 이내, 또는 대안적으로 140, 130, 120, 110, 100, 95, 94, 93, 92, 91, 90, 89, 88, 87, 86, 85, 84, 83, 82, 81, 80, 75 또는 70 염기 이내에 위치된다. 일부 구현예에서, 제2 PAM 부위는 제1 PAM으로부터 적어도 10 염기, 또는 대안적으로 적어도 15, 20, 25, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 45, 50, 55, 또는 60 염기이다. 일부 구현예에서, 제2 PAM 부위는 제1 PAM 부위로부터 상류에 있다. 일부 구현예에서, 제2 PAM 부위는 제1 PAM 부위로부터 하류에 있다. 일부 구현예에서, 거리는 제한없이, 20-100, 25-95, 30-95, 34-95, 34-91, 34-90, 35-90, 40-90, 40-84, 45-85, 또는 50-80 염기이다.
일부 구현예에서, 제2 (헬퍼) 스페이서는 8-15 염기 길이이다. 일부 구현예에서, 제2 스페이서는 8-14, 8-13, 8-12, 8-11, 8-10, 9-15, 9-14, 9-13, 9-12, 9-11, 9-10, 10-15, 10-14, 10-13, 10-12, 10-11, 11-15, 11-14, 11-13, 11-12, 12-15, 12-14, 12-13, 또는 13-15 염기 길이이다. 대조적으로, 제1 스페이서는 적어도 16, 17, 18, 또는 19 염기 길이이다.
다양한 "분할" 염기 편집 시스템이 또한 본 명세서에 기술되어 있는데, 이것은 Cas 단백질 및 핵염기 디아미나제가 별도 전달 비히클 (예를 들어, AAV)에 패키징될 수 있게 허용한다.
일부 구현예에서, 임상적 이득을 가질 수 있는, PCSK9 유전자 내에 초기 중지 코돈을 생성시키기 위해서 효율적인 편집을 매개할 수 있는 정규 sgRNA 및 hsgRNA의 쌍이 제공된다. 여기서의 발견들을 기반으로, sgRNA 및 hsgRNA에 적합한 표적 부위는 비-중지 코돈을 중지 코돈으로 전환시키기 위해 선택되었다. C에서 T/U 편집을 예로 하여, 비-중지 코돈은 CAG, CAA 또는 CGA일 수 있다.
이러한 표적 부위의 예는 표 4에 예시된다. 표 4의 서열은 표적의 위치를 보여주는데 사용된다는 것을 쉽게 이해한다. 그러나, 실제 sgRNA 및 hsgRNA는 전체 서열에 결합할 필요는 없다. 사실, 예를 들어, hsgRNA 경우에, 8-15 뉴클레오티드의 결합은 상기에 설명된 바와 같이 당연히 충분할 수 있다. 따라서, hsgRNA 상의 스페이서 서열은 임의의 표 4에 표시된 하위-서열에 상보성일 수 있거나, 또는 심지어 임의의 그들과 중복될 수 있다. 제한없이, 18-24 뉴클레오티드의 바람직한 스페이서 길이를 갖는, sgRNA에 대해서도 역시 동일하게 진실이다.
일 구현예에서, 인간 PCSK9 핵산 서열을 편집하기 위한 헬퍼 가이드 RNA/가이드 RNA의 쌍이 제공되고, 여기서 가이드 RNA는 비-중지 코돈을 중지 코돈으로 전환시키도록 염기 편집을 할 수 있도록 PCSK9 핵산 상의 제1 부위를 특이적으로 표적화하고, 헬퍼 가이드 RNA는 제1 부위로부터 20 내지 100 염기인 PCSK9 핵산 상의 제2 부위를 특이적으로 표적화한다. 일부 구현예에서, 제2 부위는 제1 부위로부터 멀리 약 20-100, 25-95, 30-95, 34-95, 34-91, 34-90, 35-90, 40-90, 40-84, 45-85, 또는 50-80 염기에 존재한다.
일부 구현예에서, hsgRNA는 8-15 염기 길이인 스페이서를 갖는다. 일부 구현예에서, 스페이서는 8-14, 8-13, 8-12, 8-11, 8-10, 9-15, 9-14, 9-13, 9-12, 9-11, 9-10, 10-15, 10-14, 10-13, 10-12, 10-11, 11-15, 11-14, 11-13, 11-12, 12-15, 12-14, 12-13, 또는 13-15 염기 길이이다. 일부 구현예에서, sgRNA는 적어도 16, 17, 18, 또는 19 염기 길이인 스페이서를 갖는다.
sgRNA/hsgRNA에 대한 스페이서 서열을 쉽게 디자인할 수 있다. 예를 들어, 표 4에 표시된 각각의 표적 부위 경우에, 스페이서는 바람직한 길이의 상보성 (즉, SEQ ID NO:166-180 또는 181-195 중 어느 하나의 하위-서열에 상보성) 서열일 수 있다. 결합 부위의 쌍의 특별한 예는 제한없이, SEQ ID NO:166 및 181; SEQ ID NO:167 및 182; SEQ ID NO:168 및 183; SEQ ID NO:169 및 184; SEQ ID NO:170 및 185; SEQ ID NO:171 및 186; SEQ ID NO:172 및 187; SEQ ID NO:173 및 188; SEQ ID NO:174 및 189; SEQ ID NO:175 및 190; SEQ ID NO:176 및 191; SEQ ID NO:177 및 192; SEQ ID NO:178 및 193; SEQ ID NO:179 및 194; 및 SEQ ID NO:180 및 195를 포함한다.
예시적인 sgRNA/hsgRNA 서열을 또한 디자인하였고 시험되었다. 표 3을 참조한다. 게다가, 헬퍼 가이드 RNA 및 가이드 RNA를 코딩하는 폴리뉴클레오티드 서열이 또한 제공된다.
sgRNA/hsgRNA 서열의 이러한 쌍을 사용하여, 세포 내 PSCK9 유전자를 불활성화시키는 방법을 수행할 수 있다. 일부 구현예에서, 방법은 세포를 본 개시의 헬퍼 가이드 RNA 및 가이드 RNA의 쌍, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 핵염기 디아미나제를 접촉시키는 단계를 수반한다. 이들 구성요소의 각각은 본 개시에서 더욱 기술되었다.
증강된 프라임 편집
일부 구현예에서, 개선된 프라임 편집 시스템이 또한 제공된다. 특히, 본 명세서에 제공된 일정 프라임 편집 가이드 RNA (pegRNA) 분자는 개선된 안정성을 갖는다. 이들 pegRNA는 통상의 가이드 RNA와 비교하여, 하나의 추가적 염기쌍을 갖는 스캐폴드를 함유한다 (도 36A 및 36E 참조). 주형에서 표준 스캐폴드 (SEQ ID NO:31)를 사용하여, 개선된 스캐폴드는 SEQ ID NO:32-43 중 어느 하나의 서열을 가질 수 있다.
상기 논의된 바와 같이, 전형적인 가이드 RNA 스캐폴드는 5'에서 3' 말단으로, (a) 반복 영역, (b) 테트라루프, (c) 반복 영역에 적어도 부분적으로 상보성인 안티-반복부, (d) 스템 루프 1, (e) 링커, (f) 스템 루프 2, 및 (g) 스템 루프 3을 포함하는 구조를 갖는다. 달리 말해서, 스캐폴드는 4 스템 루프를 포함한다. "스템 루프 2"로도 지칭되는, 제3 스템 루프 (5'에서 3'으로 계산)는 통상의 디자인에서 4 염기쌍을 포함한다. 새로운 디자인에서, 이러한 스템 루프는 5 염기쌍을 갖는다.
일 구현예에서, 5'에서 3' 방향으로, 제1 스템 루프 부분, 제2 스템 루프 부분, 제3 스템 루프 부분, 및 제4 스템 루프 부분을 포함하는, 스캐폴드를 포함하는 가이드 RNA를 제공하고, 여기서 제3 스템 루프는 그 안에 5 염기쌍을 포함한다.
스캐폴드의 서열은 다음과 같이 표시될 수 있다:
여기서 N은 임의 염기를 나타내고, X1 및 X2는 2-50 염기 (또는 2-40, 3-40, 4-40, 4-30, 2-30, 4-20 염기)의 길이의 임의의 뉴클레오티드 서열을 표시한다. 따라서, 일부 구현예에서, 염기쌍은 SEQ ID NO:31 내 위치에 따라서, 위치 45 및 55 사이의 하나를 포함한다. 일부 구현예에서, 스캐폴드는 SEQ ID NO:31에 대해 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖고 제3 스템 루프 내에 제공된 염기쌍을 포함한다.
그러므로, 일 구현예에서, 위치 45 및 위치 55의 염기 사이에 염기쌍을 도입시키고, 임의로, 스템 루프 구조 또는 스캐폴드/가이드 RNA 기능성을 유지하는 한, 1, 2, 3, 4, 또는 5 염기 첨가, 결실, 치환, 또는 이의 조합을 허용하여, SEQ ID NO:31로부터 유래된 스캐폴드를 포함하는 가이드 RNA를 제공한다. 일부 구현예에서, 스캐폴드는 SEQ ID NO:32-43으로 이루어진 군으로부터 선택되는 서열을 포함한다. 일부 구현예에서, 가이드 RNA는 적어도 100 뉴클레오티드, 또는 105, 110, 115, 120, 125, 130, 140 또는 150 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 RNA는 스페이서 (예를 들어, 8-25 뉴클레오티드), 역전사효소 주형, 및/또는 프라이머-결합 부위를 더 포함한다.
일부 구현예에서, 또한, 개선된 프라임 편집자 단백질이 제공된다. 일 구현예에서, 프라임 편집자는 프라임 편집자의 성능을 최적화하기 위해서 시험된 링커를 통해서 연결된 Cas 단백질 및 역전사효소를 포함한다. 일 구현예에서, 프라임 편집자는 SEQ ID NO:44의 아미노산 잔기를 포함한다. 일 구현예에서, 프라임 편집자는 SEQ ID NO:45의 아미노산 잔기를 포함한다. 이들 프라임 편집자 둘 모두를 시험하였고 우수한 편집 효율 및 특이성을 나타내는 것을 확인하였다.
Cas 단백질 및 역전사효소가 별도 전달 비히클 (예를 들어, AAV)로 패키징되도록 허용하는, 다양한 "분할" 프라임 편집 시스템이 또한 여기서 기술된다.
분할 프라임 편집 시스템을 사용하여, 세포 내 표적 부위에서 유전자 편집을 수행하기 위한 방법이 또한 제공된다. 일부 구현예에서, 방법은 세포로 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 코딩하는 제1 구성체가 밀봉된 제1 바이러스 입자, 및 RNA 인식 펩티드에 융합된 역전사효소를 코딩하는 제2 구성체가 밀봉된 제2 바이러스 입자를 도입시키는 단계를 수반한다. 일부 구현예에서, 제2 구성체는 RNA 인식 펩티드가 결합되는 RNA 인식 부위를 포함하는 가이드 RNA를 더 코딩한다.
일부 구현예에서, 제2 구성체는 RNA 인식 펩티드가 결합하는 RNA 인식 부위를 포함하는 가이드 RNA를 더 코딩한다. 일부 구현예에서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택된다. 일부 구현예에서, Cas 단백질은 SpCas9-NG 또는 xSpCas9이다.
역전사효소의 비제한적인 예는 인간 면역결핍 바이러스 (HIV) 역전사효소, 몰로니 쥐 백혈병 바이러스 (MMLV) 역전사효소 및 조류 골수아세포종 바이러스 (AMV) 역전사효소를 포함한다.
실시예
실시예 1. 오프-표적 편집 활성이 감소된 융합 염기 편집자
실시예에서 언급된 단일-가이드 RNA (sgRNA) 및 염기 편집자 (BE)는 특별히 지적하지 않으면, SpCas9에 대한 것이고, 예를 들어, SaCas9에 대한 sgRNA (Sa-sgRNA)이다. 현행 염기 편집 시스템이 ssDNA 영역 내에서 C에서 T 돌연변이를 유도할 수 있는지 여부를 시험하기 위해서, ssDNA 영역을 생성시키기 위해 말단 후퇴를 촉발시킬 수 있는, DNA 단일 가닥 파손 (SSD)을 만들기 위해서 SaD10A 닉카제 및 Sa-sgRNA를 사용하였다 (도 1A, 2A 및 3A). SaD10A, Sa-sgRNA (Sa-sgSITE31, Sa-sgSITE42 및 Sa-sgF1)와 2개의 공개된 BE, 즉, BE3 및 hA3A-BE3 또는 빈 벡터를 공-형질감염시켰고 (도 1B, 2B 및 3B) SaD10A에 의해 촉발된 ssDNA 영역 주변에서 돌연변이유발을 결정하였다. 3개의 시험된 부위 (Sa-SITE31, Sa-SITE42 및 Sa-F1)에서, BE3 또는 hA3A-BE3의 발현은 C에서 T 돌연변이를 유발시켰지만, 빈 벡터의 발현은 그렇지 않았다 (도 1C, 2C 및 3C). 이들 결과는 촉매적 활성 시티딘 디아미나제를 함유하는 현행 염기 편집자가 실제로 미관련 ssDNA 영역에서 비의도적 돌연변이를 초래한다는 것을 의미한다 (도 1, 2 및 3).
미관련 부위, 예를 들어, ssDNA 영역에서 시티딘 디아미나제의 활성을 억제하기 위해서, 염기 편집자를 염기 편집 억제제와 융합시키는 것을 제안하였다. 마우스 APOBEC3 (mA3)은 2개 시티딘 디아미나제 (CDA) 도메인 (CDA1 및 CDA2, 도 4A, 5A, 6A)을 포함하고 mA3-BE3에서 전체-길이 mA3의 사용 (도 4B, 5B, 6B)은 3개의 시험된 표적 부위에서 C에서 T 편집을 유도시키지 않았다 (도 4C, 5C, 6C). 그러나, mA3CDA2를 mA3-BE3으로부터 결실시켜 생성시킨, mA3CDA1-BE3 (도 4B, 5B, 6B)은 실질적 C에서 T 편집을 유도하였다 (도 4C, 5C, 6C). 이들 결과는 mA3CDA2가 염기 편집의 천연 억제제라는 것을 시사한다. 따라서, 우리는 mA3CDA2를 3개의 활성 BE, 즉, mA3CDA1-BE3, BE3 및 hA3A-BE3의 N-말단에 첨가하여서, mA3rev-BE3, mA3CDA2-BE3 및 mA3CDA2-hA3A-BE3을 생성시켰다 (도 4B, 5B, 6B). 우리가 기대한 바와 같이, N-말단에 mA3CDA2의 첨가는 분명하게 염기 편집 효율을 감소시켰다 (도 4C, 5C, 6C).
다음으로, 우리는 mA3CDA2의 절단이 염기 편집 효율을 복원시킬 수 있는지 여부를 고려하였다. 2A 자가-절단 펩티드는 mA3CDA2 및 mA3rev-BE3, mA3CDA2-BE3 및 mA3CDA2-hA3A-BE3 내 BE의 나머지 부분 사이에 삽입시켜서 mA3rev-2A-BE3, mA3CDA2-2A-BE3 및 mA3CDA2-2A-hA3A-BE3을 생성시켰다 (도 4B, 5B, 6B). 상응하여, 염기 편집 효율이 mA3rev-2A-BE3, mA3CDA2-2A-BE3 and mA3CDA2-2A-hA3A-BE3에서 복원되었고 (도 4C, 5C, 6C), mA3CDA2의 억제가 BE에 대한 이의 공유 연결에 의존적이라는 것을 의미한다. 우리는 또한 mA3CDA2 코어 서열과 유사한 도메인에 대해서 단백질 데이터베이스를 검색하였고 적어도 44 단백질이 유사한 도메인을 갖는다는 것을 발견하였다 (표 1).
인간 APOBEC3B (hA3B)는 또한 2개 시티딘 디아미나제 (CDA) 도메인 (CDA1 및 CDA2, 도 7A, 8A, 9A)을 포함하고, hA3B-BE3 내 전체-길이 hA3B의 사용 (도 7B, 8B, 9B)은 오직 3개의 시험된 표적 부위에서 상대적으로 낮은 수준의 C에서 T 편집을 유도하였다 (도 7C, 8C, 9C). 그러나, hA3BCDA1을 hA3B-BE3으로부터 결실시켜 생성된 hA3BCDA2-BE3 (도 7B, 8B, 9B)은 더 높은 C에서 T 편집을 유도하였다 (도 7C, 8C, 9C). 또한, 2A 자가-절단 펩티드는 hA3BCDA1 및 hA3BCDA2 사이에 삽입되어서 hA3B-2A-BE3을 생성시켰고 (도 7B, 8B, 9B), 이것은 hA3B-BE3에 비해서 더 높은 C에서 T 편집 효율을 유도시켰다 (도 7C, 8C, 9C). 이들 결과는 hA3BCDA1이 염기 편집의 다른 억제제이고 hA3BCDA1의 억제는 BE에 대한 이의 공유 연결에 의존한다는 것을 시사한다. 우리는 또한 hA3BCDA1에 유사한 도메인에 대해서 단백질 데이터베이스를 검색하여 유사한 도메인을 갖는 적어도 43개 단백질을 발견하였다 (표 2).
다음으로, 우리는 신규 BE를 개발하기 위해 mA3을 사용하는 것을 계획하였다. 2개 BE, mA3rev-BE3 및 mA3rev-2A-BE3은 mA3을 아미노산 (AA)207 및 AA208 사이에서 분할하여 만들었고, mA3CDA2가 최고 편집 효율을 유지할 수 있는 분할 지점을 결정하였다 (도 10A, 11A, 12A). mA3CDA1이 아미노산 (AA)154에서 종결되고 mA3CDA2가 AA238로부터 출발하므로, 우리는 mA3CDA2를 AA196/AA197, AA215/AA216, AA229/AA230 및 AA237/AA238에서 분할시켜서 mA3rev-BE3-196, mA3rev-2A-BE3-196, mA3rev-BE3-215, mA3rev-2A-BE3-215, mA3rev-BE3-229, mA3rev-2A-BE3-229, mA3rev-BE3-237, 및 mA3rev-2A-BE3-237을 생성시켰다 (도 10B, 11B, 12B). AA207/AA208 및 AA215/AA216에서 mA3의 분할이 최고 편집 효율을 유지하지만, 결과는 또한 AA196/AA197 내지 AA237/AA238을 포괄하는 분할 부위가 일반적으로 실질적 편집 효율을 유지시키는 것으로 확인되었다 (도 10C, 11C, 12C).
더 나아가서, 우리는 염기 편집 억제 효과를 갖는 mA3의 최소 영역을 결정하고자 노력하였다. 우리는 mA3rev-BE-237 내 mA3CDA2의 다양한 N-말단 부분을 결실시켜서 mA3rev-BE-27-Del-255, mA3rev-BE-237-Del-285 및 mA3rev-BE-237-Del-333을 개발하였고, 이것은 각각 염기 편집 억제제로서 mA3의 AA256-AA429, AA286-AA429 및 AA334-AA429 부분을 함유한다 (도 13A, 14A, 15A). mA3의 AA238-AA429 부분을 함유하는, mA3rev-BE-237과 비교하여, mA3rev-BE-237-Del-255, mA3rev-BE-237-Del-285 및 mA3rev-BE-237-Del-333은 유사한 편집 효율을 보였다 (도 13B, 14B, 15B). 이들 결과는 mA3의 AA334-AA429 부분은 여전히 염기 편집의 억제 효과를 갖는다는 것을 의미한다.
미관련 ssDNA 영역 내에서 C에서 T 돌연변이를 초래하지 않는 염기 편집자를 개발하기 위해서, 우리는 2A 자가-절단 부위를 mA3rev-2A-BE3 내 TEV 프로테아제의 절단부위로 치환시킨 다음에 TEV 프로테아제의 N-말단 부분 (TEVn) [Gray et al., 2010, Cell, doi: 10.1016/j.cell.2010.07.014]을 다른 TEV 절단 부위를 갖는 mA3rev-2A-BE3의 C-말단에 융합시켰다. 새롭게 개발된 BE는 BEsafe로 명명된다. 또한, 우리는 하나의 MS2 루프를 sgRNA에 넣어서 MS2-sgRNA [Ma et al., 2016, Nature Biotechnology, doi: 10.1038/nbt.3526]를 생성시킨 다음에 TEV 프로테아제의 C-말단 부분 (TEVc)을 MS2 루프에 결합할 수 있는 MS2 외피 단백질 (MCP)과 융합시켰다 (도 16A). BEsafe, MS2-sgRNA 및 MCP-TEVc가 공-발현되었을 때, BEsafe에 융합된 TEVn 및 MS2-sgRNA에 의해 동원될 수 있는 MCP-TEVc의 TEVc가 회합될 것이고 온-표적 부위에서 프로테아제 활성을 복원시킬 것이다. TEV 부위에서 후속 절단은 mA3CDA2 및 TEVn을 BEsafe의 N-말단 및 C-말단으로부터 제거시킬 것이고 최종 mA3CDA1-BE3은 온-표적 부위에서 효율적인 염기 편집을 유도시킬 수 있다 (도 16A). 대조적으로, BEsafe는 미관련 ssDNA 영역에서 C에서 T 돌연변이를 유도시키지 않을 것인데, mA3CDA1의 시티딘 디아미나제 활성이 mA3CDA2에 의해 억제되기 때문이다 (도 16B).
다음으로 우리는 온-표적 부위 및 미관련 ssDNA 영역에서 BEsafe 및 hA3A-BE3의 성능을 비교하였다 (도 17, 18, 19). 우리는 Sa-sgRNA 표적 부위에서 ssDNA 형성을 촉발시킬 수 있는, Sa-sgRNA 및 SaD10A를 발현하는 플라스미드 (도 17A, 18A, 19A)와, hA3A-BE3 발현 플라스미드 및 sgRNA 발현 플라스미드, BEsafe 발현 플라스미드 및 MS2-sgRNA 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc 발현 플라스미드 및 MS2-sgRNA 및 BEsafe를 발현하는 플라스미드 (도 17B, 18B, 19B)를 공-형질감염시켰다. 우리는 미관련 ssDNA 영역 (SpCas9의 것에 직교성인, Sa-sgRNA 온-표적 부위) 내에서 C에서 T 돌연변이 빈도 (도 17C, 18C, 19C), 및 hA3A-BE3 및 BEsafe의 sgRNA 온-표적 부위에서 염기 편집 효율을 조사하였고, 그 둘 모두는 SpCas9-유래이다 (도 17D, 18D, 19D). 우리는 BEsafe가 미관련 ssDNA 영역 (Sa-sgRNA 온-표적 부위)에서 임의의 C에서 T 돌연변이를 초래하지 않았지만 hA3A-BE3은 분명한 돌연변이를 초래하였다는 것을 확인하였다 (도 17C, 18C, 19C). sgRNA 온-표적 부위에서, BEsafe는 hA3A-BE3과 비슷한 염기 편집을 유도하였지만, 하나의 단일 플라스미드로부터 MS2-sgRNA 및 BEsafe 둘 모두의 발현은 하나의 플라스미드로부터 오직 BEsafe의 발현에 비해 더 높은 염기 편집 효율을 산출하였다 (도 17D, 18D, 19D).
본 발명에서 기술된 염기 편집자 및 염기 편집 방법은 다양한 진핵생물의 게놈에서 높은-특이성 및 높은-효율의 염기 편집을 수행하는데 적용될 수 있다.
최초로, 염기 편집 시스템은 미관련 ssDNA 영역 내에서 C에서 T 돌연변이의 초래를 피하고 온-표적 부위에서 효율적인 염기 편집을 유도하도록 확립시켰다. BEsafe 염기 편집 시스템 및 본 발명에 개시된 수반 방법은 현행 BE의 시티딘 디아미나제가 미관련 ssDNA 영역 내에서 비의도적 돌연변이를 초래할 수 있으므로 현재 존재하는 BE에 의해 구현할 수 없는 고도로 특이적인 염기 편집을 수행하는데 이용될 수 있다. 중요하게, 이러한 BEsafe 염기 편집 시스템의 높은 특이성 및 효율은 특히 질환-관련 돌연변이의 복원을 포함하는 유전자 요법에서, 잠재적인 임상적 해석을 촉진할 것이다.
실시예 2. 억제제-접합된 염기 편집자의 추가 평가
이 실시예는 sgRNA-독립적 방식으로 염기 편집자 (BE)의 APOBEC 모이어티가 오프-표적 단일 가닥 DNA (OTss) 부위에서 돌연변이를 직접적으로 유도하였다는 것을 입증하기 위한 효율적인 방법을 개발하였다. 2개 시티딘 디아미나제 (CDA) 도메인을 갖는 일련의 APOBEC 단백질을 시험하여서, 우리는 일정 이중-도메인 APOBEC의 촉매적-불활성 CDA 도메인이 시티딘 디아미나제 억제제 (CDI)로서 기능한다는 것을 확인하였다. 이러한 발견 및 분할-TEV 프로테아제의 개념을 이용하여, CDI의 sgRNA-가이드된 절단에 의해 유도된 염기 편집자 (iBE)는 nSpCas9-BE 및 TEV 절단 부위를 갖는 CDI를 연결시켜서 개발하였다. sgRNA-독립적 OTss 부위에서, iBE1은 공유적으로 연결된 CDI 덕분에 휴지 상태로 남아있었다. 반면에, 온-표적 부위에서, iBE1은 CDI의 sgRNA-가이드된 TEV 절단에 의해 활성화되어, 효율적인 염기 편집을 일으켰다. '증강된 특이성' SpCas9 닉카제를 사용하여, iBE2는 비의도적 OTsg 돌연변이를 감소시키도록 더욱 개발되었다. 이의 최소 오프-표적 효과 및 미손상 온-표적 편집 효율에 기인하여, iBE의 편집 특이성은 이전에 보고된 BE의 것에 비해서 유의하게 더 높았다. 따라서, 본 실시예에 기술된 iBE 시스템은 현행 염기 편집 시스템의 특이성에 대한 새로운 조절층을 제공하고 오프-표적 돌연변이에 대한 이의 적용을 보장한다.
방법
세포 배양 및 형질감염
ATCC로부터의 HEK293FT 세포는 DMEM (10566, Gibco/Thermo Fisher Scientific) + 10% FBS (16000-044, Gibco/Thermo Fisher Scientific)에서 유지시켰고 마이코플라즈마 오염을 배제시키기 위해 정기적으로 시험하였다.
게놈 DNA에서 염기 편집을 위해서, HEK293FT 세포는 24-웰 플레이트 중에 웰 당 1.1×105의 밀도로 파종되었고, 5.35 ㎕ LIPOFECTAMINE LTX (Life, Invitrogen), 2.14 ㎕ LIPOFECTAMINE plus (Life, Invitrogen), 1 ㎍ pCMV-BE3 (또는 hA3B-BE3, hA3BCDA2-nSpCas9-BE, hA3D-BE3, hA3DCDA2-nSpCas9-BE, hA3F-BE3, hA3FCDA2-nSpCas9-BE, hA3G-BE3, hA3GCDA2-nSpCas9-BE, mA3-BE3, mA3CDA1-nSpCas9-BE, mA3CDA2-mA3CDA1-nSpCas9-BE, hA3FCDA1-mA3CDA1-nSpCas9-BE, hA3BCDA1-mA3CDA1-nSpCas9-BE, mA3CDA2-rA1-nSpCas9-BE, hA3FCDA1-rA1-nSpCas9-BE, hA3BCDA1-rA1-nSpCas9-BE, hA3A-BE3, mA3CDA2-hA3A-nSpCas9-BE, hA3FCDA1-hA3A-nSpCas9-BE, hA3BCDA1-hA3A-nSpCas9-BE, mA3CDA2F1-mA3CDA1-nSpCas9-BE, mA3CDA2F2-mA3CDA1-nSpCas9-BE, mA3CDA2F3-mA3CDA1-nSpCas9-BE, mA3CDAI-T2A-mA3CDA1-nSpCas9-BE, EGFP-mA3CDA1-nSpCas9-BE, EGFP-T2A-mA3CDA1-nSpCas9-BE, mA3CDAI-T2A-rA1-nSpCas9-BE, EGFP-rA1-nSpCas9-BE, EGFP-T2A-rA1-nSpCas9-BE, mA3CDAI-T2A-hA3A-nSpCas9-BE, EGFP-hA3A-nSpCas9-BE, EGFP-T2A-hA3A-nSpCas9-BE, pCMV-dSpCas9, iBE1, iBE2, mA3CDAI-TS-mA3CDA1-nSpCas9HF1-BE-NTEV 또는 mA3CDAI-TS-mA3CDA1-nHypaSpCas9-BE-NTEV) 발현 벡터, 0.5 ㎍ Sa-sg-SaD10A 발현 벡터와 함께 또는 없이, 0.64 ㎍ sgRNA 발현 벡터를 함유하는, 250 ㎕ 무-혈청 Opti-MEM을 형질감염시켰다. 24시간 후에, 푸로마이신 (ant-pr-1, InvivoGen)을 4 ㎍/mL의 최종 농도로 배지에 첨가하였다. 다른 48시간 후에, 게놈 DNA는 후속 시퀀싱 분석을 위해서 QuickExtract™ DNA 추출 용액 (QE09050, Epicentre)을 사용해 세포로부터 추출하였다.
DNA 라이브러리 제조 및 시퀀싱
표적 게놈 서열은 조사되는 sgRNA 표적 부위가 측접된 프라이머 세트를 사용하여 고-충실도 DNA 중합효소 PrimeSTAR HS (Clonetech)를 통해 PCR 증폭되었다. 색인된 DNA 라이브러리는 약간의 변형으로 TruSeq ChIP 샘플 제조 키트 (Illumina)를 사용하여 제조되었다. 간략하게, 게놈 DNA 영역으로부터 증폭된 PCR 산물은 Covaris S220에 의해 단편화시켰다. 다음으로 단편화된 DNA는 TruSeq ChIP 샘플 제조 키트 (Illumina)를 사용하여 PCR 증폭되었다. Qubit 고-감도 DNA 키트 (Invitrogen)를 사용해 정량한 후, 상이한 태그를 갖는 PCR 산물은 Illumina Hiseq X10 (2Х150) 또는 NextSeq 500 (2Х150)을 사용하여, 중국, 상하이 소재의 CAS-MPG Partner Institute for Computational Biology Omics Core에서 심층 시퀀싱을 위해 함께 풀링되었다. 미가공 판독치 품질은 FastQC를 통해 평가하였다. 쌍형성 말단 시퀀싱을 위해서, 오직 R1 판독만을 사용하였다. 30 미만의 Phred 품질 점수를 갖는 양쪽 말단 상의 판독 서열 및 어댑터 서열을 정리하였다. 다음으로 정리된 판독치는 표적 서열에 대해서 BWA-MEM 알고리즘 (BWA v0.7.17)을 사용해 맵핑하였다. samtools (v1.9)을 사용해 파일업 후에, 염기 치환을 더욱 계산하였다.
염기 치환 계산
염기 치환은 적어도 1000회 독립 판독으로 맵핑된 조사된 sgRNA 표적 부위의 각 위치에서 선택되었고, 분명한 염기 치환은 오직 표적화된 염기 편집 부위에서만 관찰되었다. 염기 치환 빈도는 전체 판독으로 염기 치환 판독을 나누어 계산되었다. 각각의 sgRNA 경우에, indel 상에서 C에서 T 염기 치환의 비율은 모든 편집 부위에서 C에서 T 염기 치환의 총합을 sgRNA 표적 부위 주변 (표적 부위에 대한 상류 8 뉴클레오티드 내지 PAM 부위에 대한 하류 19 뉴클레오티드) 50-bp 영역의 idel 빈도를 나누어서 계산하였다.
결과
천연 시티딘 디아미나제 또는 CRISPR-Cas9에 의해 시험관내 진화된 아데노신 디아미나제를 융합시킨 시토신 또는 아데닌 염기 편집자 (CBE/BE 또는 ABE)는 표적화된 C에서 T 또는 아데닌에서 구아닌 (A에서 G) 전환을 높은 효율로 유도시키도록 개발되었다. BE는 게놈 DNA로 그들 결합을 유도하기 위해 촉매적 데드 Cas9 (dCas9) 단백질 또는 Cas9 닉카제 (nCas9)이므로, 비의도적 염기 치환이 sgRNA에 부분적으로 상보성인 OTsg 부위에서 유도될 것으로 예상되었다. 이러한 시나리오에서, BE에서 고-충실도 Cas9의 사용이 이들 OTsg 돌연변이를 감소시킬 수 있다. 한편, 유리 APOBEC가 단일 가닥 DNA (ssDNA) 영역 내에서 예상치 못한 C에서 T 돌연변이를 유도시킬 수 있으므로, BE의 APOBEC 모이어티는 OTss 부위에서 예상치 못한 돌연변이를 직접적으로 촉발시킬 수 있다. 달리 말해서, BE에 의해 유도된 오프-표적 돌연변이는 또한 sgRNA의 가이드와 독립적으로 OTss 부위에서 일어날 수 있지만; OTss 돌연변이는 검출에 대한 정량적 및 재현가능한 방식의 결여로 인해 밝힐 수 없었다.
이 실시예는 에스. 아우레우스 (S. aureus) 및 에스. 피오게네스 (S. pyogenes) Cas9 오솔로그의 공-발현 (co-expressing S . aureus and S . pyogenes Cas9 orthologs) (CESSCO)을 통해서 BE-유도된 OTss 돌연변이를 정량적으로 평가하기 위한 효율적인 방법을 수립한다. CESSCO에서, nSaCas9/Sa-sgRNA 쌍의 발현은 특이적 게놈 유전자좌에서 DNA 단일-가닥 파손 (SSB)을 생성시켰고 프로그램가능한 방식으로 게놈 ssDNA 영역의 형성을 야기시켰다. 동시에, sgRNA (sgRNA는 이하 Sp-sgRNA를 의미함)의 부재 하에서 공-발현된 BE3은 sgRNA-독립적 C에서 T 염기 치환이 nSaCas9/Sa-sgRNA-유도된 SSB 주변에서 생성된 ssDNA 영역 내에서 BE3 단독에 의해 유도될 수 있는지 여부를 조사하는데 사용될 수 있었다. nSaCas9/Sa-sgRNA에 의해 표적화된 게놈 영역의 심층-시퀀싱 후에, OTss 부위에서 C에서 T 돌연변이는 sgRNA의 부재 하에서 dSpCas9가 아니라 래트 APOBEC1 (rA1)-함유 BE3에 의해 유도되었다는 것을 분명하게 확인하여서, OTss 돌연변이는 sgRNA-독립적 방식으로 BE의 APOBEC 모이어티에 의해 초래된다는 것을 확인하였다.
다음으로 이 실시예는 고도로-특이적인 BE 구성에 적합한 APOBEC 패밀리의 구성원을 이용하여 OTss 돌연변이를 감소시키고자 하였다. 대부분의 일반적으로 사용되는 BE는 이중-도메인 APOBEC이 아닌, BE3 내 rA1같은, 단일 도메인 APOBE을 사용해 구성되었다. 일반적으로, 2개 CDA 도메인을 갖는 APOBEC에서, 하나는 촉매적으로 활성인 한편, 나머지 하나는 촉매적으로 불활성이어서, 시티딘 탈아미노화 활성에 대해 조절적 역할을 하고 따라서 OTss 효과를 감소시킨 고도로-특이적인 BE를 구성하는데 적합할 수 있다. 이러한 가능성을 시도하기 위해서, 우리는 5개 이중-도메인 APOBEC (도 20a), 즉, 인간 APOBEC3B (hA3B), 인간 APOBEC3D (hA3D), 인간 APOBEC3F (hA3F), 인간 APOBEC3G (hA3G) 및 마우스 APOBEC3 (mA3)의 2개 CDA 도메인 또는 하나의 촉매적으로 활성인 CDA 도메인을 갖는, 10개 쌍형성 BE를 구성하였고, 이의 C에서 T 편집 효율을 비교하였다.
도 20b,c에서 밝혀준 바와 같이, 2개 CDA 도메인을 함유하는 일정 APOBEC (hA3B, hA3F 및 mA3)으로 구축된 BE는 오직 활성 CDA 도메인만을 갖는 그들의 쌍형성 BE에 비해서 유의하게 더 낮은 편집 효율을 유도하였다. 이러한 결과는 이들 이중-도메인 APOBEC, 즉, hA3B, hA3F 및 mA3으로부터의 촉매적 불활성 CDA 도메인이 그들의 상응하는 활성 CDA 도메인에 대해 억제 기능을 나타낸다는 것을 보여준다.
억제 기능이 일반적인지 여부를 조사하기 위해서, 우리는 mA3, hA3F 또는 hA3B의 촉매적으로 불활성인 CDA 도메인을 개별적으로 mA3CDA1-nSpCas9-BE (도 20d) 및 2개의 다른 일반적으로 사용되는 BE, 즉, BE3 및 hA3A-BE3의 N-말단에 공유적으로 연결시켰다. 모든 이들 촉매적으로 불활성인 CDA 도메인은 모든 시험된 BE에 대해서 광범위한 억제 효과를 보였고, 특히, mA3의 CDA2 (mA3CDA2)는 가장 강력한 억제 효과를 보였다 (도 20e,f). 상세한 맵핑 분석은 mA3CDA2의 잔기 282-355는 전체-길이 mA3CDA2의 것과 유사한 억제 효과를 보였다는 것을 더욱 밝혀주었다. 종합적으로, 이들 결과는 일정한 이중-도메인 APOBEC의 촉매적-불활성 도메인이 실제로 시티딘 디아미나제 활성에 대해 일반적인 억제 효과를 보인다는 것을 보여주었고, 따라서 우리는 그들을 시티딘 디아미나제 억제제 (CDI)라고 정의하였다.
다음으로, 우리는 이의 공유적으로 연결된 BE로부터 mA3CDI (mA3CDA2)의 절단이 그들 염기 편집 능력을 복원할 수 있는지 여부를 시험하고자 하였다. 우리는 자가-절단 펩티드 (T2A)를 사용하여 조사를 위해 mA3CDI 및 mA3CDA1-nSpCas9-BE를 연결하였다. mA3CDI의 자가-절단 이후에, mA3CDI-T2A-mA3CDA1-nSpCas9-BE의 편집 효율은 비-절단성-mA3CDI 융합된 BE의 것에 비해 ∼10배 더 높게, EGFP-mA3CDA1-nSpCas9-BE 또는 EGFP-T2A-mA3CDA1-nSpCas9-BE와 유사한 수준까지 회복되었다. BE3 및 hA3A-BE3으로부터 mA3CDI의 자가-절단은 또한 상이한 정도지만, 그들 편집 효율을 증강시켰다.
이들 결과는 낮은 OTss 돌연변이로 정밀한 염기 편집을 위한 iBE 시스템을 개발하기 위한 핵심 개념 증명으로서 제공되었다. iBE1은 3개 핵심 모듈, 즉, mA3CDI, mA3CDA1-nSpCas9-BE 및 TEV 프로테아제의 N-말단 절반 (NTEV)을 연결하기 위해서 TEV 프로테아제 절단 부위 (TS)를 사용하여 구축하였다 (도 21a). 이론상, CDI의 공유 연결로 인해서, iBE1은 이것이 이의 APOBEC 모이어티에 의해 OTss 부위에 결합될 때 휴지 상태로 남아있는다 (도 21a). 특히, NTEV 그 자체는 불활성이지만 오직 C-말단 절반 (CTEV)이 동원될 때에만 기능성 TEV 프로테아제를 형성한다. 따라서, iBE1은 CDI가 기능성 TEV 프로테아제의 sgRNA-유도된 조립에 의해 절단되는 온-표적 부위에서 효율적인 염기 편집을 수행하기 위해 이의 CRISPR-Cas 모이어티에 의해 가이드될 수 있다 (도 21d).
세포에서 발현시킨 후에, iBE1은 예상한 대로 sgRNA-독립적 OTss 영역에서 휴지 상태로 남아있었고 (도 21b), BE3과 비교하여 C에서 T 돌연변이의 훨씬 더 낮은 (∼20%) 수준을 유도하였다 (도 21c). 온-표적 부위에서, RNA 결합 단백질 (MCP)-융합된 CTEV는 MS2-융합된 sgRNA에 의해 동원될 수 있어서 (도 21d), iBE1로부터 mA3CDI의 제거를 야기시키고 그러므로 효율적인 염기 편집을 할 수 있다. 다수의 게놈 유전자좌 전반에서 BE3 및 iBE1에 의해 유도된 온-표적 편집 효율의 비교 (도 21e)는 BE3과 유사한 수준으로 iBE1이 온-표적 염기 편집을 유도하였다는 것을 입증하였다 (도 21f, BE3의 ∼80%). 함께, 이 실시예는 우리가 CDI의 조작을 통해서, OTss 돌연변이가 억제된, 온-표적 부위에서의 효율적인 염기 편집을 촉매하는, iBE 시스템을 개발하였다는 것을 보여준다.
Cas9가 sgRNA에 상보성인 부분 서열을 갖는 OTsg 부위에서 비의도적 편집을 유도하는 것으로 알려져 있으므로, 우리는 또한 iBE1 내 비변형된 nSpCas9를 개선된 표적화 특이성을 갖는 이의 조작된 형태로 교체하여서 OTsg 돌연변이를 더욱 감소시키는 것을 목표로 하였다 (도 22a). 우리는 nSpCas9의 3개의 조작된 형태, 즉 neSpCas9, nSpCas9HF1 및 nHypaSpCas9를 시험하였고, 이들 표적화-특이성-개선된 Cas9 단백질들의 사용이 OTsg 돌연변이를 상당히 감소시켰다는 것을 확인하였다 (도 22b,c). 한편, neSpCas9의 사용은 온-표적 편집 효율을 손상시키지 않았지만, 다른 둘의 사용은 온-표적 편집 효율을 감소시켰다 (도 22d,e). 이러한 시나리오에서, 우리는 iBE2를 구축하기 위해서 nSpCas9를 neSpCas9로 교체하였다.
초기에 개발된 BE 처럼, BE3의 편집 효율은 일정 조건 하에서 제한되고, 개선된 편집 효율을 갖는 추가의 BE, 예를 들어, AncBE4max 또는 hA3A-BE3이 이후에 개발되었다. hA3A-BE3은 다양한 상황에서 고도로 활성인 BE이고, 따라서 우리는 편집 효율 및 특이성 관점에서 iBE2의 성능을 hA3A-BE3의 성능과 비교하였다 (도 23a). iBE2의 평균 온-표적 편집 빈도가 hA3A-BE3의 ∼50%였지만 (도 23a,c), OTss 및 OTsg 부위에서 iBE2에 의해 유도된 C에서 T 돌연변이는 배경 수준에 가까웠으나, hA3A-BE3은 이들 오프-표적 부위에서 실질적 돌연변이를 유도하였다 (도 23a,b). 취합하면, iBE2의 평균 편집 특이성은 hA3A-BE3의 것에 비해 ∼40배 더 높았다 (도 23d).
이 실시예에서, 우리는 먼저 sgRNA-독립적 OTss 돌연변이를 정량적으로 평가하기 위한 효율적인 방법 (CESSCO)을 개발하였고 정규 APOBEC-nCas9 골격을 갖는 BE가 실제로 sgRNA-독립적 방식으로 OTss 돌연변이를 유도시켰다는 것을 확인하였다 (도 21a, 21b, 23a, 23b). 우리의 발견과 일관되게, 최근의 전체 게놈 시퀀싱 연구가 또한 BE3가 아마도 역시 sgRNA-독립적 방식으로, 마우스 및 쌀 식물에서 실질적 오프-표적 돌연변이를 유도하였다는 것을 보여주었다. 중요하게, 우리는 CDI의 공유 연결에 기인하여 OTss 부위에서 휴지 상태로 남아있지만, 온-표적 부위에서 CDI의 sgRNA-매개 절단을 통해 활성화될 수 있는, iBE를 개발하기 위해서 CDI에 대한 우리의 발견을 이용하였다 (도 21a,d). iBE는 sgRNA-독립적 ssDNA 영역에서 유의하게 낮은 수준의 비의도적 돌연변이를 유도하였지만, 온-표적 편집을 효율적으로 수행하였다 (도 21b,c,e,f).
nSpCas9를 특이성-개선된 enSpCas9로 교체하여서, 고도의-특이적 iBE2를 개발하여 OTsg 부위에서 비의도적 편집을 더욱 감소시켰다 (도 22 및 23e). iBE 시스템은 상이한 Cas 모이어티를 갖는 BE 및 개선된 성능을 갖는 조작된 BE와 상용성이고, 구축된 BE의 특징, 예컨대 편집창을 변화시키지 않는다. 또한, APOBEC 패밀리 내에 충분한 구성원이 존재하므로, 다른 CDI가 향후 확인될 수 있고, CDI-접합된 iBE 시스템의 레파토리를 더욱 풍성하게 할 것이다. 편집 정밀도 및 효율 둘 모두가 염기 편집자에 필수적이므로, 특히, 그들의 치료적 적용성에서, 여기서 개발된 iBE 시스템은 현행 염기 편집 시스템의 특이성에 대한 새로운 조절층을 가져올 것이고 오프-표적 돌연변이에 대한 이의 적용을 보장한다.
실시예 3. 유도 및 분할 염기 편집자의 상이한 구성의 시험
이 실시예는 유도 및 분할 염기 편집자 (isplitBE) 시스템을 구현하기 위해서 분자의 다수의 상이한 구성을 시험하였다.
isplitBE의 작업 과정은 도 24B에 도시된 바와 같은 통상의 BE와 비교하여, 도 24A에 예시된다. 예시된 isplitBE 시스템에서, nCas9-D10A 구성은 AAV 비히클에 패키징된다. 전형적인 AAV 비히클은 4.7 kb 용량을 가지고, nCas9 구성체는 약 4.7 kb 길이이다. 다른 AVV 비히클은 (a) MCP, UGI, APOBEC, TEV 인식 부위 (TEV 부위), 및 mA3CDA2를 포함하는 융합 단백질; (b) TEVc 및 N22p를 갖는 융합 단백질; (c) 독립형 TEVn, (d) MS2 태그를 갖는 헬퍼 sgRNA (hsgRNA), 및 (e) boxB 태그를 갖는 다른 sgRNA를 코딩하기 위한 핵산 (약 4.4 kb의 총 길이)을 패키징할 수 있다.
표적 부위 (ON, 좌측 아래 분점)에서, hsgRNA 및 sgRNA의 각각은 표적 DNA 상의 2개의 인접한 부위에 결합하고, MCP- 및 N22p-함유 융합 단백질은 각각 hsgRNA 및 sgRNA의 MS2 태그 및 boxB 태그에 결합한다. TEVc (유리 TEVn 존재 하에) 및 TEV 부위의 근접성에 기인하여, TEVc/TEVn은 TEV 부위를 절단하여, mA3CDA2를 APOBEC로부터 제거한다. 부착된 mA3CDA2 없이, APOBEC은 바람직한 편집을 고도로 효율적으로 수행할 수 있다.
비-특이적 결합 부위일 수 있는, 오프-표적 부위 (OTss, 아래 중간 분점) 또는 가이드 RNA 중 하나에만 결합하는 부위에서, TEVc/TEVn 복합체는 TEV 부위-함유 융합 단백질로 동원되지 않고, 따라서, APOBEC은 활성화될 수 없다. 대조적으로, 통상의 BE 시스템 (도 24B)에서, APOBEC은 이미 활성이 있고 단일 가닥 뉴클레오티드 서열로 동원될 때마다 C에서 T 편집을 초래할 수 있다.
도 25에 예시된 바와 같은 10개 상이한 구성 (쌍 1-10)을 제조하였고 시험하였다. 예를 들어, 도 26A에 도시된 바와 같이, 쌍 1은 2개 구성체를 포함하였는데, 이 중 제1 구성체는 UGI 및 NLS와 함께, nCas9-D10A (spD10A)에 융합된 rA1을 함유하고, 이중 두번째는 EMX1을 표적화하는 sgRNA를 함유하였다. 쌍 2는 쌍 1과 유사하지만 rA1이 hA3A로 교체되었다. 쌍 3도 역시 유사하고 대신 돌연변이체 hA3A (Y130F)를 사용하였다.
쌍 4에서, rA1 및 nCas9 단백질을 상이한 구성체 상에 위치시켰다. rA1은 헬퍼 sgRNA 상의 MS2 태그를 인식하는 MCP 단백질에 더욱 융합시켰다. 쌍 5에서, mA3CDA2는 TEV 인식 부위 (검은색 실선 박스)를 통해, rA1에 더욱 융합되었다. 쌍 6에서, TEV 단백질은 자가-절단 부위 2A를 통해서, rA1-mA3CDA2 융합체에 더욱 융합되었다. 2A의 절단은 TEV를 융합 단백질로부터 방출시켰다.
쌍 7은 sgRNA 상의 boxB 태그를 인식하게 되는, N22p 단백질에 TEV를 융합시킴으로써 쌍 6과 상이하다. 쌍 8에서, TEV 단백질은 2A 자가 절단 부위에 의해 이격된, TEVn 및 TEVc로 나누었다. 쌍 9에서, 오직 TEVc가 N22p에 융합되었지만 TEVn은 임의의 RNA 태그-결합 단백질이 없었다. 쌍 10에서, 헬퍼 sgRNA는 근처 부위보다는 GFP를 표적화하였다.
도 26A의 구성체는 표적 부위 EMX1-ON에서 C에서 T 편집을 위해 디자인되었고, Sa-SITE31-OTss 및 EMX1-OTsg 부위에서 오프-표적 편집 역시 조사된다. 시험 결과는 도 26B에 도시된다. isplitBE-rA1 (쌍 9)은 온 (ON) 부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서 편집은 없었다.
유사하게, 모든 이들 구성은 FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위 (도 27A의 개략도 참조)에서 시험되었다. 도 27B는 FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위에서 상이한 염기 편집자에 대한 편집 효율의 비교를 보여준다. 다시, isplitBE-rA1 (쌍 9)은 OTss 또는 OTsg 부위에서의 편집은 없었지만, 온 (ON) 부위에서 실질적 편집을 유도하였다.
V1B-ON, Sa-SITE42-OTss 및 V1B-OTsg 부위 (도 28A의 개략도 참조)에서 추가 시험을 수행하였다. 다시, 도 28B에 도시된 바와 같이, isplitBE-rA1 (쌍 9)은 OTss 또는 OTsg 부위에서 편집은 없었지만, 온 (ON) 부위에서 실질적 편집을 유도하였다.
실시예 4. isplitBE 시스템의 매개변수의 조율
시험된 10개 구성 중에서, 쌍 9는 편집 특이성 관점에서 최고 성능을 나타냈다. 쌍 9는 2개 sgRNA, 헬퍼 sgRNA (hsgRNA) 및 정규 sgRNA를 적용한다. sgRNA의 이중 사용은 특이성을 더욱 증강시키는데 양쪽 표적 부위가 서로 근접하여 위치되는 것이 요구되기 때문이다.
이 실시예의 제1 어세이에서, 2개 표적 부위 간 최적 거리가 평가되었다. DNTET1, EMX1 및 FANCF 부위에서 hsgRNA 및 sgRNA 간 거리를 예시하는 개략도는 도 29A에 제시된다. 도 29B는 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도를 보여준다. 도 29C의 요약은 hsgRNA 및 sgRNA 간 거리의 효과를 보여준다. 요약을 기반으로, 최고 염기 편집 효율에 대한 거리의 최적 범위는 hsgRNA의 PAM에서 sgRNA의 PAM까지 -91 내지 -34 bp이다.
제2 어세이는 염기 편집 효율 및 정밀성에 대한 hsgRNA 스페이서 길이의 효과를 시험하였다. 도 30A는 DNEMX1, FANCF 및 V1A 부위에서 상이한 스페이서 길이를 갖는 sgRNA 및 hsgRNA의 공-형질감염을 예시하는 개략도를 제시한다. 도 30B는 hsgRNA 및 sgRNA의 표적 부위에서 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도를 보여준다. 도 30C의 통계 분석은 hsgRNA 스페이서 길이의 효과를 보여준다. 도시된 바와 같이, 10-nt 스페이서를 갖는 hsgRNA의 사용이 hsgRNA 표적 부위에서 편집 효율을 상당히 감소시켰지만 sgRNA 표적 부위에서 편집 효율은 유지시켰다. 따라서, 헬퍼 sgRNA 서열 중 9-15의 스페이서는 hsgRNA 표적 부위에서 편집을 최소화하면서, sgRNA 표적 부위에서 효율적인 편집을 보장하는 양호한 범위일 수 있다.
실시예 5. 게놈- 및 전사체-와이드 평가
isplitBE 시스템의 전체 효율은 통상의 BE3과 비교하였다. 결과는 도 31에 도시된다 (상이한 표적 부위에서 표시된 염기 편집자에 의해 유도된 편집 빈도). isplitBE가 상당히 개선된 특이성을 갖는 경우에도 효율성의 분명한 희생은 없었다.
정상 세포는 그들의 내생성 APOBEC3 활성에 기인하여 배경 수준의 C에서 T 돌연변이를 갖는다. 오프-표적 C에서 T 돌연변이의 보다 정확한 측정을 얻기 위해서, APOBEC3 녹아웃 293FT 세포주 (293FT-A3KO)가 사용되었다. 도 32A는 야생형 293FT 세포 및 APOBEC3 녹아웃 293FT 세포에서 mRNA 발현 수준을 보여준다. 도 32B는 염기 편집자에 의해 유도된 게놈-와이드 C에서 T 돌연변이를 결정하기 위한 절차를 예시하는 개략도를 제시하고, 시험 결과는 도 32C에 제시된다 (Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-rA1에 의해 유도된 게놈-와이드 C에서 T 돌연변이의 수 및 온-표적 편집 효율 (좌)). BE3 및 Y130F 둘 모두는 상당히 높은 오프-표적 편집을 가졌지만, isplitBE-rA1의 오프-표적 편집 비율은 배경치에 가깝다 (Cas9 단독).
다음으로 이 실시예는 isplitBE-mA3, BE3 및 hA3A-BE3-Y130F (Y130F)에 의해 유도된 전사체-와이드 C에서 U 돌연변이를 비교하였다. Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 전사체-와이드 C에서 T(U) 돌연변이의 수는 도 33A에 도시된다. 도 33B는 Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 RNA C에서 U 편집 빈도를 도시한다. 도 33C는 BE3 복제물 1 및 isplitBE-mA3 복제물 1에 의해 유도된 RNA C에서 U 편집의 분포를 도시한다. 다시, isplitBE는 BE3에 비해서 훨씬 낮은 C에서 U 편집을 유도하였다.
실시예 6. PCSK9 녹아웃
프로단백질 컨버타제 서브틸리신/켁신 9형 (Proprotein convertase subtilisin/kexin type 9) (PCSK9)은 인간 염색체 1 상의 PCSK9 유전자에 의해 코딩되는 효소이다. 이것은 다른 단백질을 활성화시키는 프로단백질 컨버타제 단백질 패밀리의 9번째 구성원이다. PCSK9는 처음 합성될때 불활성이고, 펩티드 사슬의 절단부가 그들 활성을 차단하므로, 프로단백질 컨버타제는 그 절단부를 제거하여 효소를 활성화시킨다. PCSK9 유전자는 관상 동맥 질환의 높은 위험성와 연관있는 27 유전자좌 중 하나를 함유한다.
PCSK9는 많은 조직 및 세포 유형에서 편재하여 발현된다. PCSK9는 전형적으로 세포외 유체 내에서, 입자 당 3,000 내지 6,000 지방 분자 (콜레스테롤 포함)를 수송하는, 저-밀도 지단백질 입자 (LDL)에 대한 수용체에 결합한다. 간 및 다른 세포 막 상의 LDL 수용체 (LDLR)에 결합하여 세포외 유체로부터 세포로 LDL-입자의 섭취를 개시하여서, LDL 입자 농도를 감소시킨다. PCSK9가 차단되면, 더 많은 LDLR이 재활용되고 세포외 유체로부터 LDL-입자를 제거하도록 세포의 표면에 존재한다. 그러므로, PCSK9의 차단은 혈액 LDL-입자 농도를 하락시킬 수 있다.
이 실시예는 본 기술을 사용하는 염기 편집을 통해 중지 코돈을 도입시켜서 PCSK9를 불활성화시키는 접근법을 시험하였다. 사용된 sgRNA/hsgRNA의 서열은 표 3에 표시되고, PCSK9 상의 표적 부위는 표 4에 표시된다.
염기 편집에 의해 생성된 중지 코돈의 수를 인간 PCSK9 유전자에 대해 측정하였다. 도 34A는 sgRNA 및 hsgRNA와 isplitBE-mA3 및 nCas9의 공-형질감염을 예시하는 개략도를 제시한다. 표시된 부위에서 isplitBE-mA3에 의해 유도된 편집 효율은 도 34B-D에 도시된다. 이들 결과는 방법의 높은 효율 및 특이성을 입증한다.
실시예 7. 아데닌 염기 편집자에서 isplitBE 디자인의 적용가능성
이 실시예는 다른 유형의 염기 편집자에서 유도 및 분할 염기 편집자 (isplitBE) 디자인의 적용가능성을 확인한다. 사용된 억제제는 mA3CDA2였고 편집자는 아데닌 염기 편집자 (ABE)였다.
sgRNA 및 mA3CDA2와 융합된 ABE (또는 대조군으로서가 아님)의 공-형질감염을 예시하는 개략도는 도 35A에 도시된다. RNF2 및 FANCF 부위에서 표시된 ABE에 의해 유도된 편집 효율은 도 35B에 도시된다. ABE에 부착된 mA3CDA2를 사용하여, 편집 효율은 ABE 단독과 비교하여 감소되었다. mA3CDA2가 2A에 의해 절단되었을 때, ABE의 편집 효율은 복원되어, ABE에 대한 isplitBE 접근법이 검증되었다.
실시예 8. 증강된 프라임 편집
통상의 염기 편집자는 염기 전환, 삽입 또는 결실이 아닌, 염기 전이에 제한된다. 최근에, Cas9 닉카제를 역전사효소 (RTase)와 접합시킴으로써 프라이머 편집자 (PE)를 적용하는, 프라이머 편집 시스템이 제안되었다. PE 시스템은 모든 유형의 염기 치환, 소형 indel, 및 그들 조합을 포함하여, 거의 모든 의도하는 변화를 갖는 게놈을 작성할 수 있다. 그러나, PE 시스템의 전체 효율 및 특이성은 여전히 제한적이다.
제1 어세이에서, 이 실시예는 프라이머 편집 가이드 RNA (pegRNA)에 대한 새로운 디자인을 시험하였다. 통상적으로, 각각의 가이드 RNA는 스캐폴드를 포함한다. 통상적으로 사용되는 스캐폴드 서열은 하기이다:
다른 예는 하기이다:
보다 포괄적인 공통 서열은 하기이다:
여기서 N은 임의 염기를 나타내고, X1 및 X2는 2-50 염기 길이의 임의의 뉴클레오티드 서열을 표시한다.
스캐폴드는 이의 내부 상보성 서열로 인해 2차 구조 (도 36A에 예시, SEQ ID NO:30)를 형성할 것으로 예상된다. 염기 편집자에서 사용되는 전형적인 sgRNA는 약 20 nt 길이고 표적 부위에 결합하는 스페이서를 포함하여, 약 96 nt 길이이다. pegRNA에서, 역전사 주형 및 프라이머-결합 부위는 스캐폴드의 3' 말단에서 더 첨가된다. 놀랍게도, 오리지날 스캐폴드는 pegRNA 상황에서 충분히 안정하지 않다는 것을 본 발명에서 발견하였다.
그러므로, 위치 48 (예를 들어, A in SEQ ID NO:30) 및 61 (예를 들어, G in SEQ ID NO:30) 사이에 신규 쌍형성을 형성하는, 신규 스캐폴드를 제조하였다. 도 36A 및 36E에 도시된 예에서, 신규 스캐폴드는 G 및 C 또는 대신 C 및 G를 갖는다 (SEQ ID NO:36, 37). 이러한 추가 예의 돌연변이체 스캐폴드는 하기 표 5에 표시된다.
통상의 pegRNA 및 새롭게 디자인된, 증강된 pegRNA (epegRNA)를 시험하기 위한 구성체는 PE2의 경우에 도 36B 및 36F에 도시되어 있고, 시험 결과는 도 36C-36D 및 36G에 도시된다. 프라임 편집 효율의 비교는 pegRNA 및 epegRNA로 유도하였다. epegRNA는 상당히 개선된 스템 안정성을 가지고, 보드 전반에서 pegRNA에 비해 훨씬 더 높은 편집 효율을 나타냈다.
유사하게, 도 37A의 개략도에 따라서, pegRNA, 닉킹 sgRNA와 PE2-NG (SEQ ID NO:132) 또는 xPE2 (SEQ ID NO:133)의 공-형질감염을 수행하여 TGATG 결실에 대한 편집 효율을 시험하였다. 결과는 도 37B에 도시된다. PE2-NG는 완화된 NG PAM을 인식할 수 있는 조작된 Cas9를 갖는다 (참조: 예를 들어, Nishimasu et al., Science 361, 1259-62 (2018)). xPE2는 완화된 NG, GAA 및 GAT PAM을 인식할 수 있는 조작된 Cas9를 갖는다 (참조: 예를 들어, Hu et al., Nature 556, 57-63 (2018)). PE2-NG (SEQ ID NO:44), xPE2 (SEQ ID NO:45), SpCas9-NG (SEQ ID NO:46), 및 xSpCas9 (SEQ ID NO:47)의 서열은 하기 표 6에 표시된다.
완전한 프라임 편집자는 AAV 비히클이 수용할 수 있는 것에 비해 훨씬 더 큰 구성체 (약 11 kb)를 요구한다. 따라서, 분할 PE 시스템을 디자인하였고 시험하였다. 오리지널 PE 시스템은 도 38A의 좌측 패널에 예시되어 있고, 새롭게 디자인된 분할 PE 시스템은 우측 패널에 예시되어 있으며, 여기서 닉카제 및 RTase는 상이한 AAV 입자에 패키징된다. RTase는 RNA 결합 단백질 MCP에 융합되고, pegRNA는 결합 부위 MS2를 포함한다. 세포 내로 흡수될 때, RTase는 MS2-MCP 결합을 통해서, pegRNA에 의해 동원될 수 있고, 닉카제와 접촉될 수 있다.
예시적인 공-형질감염 시스템은 도 38B에 예시되어 있고, EMX1 부위에서, 시험 결과는 도 38C에 도시되어 있다.
* * *
본 개시는 본 개시의 개별 양태의 단일 예시로서 의도되는 기술된 특별한 구현예에 의해 범주가 제한되지 않고, 기능적으로 동등한 임의의 조성물 또는 방법은 본 개시의 범주 내에 있다. 다양한 변형 및 변동이 본 개시의 정신 또는 범주를 벗어나지 않고 본 개시의 방법 및 조성물에 대해서 만들어질 수 있다는 것은 당업자에게 자명할 것이다. 따라서, 본 개시는 그들이 첨부된 청구항 및 그들 동등물의 범주 내에 있는 제공된 본 개시의 변형 및 변동을 포괄하고자 한다.
본 명세서에서 언급된 모든 공개물 및 특허 출원은 각각의 개별 공개물 또는 특허 출원이 특별히 개별적으로 참조로 편입시킨다고 표시한 바와 동일한 정도로 참조로 본 명세서에 편입된다.
SEQUENCE LISTING
<110> ShanghaiTech University
<120> INHIBITION OF UNINTENDED MUTATIONS IN GENE EDITING
<130> 49BD-292057-WO2
<150> PCT/CN2019/074577
<151> 2019-02-02
<160> 203
<170> PatentIn version 3.5
<210> 1
<211> 223
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 1
Met Ser Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro
1 5 10 15
Glu Thr Arg Phe Trp Val Glu Gly Arg Arg Met Asp Pro Leu Ser Glu
20 25 30
Glu Glu Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys
35 40 45
Tyr Tyr His Arg Met Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe
50 55 60
Asn Gly Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys
65 70 75 80
Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu
85 90 95
Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn
100 105 110
Cys Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile
115 120 125
Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe
130 135 140
Gln Lys Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val
145 150 155 160
Met Asp Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro
165 170 175
Lys Arg Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg
180 185 190
Thr Gln Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp
195 200 205
Leu Val Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
210 215 220
<210> 2
<211> 166
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr Phe Lys Pro Gln
50 55 60
Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ser Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Lys Ile Met Asp Tyr Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln
165
<210> 3
<211> 119
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 3
Met Gly Glu Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser
1 5 10 15
Ser Thr Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser
20 25 30
Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu
35 40 45
Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val
50 55 60
Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly
65 70 75 80
Arg Asp Met Ile Ile Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro
85 90 95
Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu
100 105 110
Val Thr Thr Asn Phe Gln Thr
115
<210> 4
<211> 116
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 4
Met Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro
1 5 10 15
Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly
20 25 30
Gln Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly
35 40 45
Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser
50 55 60
Val Pro Lys Asn Phe Met Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln
65 70 75 80
Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly
85 90 95
His Lys Val Phe Met Val Lys Pro Glu Glu Pro Phe Gln Pro Val Lys
100 105 110
Glu Ala Thr Gln
115
<210> 5
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 5
Glu Asn Leu Tyr Phe Gln Ser
1 5
<210> 6
<211> 246
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 6
Met Ala Ser Ser Asn Ser Met Phe Arg Gly Leu Arg Asp Tyr Asn Pro
1 5 10 15
Ile Ser Asn Asn Ile Cys His Leu Thr Asn Val Ser Asp Gly Ala Ser
20 25 30
Asn Ser Leu Tyr Gly Val Gly Phe Gly Pro Leu Ile Leu Thr Asn Arg
35 40 45
His Leu Phe Glu Arg Asn Asn Gly Glu Leu Val Ile Lys Ser Arg His
50 55 60
Gly Glu Phe Val Ile Lys Asn Thr Thr Gln Leu His Leu Leu Pro Ile
65 70 75 80
Pro Asp Arg Asp Leu Leu Leu Ile Arg Leu Pro Lys Asp Val Pro Pro
85 90 95
Phe Pro Gln Lys Leu Gly Phe Arg Gln Pro Glu Lys Gly Glu Arg Ile
100 105 110
Cys Met Val Gly Ser Asn Phe Gln Thr Lys Ser Ile Thr Ser Ile Val
115 120 125
Ser Glu Thr Ser Thr Ile Met Pro Val Glu Asn Ser Gln Phe Trp Lys
130 135 140
His Trp Ile Ser Thr Lys Asp Gly Gln Cys Gly Ser Pro Met Val Ser
145 150 155 160
Thr Lys Asp Gly Lys Ile Leu Gly Leu His Ser Leu Ala Asn Phe Gln
165 170 175
Asn Ser Ile Asn Tyr Phe Ala Ala Phe Pro Asp Asp Phe Ala Glu Lys
180 185 190
Tyr Leu His Thr Ile Glu Ala His Glu Trp Val Lys His Trp Lys Tyr
195 200 205
Asn Thr Ser Ala Ile Ser Trp Gly Ser Leu Asn Ile Gln Ala Ser Gln
210 215 220
Pro Ser Gly Leu Phe Lys Val Ser Lys Leu Ile Ser Asp Leu Asp Ser
225 230 235 240
Thr Ala Val Tyr Ala Gln
245
<210> 7
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 7
Gly Gly Cys Ser His Gln Ser
1 5
<210> 8
<211> 246
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 8
Met Ala Ser Ser Lys Ser Leu Phe Arg Gly Leu Arg Asp Tyr Asn Pro
1 5 10 15
Ile Ala Ser Ser Ile Cys Gln Leu Asn Asn Ser Ser Gly Ala Arg Gln
20 25 30
Ser Glu Met Phe Gly Leu Gly Phe Gly Gly Leu Ile Val Thr Asn Gln
35 40 45
His Leu Phe Lys Arg Asn Asp Gly Glu Leu Thr Ile Arg Ser His His
50 55 60
Gly Glu Phe Val Val Lys Asp Thr Lys Thr Leu Lys Leu Leu Pro Cys
65 70 75 80
Lys Gly Arg Asp Ile Val Ile Ile Arg Leu Pro Lys Asp Phe Pro Pro
85 90 95
Phe Pro Arg Arg Leu Gln Phe Arg Thr Pro Thr Thr Glu Asp Arg Val
100 105 110
Cys Leu Ile Gly Ser Asn Phe Gln Thr Lys Ser Ile Ser Ser Thr Met
115 120 125
Ser Glu Thr Ser Ala Thr Tyr Pro Val Asp Asn Ser His Phe Trp Lys
130 135 140
His Trp Ile Ser Thr Lys Asp Gly His Cys Gly Leu Pro Ile Val Ser
145 150 155 160
Thr Arg Asp Gly Ser Ile Leu Gly Leu His Ser Leu Ala Asn Ser Thr
165 170 175
Asn Thr Gln Asn Phe Tyr Ala Ala Phe Pro Asp Asn Phe Glu Thr Thr
180 185 190
Tyr Leu Ser Asn Gln Asp Asn Asp Asn Trp Ile Lys Gln Trp Arg Tyr
195 200 205
Asn Pro Asp Glu Val Cys Trp Gly Ser Leu Gln Leu Lys Arg Asp Ile
210 215 220
Pro Gln Ser Pro Phe Thr Ile Cys Lys Leu Leu Thr Asp Leu Asp Gly
225 230 235 240
Glu Phe Val Tyr Thr Gln
245
<210> 9
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 9
Gln Val Val Val His Gln Ser Lys
1 5
<210> 10
<211> 247
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 10
Met Ala Ser Ala Lys Ser Leu Met Arg Gly Leu Arg Asp Phe Asn Pro
1 5 10 15
Ile Ala Gln Thr Val Cys Arg Leu Lys Val Ser Val Glu Tyr Gly Ala
20 25 30
Ser Glu Met Tyr Gly Phe Gly Phe Gly Ala Tyr Ile Val Ala Asn His
35 40 45
His Leu Phe Arg Ser Tyr Asn Gly Ser Met Glu Val Gln Ser Met His
50 55 60
Gly Thr Phe Arg Val Lys Asn Leu His Ser Leu Ser Val Leu Pro Ile
65 70 75 80
Lys Gly Arg Asp Ile Ile Leu Ile Lys Met Pro Lys Asp Phe Pro Val
85 90 95
Phe Pro Gln Lys Leu His Phe Arg Ala Pro Thr Gln Asn Glu Arg Ile
100 105 110
Cys Leu Val Gly Thr Asn Phe Gln Glu Lys Tyr Ala Ser Ser Ile Ile
115 120 125
Thr Glu Thr Ser Thr Thr Tyr Asn Ile Pro Gly Ser Thr Phe Trp Lys
130 135 140
His Trp Ile Glu Thr Asp Asn Gly His Cys Gly Leu Pro Val Val Ser
145 150 155 160
Thr Ala Asp Gly Cys Ile Val Gly Ile His Ser Leu Ala Asn Asn Ala
165 170 175
His Thr Thr Asn Tyr Tyr Ser Ala Phe Asp Glu Asp Phe Glu Ser Lys
180 185 190
Tyr Leu Arg Thr Asn Glu His Asn Glu Trp Val Lys Ser Trp Val Tyr
195 200 205
Asn Pro Asp Thr Val Leu Trp Gly Pro Leu Lys Leu Lys Asp Ser Thr
210 215 220
Pro Lys Gly Leu Phe Lys Thr Thr Lys Leu Val Gln Asp Leu Ile Asp
225 230 235 240
His Asp Val Val Val Glu Gln
245
<210> 11
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 11
Tyr Asp Val Arg His Gln Ser Arg
1 5
<210> 12
<211> 239
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 12
Met Ala Ser Asp Met Tyr Ile Glu Arg Ala Gly Asp Ile Thr Trp Glu
1 5 10 15
Lys Asp Ala Glu Val Thr Gly Asn Ser Pro Arg Leu Asp Val Ala Leu
20 25 30
Asp Glu Ser Gly Asp Phe Ser Leu Val Glu Glu Asp Gly Pro Pro Met
35 40 45
Arg Glu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ala Leu Trp
50 55 60
Asp Val Pro Ala Pro Lys Glu Val Lys Lys Gly Glu Thr Thr Asp Gly
65 70 75 80
Val Tyr Arg Val Met Thr Arg Arg Leu Leu Gly Ser Thr Gln Val Gly
85 90 95
Val Gly Val Met Gln Glu Gly Val Phe His Thr Met Trp His Val Thr
100 105 110
Lys Gly Ala Ala Leu Arg Ser Gly Glu Gly Arg Leu Asp Pro Tyr Trp
115 120 125
Gly Asp Val Lys Gln Asp Leu Val Ser Tyr Cys Gly Pro Trp Lys Leu
130 135 140
Asp Ala Ala Trp Asp Gly Leu Ser Glu Val Gln Leu Leu Ala Val Pro
145 150 155 160
Pro Gly Glu Arg Ala Arg Asn Ile Gln Thr Leu Pro Gly Ile Phe Lys
165 170 175
Thr Lys Asp Gly Asp Ile Gly Ala Val Ala Leu Asp Tyr Pro Ala Gly
180 185 190
Thr Ser Gly Ser Pro Ile Leu Asp Lys Cys Gly Arg Val Ile Gly Leu
195 200 205
Tyr Gly Asn Gly Val Val Ile Lys Asn Gly Ser Tyr Val Ser Ala Ile
210 215 220
Thr Gln Gly Lys Arg Glu Glu Glu Thr Pro Val Glu Cys Phe Glu
225 230 235
<210> 13
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 13
Lys Glu Arg Lys Arg Arg Gly Ala
1 5
<210> 14
<211> 243
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 14
Met Ala Ser Ser Thr Asp Met Trp Ile Glu Arg Thr Ala Asp Ile Ser
1 5 10 15
Trp Glu Ser Asp Ala Glu Ile Thr Gly Ser Ser Glu Arg Val Asp Val
20 25 30
Arg Leu Asp Asp Asp Gly Asn Phe Gln Leu Met Asn Asp Pro Gly Ala
35 40 45
Pro Trp Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Val Leu Trp
50 55 60
Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys Gly Asp Thr Thr Thr Gly
65 70 75 80
Val Tyr Arg Ile Met Thr Arg Gly Leu Leu Gly Ser Tyr Gln Ala Gly
85 90 95
Ala Gly Val Met Val Glu Gly Val Phe His Thr Leu Trp His Thr Thr
100 105 110
Lys Gly Ala Ala Leu Met Ser Gly Glu Gly Arg Leu Asp Pro Tyr Trp
115 120 125
Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr Gly Gly Pro Trp Lys Leu
130 135 140
Gln His Lys Trp Asn Gly Gln Asp Glu Val Gln Met Ile Val Val Glu
145 150 155 160
Pro Gly Lys Asn Val Lys Asn Val Gln Thr Lys Pro Gly Val Phe Lys
165 170 175
Thr Pro Glu Gly Glu Ile Gly Ala Val Thr Leu Asp Phe Pro Thr Gly
180 185 190
Thr Ser Gly Ser Pro Ile Val Asp Lys Asn Gly Asp Val Ile Gly Leu
195 200 205
Tyr Gly Asn Gly Val Ile Met Pro Asn Gly Ser Tyr Ile Ser Ala Ile
210 215 220
Val Gln Gly Glu Arg Met Asp Glu Pro Ile Pro Ala Gly Phe Glu Pro
225 230 235 240
Glu Met Leu
<210> 15
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 15
Lys Gln Lys Lys Arg Gly Gly Lys
1 5
<210> 16
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 16
acaugaggau cacccaugu 19
<210> 17
<211> 136
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 17
guuugagagc uaggccaaca ugaggaucac ccaugucugc agggccuagc aaguucaaau 60
aaggcuaguc cguuaucaac uuggccaaca ugaggaucac ccaugucugc agggccaagu 120
ggcaccgagu cggugc 136
<210> 18
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
ggagcagacg auauggcguc gcucc 25
<210> 19
<211> 122
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
guuugagagc uaccggagca gacgauaugg cgucgcuccg guagcaaguu caaauaaggc 60
uaguccguua ucaacuugga gcagacgaua uggcgucgcu ccaaguggca ccgagucggu 120
gc 122
<210> 20
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 20
gcccugaaga agggc 15
<210> 21
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 21
guuugagagc uagggcccug aagaagggcc cuagcaaguu caaauaaggc uaguccguua 60
ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu cggugc 106
<210> 22
<211> 117
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 22
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Ile Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile
65 70 75 80
Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met
85 90 95
Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala
100 105 110
Asn Ser Gly Ile Tyr
115
<210> 23
<211> 123
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 23
Met Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr
1 5 10 15
Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys
20 25 30
Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln
35 40 45
Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala
50 55 60
Asp Val Val Asp Ser Gly Leu Pro Lys Val Arg Tyr Thr Gln Val Trp
65 70 75 80
Ser His Asp Val Thr Ile Val Ala Asn Ser Thr Glu Ala Ser Arg Lys
85 90 95
Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala Thr Ser Gln Val Glu
100 105 110
Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg
115 120
<210> 24
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 24
Met Gly Asn Ala Arg Thr Arg Arg Arg Glu Arg Arg Ala Glu Lys Gln
1 5 10 15
Ala Gln Trp Lys Ala Ala Asn
20
<210> 25
<211> 83
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 25
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1 5 10 15
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
20 25 30
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
35 40 45
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
50 55 60
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
65 70 75 80
Lys Met Leu
<210> 26
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 26
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 27
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 27
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 28
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 28
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 29
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 29
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 30
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 30
guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuaucaac uugaaaaagu 60
ggcaccgauu cggugc 76
<210> 31
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (33)..(34)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (50)..(50)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (63)..(63)
<223> n is a, c, g, or u
<400> 31
guuunagagc uanuagcaag uunaaauaag gcnnguccgu uaucaacuun aaguggcacc 60
ganucggugc 70
<210> 32
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (33)..(34)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (50)..(50)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (63)..(63)
<223> n is a, c, g, or u
<400> 32
guuunagagc uanuagcaag uunaaauaag gcnnguccgu uaucgacuun aagucgcacc 60
ganucggugc 70
<210> 33
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (33)..(34)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (50)..(50)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (63)..(63)
<223> n is a, c, g, or u
<400> 33
guuunagagc uanuagcaag uunaaauaag gcnnguccgu uauccacuun aaguggcacc 60
ganucggugc 70
<210> 34
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (33)..(34)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (50)..(50)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (63)..(63)
<223> n is a, c, g, or u
<400> 34
guuunagagc uanuagcaag uunaaauaag gcnnguccgu uaucaacuun aaguugcacc 60
ganucggugc 70
<210> 35
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (33)..(34)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (50)..(50)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (63)..(63)
<223> n is a, c, g, or u
<400> 35
guuunagagc uanuagcaag uunaaauaag gcnnguccgu uaucuacuun aaguagcacc 60
ganucggugc 70
<210> 36
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 36
guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuaucgac uugaaaaagu 60
cgcaccgauu cggugc 76
<210> 37
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 37
guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuauccac uugaaaaagu 60
ggcaccgauu cggugc 76
<210> 38
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 38
guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuaucaac uugaaaaagu 60
ugcaccgauu cggugc 76
<210> 39
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 39
guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuaucuac uugaaaaagu 60
agcaccgauu cggugc 76
<210> 40
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 40
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucgac uugaaaaagu 60
cgcaccgagu cggugc 76
<210> 41
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 41
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuauccac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 42
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 42
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ugcaccgagu cggugc 76
<210> 43
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 43
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucuac uugaaaaagu 60
agcaccgagu cggugc 76
<210> 44
<211> 2080
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 44
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Arg
1205 1210 1215
Phe Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Arg Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Val Tyr Arg Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Thr Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr
1370 1375 1380
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser
1385 1390 1395
Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu
1400 1405 1410
His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp
1415 1420 1425
Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly
1430 1435 1440
Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr
1445 1450 1455
Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala
1460 1465 1470
Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly
1475 1480 1485
Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro
1490 1495 1500
Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu
1505 1510 1515
Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro
1520 1525 1530
Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp
1535 1540 1545
Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu
1550 1555 1560
His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
1565 1570 1575
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln
1580 1585 1590
Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg
1595 1600 1605
Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu
1610 1615 1620
Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp
1625 1630 1635
Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu
1640 1645 1650
Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln
1655 1660 1665
Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu
1670 1675 1680
Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys
1685 1690 1695
Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys
1700 1705 1710
Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr
1715 1720 1725
Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln
1730 1735 1740
Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro
1745 1750 1755
Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val
1760 1765 1770
Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu
1775 1780 1785
Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp
1790 1795 1800
Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
1805 1810 1815
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln
1820 1825 1830
Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys
1835 1840 1845
Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr
1850 1855 1860
Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val
1865 1870 1875
Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly
1880 1885 1890
Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr
1895 1900 1905
Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr
1910 1915 1920
Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys
1925 1930 1935
Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys
1940 1945 1950
Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala
1955 1960 1965
Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val
1970 1975 1980
Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly
1985 1990 1995
Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu
2000 2005 2010
Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe
2015 2020 2025
Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys
2030 2035 2040
Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
2045 2050 2055
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu
2060 2065 2070
Leu Ile Glu Asn Ser Ser Pro
2075 2080
<210> 45
<211> 2080
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 45
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Thr Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Leu Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ile Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Lys
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Asp Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Ile Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Val Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Thr Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr
1370 1375 1380
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser
1385 1390 1395
Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu
1400 1405 1410
His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp
1415 1420 1425
Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly
1430 1435 1440
Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr
1445 1450 1455
Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala
1460 1465 1470
Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly
1475 1480 1485
Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro
1490 1495 1500
Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu
1505 1510 1515
Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro
1520 1525 1530
Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp
1535 1540 1545
Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu
1550 1555 1560
His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
1565 1570 1575
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln
1580 1585 1590
Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg
1595 1600 1605
Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu
1610 1615 1620
Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp
1625 1630 1635
Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu
1640 1645 1650
Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln
1655 1660 1665
Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu
1670 1675 1680
Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys
1685 1690 1695
Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys
1700 1705 1710
Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr
1715 1720 1725
Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln
1730 1735 1740
Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro
1745 1750 1755
Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val
1760 1765 1770
Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu
1775 1780 1785
Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp
1790 1795 1800
Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
1805 1810 1815
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln
1820 1825 1830
Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys
1835 1840 1845
Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr
1850 1855 1860
Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val
1865 1870 1875
Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly
1880 1885 1890
Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr
1895 1900 1905
Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr
1910 1915 1920
Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys
1925 1930 1935
Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys
1940 1945 1950
Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala
1955 1960 1965
Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val
1970 1975 1980
Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly
1985 1990 1995
Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu
2000 2005 2010
Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe
2015 2020 2025
Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys
2030 2035 2040
Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
2045 2050 2055
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu
2060 2065 2070
Leu Ile Glu Asn Ser Ser Pro
2075 2080
<210> 46
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 46
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Arg
1205 1210 1215
Phe Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Arg Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Val Tyr Arg Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 47
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 47
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Thr Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Leu Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ile Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Lys
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Asp Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Ile Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Val Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 48
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 48
Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile
1 5 10 15
Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp
35 40 45
Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His
50 55 60
Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys
65 70
<210> 49
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 49
Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile
1 5 10 15
Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp
35 40 45
Arg Pro Asp Leu Ile Pro His Ile Tyr Thr Ser Arg Leu Tyr Phe His
50 55 60
Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys
65 70
<210> 50
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 50
Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile
1 5 10 15
Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Arg Leu Ala Ala Phe Lys Arg Asp
35 40 45
Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His
50 55 60
Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys
65 70
<210> 51
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 51
Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asn Lys Ile
1 5 10 15
Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Lys Asp
35 40 45
Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His
50 55 60
Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys
65 70
<210> 52
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 52
Ser Lys Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile
1 5 10 15
Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp
35 40 45
His Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His
50 55 60
Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys
65 70
<210> 53
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 53
Ser Lys Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Glu Lys Ile
1 5 10 15
Arg Ser Met Glu Leu Ser Gln Met Arg Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Gln Lys Asp
35 40 45
Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His
50 55 60
Trp Arg Arg Ile Phe Gln Lys Gly Leu Cys
65 70
<210> 54
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 54
Ser Lys Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Glu Lys Ile
1 5 10 15
Arg Ser Met Glu Leu Ser Gln Met Arg Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Gln Lys Asp
35 40 45
Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His
50 55 60
Trp Arg Arg Ile Phe Gln Lys Gly Leu Cys
65 70
<210> 55
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 55
Ser Lys Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile
1 5 10 15
Arg Ser Met Glu Leu Ser Gln Val Arg Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Glu Thr Phe Lys Lys Asp
35 40 45
Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His
50 55 60
Trp Lys Arg Ala Phe Gln Glu Gly Leu Cys
65 70
<210> 56
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 56
Ser Lys Lys Gly Lys Pro His Ala Glu Ile Leu Phe Leu Asp Lys Met
1 5 10 15
Trp Ser Met Glu Glu Leu Ser Gln Val Arg Ile Thr Cys Tyr Leu Thr
20 25 30
Trp Ser Pro Cys Pro Asn Cys Ala Arg Gln Leu Ala Ala Phe Lys Lys
35 40 45
Asp His Pro Gly Leu Ile Leu Arg Ile Tyr Thr Ser Arg Leu Tyr Phe
50 55 60
Tyr Trp Arg Arg Lys Phe Gln Lys Gly Leu Cys
65 70 75
<210> 57
<211> 73
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 57
Lys Lys Gly Glu Gln His Val Glu Ile Leu Phe Leu Glu Lys Met Arg
1 5 10 15
Ser Met Glu Leu Ser Gln Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Pro Asn Cys Ala Arg Gln Leu Ala Ala Phe Lys Lys Asp His
35 40 45
Pro Asp Leu Ile Leu Arg Ile Tyr Thr Ser Arg Leu Tyr Phe Tyr Trp
50 55 60
Arg Lys Lys Phe Gln Lys Gly Leu Cys
65 70
<210> 58
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 58
Ser Lys Lys Gly Arg Gln His Ala Glu Ile Leu Phe Leu Glu Lys Val
1 5 10 15
Arg Ser Met Gln Leu Ser Gln Val Arg Ile Thr Cys Tyr Leu Thr Trp
20 25 30
Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Met Asp
35 40 45
His Pro Asp Leu Ile Leu Arg Ile Tyr Ala Ser Arg Leu Tyr Phe His
50 55 60
Trp Arg Arg Ala Phe Gln Lys Gly Leu Cys
65 70
<210> 59
<211> 73
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 59
Asn Lys Lys Gly Lys His Ala Glu Ile Leu Phe Ile Asp Glu Met Arg
1 5 10 15
Ser Leu Glu Leu Gly Gln Val Gln Ile Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Pro Asn Cys Ala Gln Glu Leu Ala Ala Phe Lys Ser Asp His
35 40 45
Pro Asp Leu Val Leu Arg Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp
50 55 60
Arg Arg Lys Tyr Gln Glu Gly Leu Cys
65 70
<210> 60
<211> 73
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 60
Asn Lys Lys Gly Lys His Ala Glu Ile Leu Phe Ile Asp Glu Met Arg
1 5 10 15
Ser Leu Glu Leu Gly Gln Ala Arg Ile Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Pro Asn Cys Ala Gln Lys Leu Ala Ala Phe Lys Lys Asp His
35 40 45
Pro Asp Leu Val Leu Arg Val Tyr Thr Ser Arg Leu Tyr Phe His Trp
50 55 60
Arg Arg Lys Tyr Gln Glu Gly Leu Cys
65 70
<210> 61
<211> 73
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 61
Asn Lys Lys Asp Lys His Ala Glu Ile Leu Phe Ile Asp Lys Met Arg
1 5 10 15
Ser Leu Glu Leu Cys Gln Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Pro Asn Cys Ala Gln Glu Leu Ala Ala Phe Lys Lys Asp His
35 40 45
Pro Asp Leu Val Leu Arg Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp
50 55 60
Arg Arg Lys Tyr Gln Glu Gly Leu Cys
65 70
<210> 62
<211> 73
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 62
Asn Lys Lys Gly Lys His Ala Glu Ile Leu Phe Ile Asp Glu Met Arg
1 5 10 15
Ser Leu Lys Leu Ser Gln Glu Arg Ile Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Pro Asn Cys Ala Gln Glu Leu Ala Ala Phe Lys Arg Asp His
35 40 45
Pro Gly Leu Val Leu Arg Ile Tyr Ala Ser Arg Leu Tyr Phe His Trp
50 55 60
Arg Arg Lys Tyr Gln Glu Gly Leu Cys
65 70
<210> 63
<211> 72
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 63
Asn Lys Arg Ala Lys His Ala Glu Ile Leu Leu Ile Asp Met Met Arg
1 5 10 15
Ser Met Glu Leu Gly Gln Val Gln Ile Thr Cys Tyr Ile Thr Trp Ser
20 25 30
Pro Cys Pro Thr Cys Ala Gln Glu Leu Ala Ala Phe Lys Gln Asp His
35 40 45
Pro Asp Leu Val Leu Arg Ile Tyr Ala Ser Arg Leu Tyr Phe His Trp
50 55 60
Lys Arg Lys Phe Gln Lys Gly Leu
65 70
<210> 64
<211> 73
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 64
Asn Lys Lys Gly Arg His Ala Glu Ile Cys Leu Ile Asp Glu Met Arg
1 5 10 15
Ser Leu Gly Leu Gly Lys Ala Gln Ile Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Arg Lys Cys Ala Gln Glu Leu Ala Thr Phe Lys Lys Asp His
35 40 45
Pro Asp Leu Val Leu Arg Val Tyr Ala Ser Arg Leu Tyr Phe His Trp
50 55 60
Ser Arg Lys Tyr Gln Gln Gly Leu Cys
65 70
<210> 65
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 65
Asn Lys Lys Gly His His Ala Glu Ile Arg Phe Ile Glu Arg Ile Arg
1 5 10 15
Ser Met Gly Leu Asp Pro Ser Gln Asp Tyr Gln Ile Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Leu Asp Cys Ala Phe Lys Leu Ala Lys Leu Lys
35 40 45
Lys Asp Phe Pro Arg Leu Thr Leu Arg Ile Phe Thr Ser Arg Leu Tyr
50 55 60
Phe His Trp Ile Arg Lys Phe Gln Lys Gly Leu
65 70 75
<210> 66
<211> 72
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 66
Asn Lys Lys Gly Lys His Ala Glu Ala Arg Phe Val Asp Lys Met Arg
1 5 10 15
Ser Met Gln Leu Asp His Ala Leu Ile Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Leu Asp Cys Ser Gln Lys Leu Ala Ala Leu Lys Arg Asp His
35 40 45
Pro Gly Leu Thr Leu Arg Ile Phe Thr Ser Arg Leu Tyr Phe His Trp
50 55 60
Val Lys Lys Phe Gln Glu Gly Leu
65 70
<210> 67
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 67
Ser Pro Gln Lys Gly His His Ala Glu Ser Arg Phe Ile Lys Arg Ile
1 5 10 15
Ser Ser Met Asp Leu Asp Arg Ser Arg Ser Tyr Gln Ile Thr Cys Phe
20 25 30
Leu Thr Trp Ser Pro Cys Pro Ser Cys Ala Gln Glu Leu Ala Ser Phe
35 40 45
Lys Arg Ala His Pro His Leu Arg Phe Gln Ile Phe Val Ser Arg Leu
50 55 60
Tyr Phe His Trp Lys Arg Ser Tyr Gln Ala Gly Leu
65 70 75
<210> 68
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 68
Lys Lys Gly Tyr His Ala Glu Ser Arg Phe Ile Lys Arg Ile Cys Ser
1 5 10 15
Met Asp Leu Gly Gln Asp Gln Ser Tyr Gln Val Thr Cys Phe Leu Thr
20 25 30
Trp Ser Pro Cys Pro His Cys Ala Gln Glu Leu Val Ser Phe Lys Arg
35 40 45
Ala His Pro His Leu Arg Leu Gln Ile Phe Thr Ala Arg Leu Phe Phe
50 55 60
His Trp Lys Arg Ser Tyr Gln Glu Gly Leu
65 70
<210> 69
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 69
Lys Lys Gly Gln His Ala Glu Ile Arg Phe Ile Glu Arg Ile His Ser
1 5 10 15
Met Ala Leu Asp Gln Ala Arg Ser Tyr Gln Ile Thr Cys Phe Leu Thr
20 25 30
Trp Ser Pro Cys Pro Phe Cys Ala Gln Glu Leu Ala Ser Phe Lys Ser
35 40 45
Thr His Pro Arg Val His Leu Gln Ile Phe Val Ser Arg Leu Tyr Phe
50 55 60
His Trp Lys Arg Ser Tyr Gln Glu Gly Leu
65 70
<210> 70
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 70
Asn Lys Lys Gly His His Ala Glu Ile Arg Phe Ile Lys Lys Ile Arg
1 5 10 15
Ser Leu Asp Leu Asp Gln Ser Gln Asn Tyr Glu Val Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Pro Asp Cys Ala Gln Glu Leu Val Ala Leu Thr
35 40 45
Arg Ser His Pro His Val Arg Leu Arg Leu Phe Thr Ser Arg Leu Tyr
50 55 60
Phe His Trp Phe Trp Ser Phe Gln Glu Gly Leu
65 70 75
<210> 71
<211> 72
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 71
Asn Arg His Ala Glu Ile Cys Phe Ile Asp Glu Ile Glu Ser Met Gly
1 5 10 15
Leu Asp Lys Thr Gln Cys Tyr Glu Val Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Pro Ser Cys Ala Gln Lys Leu Ala Ala Phe Thr Lys Ala Gln
35 40 45
Val His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr Tyr His Trp
50 55 60
Arg Ser Ser Tyr Gln Lys Gly Leu
65 70
<210> 72
<211> 72
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 72
Asn Arg His Ala Glu Ile Cys Phe Ile Asp Glu Ile Glu Ser Met Gly
1 5 10 15
Leu Asp Lys Thr Gln Cys Tyr Glu Val Thr Cys Tyr Leu Thr Trp Ser
20 25 30
Pro Cys Pro Ser Cys Ala Gln Lys Leu Val Ala Phe Ala Lys Ala Gln
35 40 45
Asp His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr Tyr His Trp
50 55 60
Arg Arg Arg Tyr Lys Glu Gly Leu
65 70
<210> 73
<211> 70
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 73
His Val Glu Ile Cys Phe Ile Asp Lys Ile Ala Ser Met Glu Leu Asp
1 5 10 15
Lys Thr Gln Cys Tyr Asp Val Thr Cys Tyr Leu Thr Trp Ser Pro Cys
20 25 30
Pro Ser Cys Ala Gln Lys Leu Ala Ala Phe Ala Lys Ala Gln Asp His
35 40 45
Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr Tyr His Trp Arg Arg
50 55 60
Ser Tyr Gln Lys Gly Leu
65 70
<210> 74
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 74
Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile Lys
1 5 10 15
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Glu Leu Val Asp Phe Ile
35 40 45
Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Tyr His Trp Cys Lys Pro Gln Gln Lys Gly Leu
65 70 75
<210> 75
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 75
Glu Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile
1 5 10 15
Lys Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr
20 25 30
Leu Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Glu Leu Val Asp Phe
35 40 45
Ile Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu
50 55 60
Tyr Tyr His Trp Cys Lys Pro Gln Gln Lys Gly Leu
65 70 75
<210> 76
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 76
Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile Lys
1 5 10 15
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Lys Leu Val Asp Phe Ile
35 40 45
Gln Ala His Asp His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Tyr His Trp Cys Lys Pro Gln Gln Glu Gly Leu
65 70 75
<210> 77
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 77
Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys
1 5 10 15
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Pro Ser Cys Ala Trp Glu Leu Val Asp Phe Ile
35 40 45
Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Tyr His Trp Cys Arg His Gln Gln Glu Gly Leu
65 70 75
<210> 78
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 78
Asn Lys Lys Lys Asp His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys
1 5 10 15
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Glu Leu Val Asp Phe Ile
35 40 45
Lys Ala His Arg His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Tyr His Trp Arg Pro Asn Tyr Gln Glu Gly Leu
65 70 75
<210> 79
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 79
Asn Lys Lys Lys Glu His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys
1 5 10 15
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Lys Leu Val Asp Phe Ile
35 40 45
Lys Ala His His His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Tyr His Trp Arg Pro Asn Tyr Gln Glu Gly Leu
65 70 75
<210> 80
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 80
Asn Lys Lys Lys His His Ala Glu Ile His Phe Ile Asn Lys Ile Lys
1 5 10 15
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Pro Ser Cys Ala Arg Glu Leu Val Asp Phe Ile
35 40 45
Lys Ala His Arg His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Tyr His Trp Arg Pro His Tyr Gln Glu Gly Leu
65 70 75
<210> 81
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 81
Asn Lys Lys Gln Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn
1 5 10 15
Ser Leu Asp Leu Asn Pro Ser Gln Ser Tyr Lys Ile Ile Cys Tyr Ile
20 25 30
Thr Trp Ser Pro Cys Pro Asn Cys Ala Asn Glu Leu Val Asn Phe Ile
35 40 45
Thr Arg Asn Asn His Leu Lys Leu Glu Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Phe His Trp Ile Lys Pro Phe Lys Met Gly Leu
65 70 75
<210> 82
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 82
Asn Lys Lys Gln Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn
1 5 10 15
Ser Leu Asp Leu Asn Pro Ser Gln Ser Tyr Lys Ile Ile Cys Tyr Ile
20 25 30
Thr Trp Ser Pro Cys Pro Asn Cys Ala Ser Glu Leu Val Asp Phe Ile
35 40 45
Thr Arg Asn Asp His Leu Asp Leu Gln Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Phe His Trp Ile Lys Pro Phe Lys Arg Gly Leu
65 70 75
<210> 83
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 83
Asn Lys Lys Gln Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn
1 5 10 15
Ser Leu Asn Leu Asp Arg Arg Gln Ser Tyr Lys Ile Ile Cys Tyr Ile
20 25 30
Thr Trp Ser Pro Cys Pro Arg Cys Ala Ser Glu Leu Val Asp Phe Ile
35 40 45
Thr Gly Asn Asp His Leu Asn Leu Gln Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Phe His Trp Lys Lys Pro Phe Gln Arg Gly Leu
65 70 75
<210> 84
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 84
Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn
1 5 10 15
Ser Leu Asn Leu Asp Gln Asn Gln Cys Tyr Arg Ile Ile Cys Tyr Val
20 25 30
Thr Trp Ser Pro Cys His Asn Cys Ala Lys Glu Leu Val Asp Phe Ile
35 40 45
Ser Asn Arg His His Leu Ser Leu Gln Leu Phe Ala Ser Arg Leu Tyr
50 55 60
Phe His Trp Val Arg Cys Tyr Gln Arg Gly Leu
65 70 75
<210> 85
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 85
Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Lys
1 5 10 15
Ser Leu Gly Leu Asp Arg Val Gln Ser Tyr Glu Ile Thr Cys Tyr Ile
20 25 30
Thr Trp Ser Pro Cys Pro Thr Cys Ala Leu Glu Leu Val Ala Phe Thr
35 40 45
Arg Asp Tyr Pro Arg Leu Ser Leu Gln Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Phe His Trp Arg Arg Arg Ser Ile Gln Gly Leu
65 70 75
<210> 86
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 86
Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn
1 5 10 15
Ser Leu Gly Leu Asp Gln Asp Gln Ser Tyr Glu Ile Thr Cys Tyr Val
20 25 30
Thr Trp Ser Pro Cys Ala Thr Cys Ala Cys Lys Leu Ile Lys Phe Thr
35 40 45
Arg Lys Phe Pro Asn Leu Ser Leu Arg Ile Phe Val Ser Arg Leu Tyr
50 55 60
Tyr His Trp Phe Arg Gln Asn Gln Gln Gly Leu
65 70 75
<210> 87
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 87
Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Ser Ile Arg Ala
1 5 10 15
Leu Gln Leu Asp Gln Ser Gln Arg Phe Glu Ile Thr Cys Tyr Leu Thr
20 25 30
Trp Ser Pro Cys Pro Thr Cys Ala Lys Glu Leu Ala Met Phe Val Gln
35 40 45
Asp His Pro His Ile Ser Leu Arg Leu Phe Ala Ser Arg Leu Tyr Phe
50 55 60
His Trp Arg Trp Lys Tyr Gln Glu Gly Leu
65 70
<210> 88
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 88
Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Asn Ile Lys Ala
1 5 10 15
Leu Arg Leu Asp Thr Ser Gln Arg Phe Glu Ile Thr Cys Tyr Val Thr
20 25 30
Trp Ser Pro Cys Pro Thr Cys Ala Lys Glu Leu Val Ala Phe Val Arg
35 40 45
Asp His Arg His Ile Ser Leu Arg Leu Phe Ala Ser Arg Leu Tyr Phe
50 55 60
His Trp Leu Arg Glu Asn Lys Lys Gly Leu
65 70
<210> 89
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 89
Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Arg
1 5 10 15
Ser Leu Gln Arg Asp Ser Ser Gln Thr Phe Glu Ile Thr Cys Tyr Val
20 25 30
Thr Trp Ser Pro Cys Phe Thr Cys Ala Glu Glu Leu Val Ala Phe Val
35 40 45
Arg Asp His Pro His Val Arg Leu Arg Leu Phe Ala Ser Arg Leu Tyr
50 55 60
Phe His Trp Leu Arg Lys Tyr Gln Glu Gly Leu
65 70 75
<210> 90
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 90
Asn Lys Lys Lys Arg His Ala Glu Ile Cys Phe Ile Asp Lys Ile Lys
1 5 10 15
Ser Leu Thr Arg Asp Thr Ser Gln Arg Phe Glu Ile Ile Cys Tyr Ile
20 25 30
Thr Trp Ser Pro Cys Pro Phe Cys Ala Glu Glu Leu Val Ala Phe Val
35 40 45
Lys Asp Asn Pro His Leu Ser Leu Arg Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Val His Trp Arg Trp Lys Tyr Gln Gln Gly Leu
65 70 75
<210> 91
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 91
Asn Lys Lys Lys Arg His Ala Glu Ile Cys Phe Ile Asp Lys Ile Lys
1 5 10 15
Ser Leu Thr Arg Asp Thr Ser Gln Arg Phe Glu Ile Ile Cys Tyr Ile
20 25 30
Thr Trp Ser Pro Cys Pro Phe Cys Ala Glu Glu Leu Val Ala Phe Val
35 40 45
Lys Asp Asn Pro His Leu Ser Leu Arg Ile Phe Ala Ser Arg Leu Tyr
50 55 60
Val His Trp Arg Trp Lys Tyr Gln Gln Gly Leu
65 70 75
<210> 92
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 92
Asn Lys Lys His Arg His Ala Glu Val Arg Phe Ile Ala Lys Ile Arg
1 5 10 15
Ser Met Ser Leu Asp Leu Asp Gln Lys His Gln Leu Thr Cys Tyr Leu
20 25 30
Thr Trp Ser Pro Cys Pro Ser Cys Ala Gln Glu Leu Val Thr Phe Met
35 40 45
Ala Glu Ser Arg His Leu Asn Leu Gln Val Phe Val Ser Arg Leu Tyr
50 55 60
Phe His Trp Gln Arg Asp Phe Gln Gln Gly Leu
65 70 75
<210> 93
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 93
Gly Arg Ser Tyr Asn Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly
1 5 10 15
Arg Ser Asn Leu Leu Trp Asn Thr Gly Val Phe Arg Gly Gln Met Tyr
20 25 30
Ser Gln Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu
65 70 75 80
Ala Glu Tyr Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105 110
<210> 94
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 94
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly
1 5 10 15
His Ser Asn Leu Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr
20 25 30
Ser Gln Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105 110
<210> 95
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 95
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly
1 5 10 15
His Ser Asn Leu Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr
20 25 30
Ser Gln Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Ser Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Lys Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105 110
<210> 96
<211> 98
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 96
Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
1 5 10 15
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Phe Glu
20 25 30
Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Glu
<210> 97
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 97
Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
1 5 10 15
Arg Pro Arg Leu Asp Thr Lys Ile Phe Arg Gly Gln Val Tyr Phe Glu
20 25 30
Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105
<210> 98
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 98
Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
1 5 10 15
Arg Pro Arg Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Gln
20 25 30
Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105
<210> 99
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 99
Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser
1 5 10 15
Met Pro Thr Trp Gly Thr Lys Ile Phe Arg Gly Gln Val Cys Phe Glu
20 25 30
Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105
<210> 100
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 100
Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser
1 5 10 15
Met Pro Thr Trp Gly Thr Lys Ile Phe Arg Gly Gln Val Cys Phe Glu
20 25 30
Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105
<210> 101
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 101
Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser
1 5 10 15
Met Pro Thr Trp Gly Ala Lys Ile Phe Arg Gly Gln Val Tyr Phe Glu
20 25 30
Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105
<210> 102
<211> 101
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 102
Arg Asn Thr Val Trp Leu Cys Tyr Lys Val Lys Thr Arg Gly Pro Ser
1 5 10 15
Met Pro Thr Trp Gly Thr Lys Ile Phe Arg Gly Gln Val Tyr Phe Gln
20 25 30
Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Thr Pro Cys Pro Asp Cys Val Val Lys Val Ala Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Glu Thr Asp Tyr
100
<210> 103
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 103
Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser
1 5 10 15
Met Pro Thr Trp Asp Thr Lys Ile Phe Arg Gly Gln Val Tyr Ser Lys
20 25 30
Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105
<210> 104
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 104
Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser
1 5 10 15
Met Pro Thr Trp Gly Thr Lys Ile Phe Arg Gly Gln Val Tyr Phe Gln
20 25 30
Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys Gly Asn
35 40 45
Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp
50 55 60
Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu Ala Glu
65 70 75 80
His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr
85 90 95
Trp Gly Arg Asp Trp Arg Arg Ala Leu Arg Arg Leu
100 105
<210> 105
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 105
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Tyr Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Ser Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu
100 105 110
<210> 106
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 106
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu
100 105 110
<210> 107
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 107
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu
100 105 110
<210> 108
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 108
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Val Lys Val Ile Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu
100 105 110
<210> 109
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 109
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Tyr Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Phe Thr Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu
100 105 110
<210> 110
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 110
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu
100 105 110
<210> 111
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 111
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Ser Glu Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu
65 70 75 80
Thr Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Arg Gly Arg Asp Trp Arg Arg Ala Leu Cys Arg Leu
100 105 110
<210> 112
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 112
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Ser Glu Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu
65 70 75 80
Thr Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Arg Gly Arg Asp Trp Arg Arg Ala Leu Cys Arg Leu
100 105 110
<210> 113
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 113
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr
20 25 30
Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala His Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu
65 70 75 80
Ala Glu Tyr Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105 110
<210> 114
<211> 109
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 114
Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro
1 5 10 15
Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr Phe
20 25 30
Gln Pro Glu Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly
35 40 45
Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser
50 55 60
Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Val Phe Leu Ala
65 70 75 80
Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr
85 90 95
Tyr Trp Glu Lys Asp Trp Gln Arg Ala Leu Cys Arg Leu
100 105
<210> 115
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (103)..(103)
<223> Xaa can be any naturally occurring amino acid
<400> 115
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Tyr
1 5 10 15
Pro Ser Lys Leu Leu Trp Asp Thr Gly Val Phe Gln Gly Gln Val Tyr
20 25 30
Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Glu Lys Asp Xaa Arg Arg Ala Leu Arg Arg Leu
100 105 110
<210> 116
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 116
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Glu Asp
1 5 10 15
Pro Ser Lys Leu Leu Trp Asp Thr Gly Val Phe Gln Gly Gln Val Tyr
20 25 30
Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Gly Arg Asp Trp Arg Arg Ala Leu Arg Arg Leu
100 105 110
<210> 117
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 117
Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Pro Gly Gln Val Arg
20 25 30
Pro Lys Phe Gln Ser Asn Arg Arg Tyr Glu Val Tyr Phe Gln Pro Gln
35 40 45
Tyr His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
50 55 60
Pro Ala Tyr Lys His Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
65 70 75 80
Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Arg
85 90 95
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Gly
100 105 110
Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu
115 120
<210> 118
<211> 106
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 118
Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Pro Gly Gln Pro Gln
20 25 30
Tyr His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
35 40 45
Pro Ala Tyr Lys His Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
50 55 60
Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Arg
65 70 75 80
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Gly
85 90 95
Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu
100 105
<210> 119
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 119
Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Pro Gly Gln Val Arg
20 25 30
Pro Lys Phe Gln Ser Asn Arg Arg Gln Lys Val Tyr Phe Gln Pro Gln
35 40 45
Tyr His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
50 55 60
Pro Ala Tyr Lys His Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
65 70 75 80
Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Arg
85 90 95
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Gly
100 105 110
Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu
115 120
<210> 120
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 120
Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Gln Gly Gln Val Arg
20 25 30
Pro Lys Phe Gln Ser Asn Arg Arg Tyr Glu Val Tyr Phe Gln Pro Gln
35 40 45
Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
50 55 60
Pro Ala Tyr Lys His Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
65 70 75 80
Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Pro
85 90 95
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Gly
100 105 110
Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu
115 120
<210> 121
<211> 131
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 121
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Arg
20 25 30
Pro Lys Leu Gln Ser Asn Arg Arg Tyr Glu Leu Ser Asn Trp Glu Cys
35 40 45
Arg Lys Arg Val Tyr Phe Gln Pro Gln Tyr His Ala Glu Met Tyr Phe
50 55 60
Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro Ala Asn Lys Arg Phe Gln
65 70 75 80
Ile Thr Trp Phe Ala Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys
85 90 95
Val Thr Glu Phe Leu Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser
100 105 110
Val Ala Arg Leu Tyr Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu
115 120 125
Arg Arg Leu
130
<210> 122
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 122
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Phe Gln Pro Gln Tyr His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Asn Lys Arg Phe Gln Ile Thr Trp Phe Ala
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu Tyr
85 90 95
Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Arg Arg Leu
100 105 110
<210> 123
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 123
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Asp Gln Val Tyr
20 25 30
Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Asn Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Thr Lys Val Thr Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu Tyr
85 90 95
Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Arg Arg Leu
100 105 110
<210> 124
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 124
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Tyr Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Asn Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu Tyr
85 90 95
Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Arg Arg Leu
100 105 110
<210> 125
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 125
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu Tyr
85 90 95
Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu
100 105 110
<210> 126
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 126
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly
1 5 10 15
Ser Ser Asn Leu Leu Trp Asn Thr Gly Val Phe Arg Gly Pro Val Pro
20 25 30
Pro Lys Leu Gln Ser Asn His Arg Gln Glu Val Tyr Phe Gln Phe Glu
35 40 45
Asn His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Arg Leu
50 55 60
Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
65 70 75 80
Cys Leu Pro Cys Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro
85 90 95
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Asp
100 105 110
Arg Glu Trp Arg Arg Val Leu Arg Arg Leu
115 120
<210> 127
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 127
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly
1 5 10 15
Cys Ser Asn Leu Ile Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu
20 25 30
Pro Lys Leu Gln Ser Asn His Arg Gln Glu Val Tyr Phe Gln Phe Glu
35 40 45
Asn His Ala Glu Met Cys Phe Phe Ser Trp Phe Cys Gly Asn Arg Leu
50 55 60
Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
65 70 75 80
Cys Leu Pro Cys Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro
85 90 95
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Gln Asp
100 105 110
Arg Glu Trp Arg Arg Val Leu Arg Arg Leu
115 120
<210> 128
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 128
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly
1 5 10 15
Cys Ser Asn Leu Ile Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu
20 25 30
Pro Lys Leu Gln Ser Asn His Arg Gln Glu Val Tyr Phe Gln Phe Glu
35 40 45
Asn His Ala Glu Met Cys Phe Phe Ser Trp Phe Cys Gly Asn Arg Leu
50 55 60
Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
65 70 75 80
Cys Leu Pro Cys Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro
85 90 95
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Gln Asp
100 105 110
Arg Glu Trp Arg Arg Val Leu Arg Arg Leu
115 120
<210> 129
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 129
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly
1 5 10 15
Arg Ser Asn Leu Leu Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu
20 25 30
Pro Lys Arg Gln Ser Asn His Arg Gln Glu Val Tyr Phe Arg Phe Glu
35 40 45
Asn His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Arg Leu
50 55 60
Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
65 70 75 80
Cys Leu Pro Cys Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro
85 90 95
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Asp
100 105 110
Arg Asp Trp Arg Trp Val Leu Leu Arg Leu
115 120
<210> 130
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 130
Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Lys Gly Val Phe Arg Gly Gln Val Leu
20 25 30
Pro Lys Phe Gln Ser Asn His Arg Gln Glu Val Tyr Phe Gln Leu Glu
35 40 45
Asn His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
50 55 60
Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro
65 70 75 80
Cys Leu Pro Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Pro
85 90 95
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Gly
100 105 110
Arg Asp Trp Arg Arg Ala Leu Arg Arg Leu
115 120
<210> 131
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 131
Gly Lys Lys Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp
1 5 10 15
Thr Ser Lys Leu Pro Trp Asn Thr Gly Val Phe Arg Gly Gln Val Asn
20 25 30
Phe Asn Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Arg
35 40 45
Gly Lys Leu Leu Pro Ala Cys Lys Arg Ser Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Leu Tyr Cys Val Ala Lys Val Ala Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Val Ser Thr Ala Arg Leu Tyr
85 90 95
Cys Tyr Trp Lys Lys Asp Trp Arg Arg Ala Leu Arg Lys Leu
100 105 110
<210> 132
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 132
Gly Lys Lys Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp
1 5 10 15
Thr Ser Lys Leu Pro Trp Asn Thr Gly Val Phe Arg Gly Gln Val Asn
20 25 30
Phe Asn Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Arg
35 40 45
Gly Lys Leu Leu Pro Ala Cys Lys Arg Ser Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Asn Pro Cys Leu Tyr Cys Val Ala Lys Val Ala Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Val Ser Thr Ala Arg Leu Tyr
85 90 95
Cys Tyr Trp Lys Lys Asp Trp Arg Arg Ala Leu Arg Lys Leu
100 105 110
<210> 133
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 133
Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Met Lys Asp
1 5 10 15
His Ser Lys Leu Pro Trp Tyr Thr Gly Val Phe Arg Gly Gln Val Tyr
20 25 30
Phe Glu Pro Gln Asn His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Glu Cys Cys Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Arg Gly Arg Asp Trp Arg Arg Ala Leu Arg Arg Leu
100 105 110
<210> 134
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 134
Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Ser Lys Asp
1 5 10 15
Pro Ser Lys Leu Pro Trp Asp Thr Gly Ile Phe Arg Gly Gln Val Tyr
20 25 30
Phe Glu Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Tyr Cys
35 40 45
Gly Asn Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val
50 55 60
Ser Trp Thr Pro Cys Pro Asp Cys Val Gly Lys Val Ala Glu Phe Leu
65 70 75 80
Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr
85 90 95
Tyr Tyr Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu
100 105 110
<210> 135
<211> 121
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 135
Arg Asn Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro
1 5 10 15
Ser Lys Leu Ala Trp Asp Thr Gly Val Phe Arg Gly Gln Val Leu Pro
20 25 30
Lys Leu Gln Ser Asn His Arg Arg Glu Val Tyr Phe Glu Pro Gln Tyr
35 40 45
His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Ser
50 55 60
Ala Tyr Glu Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro Cys
65 70 75 80
Pro Asp Cys Val Ala Met Leu Ala Glu Phe Leu Ala Glu His Pro Asn
85 90 95
Val Thr Leu Thr Val Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu Arg
100 105 110
Asp Tyr Arg Gly Ala Leu Arg Arg Leu
115 120
<210> 136
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 136
gagguugccu ggcaccuacg guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 137
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 137
gagacccacc ucucgcaguc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 138
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 138
gccccauguc gacuacaucg guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 139
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 139
auggucaccg acuucgagaa guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 140
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 140
accuuggcuu uguuccuccc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 141
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 141
ggcuuuguuc cucccaggcc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 142
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 142
guggugcugc ugccccuggc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 143
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 143
ugcugcugcc ccuggcgggu guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 144
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 144
acccaccucc ucaccuuucc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 145
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 145
agcgacugca gcaccugcuu guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 146
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 146
aacgcuuuug ggggugaggg guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 147
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 147
ccacacagcu ccaccagcug guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 148
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 148
cacugggagg uggaggaccu guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 149
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 149
cccacaagcc gccugugcug guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 150
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 150
aggucuggaa ugcaaaguca guuugagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120
cggugc 126
<210> 151
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 151
cucucgcagu cagagcgcac guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 152
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 152
caggcccagg cugcccgccg guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 153
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 153
ucuuugccca gagcaucccg guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 154
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 154
cacagacagg uaagcacggc guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 155
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 155
aagccagcug guccagccug guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 156
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 156
gguccagccu guggggccac guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 157
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 157
cgccugccag cgccuggcga guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 158
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 158
ugccagcgcc uggcgagggc guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 159
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 159
aagaccagcc ggugacccug guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 160
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 160
aucacaggcu gcugcccacg guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 161
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 161
cuaccccagg ccaacugcag guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 162
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 162
caacagggcc acguccucac guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 163
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 163
aggucagccc aaccagugcg guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 164
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 164
ccaaccagug cgugggccac guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 165
<211> 126
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 165
ccccucagga gcaggugaag guuugagagc uagggcccug aagaagggcc cuagcaaguu 60
caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120
cggugc 126
<210> 166
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 166
gaggttgcct ggcacctacg tgg 23
<210> 167
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 167
gagacccacc tctcgcagtc aga 23
<210> 168
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 168
gccccatgtc gactacatcg agg 23
<210> 169
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 169
atggtcaccg acttcgagaa tgt 23
<210> 170
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 170
accttggctt tgttcctccc agg 23
<210> 171
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 171
ggctttgttc ctcccaggcc tgg 23
<210> 172
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 172
gtggtgctgc tgcccctggc ggg 23
<210> 173
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 173
tgctgctgcc cctggcgggt ggg 23
<210> 174
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 174
acccacctcc tcacctttcc agg 23
<210> 175
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 175
agcgactgca gcacctgctt tgt 23
<210> 176
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 176
aacgcttttg ggggtgaggg tgt 23
<210> 177
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 177
ccacacagct ccaccagctg agg 23
<210> 178
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 178
cactgggagg tggaggacct tgg 23
<210> 179
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 179
cccacaagcc gcctgtgctg agg 23
<210> 180
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 180
aggtctggaa tgcaaagtca agg 23
<210> 181
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 181
ctctcgcagt cagagcgcac tgc 23
<210> 182
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 182
caggcccagg ctgcccgccg ggg 23
<210> 183
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 183
tctttgccca gagcatcccg tgg 23
<210> 184
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 184
cacagacagg taagcacggc cgt 23
<210> 185
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 185
aagccagctg gtccagcctg tgg 23
<210> 186
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 186
ggtccagcct gtggggccac tgg 23
<210> 187
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 187
cgcctgccag cgcctggcga ggg 23
<210> 188
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 188
tgccagcgcc tggcgagggc tgg 23
<210> 189
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 189
aagaccagcc ggtgaccctg ggg 23
<210> 190
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 190
atcacaggct gctgcccacg tgg 23
<210> 191
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 191
ctaccccagg ccaactgcag cgt 23
<210> 192
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 192
caacagggcc acgtcctcac agg 23
<210> 193
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 193
aggtcagccc aaccagtgcg tgg 23
<210> 194
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 194
ccaaccagtg cgtgggccac agg 23
<210> 195
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 195
cccctcagga gcaggtgaag agg 23
<210> 196
<211> 76
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 196
guuugagagc uagaaauagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 197
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 197
guuuuagagc ua 12
<210> 198
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 198
guuugagagc ua 12
<210> 199
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 199
uagcaaguua aaau 14
<210> 200
<211> 4
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 200
gaaa 4
<210> 201
<211> 14
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 201
aacuugaaaa agug 14
<210> 202
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 202
gcaccgaguc ggugc 15
<210> 203
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 203
gcaccgauuc ggugc 15
Claims (64)
- 융합 단백질로서,
핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편,
핵염기 디아미나제 억제제를 포함하는 제2 단편, 및
제1 단편 및 제2 단편 사이의 프로테아제 절단 부위
를 포함하는 것인 융합 단백질. - 제1항에 있어서, 핵염기 디아미나제는 아데노신 디아미나제인 융합 단백질.
- 제2항에 있어서, 아데노신 디아미나제는 tRNA-특이적 아데노신 디아미나제 (TadA), 아데노신 디아미나제 tRNA 특이적 1 (ADAT1), 아데노신 디아미나제 tRNA 특이적 2 (ADAT2), 아데노신 디아미나제 tRNA 특이적 3 (ADAT3), 아데노신 디아미나제 RNA 특이적 B1 (ADARB1), 아데노신 디아미나제 RNA 특이적 B2 (ADARB2), 아데노신 모노포스페이트 디아미나제 1 (AMPD1), 아데노신 모노포스페이트 디아미나제 2 (AMPD2), 아데노신 모노포스페이트 디아미나제 3 (AMPD3), 아데노신 디아미나제 (ADA), 아데노신 디아미나제 2 (ADA2), 아데노신 디아미나제 유사 (ADAL), 아데노신 디아미나제 도메인 함유 1 (ADAD1), 아데노신 디아미나제 도메인 함유 2 (ADAD2), 아데노신 디아미나제 RNA 특이적 (ADAR) 및 아데노신 디아미나제 RNA 특이적 B1 (ADARB1)으로 이루어진 군으로부터 선택되는 것인 융합 단백질.
- 제1항에 있어서, 핵염기 디아미나제는 시티딘 디아미나제인 융합 단백질.
- 제4항에 있어서, 시티딘 디아미나제는 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)로 이루어진 군으로부터 선택되는 것인 융합 단백질.
- 제4항에 있어서, 시티딘 디아미나제는 인간 또는 마우스 시티딘 디아미나제인 융합 단백질.
- 제6항에 있어서, 촉매 도메인은 마우스 A3 시티딘 디아미나제 도메인 1 (CDA1) 또는 인간 A3B 시티딘 디아미나제 도메인 2 (CDA2)인 융합 단백질.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 핵염기 디아미나제 억제제는 핵염기 디아미나제의 억제성 도메인인 융합 단백질.
- 제8항에 있어서, 핵염기 디아미나제 억제제는 시티딘 디아미나제의 억제성 도메인인 융합 단백질.
- 제9항에 있어서, 핵염기 디아미나제 억제제는 SEQ ID NO: 1-2 및 48-135로부터 선택되는 아미노산 서열, 또는 SEQ ID NO: 1-2 및 48-135로부터 선택되는 임의의 아미노산 서열과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제9항에 있어서, 핵염기 디아미나제 억제제는 SEQ ID NO:1의 아미노산 서열, SEQ ID NO:1의 아미노산 잔기 AA128-AA223 또는 SEQ ID NO:2의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 제1 단편은 군집된 규칙적으로 산재된 짧은 회문식 반복부 (clustered regularly interspaced short palindromic repeats)(CRISPR)-연관 (Cas) 단백질을 더 포함하는 것인 융합 단백질.
- 제12항에 있어서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택되는 것인 융합 단백질.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 프로테아제 절단 부위는 TuMV 프로테아제, PPV 프로테아제, PVY 프로테아제, ZIKV 프로테아제 및 WNV 프로테아제로 이루어진 군으로부터 선택되는 프로테아제의 프로테아제 절단 부위인 융합 단백질.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 프로테아제 절단 부위는 자가-절단 부위인 융합 단백질.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 프로테아제 절단 부위는 TEV 프로테아제 절단 부위인 융합 단백질.
- 제16항에 있어서, TEV 프로테아제 또는 이의 단편을 포함하는 제3 단편을 더 포함하는 것인 융합 단백질.
- 제17항에 있어서, 제3 단편은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편을 포함하는 것인 융합 단백질.
- 융합 단백질로서,
핵염기 디아미나제 또는 이의 촉매 도메인, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 제1 TEV 프로테아제 단편을 포함하는 제1 단편,
핵염기 디아미나제 억제제를 포함하는 제2 단편, 및
제1 단편 및 제2 단편 사이의 TEV 프로테아제 절단 부위
를 포함하고,
제1 TEV 프로테아제 단편은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 것인, 융합 단백질. - 제19항에 있어서, 우라실 글리코실라제 억제제 (UGI)를 더 포함하는 것인 융합 단백질.
- 제19항에 있어서, 핵염기 디아미나제 억제제, TEV 프로테아제 절단 부위, 핵염기 디아미나제 또는 이의 촉매 도메인, Cas 단백질, 및 제1 TEV 프로테아제 단편은 N-말단에서 C-말단으로 배열되는 것인 융합 단백질.
- 제19항에 있어서, 제1 TEV 프로테아제 단편은 TEV 프로테아제의 N-말단 도메인 (SEQ ID NO:3) 또는 C-말단 도메인 (SEQ ID NO:4)인 융합 단백질.
- 제22항에 있어서, TEV 프로테아제 절단 부위는 SEQ ID NO:5의 아미노산 서열을 갖는 것인 융합 단백질.
- 제19항에 있어서, 핵염기 디아미나제는 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)로 이루어진 군으로부터 선택되는 것인 융합 단백질.
- 제19항에 있어서, 핵염기 디아미나제 억제제는 SEQ ID NO: 1-2 및 48-135로부터 선택되는 아미노산 서열, 또는 SEQ ID NO: 1-2 및 48-135로부터 선택되는 임의의 아미노산 서열과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제19항에 있어서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택되는 것인 융합 단백질.
- 세포 내 표적 부위에서 유전자 편집을 수행하기 위한 방법으로서, 세포로
(a) 제19항 내지 제26항 중 어느 한 항의 융합 단백질,
(b) 태그 서열을 더 포함하는, 표적 부위를 표적화하는 가이드 RNA 또는 표적 부위를 표적화하는 crRNA 및 tracrRNA, 및
(c) 태그 서열에 결합할 수 있는 RNA 인식 펩티드에 커플링된 제2 TEV 프로테아제 단편
을 도입시키는 단계를 포함하는 것인 수행 방법. - 제27항에 있어서, 하나 이상의 분자는 분자를 코딩하는 폴리뉴클레오티드에 의해 세포로 도입되는 것인 수행 방법.
- 제27항에 있어서, 제1 TEV 프로테아제 단편 및 제2 TEV 프로테아제 단편은, 상호작용할 때, TEV 프로테아제 절단 부위를 절단할 수 있는 것인 수행 방법.
- 제27항에 있어서, 제2 TEV 프로테아제 단편은 RNA 인식 펩티드에 융합되는 것인 수행 방법.
- 제27항 내지 제30항 중 어느 한 항에 있어서, 태그 서열은 MS2 서열 (SEQ ID NO:16)을 포함하는 것인 수행 방법.
- 제31항에 있어서, RNA 인식 펩티드는 MS2 외피 단백질 (MCP, SEQ ID NO:22)을 포함하는 것인 수행 방법.
- 제27항 내지 제30항 중 어느 한 항에 있어서, 태그 서열은 PP7 서열 (SEQ ID NO:18)을 포함하고 RNA 인식 펩티드는 PP7 외피 단백질 (PCP, SEQ ID NO: 23)을 포함하거나, 또는 태그 서열은 boxB 서열 (SEQ ID NO:20)을 포함하고 RNA 인식 펩티드는 boxB 외피 단백질 (N22p, SEQ ID NO: 24)을 포함하는 것인 수행 방법.
- 제27항에 있어서, 세포는 살아있는 유기체 내에 존재하는 것인 수행 방법.
- 제34항에 있어서, 세포는 인간 환자 내의 인간 세포인 수행 방법.
- 유전자 편집을 수행하기 위한 키트 또는 패키지로서,
(a) 제19항 내지 제26항 중 어느 한 항의 융합 단백질, 및
(b) RNA 서열에 결합할 수 있는 RNA 인식 펩티드에 커플링된 제2 TEV 프로테아제 단편
을 포함하는 것인 키트 또는 패키지. - 융합 단백질로서,
제1 핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 및
제2 핵염기 디아미나제의 억제성 도메인을 포함하는 제2 단편을 포함하고,
제1 핵염기 디아미나제는 제2 핵염기 디아미나제와 동일하거나 또는 상이한 것인 융합 단백질. - 제37항에 있어서, 제1 및 제2 핵염기 디아미나제는 각각이 인간 및 마우스 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)의 군으로부터 독립적으로 선택되는 것인 융합 단백질.
- 융합 단백질로서,
핵염기 디아미나제 또는 이의 촉매 도메인,
핵염기 디아미나제 억제제,
제1 RNA 인식 펩티드, 및
핵염기 디아미나제 또는 이의 촉매 도메인 및 핵염기 디아미나제 억제제 사이의 TEV 프로테아제 절단 부위
를 포함하는 제1 단편을 포함하는 것인 융합 단백질. - 제39항에 있어서,
단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편, 및
제2 RNA 인식 펩티드
를 포함하는 제2 단편을 더 포함하는 것인 융합 단백질. - 제40항에 있어서, 제1 단편 및 제2 단편 사이에 자가-절단 부위를 더 포함하는 것인 융합 단백질.
- 제41항에 있어서, 제2 TEV 프로테아제 단편을 포함하는 제3 단편을 더 포함하고, 제1 TEV 프로테아제 단편은 제2 TEV 프로테아제 단편의 존재 하에서 TEV 프로테아제 부위를 절단할 수 있는 것인 융합 단백질.
- 제42항에 있어서, 제2 단편 및 제3 단편 사이에 제2 자가-절단 부위를 더 포함하고, 제2 자가-절단 부위의 절단 시에, 융합 단백질은 임의의 RNA 인식 펩티드에 융합되지 않은 제2 TEV 프로테아제 단편을 방출시키는 것인 융합 단백질.
- 이중 가이드 RNA 시스템으로서,
제1 PAM 부위에 근접한 표적 핵산 서열에 상보성인 서열을 갖는 제1 스페이서를 포함하는 표적 단일 가이드 RNA,
제2 PAM 부위에 근접한 제2 핵산 서열에 상보성인 서열을 갖는 제2 스페이서를 포함하는 헬퍼 단일 가이드 RNA,
군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및
핵염기 디아미나제를 포함하고,
제2 PAM 부위는 제1 PAM 부위로부터 34 내지 91 염기인 이중 가이드 RNA 시스템. - 제44항에 있어서, 제2 스페이서는 7-23 염기 길이인 이중 가이드 RNA 시스템.
- 제44항에 있어서, 제2 스페이서는 8-15 염기 길이인 이중 가이드 RNA 시스템.
- 제44항에 있어서, 제2 스페이서는 9-12 염기 길이인 이중 가이드 RNA 시스템.
- 가이드 RNA로서, 5'에서 3' 방향으로,
제1 스템 루프 부분,
제2 스템 루프 부분,
제3 스템 루프 부분, 및
제4 스템 루프 부분을 포함하는 스캐폴드를 포함하고,
제3 스템 루프는 그 안에 5 염기쌍을 포함하는 것인 가이드 RNA. - 제48항에 있어서, 염기쌍은 SEQ ID NO:31 내 위치에 따라서, 위치 45 및 55 사이의 하나를 포함하는 것인 가이드 RNA.
- 제48항 또는 제49항에 있어서, 스캐폴드는 SEQ ID NO:32-43으로 이루어진 군으로부터 선택되는 서열을 포함하는 것인 가이드 RNA.
- 제48항에 있어서, 표적 서열을 인식하기 위한 스페이서, 역전사효소 주형, 또는 프라이머-결합 부위 중 하나 이상을 더 포함하는 것인 가이드 RNA.
- 세포 내 표적 부위에서 유전자 편집을 수행하기 위한 방법으로서, 세포로
군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 코딩하는 제1 구성체가 밀봉된 제1 바이러스 입자, 및
RNA 인식 펩티드에 융합된 역전사효소를 코딩하는 제2 구성체가 밀봉된 제2 바이러스 입자
를 도입시키는 단계를 포함하는 것인 수행 방법. - 제52항에 있어서, 제2 구성체는 RNA 인식 펩티드가 결합하는 RNA 인식 부위를 포함하는 가이드 RNA를 더 코딩하는 것인 수행 방법.
- 제52항에 있어서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택되는 것인 수행 방법.
- 제52항에 있어서, 역전사효소는 인간 면역결핍 바이러스 (HIV) 역전사효소, 몰로니 쥐 백혈병 바이러스 (MMLV) 역전사효소 및 조류 골수아세포종 바이러스 (AMV) 역전사효소로 이루어진 군으로부터 선택되는 것인 수행 방법.
- 인간 PCSK9 핵산 서열을 편집하기 위한 헬퍼 가이드 RNA/가이드 RNA의 쌍으로서, 가이드 RNA는 PCSK9 핵산 상의 제1 부위를 특이적으로 표적화하여 비-중지 코돈을 중지 코돈으로 전환시키는 염기 편집을 할 수 있고, 헬퍼 가이드 RNA는 제1 부위로부터 20 내지 100 염기인 PCSK9 핵산 상의 제2 부위를 특이적으로 표적화하는 것인 쌍.
- 제56항에 있어서, 비-중지 코돈은 CAG, CAA, 또는 CGA인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
- 제56항 또는 제57항에 있어서, 헬퍼 가이드 RNA는 7-23 뉴클레오티드 길이인 서열에 특이적으로 결합하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
- 제56항 또는 제57항에 있어서, 헬퍼 가이드 RNA는 8-15 뉴클레오티드 길이인 서열에 특이적으로 결합하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
- 제58항 또는 제59항에 있어서, 헬퍼 가이드 RNA는 제1 부위 내 서열에 특이적으로 결합하고, 가이드 RNA는 제2 부위 내 서열에 특이적으로 결합하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
- 제60항에 있어서, 제2 부위는 SEQ ID NO:166-180 중 어느 하나의 서열을 포함하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
- 제60항에 있어서, 제2 부위 및 제1 부위는 각각이
SEQ ID NO:166 및 181;
SEQ ID NO:167 및 182;
SEQ ID NO:168 및 183;
SEQ ID NO:169 및 184;
SEQ ID NO:170 및 185;
SEQ ID NO:171 및 186;
SEQ ID NO:172 및 187;
SEQ ID NO:173 및 188;
SEQ ID NO:174 및 189;
SEQ ID NO:175 및 190;
SEQ ID NO:176 및 191;
SEQ ID NO:177 및 192;
SEQ ID NO:178 및 193;
SEQ ID NO:179 및 194; 또는
SEQ ID NO:180 및 195의 서열을 포함하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍. - 제56항 내지 제62항 중 어느 한 항의 헬퍼 가이드 RNA 및 가이드 RNA를 코딩하는 하나 이상의 폴리뉴클레오티드 서열.
- 세포 내 PSCK9 유전자를 불활성화시키는 방법으로서, 세포를 제56항 내지 제62항 중 어느 한 항의 헬퍼 가이드 RNA 및 가이드 RNA의 쌍, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 핵염기 디아미나제와 접촉시키는 단계를 포함하는 것인 불활성화 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019074577 | 2019-02-02 | ||
CNPCT/CN2019/074577 | 2019-02-02 | ||
PCT/CN2020/074218 WO2020156575A1 (en) | 2019-02-02 | 2020-02-03 | Inhibition of unintended mutations in gene editing |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210126042A true KR20210126042A (ko) | 2021-10-19 |
Family
ID=71841894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217028085A KR20210126042A (ko) | 2019-02-02 | 2020-02-03 | 유전자 편집에서 비의도적 돌연변이의 억제 |
Country Status (11)
Country | Link |
---|---|
US (3) | US11384353B2 (ko) |
EP (1) | EP3918083A4 (ko) |
JP (1) | JP2022526695A (ko) |
KR (1) | KR20210126042A (ko) |
CN (4) | CN116286802A (ko) |
AU (2) | AU2020214090B2 (ko) |
BR (1) | BR112021015092A2 (ko) |
CA (1) | CA3128283A1 (ko) |
IL (1) | IL285194A (ko) |
SG (1) | SG11202108303SA (ko) |
WO (1) | WO2020156575A1 (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4244369A1 (en) * | 2020-11-12 | 2023-09-20 | Shanghaitech University | Genomic editing of improved efficiency and accuracy |
CN112575014B (zh) * | 2020-12-11 | 2022-04-01 | 安徽省农业科学院水稻研究所 | 一种碱基编辑器SpCas9-LjCDAL1及其构建和应用 |
BR112023019773A2 (pt) * | 2021-04-02 | 2024-03-12 | Univ Shanghai Technology | Método para promover a produção de gama-globina em uma célula humana, polinucleotídeos codificando uma proteína associada a um crispr (cas), uma nucleobase desaminase, um rna de guia único (sgrna) e um rna de guia único auxiliar (hsgrna), e, proteína de fusão |
US20220372497A1 (en) * | 2021-05-18 | 2022-11-24 | Shanghaitech University | Base Editing Tool And Use Thereof |
WO2023088440A1 (en) * | 2021-11-18 | 2023-05-25 | Correctsequence Therapeutics | Regeneration of surface antigen-negative cells |
WO2023153811A1 (ko) * | 2022-02-08 | 2023-08-17 | 주식회사 툴젠 | 프라임 에디팅 시스템을 이용한 게놈 편집의 과정에서 발생 가능한 오프 타겟을 예측하는 방법 |
WO2024012435A1 (en) | 2022-07-11 | 2024-01-18 | CorrectSequence Therapeutics Co., Ltd | Gene editing systems and methods for treating hereditary angioedema |
WO2024042489A1 (en) | 2022-08-25 | 2024-02-29 | LifeEDIT Therapeutics, Inc. | Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing |
WO2024088401A1 (en) * | 2022-10-28 | 2024-05-02 | CorrectSequence Therapeutics Co., Ltd | Gene editing systems and methods for reducing immunogenicity and graft versus host response |
WO2024095245A2 (en) | 2022-11-04 | 2024-05-10 | LifeEDIT Therapeutics, Inc. | Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use |
CN117092084B (zh) * | 2023-10-20 | 2024-01-12 | 浙江迪福润丝生物科技有限公司 | Wnv蛋白酶抑制剂的筛选方法和抑制效果评价方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6445314A (en) | 1987-04-16 | 1989-02-17 | Res Corp Technologies Inc | Antitumoral |
US8288094B2 (en) | 2008-04-09 | 2012-10-16 | Institut Pasteur | APOBEC3 mediated DNA editing |
US20150166984A1 (en) * | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting alpha-antitrypsin point mutations |
CN105886498A (zh) * | 2015-05-13 | 2016-08-24 | 沈志荣 | CRISPR-Cas9特异性敲除人PCSK9基因的方法以及用于特异性靶向PCSK9基因的sgRNA |
IL258821B (en) * | 2015-10-23 | 2022-07-01 | Harvard College | Nucleobase editors and their uses |
WO2018052247A1 (ko) * | 2016-09-13 | 2018-03-22 | 주식회사 툴젠 | 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법 |
US11192929B2 (en) * | 2016-12-08 | 2021-12-07 | Regents Of The University Of Minnesota | Site-specific DNA base editing using modified APOBEC enzymes |
CN108342387B (zh) | 2017-01-24 | 2021-09-24 | 谭旭 | Pcsk9抑制剂类降血脂药的递送系统和生物制剂 |
WO2018208998A1 (en) * | 2017-05-10 | 2018-11-15 | The Regents Of The University Of California | Directed editing of cellular rna via nuclear delivery of crispr/cas9 |
EP3630198A4 (en) * | 2017-05-25 | 2021-04-21 | The General Hospital Corporation | USE OF CLIVED DESAMINASES TO LIMIT UNWANTED OUT-OF-TARGET DESAMINATION FROM BASE EDITING |
CN109136272A (zh) | 2017-06-15 | 2019-01-04 | 中山大学 | 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其在人生殖系中的应用 |
CN109021111B (zh) * | 2018-02-23 | 2021-12-07 | 上海科技大学 | 一种基因碱基编辑器 |
-
2020
- 2020-02-03 KR KR1020217028085A patent/KR20210126042A/ko unknown
- 2020-02-03 JP JP2021544682A patent/JP2022526695A/ja active Pending
- 2020-02-03 CN CN202211042699.9A patent/CN116286802A/zh active Pending
- 2020-02-03 EP EP20748289.4A patent/EP3918083A4/en active Pending
- 2020-02-03 AU AU2020214090A patent/AU2020214090B2/en active Active
- 2020-02-03 BR BR112021015092A patent/BR112021015092A2/pt unknown
- 2020-02-03 CA CA3128283A patent/CA3128283A1/en active Pending
- 2020-02-03 WO PCT/CN2020/074218 patent/WO2020156575A1/en active Application Filing
- 2020-02-03 CN CN202080026986.3A patent/CN113661248B/zh active Active
- 2020-02-03 SG SG11202108303SA patent/SG11202108303SA/en unknown
- 2020-02-03 CN CN202211043562.5A patent/CN116656676A/zh active Pending
- 2020-02-03 US US17/427,040 patent/US11384353B2/en active Active
- 2020-02-03 CN CN202211057011.4A patent/CN116355966A/zh active Pending
-
2021
- 2021-07-28 IL IL285194A patent/IL285194A/en unknown
-
2022
- 2022-07-11 US US17/862,354 patent/US11840685B2/en active Active
- 2022-12-12 AU AU2022287550A patent/AU2022287550A1/en active Pending
-
2023
- 2023-09-29 US US18/478,861 patent/US20240026342A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3918083A1 (en) | 2021-12-08 |
US20220064626A1 (en) | 2022-03-03 |
IL285194A (en) | 2021-09-30 |
CN116656676A (zh) | 2023-08-29 |
AU2020214090A1 (en) | 2021-09-16 |
SG11202108303SA (en) | 2021-08-30 |
AU2022287550A1 (en) | 2023-02-02 |
AU2020214090B2 (en) | 2022-09-15 |
EP3918083A4 (en) | 2023-03-29 |
CA3128283A1 (en) | 2020-08-06 |
US20240026342A1 (en) | 2024-01-25 |
CN113661248A (zh) | 2021-11-16 |
WO2020156575A1 (en) | 2020-08-06 |
BR112021015092A2 (pt) | 2022-10-11 |
CN113661248B (zh) | 2022-09-16 |
US20230094769A1 (en) | 2023-03-30 |
JP2022526695A (ja) | 2022-05-26 |
CN116286802A (zh) | 2023-06-23 |
US11840685B2 (en) | 2023-12-12 |
US11384353B2 (en) | 2022-07-12 |
CN116355966A (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210126042A (ko) | 유전자 편집에서 비의도적 돌연변이의 억제 | |
JP7074827B2 (ja) | 遺伝子操作CRISPR-Cas9ヌクレアーゼ | |
US10633642B2 (en) | Engineered CRISPR-Cas9 nucleases | |
US10526591B2 (en) | Engineered CRISPR-Cas9 nucleases | |
EP2680877B1 (en) | Coupling endonucleases with end-processing enzymes drive high efficiency gene disruption | |
AU2006272634B2 (en) | Targeted integration and expression of exogenous nucleic acid sequences | |
AU2004263865A1 (en) | Methods and compositions for targeted cleavage and recombination | |
KR20190090724A (ko) | 아데노신 디아미나아제를 이용한 염기 교정 확인 방법 | |
JP2022546594A (ja) | 新規crispr dnaターゲティング酵素及びシステム | |
WO2024086845A2 (en) | Engineered casphi2 nucleases |