KR20230021081A - 에피게놈 편집을 위한 조성물 및 방법 - Google Patents
에피게놈 편집을 위한 조성물 및 방법 Download PDFInfo
- Publication number
- KR20230021081A KR20230021081A KR1020237000254A KR20237000254A KR20230021081A KR 20230021081 A KR20230021081 A KR 20230021081A KR 1020237000254 A KR1020237000254 A KR 1020237000254A KR 20237000254 A KR20237000254 A KR 20237000254A KR 20230021081 A KR20230021081 A KR 20230021081A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- fusion protein
- ser
- amino acid
- leu
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 239000000203 mixture Substances 0.000 title abstract description 19
- 238000012236 epigenome editing Methods 0.000 title description 5
- 108020001507 fusion proteins Proteins 0.000 claims description 356
- 102000037865 fusion proteins Human genes 0.000 claims description 356
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 276
- 150000007523 nucleic acids Chemical class 0.000 claims description 202
- 108090000623 proteins and genes Proteins 0.000 claims description 189
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 176
- 125000000539 amino acid group Chemical group 0.000 claims description 169
- 230000002950 deficient Effects 0.000 claims description 143
- 108091006106 transcriptional activators Proteins 0.000 claims description 143
- 101710163270 Nuclease Proteins 0.000 claims description 141
- 102000040430 polynucleotide Human genes 0.000 claims description 120
- 108091033319 polynucleotide Proteins 0.000 claims description 120
- 239000002157 polynucleotide Substances 0.000 claims description 120
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 119
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 119
- 102000039446 nucleic acids Human genes 0.000 claims description 111
- 108020004707 nucleic acids Proteins 0.000 claims description 111
- 102000004169 proteins and genes Human genes 0.000 claims description 109
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 92
- 150000001413 amino acids Chemical class 0.000 claims description 84
- 230000017858 demethylation Effects 0.000 claims description 74
- 238000010520 demethylation reaction Methods 0.000 claims description 74
- 108091029523 CpG island Proteins 0.000 claims description 60
- 230000030648 nucleus localization Effects 0.000 claims description 45
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 40
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 34
- 229910052725 zinc Inorganic materials 0.000 claims description 34
- 239000011701 zinc Substances 0.000 claims description 33
- 230000004570 RNA-binding Effects 0.000 claims description 29
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 29
- 108091006047 fluorescent proteins Proteins 0.000 claims description 20
- 102000034287 fluorescent proteins Human genes 0.000 claims description 20
- 230000003213 activating effect Effects 0.000 claims description 19
- 230000004927 fusion Effects 0.000 claims description 18
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 11
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 claims description 10
- 108060003951 Immunoglobulin Proteins 0.000 claims description 9
- 102000018358 immunoglobulin Human genes 0.000 claims description 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 8
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 8
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 claims description 5
- 102100030812 Methylcytosine dioxygenase TET3 Human genes 0.000 claims description 5
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 claims 9
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 claims 4
- 101000653369 Homo sapiens Methylcytosine dioxygenase TET3 Proteins 0.000 claims 4
- 230000014509 gene expression Effects 0.000 abstract description 37
- 210000004027 cell Anatomy 0.000 description 137
- 102100035100 Transcription factor p65 Human genes 0.000 description 112
- 101710124574 Synaptotagmin-1 Proteins 0.000 description 111
- 101710122931 Replication and transcription activator Proteins 0.000 description 107
- 235000018102 proteins Nutrition 0.000 description 107
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 104
- 235000001014 amino acid Nutrition 0.000 description 86
- 229940024606 amino acid Drugs 0.000 description 85
- 108091033409 CRISPR Proteins 0.000 description 82
- 108020004414 DNA Proteins 0.000 description 50
- 150000001875 compounds Chemical class 0.000 description 44
- 102100034467 Clathrin light chain A Human genes 0.000 description 42
- 101000710244 Homo sapiens Clathrin light chain A Proteins 0.000 description 42
- 230000027455 binding Effects 0.000 description 42
- 125000003729 nucleotide group Chemical group 0.000 description 42
- 238000001890 transfection Methods 0.000 description 41
- 239000002773 nucleotide Substances 0.000 description 40
- 230000007420 reactivation Effects 0.000 description 38
- 230000000694 effects Effects 0.000 description 36
- 239000013598 vector Substances 0.000 description 35
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 34
- 238000013518 transcription Methods 0.000 description 32
- 230000035897 transcription Effects 0.000 description 32
- 102100031780 Endonuclease Human genes 0.000 description 31
- 108010042407 Endonucleases Proteins 0.000 description 31
- 101710125418 Major capsid protein Proteins 0.000 description 31
- 102000004196 processed proteins & peptides Human genes 0.000 description 30
- 238000010354 CRISPR gene editing Methods 0.000 description 29
- 229920001184 polypeptide Polymers 0.000 description 29
- 230000000295 complement effect Effects 0.000 description 26
- 108020005004 Guide RNA Proteins 0.000 description 20
- 239000013612 plasmid Substances 0.000 description 19
- 108091023040 Transcription factor Proteins 0.000 description 18
- 238000009396 hybridization Methods 0.000 description 18
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 17
- 230000004913 activation Effects 0.000 description 17
- 125000006850 spacer group Chemical group 0.000 description 16
- 102000040945 Transcription factor Human genes 0.000 description 15
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 14
- 108020004999 messenger RNA Proteins 0.000 description 14
- 108091005948 blue fluorescent proteins Proteins 0.000 description 13
- -1 e.g. Proteins 0.000 description 13
- 230000030279 gene silencing Effects 0.000 description 13
- 230000001413 cellular effect Effects 0.000 description 12
- 239000003623 enhancer Substances 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 239000002105 nanoparticle Substances 0.000 description 12
- 230000008685 targeting Effects 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 108010031719 prolyl-serine Proteins 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 108010026333 seryl-proline Proteins 0.000 description 11
- 230000002103 transcriptional effect Effects 0.000 description 11
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 10
- 230000003612 virological effect Effects 0.000 description 10
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 9
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 9
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 9
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 9
- 230000007067 DNA methylation Effects 0.000 description 9
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 108010078144 glutaminyl-glycine Proteins 0.000 description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 9
- 108010057821 leucylproline Proteins 0.000 description 9
- 239000013603 viral vector Substances 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 8
- 108010065920 Insulin Lispro Proteins 0.000 description 8
- 101150063416 add gene Proteins 0.000 description 8
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 239000010931 gold Substances 0.000 description 8
- 108010009298 lysylglutamic acid Proteins 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 7
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 7
- 108010044940 alanylglutamine Proteins 0.000 description 7
- 108010087924 alanylproline Proteins 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000001973 epigenetic effect Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 230000004952 protein activity Effects 0.000 description 7
- 101710132601 Capsid protein Proteins 0.000 description 6
- 101710094648 Coat protein Proteins 0.000 description 6
- 230000035131 DNA demethylation Effects 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- 101710141454 Nucleoprotein Proteins 0.000 description 6
- 101710083689 Probable capsid protein Proteins 0.000 description 6
- 108010081734 Ribonucleoproteins Proteins 0.000 description 6
- 102000004389 Ribonucleoproteins Human genes 0.000 description 6
- 108700009124 Transcription Initiation Site Proteins 0.000 description 6
- 108010062796 arginyllysine Proteins 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- 238000003753 real-time PCR Methods 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 230000005945 translocation Effects 0.000 description 6
- 102100037064 Cytoplasmic dynein 2 light intermediate chain 1 Human genes 0.000 description 5
- 230000004568 DNA-binding Effects 0.000 description 5
- 101000954716 Homo sapiens Cytoplasmic dynein 2 light intermediate chain 1 Proteins 0.000 description 5
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 5
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 5
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 5
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 108010013835 arginine glutamate Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 108010016616 cysteinylglycine Proteins 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- ZJAOAACCNHFJAH-UHFFFAOYSA-N phosphonoformic acid Chemical compound OC(=O)P(O)(O)=O ZJAOAACCNHFJAH-UHFFFAOYSA-N 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 4
- 101150075848 Clta gene Proteins 0.000 description 4
- 229910052688 Gadolinium Inorganic materials 0.000 description 4
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 4
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 4
- 108010009491 Lysosomal-Associated Membrane Protein 2 Proteins 0.000 description 4
- 102100038225 Lysosome-associated membrane glycoprotein 2 Human genes 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 4
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 4
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 4
- 108091028664 Ribonucleotide Proteins 0.000 description 4
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 4
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 4
- 239000012190 activator Substances 0.000 description 4
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 238000000684 flow cytometry Methods 0.000 description 4
- 238000012226 gene silencing method Methods 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 4
- 229910052737 gold Inorganic materials 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 150000004713 phosphodiesters Chemical class 0.000 description 4
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 230000007115 recruitment Effects 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 239000002336 ribonucleotide Substances 0.000 description 4
- 125000002652 ribonucleotide group Chemical group 0.000 description 4
- 230000003584 silencer Effects 0.000 description 4
- 230000009870 specific binding Effects 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 3
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 3
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 3
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 3
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 3
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 3
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 3
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 3
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 3
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 3
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 3
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 3
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 3
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 3
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 3
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 3
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 3
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 3
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 3
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 3
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 3
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 101001128460 Homo sapiens Myosin light polypeptide 6 Proteins 0.000 description 3
- QRTVJGKXFSYJGW-KBIXCLLPSA-N Ile-Glu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QRTVJGKXFSYJGW-KBIXCLLPSA-N 0.000 description 3
- ZXIGYKICRDFISM-DJFWLOJKSA-N Ile-His-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZXIGYKICRDFISM-DJFWLOJKSA-N 0.000 description 3
- 102100034349 Integrase Human genes 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 3
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 3
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 3
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 3
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 3
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 3
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 3
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 3
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 3
- 108030004080 Methylcytosine dioxygenases Proteins 0.000 description 3
- 102100031829 Myosin light polypeptide 6 Human genes 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 3
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 3
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 3
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 3
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 3
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 3
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 3
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 3
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 3
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 3
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 3
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 3
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 3
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 3
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 3
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 3
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 238000001369 bisulfite sequencing Methods 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 108010054813 diprotin B Proteins 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 3
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 3
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 230000005298 paramagnetic effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000002459 sustained effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 2
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 2
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 2
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 2
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 2
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 2
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 2
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 2
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 2
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 2
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 2
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 2
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 2
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 2
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 2
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 2
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 2
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 2
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 2
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 2
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 2
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 2
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 2
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 2
- 229910052684 Cerium Inorganic materials 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- NLDWTJBJFVWBDQ-KKUMJFAQSA-N Cys-Lys-Phe Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NLDWTJBJFVWBDQ-KKUMJFAQSA-N 0.000 description 2
- OETOANMAHTWESF-KKUMJFAQSA-N Cys-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CS)N OETOANMAHTWESF-KKUMJFAQSA-N 0.000 description 2
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 229910052692 Dysprosium Inorganic materials 0.000 description 2
- 101710091045 Envelope protein Proteins 0.000 description 2
- 229910052691 Erbium Inorganic materials 0.000 description 2
- 229910052693 Europium Inorganic materials 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 101150106478 GPS1 gene Proteins 0.000 description 2
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 2
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 2
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 2
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 2
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 2
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 2
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 2
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 2
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 2
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 2
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 2
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 2
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 2
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 2
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 2
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 2
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 2
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 2
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 2
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 2
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 2
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 2
- 229910052689 Holmium Inorganic materials 0.000 description 2
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 2
- 101000667188 Homo sapiens Vacuolar protein-sorting-associated protein 25 Proteins 0.000 description 2
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- UQSXHKLRYXJYBZ-UHFFFAOYSA-N Iron oxide Chemical compound [Fe]=O UQSXHKLRYXJYBZ-UHFFFAOYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 2
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- 229910052765 Lutetium Inorganic materials 0.000 description 2
- ZTPWXNOOKAXPPE-DCAQKATOSA-N Lys-Arg-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N ZTPWXNOOKAXPPE-DCAQKATOSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- 108091060294 Messenger RNP Proteins 0.000 description 2
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 2
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 229910052779 Neodymium Inorganic materials 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 2
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 2
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 2
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 2
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 2
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 2
- 229910052777 Praseodymium Inorganic materials 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 2
- SBYVDRLQAGENMY-DCAQKATOSA-N Pro-Asn-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O SBYVDRLQAGENMY-DCAQKATOSA-N 0.000 description 2
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 2
- JUJGNDZIKKQMDJ-IHRRRGAJSA-N Pro-His-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O JUJGNDZIKKQMDJ-IHRRRGAJSA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 2
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 2
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 2
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 2
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 2
- MDAWMJUZHBQTBO-XGEHTFHBSA-N Pro-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1)O MDAWMJUZHBQTBO-XGEHTFHBSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 2
- 101710188315 Protein X Proteins 0.000 description 2
- 229910052772 Samarium Inorganic materials 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 2
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 2
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 2
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 2
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 2
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000399119 Spio Species 0.000 description 2
- 229910052771 Terbium Inorganic materials 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 2
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 2
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 2
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- 229910052775 Thulium Inorganic materials 0.000 description 2
- SVGAWGVHFIYAEE-JSGCOSHPSA-N Trp-Gly-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 SVGAWGVHFIYAEE-JSGCOSHPSA-N 0.000 description 2
- GNCPKOZDOCQRAF-BPUTZDHNSA-N Trp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GNCPKOZDOCQRAF-BPUTZDHNSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 2
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 2
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 102100039080 Vacuolar protein-sorting-associated protein 25 Human genes 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 229910052769 Ytterbium Inorganic materials 0.000 description 2
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 2
- KRHYYFGTRYWZRS-BJUDXGSMSA-N ac1l2y5h Chemical compound [18FH] KRHYYFGTRYWZRS-BJUDXGSMSA-N 0.000 description 2
- 230000001464 adherent effect Effects 0.000 description 2
- 108010069490 alanyl-glycyl-seryl-glutamic acid Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- TZCXTZWJZNENPQ-UHFFFAOYSA-L barium sulfate Chemical compound [Ba+2].[O-]S([O-])(=O)=O TZCXTZWJZNENPQ-UHFFFAOYSA-L 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000013522 chelant Substances 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000002872 contrast media Substances 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 229960005102 foscarnet Drugs 0.000 description 2
- UIWYJDYFSGRHKR-UHFFFAOYSA-N gadolinium atom Chemical compound [Gd] UIWYJDYFSGRHKR-UHFFFAOYSA-N 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- WTFXARWRTYJXII-UHFFFAOYSA-N iron(2+);iron(3+);oxygen(2-) Chemical compound [O-2].[O-2].[O-2].[O-2].[Fe+2].[Fe+3].[Fe+3] WTFXARWRTYJXII-UHFFFAOYSA-N 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 229910052746 lanthanum Inorganic materials 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 229910052748 manganese Inorganic materials 0.000 description 2
- 108010082117 matrigel Proteins 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 230000032965 negative regulation of cell volume Effects 0.000 description 2
- 229910052759 nickel Inorganic materials 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- XUYJLQHKOGNDPB-UHFFFAOYSA-N phosphonoacetic acid Chemical compound OC(=O)CP(O)(O)=O XUYJLQHKOGNDPB-UHFFFAOYSA-N 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000001718 repressive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 229910052720 vanadium Inorganic materials 0.000 description 2
- 108010000998 wheylin-2 peptide Proteins 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- AOYNUTHNTBLRMT-SLPGGIOYSA-N 2-deoxy-2-fluoro-aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](F)C=O AOYNUTHNTBLRMT-SLPGGIOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- FRFDXQWNDZMREB-ACZMJKKPSA-N Ala-Cys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRFDXQWNDZMREB-ACZMJKKPSA-N 0.000 description 1
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 1
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- MLNSNVLOEIYJIU-ZUDIRPEPSA-N Ala-Leu-Thr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLNSNVLOEIYJIU-ZUDIRPEPSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 1
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- DGFGDPVSDQPANQ-XGEHTFHBSA-N Arg-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)O DGFGDPVSDQPANQ-XGEHTFHBSA-N 0.000 description 1
- RWDVGVPHEWOZMO-GUBZILKMSA-N Arg-Cys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCNC(N)=N)C(O)=O RWDVGVPHEWOZMO-GUBZILKMSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- XKDYWGLNSCNRGW-WDSOQIARSA-N Arg-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCN=C(N)N)CCCCN)C(O)=O)=CNC2=C1 XKDYWGLNSCNRGW-WDSOQIARSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- NIELFHOLFTUZME-HJWJTTGWSA-N Arg-Phe-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NIELFHOLFTUZME-HJWJTTGWSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- VWJFQGXPYOPXJH-ZLUOBGJFSA-N Asn-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)N VWJFQGXPYOPXJH-ZLUOBGJFSA-N 0.000 description 1
- TWVTVZUGEDBAJF-ACZMJKKPSA-N Asn-Cys-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N TWVTVZUGEDBAJF-ACZMJKKPSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- CZIXHXIJJZLYRJ-SRVKXCTJSA-N Asn-Cys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CZIXHXIJJZLYRJ-SRVKXCTJSA-N 0.000 description 1
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- UEONJSPBTSWKOI-CIUDSAMLSA-N Asn-Gln-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O UEONJSPBTSWKOI-CIUDSAMLSA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- OFQPMRDJVWLMNJ-CIUDSAMLSA-N Asn-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N OFQPMRDJVWLMNJ-CIUDSAMLSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 1
- VOKWBBBXJONREA-DCAQKATOSA-N Asn-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N VOKWBBBXJONREA-DCAQKATOSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 1
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 1
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- LXKLDWVHXNZQGB-SRVKXCTJSA-N Asp-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O LXKLDWVHXNZQGB-SRVKXCTJSA-N 0.000 description 1
- PJERDVUTUDZPGX-ZKWXMUAHSA-N Asp-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O PJERDVUTUDZPGX-ZKWXMUAHSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- OEDJQRXNDRUGEU-SRVKXCTJSA-N Asp-Leu-His Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O OEDJQRXNDRUGEU-SRVKXCTJSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- WZUZGDANRQPCDD-SRVKXCTJSA-N Asp-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N WZUZGDANRQPCDD-SRVKXCTJSA-N 0.000 description 1
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- LGGHQRZIJSYRHA-GUBZILKMSA-N Asp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N LGGHQRZIJSYRHA-GUBZILKMSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- NBKLEMWHDLAUEM-CIUDSAMLSA-N Asp-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N NBKLEMWHDLAUEM-CIUDSAMLSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- XAPPCWUWHNWCPQ-PBCZWWQYSA-N Asp-Thr-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XAPPCWUWHNWCPQ-PBCZWWQYSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 102100035893 CD151 antigen Human genes 0.000 description 1
- 102100027221 CD81 antigen Human genes 0.000 description 1
- 208000019300 CLIPPERS Diseases 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010446 CRISPR interference Methods 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108091029430 CpG site Proteins 0.000 description 1
- PLBJMUUEGBBHRH-ZLUOBGJFSA-N Cys-Ala-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLBJMUUEGBBHRH-ZLUOBGJFSA-N 0.000 description 1
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 1
- BUIYOWKUSCTBRE-CIUDSAMLSA-N Cys-Arg-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O BUIYOWKUSCTBRE-CIUDSAMLSA-N 0.000 description 1
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 1
- QLCPDGRAEJSYQM-LPEHRKFASA-N Cys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)C(=O)O QLCPDGRAEJSYQM-LPEHRKFASA-N 0.000 description 1
- UISYPAHPLXGLNH-ACZMJKKPSA-N Cys-Asn-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UISYPAHPLXGLNH-ACZMJKKPSA-N 0.000 description 1
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 1
- NIPJKKSXHSBEMX-CIUDSAMLSA-N Cys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N NIPJKKSXHSBEMX-CIUDSAMLSA-N 0.000 description 1
- QADHATDBZXHRCA-ACZMJKKPSA-N Cys-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N QADHATDBZXHRCA-ACZMJKKPSA-N 0.000 description 1
- KEBJBKIASQVRJS-WDSKDSINSA-N Cys-Gln-Gly Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N KEBJBKIASQVRJS-WDSKDSINSA-N 0.000 description 1
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 1
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 1
- WTNLLMQAFPOCTJ-GARJFASQSA-N Cys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N)C(=O)O WTNLLMQAFPOCTJ-GARJFASQSA-N 0.000 description 1
- WAJDEKCJRKGRPG-CIUDSAMLSA-N Cys-His-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N WAJDEKCJRKGRPG-CIUDSAMLSA-N 0.000 description 1
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 1
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 1
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 1
- LHMSYHSAAJOEBL-CIUDSAMLSA-N Cys-Lys-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O LHMSYHSAAJOEBL-CIUDSAMLSA-N 0.000 description 1
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 1
- JUUMIGUJJRFQQR-KKUMJFAQSA-N Cys-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O JUUMIGUJJRFQQR-KKUMJFAQSA-N 0.000 description 1
- LWYKPOCGGTYAIH-FXQIFTODSA-N Cys-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LWYKPOCGGTYAIH-FXQIFTODSA-N 0.000 description 1
- SCOPAVYZWHPDBA-DCAQKATOSA-N Cys-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N SCOPAVYZWHPDBA-DCAQKATOSA-N 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- XWTGTTNUCCEFJI-UBHSHLNASA-N Cys-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N XWTGTTNUCCEFJI-UBHSHLNASA-N 0.000 description 1
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 1
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 1
- KFYPRIGJTICABD-XGEHTFHBSA-N Cys-Thr-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N)O KFYPRIGJTICABD-XGEHTFHBSA-N 0.000 description 1
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 1
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 1
- 230000026641 DNA hypermethylation Effects 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 101150062286 Dync2li1 gene Proteins 0.000 description 1
- 101710197780 E3 ubiquitin-protein ligase LAP Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000588088 Francisella tularensis subsp. novicida U112 Species 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 1
- KWLMLNHADZIJIS-CIUDSAMLSA-N Gln-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N KWLMLNHADZIJIS-CIUDSAMLSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 1
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- KHNJVFYHIKLUPD-SRVKXCTJSA-N Gln-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHNJVFYHIKLUPD-SRVKXCTJSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- KSKFIECUYMYWNS-AVGNSLFASA-N Gln-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N KSKFIECUYMYWNS-AVGNSLFASA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 1
- AMHIFFIUJOJEKJ-SZMVWBNQSA-N Gln-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N AMHIFFIUJOJEKJ-SZMVWBNQSA-N 0.000 description 1
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 1
- XBWGJWXGUNSZAT-CIUDSAMLSA-N Gln-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XBWGJWXGUNSZAT-CIUDSAMLSA-N 0.000 description 1
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 1
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- YJSCHRBERYWPQL-DCAQKATOSA-N Gln-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N YJSCHRBERYWPQL-DCAQKATOSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- DITJVHONFRJKJW-BPUTZDHNSA-N Gln-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DITJVHONFRJKJW-BPUTZDHNSA-N 0.000 description 1
- RGNMNWULPAYDAH-JSGCOSHPSA-N Gln-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N RGNMNWULPAYDAH-JSGCOSHPSA-N 0.000 description 1
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- QZQYITIKPAUDGN-GVXVVHGQSA-N Gln-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QZQYITIKPAUDGN-GVXVVHGQSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- FLQAKQOBSPFGKG-CIUDSAMLSA-N Glu-Cys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLQAKQOBSPFGKG-CIUDSAMLSA-N 0.000 description 1
- UENPHLAAKDPZQY-XKBZYTNZSA-N Glu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O UENPHLAAKDPZQY-XKBZYTNZSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 1
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 1
- NPMSEUWUMOSEFM-CIUDSAMLSA-N Glu-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N NPMSEUWUMOSEFM-CIUDSAMLSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- HLYCMRDRWGSTPZ-CIUDSAMLSA-N Glu-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CS)C(=O)O HLYCMRDRWGSTPZ-CIUDSAMLSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- LGQZOQRDEUIZJY-YUMQZZPRSA-N Gly-Cys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O LGQZOQRDEUIZJY-YUMQZZPRSA-N 0.000 description 1
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 1
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 1
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- WTUSRDZLLWGYAT-KCTSRDHCSA-N Gly-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN WTUSRDZLLWGYAT-KCTSRDHCSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- JHVCZQFWRLHUQR-DCAQKATOSA-N His-Arg-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JHVCZQFWRLHUQR-DCAQKATOSA-N 0.000 description 1
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 1
- WJUYPBBCSSLVJE-CIUDSAMLSA-N His-Asn-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N WJUYPBBCSSLVJE-CIUDSAMLSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- QQQHYJFKDLDUNK-CIUDSAMLSA-N His-Asp-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QQQHYJFKDLDUNK-CIUDSAMLSA-N 0.000 description 1
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 1
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 1
- NNBWMLHQXBTIIT-HVTMNAMFSA-N His-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N NNBWMLHQXBTIIT-HVTMNAMFSA-N 0.000 description 1
- VHHYJBSXXMPQGZ-AVGNSLFASA-N His-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N VHHYJBSXXMPQGZ-AVGNSLFASA-N 0.000 description 1
- CZXKZMQKXQZDEX-YUMQZZPRSA-N His-Gly-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N CZXKZMQKXQZDEX-YUMQZZPRSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- QAMFAYSMNZBNCA-UWVGGRQHSA-N His-Gly-Met Chemical compound CSCC[C@H](NC(=O)CNC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O QAMFAYSMNZBNCA-UWVGGRQHSA-N 0.000 description 1
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 1
- QPSCMXDWVKWVOW-BZSNNMDCSA-N His-His-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QPSCMXDWVKWVOW-BZSNNMDCSA-N 0.000 description 1
- MFQVZYSPCIZFMR-MGHWNKPDSA-N His-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N MFQVZYSPCIZFMR-MGHWNKPDSA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 1
- NKRWVZQTPXPNRZ-SRVKXCTJSA-N His-Met-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CN=CN1 NKRWVZQTPXPNRZ-SRVKXCTJSA-N 0.000 description 1
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 1
- AJTBOTWDSRSUDV-ULQDDVLXSA-N His-Phe-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O AJTBOTWDSRSUDV-ULQDDVLXSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 1
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 1
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 1
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 1
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 1
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 1
- HZWWOGWOBQBETJ-CUJWVEQBSA-N His-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O HZWWOGWOBQBETJ-CUJWVEQBSA-N 0.000 description 1
- PFOUFRJYHWZJKW-NKIYYHGXSA-N His-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O PFOUFRJYHWZJKW-NKIYYHGXSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- WSXNWASHQNSMRX-GVXVVHGQSA-N His-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSXNWASHQNSMRX-GVXVVHGQSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- CKONPJHGMIDMJP-IHRRRGAJSA-N His-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CKONPJHGMIDMJP-IHRRRGAJSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 1
- 101710103773 Histone H2B Proteins 0.000 description 1
- 102100033572 Histone H2B type 2-E Human genes 0.000 description 1
- 101000946874 Homo sapiens CD151 antigen Proteins 0.000 description 1
- 101000914479 Homo sapiens CD81 antigen Proteins 0.000 description 1
- 101000871966 Homo sapiens Histone H2B type 2-E Proteins 0.000 description 1
- 101000935043 Homo sapiens Integrin beta-1 Proteins 0.000 description 1
- 101000620798 Homo sapiens Ras-related protein Rab-11A Proteins 0.000 description 1
- 101600120795 Homo sapiens Transcription factor p65 (isoform 1) Proteins 0.000 description 1
- 101000803403 Homo sapiens Vimentin Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- DMHGKBGOUAJRHU-RVMXOQNASA-N Ile-Arg-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N DMHGKBGOUAJRHU-RVMXOQNASA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 1
- XLDYDEDTGMHUCZ-GHCJXIJMSA-N Ile-Asp-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N XLDYDEDTGMHUCZ-GHCJXIJMSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- CTHAJJYOHOBUDY-GHCJXIJMSA-N Ile-Cys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N CTHAJJYOHOBUDY-GHCJXIJMSA-N 0.000 description 1
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- YTRFFJUOYBMLPN-UHFFFAOYSA-N Ile-Lys-Lys-Ser Chemical compound CCC(C)C(N)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CO)C(O)=O YTRFFJUOYBMLPN-UHFFFAOYSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- XVUAQNRNFMVWBR-BLMTYFJBSA-N Ile-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N XVUAQNRNFMVWBR-BLMTYFJBSA-N 0.000 description 1
- VBGCPJBKUXRYDA-DSYPUSFNSA-N Ile-Trp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N VBGCPJBKUXRYDA-DSYPUSFNSA-N 0.000 description 1
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 102100025304 Integrin beta-1 Human genes 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- AMDBBAQNWSUWGN-UHFFFAOYSA-N Ioversol Chemical compound OCCN(C(=O)CO)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I AMDBBAQNWSUWGN-UHFFFAOYSA-N 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- 241000689670 Lachnospiraceae bacterium ND2006 Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- URGPVYGVWLIRGT-DCAQKATOSA-N Lys-Met-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O URGPVYGVWLIRGT-DCAQKATOSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- CFRRIZLGFGJEDB-SRVKXCTJSA-N Met-His-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CFRRIZLGFGJEDB-SRVKXCTJSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- YYEIFXZOBZVDPH-DCAQKATOSA-N Met-Lys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O YYEIFXZOBZVDPH-DCAQKATOSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 1
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- ZDJICAUBMUKVEJ-CIUDSAMLSA-N Met-Ser-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O ZDJICAUBMUKVEJ-CIUDSAMLSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 1
- NBEFNGUZUOUGFG-KKUMJFAQSA-N Met-Tyr-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NBEFNGUZUOUGFG-KKUMJFAQSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101710158461 Methylcytosine dioxygenase TET1 Proteins 0.000 description 1
- 101710158562 Methylcytosine dioxygenase TET2 Proteins 0.000 description 1
- 101710158471 Methylcytosine dioxygenase tet3 Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- QJGQUHMNIGDVPM-BJUDXGSMSA-N Nitrogen-13 Chemical compound [13N] QJGQUHMNIGDVPM-BJUDXGSMSA-N 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- LYNKVJADAPZJIK-UHFFFAOYSA-H P([O-])([O-])=O.[B+3].P([O-])([O-])=O.P([O-])([O-])=O.[B+3] Chemical compound P([O-])([O-])=O.[B+3].P([O-])([O-])=O.P([O-])([O-])=O.[B+3] LYNKVJADAPZJIK-UHFFFAOYSA-H 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- UUWCIPUVJJIEEP-SRVKXCTJSA-N Phe-Asn-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N UUWCIPUVJJIEEP-SRVKXCTJSA-N 0.000 description 1
- UEHNWRNADDPYNK-DLOVCJGASA-N Phe-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N UEHNWRNADDPYNK-DLOVCJGASA-N 0.000 description 1
- VJEZWOSKRCLHRP-MELADBBJSA-N Phe-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O VJEZWOSKRCLHRP-MELADBBJSA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 1
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- FINLZXKJWTYYLC-ACRUOGEOSA-N Phe-His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FINLZXKJWTYYLC-ACRUOGEOSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 1
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 1
- DIZLUAZLNDFDPR-CIUDSAMLSA-N Pro-Cys-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 DIZLUAZLNDFDPR-CIUDSAMLSA-N 0.000 description 1
- OHQFMEIJLZQXHB-GUBZILKMSA-N Pro-Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 OHQFMEIJLZQXHB-GUBZILKMSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 1
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- QNZLIVROMORQFH-BQBZGAKWSA-N Pro-Gly-Cys Chemical compound C1C[C@H](NC1)C(=O)NCC(=O)N[C@@H](CS)C(=O)O QNZLIVROMORQFH-BQBZGAKWSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- FFSLAIOXRMOFIZ-GJZGRUSLSA-N Pro-Gly-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)CNC(=O)[C@@H]1CCCN1 FFSLAIOXRMOFIZ-GJZGRUSLSA-N 0.000 description 1
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 1
- DTQIXTOJHKVEOH-DCAQKATOSA-N Pro-His-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O DTQIXTOJHKVEOH-DCAQKATOSA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- BAKAHWWRCCUDAF-IHRRRGAJSA-N Pro-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BAKAHWWRCCUDAF-IHRRRGAJSA-N 0.000 description 1
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 1
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 1
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- NBDHWLZEMKSVHH-UVBJJODRSA-N Pro-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 NBDHWLZEMKSVHH-UVBJJODRSA-N 0.000 description 1
- XNJVJEHDZPDPQL-BZSNNMDCSA-N Pro-Trp-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H]1CCCN1)C(O)=O XNJVJEHDZPDPQL-BZSNNMDCSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 1
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 1
- 101710150451 Protein Bel-1 Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 239000012980 RPMI-1640 medium Substances 0.000 description 1
- 102100022873 Ras-related protein Rab-11A Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101710141795 Ribonuclease inhibitor Proteins 0.000 description 1
- 229940122208 Ribonuclease inhibitor Drugs 0.000 description 1
- 102100037968 Ribonuclease inhibitor Human genes 0.000 description 1
- IGLNJRXAVVLDKE-OIOBTWANSA-N Rubidium-82 Chemical compound [82Rb] IGLNJRXAVVLDKE-OIOBTWANSA-N 0.000 description 1
- 101000999689 Saimiriine herpesvirus 2 (strain 11) Transcriptional regulator ICP22 homolog Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 1
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 1
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 1
- KMWFXJCGRXBQAC-CIUDSAMLSA-N Ser-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N KMWFXJCGRXBQAC-CIUDSAMLSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 1
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 1
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 1
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- OVQZAFXWIWNYKA-GUBZILKMSA-N Ser-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CO)N OVQZAFXWIWNYKA-GUBZILKMSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 1
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- YXGCIEUDOHILKR-IHRRRGAJSA-N Ser-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CO)N YXGCIEUDOHILKR-IHRRRGAJSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- OSFZCEQJLWCIBG-BZSNNMDCSA-N Ser-Tyr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSFZCEQJLWCIBG-BZSNNMDCSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 241000320123 Streptococcus pyogenes M1 GAS Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 101710192321 Tegument protein VP16 Proteins 0.000 description 1
- 101710193546 Tegument protein VP16 homolog Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- JMQUAZXYFAEOIH-XGEHTFHBSA-N Thr-Arg-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O JMQUAZXYFAEOIH-XGEHTFHBSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 1
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- IGGFFPOIFHZYKC-PBCZWWQYSA-N Thr-His-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O IGGFFPOIFHZYKC-PBCZWWQYSA-N 0.000 description 1
- WPSDXXQRIVKBAY-NKIYYHGXSA-N Thr-His-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O WPSDXXQRIVKBAY-NKIYYHGXSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 1
- KDGBLMDAPJTQIW-RHYQMDGZSA-N Thr-Met-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N)O KDGBLMDAPJTQIW-RHYQMDGZSA-N 0.000 description 1
- SIEZEMFJLYRUMK-YTWAJWBKSA-N Thr-Met-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N)O SIEZEMFJLYRUMK-YTWAJWBKSA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 1
- AXEJRUGTOJPZKG-XGEHTFHBSA-N Thr-Val-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O AXEJRUGTOJPZKG-XGEHTFHBSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 101710102923 Transcription factor p65 Proteins 0.000 description 1
- 102300038050 Transcription factor p65 isoform 1 Human genes 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- LHHDBONOFZDWMW-AAEUAGOBSA-N Trp-Asp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LHHDBONOFZDWMW-AAEUAGOBSA-N 0.000 description 1
- WACMTVIJWRNVSO-CWRNSKLLSA-N Trp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O WACMTVIJWRNVSO-CWRNSKLLSA-N 0.000 description 1
- AWYXDHQQFPZJNE-QEJZJMRPSA-N Trp-Gln-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N AWYXDHQQFPZJNE-QEJZJMRPSA-N 0.000 description 1
- OZUJUVFWMHTWCZ-HOCLYGCPSA-N Trp-Gly-His Chemical compound N[C@@H](Cc1c[nH]c2ccccc12)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OZUJUVFWMHTWCZ-HOCLYGCPSA-N 0.000 description 1
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 1
- RXEQOXHCHQJMSO-IHPCNDPISA-N Trp-His-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O RXEQOXHCHQJMSO-IHPCNDPISA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- IVBJBFSWJDNQFW-XIRDDKMYSA-N Trp-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IVBJBFSWJDNQFW-XIRDDKMYSA-N 0.000 description 1
- RNDWCRUOGGQDKN-UBHSHLNASA-N Trp-Ser-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RNDWCRUOGGQDKN-UBHSHLNASA-N 0.000 description 1
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 1
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 1
- SWSUXOKZKQRADK-FDARSICLSA-N Trp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SWSUXOKZKQRADK-FDARSICLSA-N 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 1
- LMLBOGIOLHZXOT-JYJNAYRXSA-N Tyr-Glu-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O LMLBOGIOLHZXOT-JYJNAYRXSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 1
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 1
- XDGPTBVOSHKDFT-KKUMJFAQSA-N Tyr-Met-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XDGPTBVOSHKDFT-KKUMJFAQSA-N 0.000 description 1
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- XYBNMHRFAUKPAW-IHRRRGAJSA-N Tyr-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XYBNMHRFAUKPAW-IHRRRGAJSA-N 0.000 description 1
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- QRCBQDPRKMYTMB-IHPCNDPISA-N Tyr-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N QRCBQDPRKMYTMB-IHPCNDPISA-N 0.000 description 1
- GZWPQZDVTBZVEP-BZSNNMDCSA-N Tyr-Tyr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O GZWPQZDVTBZVEP-BZSNNMDCSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- 101150114976 US21 gene Proteins 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- XPYNXORPPVTVQK-SRVKXCTJSA-N Val-Arg-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N XPYNXORPPVTVQK-SRVKXCTJSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 1
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 1
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- DLMNFMXSNGTSNJ-PYJNHQTQSA-N Val-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N DLMNFMXSNGTSNJ-PYJNHQTQSA-N 0.000 description 1
- XBRMBDFYOFARST-AVGNSLFASA-N Val-His-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N XBRMBDFYOFARST-AVGNSLFASA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- SVLAAUGFIHSJPK-JYJNAYRXSA-N Val-Trp-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N SVLAAUGFIHSJPK-JYJNAYRXSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 102100035071 Vimentin Human genes 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 101710180877 Zinc finger protein 6 Proteins 0.000 description 1
- 102100040724 Zinc finger protein 711 Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 108010076089 accutase Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical group OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000005775 apoptotic pathway Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010007483 arginyl-leucyl-tyrosyl-glutamic acid Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- OKTJSMMVPCPJKN-BJUDXGSMSA-N carbon-11 Chemical compound [11C] OKTJSMMVPCPJKN-BJUDXGSMSA-N 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- UHBYWPGGCSDKFX-UHFFFAOYSA-N carboxyglutamic acid Chemical compound OC(=O)C(N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-UHFFFAOYSA-N 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 229910052804 chromium Inorganic materials 0.000 description 1
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- 239000012216 imaging agent Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- NTHXOOBQLCIOLC-UHFFFAOYSA-N iohexol Chemical compound OCC(O)CN(C(=O)C)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NTHXOOBQLCIOLC-UHFFFAOYSA-N 0.000 description 1
- 229960001025 iohexol Drugs 0.000 description 1
- 229960004647 iopamidol Drugs 0.000 description 1
- XQZXYNRDCRIARQ-LURJTMIESA-N iopamidol Chemical compound C[C@H](O)C(=O)NC1=C(I)C(C(=O)NC(CO)CO)=C(I)C(C(=O)NC(CO)CO)=C1I XQZXYNRDCRIARQ-LURJTMIESA-N 0.000 description 1
- 229960002603 iopromide Drugs 0.000 description 1
- DGAIEPBNLOQYER-UHFFFAOYSA-N iopromide Chemical compound COCC(=O)NC1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)N(C)CC(O)CO)=C1I DGAIEPBNLOQYER-UHFFFAOYSA-N 0.000 description 1
- 229960004537 ioversol Drugs 0.000 description 1
- 229940029407 ioxaglate Drugs 0.000 description 1
- TYYBFXNZMFNZJT-UHFFFAOYSA-N ioxaglic acid Chemical compound CNC(=O)C1=C(I)C(N(C)C(C)=O)=C(I)C(C(=O)NCC(=O)NC=2C(=C(C(=O)NCCO)C(I)=C(C(O)=O)C=2I)I)=C1I TYYBFXNZMFNZJT-UHFFFAOYSA-N 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010043612 kentsin Proteins 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229910052747 lanthanoid Inorganic materials 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 235000011475 lollipops Nutrition 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-L methylphosphonate(2-) Chemical compound CP([O-])([O-])=O YACKEPLHDIMKIO-UHFFFAOYSA-L 0.000 description 1
- GGGDNPWHMNJRFN-UHFFFAOYSA-N metrizoic acid Chemical compound CC(=O)N(C)C1=C(I)C(NC(C)=O)=C(I)C(C(O)=O)=C1I GGGDNPWHMNJRFN-UHFFFAOYSA-N 0.000 description 1
- 229960004712 metrizoic acid Drugs 0.000 description 1
- 108091056705 miR-2306 stem-loop Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229940031182 nanoparticles iron oxide Drugs 0.000 description 1
- 108010009920 neokyotorphin (1-4) Proteins 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000007826 nucleic acid assay Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- QYSGYZVSCZSLHT-UHFFFAOYSA-N octafluoropropane Chemical compound FC(F)(F)C(F)(F)C(F)(F)F QYSGYZVSCZSLHT-UHFFFAOYSA-N 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- LOAWONYKRRPPLP-UHFFFAOYSA-N oxygen(2-);thorium(4+);hydrate Chemical compound O.[O-2].[O-2].[Th+4] LOAWONYKRRPPLP-UHFFFAOYSA-N 0.000 description 1
- QVGXLLKOCUKJST-BJUDXGSMSA-N oxygen-15 atom Chemical compound [15O] QVGXLLKOCUKJST-BJUDXGSMSA-N 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229960004065 perflutren Drugs 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000008299 phosphorodiamidates Chemical class 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- 125000005642 phosphothioate group Chemical group 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010007513 prolyl-glycyl-prolyl-leucine Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000012857 radioactive material Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 150000003290 ribose derivatives Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-O sulfonium Chemical compound [SH3+] RWSOTUBLDIXVET-UHFFFAOYSA-O 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- TXEYQDLBPFQVAA-UHFFFAOYSA-N tetrafluoromethane Chemical compound FC(F)(F)F TXEYQDLBPFQVAA-UHFFFAOYSA-N 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009495 transient activation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 229940006486 zinc cation Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/11—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/73—Fusion polypeptide containing domain for protein-protein interaction containing coiled-coiled motif (leucine zippers)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/85—Fusion polypeptide containing an RNA binding domain
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
Abstract
특히, 유전자 발현의 변조를 위한 조성물 및 방법이 본원에서 제공된다.
Description
관련 출원의 상호 참조
본 출원은 2020년 11월 27일 출원된 미국 출원 번호 63/118,832 및 2020년 6월 5일 출원된 미국 출원 번호 63/035,431에 대한 우선권을 주장하며, 이들의 개시내용은 그 전체가 본원에 참조로 포함된다.
연방정부의 지원을 받는 연구 및 개발 하에 이루어진 발명에 대한 권리에 관한 진술
본 발명은 방위 고등 연구 계획국(The Defense Advanced Research Projects Agency)이 수여하는 DARPA-BAA-16-59 부여 하에 정부 지원으로 이루어졌다. 정부는 본 발명에 대해 특정 권리를 갖는다.
"서열 목록", 표, 또는 ASCII 파일로 제출된 컴퓨터 프로그램 목록 부록에 대한 참조
파일 048536-690001WO_SequenceListing_ST25.txt (2021년 생성, x 바이트, 기계 형식 IBM-PC, MS Windows 운영 체제)에 작성된 서열 목록이 본원에 참조로 포함된다.
배경
CRISPR-기반 기술을 사용하는 유전자 편집은 질환, 특히 유전적으로 정의된 질환의 치료에 대한 유망한 접근이지만, CRISPR-기반 유전자 편집은 DNA 절단 또는 염기 편집에 의존하고, 이는 표적외(off-target) 변형, 세포 독성, 또는 예측불가능한 DNA 복구 결과를 초래할 수 있다. 또한, 대부분의 CRISPR-기반 기술은 게놈-편집으로 제한되고 비가역적인 해로운 변화를 생성할 수 있다. 대조적으로, 후생유전학적(epigenetic) 편집을 통해 이루어진 변형은 장기적일 수 있고 가역적이고, 그에 따라 유전자 발현을 변조하기 위한 보다 안전한 접근을 제공한다. 후생유전학적 편집은 또한 DNA 후생유전학적 코드 및 히스톤 코드 둘 다를 변환하기 위한 기회를 제공하여, 상이한 양식을 사용하고 다양한 세포 및 유전적 맥락 내에 있는 편집을 가능하게 한다. 특히, 이들 및 당업계의 다른 문제에 대한 해결책이 본원에서 제공된다.
간단한 요약
하나의 양태에서는, N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소 또는 뉴클레아제-결핍 엔도뉴클레아제 효소를 포함하는 융합 단백질이 제공된다. 양태들에서, 융합 단백질은 전사 활성화제를 추가로 포함한다. 양태들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합이다. 양태들에서, 융합 단백질은 핵 국소화 서열을 추가로 포함한다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함한다.
하나의 양태에서는, N-말단으로부터 C-말단까지, RNA-결합 서열, XTEN 링커, 및 전사 활성화제를 포함하는 융합 단백질이 제공된다. 양태들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합이다. 양태들에서, 융합 단백질은 탈메틸화 도메인, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소 또는 뉴클레아제-결핍 엔도뉴클레아제 효소, 핵 국소화 서열, 이들 둘 이상의 조합을 포함한다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함한다.
하나의 양태에서는, N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소 또는 뉴클레아제-결핍 엔도뉴클레아제 효소, 및 전사 활성화제를 포함하는 융합 단백질이 제공된다. 양태들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합이다. 양태들에서, 융합 단백질은 핵 국소화 서열을 추가로 포함한다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함한다.
하나의 양태에서는, N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소 또는 뉴클레아제-결핍 엔도뉴클레아제 효소, 및 핵 국소화 서열을 포함하는 융합 단백질이 제공된다. 양태들에서, 융합 단백질은 전사 활성화제를 추가로 포함한다. 양태들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합이다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함한다.
하나의 양태에서는, (i) 그의 구현예를 포함한 본원에 기재된 융합 단백질을 인코딩하는 제1 폴리뉴클레오티드를 사일런싱(silencing)된 표적 핵산을 함유하는 세포로 전달하는 단계; 및 (ii) (a) sgRNA 또는 (b) cr:tracrRNA를 포함하는 제2 폴리뉴클레오티드를 세포로 전달하고; 이로써 세포에서 사일런싱된 표적 핵산 서열을 재활성화하는 단계를 포함하는, 세포에서의 표적 핵산 서열의 활성화 방법이 제공된다. 양태들에서, sgRNA는 적어도 하나의 MS2 스템 루프를 포함한다. 양태들에서, 제2 폴리뉴클레오티드는 전사 활성화제를 포함한다. 양태들에서, 제2 폴리뉴클레오티드는 둘 이상의 sgRNA를 포함한다. 양태들에서, 표적 핵산 서열은 CpG 섬(island)을 포함한다. 양태들에서, 표적 핵산 서열은 비-CpG 섬을 포함한다. 구현예들에서, 융합 단백질은 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 융합 단백질이 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함하는 경우, 방법은 단계 (ii)를 포함하지 않는다.
하나의 양태에서는, 그의 구현예를 포함한 본원에 기재된 융합 단백질을 인코딩하는 폴리뉴클레오티드를 사일런싱된 표적 핵산을 함유하는 세포로 전달하고; 이로써 세포에서 사일런싱된 표적 핵산 서열을 재활성화하는 것을 포함하는, 세포에서의 표적 핵산 서열의 활성화 또는 사일런싱된 표적 핵산 서열의 재활성화 방법이 제공된다. 구현예들에서, 융합 단백질은 탈메틸화 도메인, XTEN 링커, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소, sgRNA, 및 전사 활성화제를 포함한다. 양태들에서, 표적 핵산 서열은 CpG 섬을 포함한다. 양태들에서, 표적 핵산 서열은 비-CpG 섬을 포함한다.
개시내용의 이들 및 다른 구현예 및 양태가 본원에 상세히 기재된다.
도 1은 DNMT1의 Cas9-매개된 녹아웃 9일 후 CRISPRoff-사일런싱된 H2B, Snrpn-GFP, 또는 CLTA를 재활성화하는 HEK293T 세포의 막대 플롯이다. 에러 바는 3개의 독립적 실험으로부터의 SD이다.
도 2는 CRISPRoff에 의해 사일런싱된 CLTA를 갖는 HEK293T 세포에서 5-aza-dC의 용량 증가 후 CLTA 재활성화의 시간 경과 측정을 제공한다. 재활성화된 CLTA를 갖는 세포 퍼센트가 나타나 있다. 이 플롯은 세포가 DNA 탈메틸화를 통해 CLTA의 발현을 재활성화할 수 있음을 보여준다.
도 3은 CRISPRoff에 의해 사일런싱된 CLTA를 갖는 HEK293T 세포에서 5-aza-dC의 용량 증가 후 CLTA 재활성화의 중간값 CLTA-GFP 형광을 제공한다.
도 4는 유전자 재활성화 실험의 개략도이다. CRISPRoff-사일런싱된 CLTA-GFP를 인코딩하는 세포를 dCas9-TET1 및 sgRNA를 인코딩하는 플라스미드로 트랜스펙션하였다.
도 5는 CRISPRon 유전자 재활성화에 대해 시험된 dCas9 (v1-v4)에 대한 4개의 TET1 융합의 개략도이다.
도 6은 CLTA를 표적화하는 sgRNA의 풀(pool)로의 도 5에 나타낸 4개의 TET 융합의 트랜스펙션 후 CLTA 재활성화의 시간 경과를 보여주는 그래프이다. CLTA 유전자는 CpG 섬을 갖는다.
도 7은 하나의 sgRNA 서열 또는 3개의 sgRNA의 풀로 공동-트랜스펙션된 도 5에서의 4개의 TET 융합을 사용한 CLTA 재활성화의 비교를 보여주는 막대 그래프이다. 에러 바는 2개의 기술 복제의 범위를 나타낸다.
도 8은 표적화 sgRNA 및 TETv4의 트랜스펙션-후 28일에 측정된 CLTA 재활성화의 대표적 FACS 플롯이다.
도 9a는 CRISPRoff 사일런싱된 CLTA (흑색 원)에 비해 높은 수준의 시토신 탈메틸화 (백색 원)를 보여주는 TET1 재활성화 후 CLTA CGI의 비술파이트-PCR 분석이다. 각각의 행은 하나의 시퀀싱 판독을 나타낸다. 자리의 퍼센트 메틸화는 수평 막대 그래프로 표시된다.
도 9b는 주석화(annotation)된 sgRNA 결합 부위 (a, b, c)를 갖는 CLTA CGI (녹색)의 개략도를 제공한다. 롤리팝 플롯 음영은, 비술파이트-PCR에 의해 측정된, 메틸화된 시토신을 갖는 각각의 CpG 디뉴클레오티드의 퍼센트를 나타낸다. 프로모터, 스플라이싱, 및 CGI 주석화는 UCSC Genome Browser로부터 얻었다.
도 10은 2개의 MS2 RNA 압타머를 인코딩하는 sgRNA에 의해 매개된 TETv4 및 전이활성화제(transactivator) 리보뉴클레오단백질 복합체의 개략도이다. 전이활성화제 도메인은 VP16 사량체 VP64, RELA 활성화 도메인 (p65), 및 바이러스 전사 활성화제 Rta의 단일부분(monopartite), 2부분(bipartite), 및 3부분(tripartite) 아키텍처를 포함한다.
도 11은 다양한 전사 활성화제에 대한 CLTA-표적화 sgRNA 및 MS2 코트 단백질 (MCP) 융합을 발현하는 벡터의 개략도이다.
도 12는 내생적으로 발현된 CLTA-GFP로의 세포로의 CLTA 및 dCas9 또는 dCas9 및 MCP-융합 전이활성화제를 표적화하는 sgRNA의 트랜스펙션-후 2일의 중간값 CLTA-GFP 형광을 나타내는 바이올린 플롯이다.
도 13은 TETv4 및 MCP-융합된 전이활성화제의 트랜스펙션-후 2일에 측정된 CLTA-GFP 재활성화된 세포의 분율에서의 배수 변화의 비교를 보여주는 막대 그래프이다. 데이터는, 2개의 기술 복제의 평균으로부터 계산된, TETv4 단독에 비해 배수 변화로서 표시된다.
도 14는 전이활성화제와 조합된 TET1이 유전자 발현을 재활성화함을 보여주는 막대 그래프를 나타낸다. 유전자 및 플라스미드 발현 수준을 트랜스펙션-후 다수의 시점에 측정하였다.
도 15a-15b는 Rta, p65-Rta 및 VP64-p65 전이활성화제의 일시적 발현이 재활성화된 세포 내의 단일 세포 유전자 발현을 현저히 증가시켰음을 보여주는 바이올린 플롯이다. 도 15b는, 트랜스펙션-후 28일에 측정된, 재활성화된 CLTA-GFP를 갖는 단일 세포의 중간값 형광의 비교를 제공한다. 데이터는 2개의 기술 복제를 대표하는 것이다. * p 값 < 0.05, ** p 값 < 0.0005, *** p 값, 1e-15, Wilcoxon 순위-합계 시험에 의한 TETv4 조건에서의 GFP 포지티브 집단에 대한 것.
도 16은 이전에 사일런싱된 유전자를 갖는 세포에서 TET1 융합 단백질의 유전자 재활성화를 보여주는 막대 그래프이다. DYNC2LI1 및 LAMP2는 정준 CpG 섬을 갖지 않는다.
도 17은, CLTA 및 단지 TETv4, 또는 다양한 MCP-융합 전이활성화제 도메인과 함께 TETv4를 표적화하는 sgRNA의, CRISPRoff-사일런싱 CLTA를 갖는 세포로의 트랜스펙션 후 CLTA-GFP 재활성화를 갖는 HEK293T 세포의 시간 경과를 제공한다. 처리되지 않은 세포는 백색 원으로 표시된다. 에러 바는 3개의 독립적 실험으로부터의 SD이다.
도 18은 CLTA 및 dCas9-VPR 또는 다양한 MCP-융합 전이활성화제 도메인과 함께 dCas9를 표적화하는 sgRNA의 트랜스펙션 후 CLTA-GFP 재활성화를 갖는 HEK293T 세포, 또는 트랜스펙션되지 않은 세포의 시간 경과를 제공한다. DNA 탈메틸화의 부재 하에 지속적인 유전자 활성화를 측정하기 위해 TETv4의 부재 하에 트랜스펙션을 수행하였다. 에러 바는 3개의 독립적 실험으로부터의 SD이다.
도 19a-19d는 융합 단백질 및 그의 유전자 재활성화를 나타낸다. 도 19d는, GCP21 (서열 번호:102), JKNp146 (서열 번호:99), 및 JKNp147 (서열 번호:101)을 포함한, 본원에 기재된 융합 단백질을 보여주는 그래프이다. 도 19b-19d는, 트랜스펙션-후 13일에 측정된, 융합 단백질의 트랜스펙션 후 CLTA 유전자, DYNC2LI1 유전자, 및 히스톤 H2B 유전자 (각각)의 유전자 재활성화를 나타낸다.
도 2는 CRISPRoff에 의해 사일런싱된 CLTA를 갖는 HEK293T 세포에서 5-aza-dC의 용량 증가 후 CLTA 재활성화의 시간 경과 측정을 제공한다. 재활성화된 CLTA를 갖는 세포 퍼센트가 나타나 있다. 이 플롯은 세포가 DNA 탈메틸화를 통해 CLTA의 발현을 재활성화할 수 있음을 보여준다.
도 3은 CRISPRoff에 의해 사일런싱된 CLTA를 갖는 HEK293T 세포에서 5-aza-dC의 용량 증가 후 CLTA 재활성화의 중간값 CLTA-GFP 형광을 제공한다.
도 4는 유전자 재활성화 실험의 개략도이다. CRISPRoff-사일런싱된 CLTA-GFP를 인코딩하는 세포를 dCas9-TET1 및 sgRNA를 인코딩하는 플라스미드로 트랜스펙션하였다.
도 5는 CRISPRon 유전자 재활성화에 대해 시험된 dCas9 (v1-v4)에 대한 4개의 TET1 융합의 개략도이다.
도 6은 CLTA를 표적화하는 sgRNA의 풀(pool)로의 도 5에 나타낸 4개의 TET 융합의 트랜스펙션 후 CLTA 재활성화의 시간 경과를 보여주는 그래프이다. CLTA 유전자는 CpG 섬을 갖는다.
도 7은 하나의 sgRNA 서열 또는 3개의 sgRNA의 풀로 공동-트랜스펙션된 도 5에서의 4개의 TET 융합을 사용한 CLTA 재활성화의 비교를 보여주는 막대 그래프이다. 에러 바는 2개의 기술 복제의 범위를 나타낸다.
도 8은 표적화 sgRNA 및 TETv4의 트랜스펙션-후 28일에 측정된 CLTA 재활성화의 대표적 FACS 플롯이다.
도 9a는 CRISPRoff 사일런싱된 CLTA (흑색 원)에 비해 높은 수준의 시토신 탈메틸화 (백색 원)를 보여주는 TET1 재활성화 후 CLTA CGI의 비술파이트-PCR 분석이다. 각각의 행은 하나의 시퀀싱 판독을 나타낸다. 자리의 퍼센트 메틸화는 수평 막대 그래프로 표시된다.
도 9b는 주석화(annotation)된 sgRNA 결합 부위 (a, b, c)를 갖는 CLTA CGI (녹색)의 개략도를 제공한다. 롤리팝 플롯 음영은, 비술파이트-PCR에 의해 측정된, 메틸화된 시토신을 갖는 각각의 CpG 디뉴클레오티드의 퍼센트를 나타낸다. 프로모터, 스플라이싱, 및 CGI 주석화는 UCSC Genome Browser로부터 얻었다.
도 10은 2개의 MS2 RNA 압타머를 인코딩하는 sgRNA에 의해 매개된 TETv4 및 전이활성화제(transactivator) 리보뉴클레오단백질 복합체의 개략도이다. 전이활성화제 도메인은 VP16 사량체 VP64, RELA 활성화 도메인 (p65), 및 바이러스 전사 활성화제 Rta의 단일부분(monopartite), 2부분(bipartite), 및 3부분(tripartite) 아키텍처를 포함한다.
도 11은 다양한 전사 활성화제에 대한 CLTA-표적화 sgRNA 및 MS2 코트 단백질 (MCP) 융합을 발현하는 벡터의 개략도이다.
도 12는 내생적으로 발현된 CLTA-GFP로의 세포로의 CLTA 및 dCas9 또는 dCas9 및 MCP-융합 전이활성화제를 표적화하는 sgRNA의 트랜스펙션-후 2일의 중간값 CLTA-GFP 형광을 나타내는 바이올린 플롯이다.
도 13은 TETv4 및 MCP-융합된 전이활성화제의 트랜스펙션-후 2일에 측정된 CLTA-GFP 재활성화된 세포의 분율에서의 배수 변화의 비교를 보여주는 막대 그래프이다. 데이터는, 2개의 기술 복제의 평균으로부터 계산된, TETv4 단독에 비해 배수 변화로서 표시된다.
도 14는 전이활성화제와 조합된 TET1이 유전자 발현을 재활성화함을 보여주는 막대 그래프를 나타낸다. 유전자 및 플라스미드 발현 수준을 트랜스펙션-후 다수의 시점에 측정하였다.
도 15a-15b는 Rta, p65-Rta 및 VP64-p65 전이활성화제의 일시적 발현이 재활성화된 세포 내의 단일 세포 유전자 발현을 현저히 증가시켰음을 보여주는 바이올린 플롯이다. 도 15b는, 트랜스펙션-후 28일에 측정된, 재활성화된 CLTA-GFP를 갖는 단일 세포의 중간값 형광의 비교를 제공한다. 데이터는 2개의 기술 복제를 대표하는 것이다. * p 값 < 0.05, ** p 값 < 0.0005, *** p 값, 1e-15, Wilcoxon 순위-합계 시험에 의한 TETv4 조건에서의 GFP 포지티브 집단에 대한 것.
도 16은 이전에 사일런싱된 유전자를 갖는 세포에서 TET1 융합 단백질의 유전자 재활성화를 보여주는 막대 그래프이다. DYNC2LI1 및 LAMP2는 정준 CpG 섬을 갖지 않는다.
도 17은, CLTA 및 단지 TETv4, 또는 다양한 MCP-융합 전이활성화제 도메인과 함께 TETv4를 표적화하는 sgRNA의, CRISPRoff-사일런싱 CLTA를 갖는 세포로의 트랜스펙션 후 CLTA-GFP 재활성화를 갖는 HEK293T 세포의 시간 경과를 제공한다. 처리되지 않은 세포는 백색 원으로 표시된다. 에러 바는 3개의 독립적 실험으로부터의 SD이다.
도 18은 CLTA 및 dCas9-VPR 또는 다양한 MCP-융합 전이활성화제 도메인과 함께 dCas9를 표적화하는 sgRNA의 트랜스펙션 후 CLTA-GFP 재활성화를 갖는 HEK293T 세포, 또는 트랜스펙션되지 않은 세포의 시간 경과를 제공한다. DNA 탈메틸화의 부재 하에 지속적인 유전자 활성화를 측정하기 위해 TETv4의 부재 하에 트랜스펙션을 수행하였다. 에러 바는 3개의 독립적 실험으로부터의 SD이다.
도 19a-19d는 융합 단백질 및 그의 유전자 재활성화를 나타낸다. 도 19d는, GCP21 (서열 번호:102), JKNp146 (서열 번호:99), 및 JKNp147 (서열 번호:101)을 포함한, 본원에 기재된 융합 단백질을 보여주는 그래프이다. 도 19b-19d는, 트랜스펙션-후 13일에 측정된, 융합 단백질의 트랜스펙션 후 CLTA 유전자, DYNC2LI1 유전자, 및 히스톤 H2B 유전자 (각각)의 유전자 재활성화를 나타낸다.
상세한 설명
정의
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 의미를 갖는다. 하기 참조문헌은 본 발명에서 사용되는 많은 용어의 일반적 정의를 당업자에게 제공한다: Singleton 등, Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger 등 (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991). 본원에서 사용되는 바와 같이, 하기 용어는 달리 특정되지 않는 한 그에 주어진 의미를 갖는다.
본 개시내용 및 하기 청구항에서 단수형 부정 관사 또는 정관사 (예: "a", "an", "the" 등)의 사용은, 특정 경우에 문맥으로부터 그 용어가 그 특정 경우에 구체적으로 하나 및 단지 하나를 의미하도록 의도되는 것이 명백하지 않은 한, "적어도 하나"를 의미하는 특허에서의 전형적인 접근을 따른다. 마찬가지로, 용어 "포함하는"은 개방적이며, 추가의 항목, 특징, 구성요소 등을 배제하지 않는다. 본원에서 식별된 참조문헌은 달리 지시되지 않는 한 명시적으로 그 전체가 본원에 참조로 포함된다.
용어 "포함하다(comprise, include)", 및 "갖다", 및 그의 파생어는 포괄적, 개방적 용어로서 본원에서 상호교환가능하게 사용된다. 예를 들어, "포함하는(comprising, including)", 또는 "갖는"의 사용은, 어떠한 요소가 구성되거나 갖거나 포함되든, 그것이 동사를 함유하는 절의 주어에 포함되는 유일한 요소는 아님을 의미한다.
"핵산"은 단일-, 이중- 또는 다중-가닥 형태의 뉴클레오티드 (예: 데옥시리보뉴클레오티드 또는 리보뉴클레오티드) 및 그의 중합체, 또는 그의 보체를 지칭한다. 용어 "폴리뉴클레오티드", "올리고뉴클레오티드", "올리고" 등은, 통상적 및 관습적 의미에서, 뉴클레오티드의 선형 서열을 지칭한다. 용어 "뉴클레오티드"는, 통상적 및 관습적 의미에서, 폴리뉴클레오티드의 단일 단위, 즉, 단량체를 지칭한다. 뉴클레오티드는 리보뉴클레오티드, 데옥시리보뉴클레오티드, 또는 그의 변형된 버전일 수 있다. 본원에서 고려되는 폴리뉴클레오티드의 예는 단일 및 이중 가닥 DNA, 단일 및 이중 가닥 RNA, 및 단일 및 이중 가닥 DNA 및 RNA의 혼합물을 갖는 하이브리드 분자를 포함한다. 본원에서 고려되는 핵산, 예를 들어 폴리뉴클레오티드의 예는, 임의의 유형의 RNA, 예를 들어, mRNA, siRNA, miRNA, sgRNA, 및 가이드 RNA 및 임의의 유형의 DNA, 게놈 DNA, 플라스미드 DNA, 및 미니서클 DNA, 및 임의의 이들의 단편을 포함하나, 이에 제한되지는 않는다. 양태들에서, 핵산은 메신저 RNA이다. 양태들에서, 메신저 RNA는 메신저 리보뉴클레오단백질 (RNP)이다. 폴리뉴클레오티드와 관련하여 용어 "듀플렉스"는, 통상적 및 관습적 의미에서, 이중 가닥성을 지칭한다. 핵산은 선형이거나 분지화될 수 있다. 예를 들어, 핵산은 뉴클레오티드의 선형 사슬일 수 있거나, 또는 핵산은, 예를 들어, 핵산이 뉴클레오티드의 하나 이상의 아암(arm) 또는 분지를 포함하도록, 분지화될 수 있다. 임의로, 분지화된 핵산은 반복적으로 분지화되어 고도로 질서화된 구조, 예컨대 덴드리머 등을 형성한다.
본원에서 사용될 수 있는 바와 같이, 용어 "핵산", "핵산 분자", "핵산 올리고머", "올리고뉴클레오티드", "핵산 서열", "핵산 단편" 및 "폴리뉴클레오티드"는 상호교환가능하고, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드인, 다양한 길이를 가질 수 있는 함께 공유 연결된 뉴클레오티드의 중합체 형태, 또는 그의 유사체, 유도체 또는 변형을 포함하도록 의도되나, 이에 제한되지는 않는다. 상이한 폴리뉴클레오티드는 상이한 3-차원 구조를 가질 수 있고, 알려진 또는 알려지지 않은 다양한 기능을 수행할 수 있다. 폴리뉴클레오티드의 비-제한적 예는 유전자, 유전자 단편, 엑손, 인트론, 유전자간 DNA (제한 없이, 이색 DNA), 메신저 RNA (mRNA), 전이 RNA, 리보솜 RNA, 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지화된 폴리뉴클레오티드, 플라스미드, 벡터, 서열의 단리된 DNA, 서열의 단리된 RNA, sgRNA, 가이드 RNA, 핵산 프로브, 및 프라이머를 포함한다. 개시내용의 방법에서 유용한 폴리뉴클레오티드는 천연 핵산 서열 및 그의 변이체, 인공 핵산 서열, 또는 이러한 서열의 조합을 포함할 수 있다.
폴리뉴클레오티드는 전형적으로 4개 뉴클레오티드 염기의 특정 서열로 구성된다: 아데닌 (A); 시토신 (C); 구아닌 (G); 및 티민 (T) (폴리뉴클레오티드가 RNA인 경우 티민 (T)에 대하여 우라실 (U)). 따라서, 용어 "폴리뉴클레오티드 서열"은 폴리뉴클레오티드 분자의 알파벳 표시이고; 대안적으로, 용어는 폴리뉴클레오티드 분자 자체에 적용될 수 있다. 이 알파벳 표시는 중앙 처리 장치를 갖는 컴퓨터의 데이터베이스에 입력되고 기능 유전체학 및 상동성 검색과 같은 생물정보학 응용에 사용될 수 있다. 폴리뉴클레오티드는 임의로 하나 이상의 비-표준 뉴클레오티드(들), 뉴클레오티드 유사체(들) 및/또는 변형된 뉴클레오티드를 포함할 수 있다.
예를 들어, 포스포티오에이트 백본을 갖는 핵산을 포함한 핵산은 하나 이상의 반응성 모이어티를 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 반응성 모이어티는, 공유, 비-공유 또는 다른 상호작용을 통해, 또 다른 분자, 예를 들어 핵산 또는 폴리펩티드와 반응할 수 있는 임의의 기를 포함한다. 예로서, 핵산은, 공유, 비-공유 또는 다른 상호작용을 통해, 단백질 또는 폴리펩티드 상의 아미노산과 반응하는 아미노산 반응성 모이어티를 포함할 수 있다.
용어는 또한, 참조 핵산과 유사한 결합 특성을 갖고, 참조 뉴클레오티드와 유사한 방식으로 대사되는, 합성, 자연 발생, 및 비-자연 발생인, 알려진 뉴클레오티드 유사체 또는 변형된 백본 잔기 또는 연결을 함유하는 핵산을 포함한다. 이러한 유사체의 예는, 제한 없이, 예를 들어, 하기를 포함한 포스포디에스테르 유도체: 포스포르아미데이트, 포스포로디아미데이트, 포스포로티오에이트 (또한 포스페이트에서 산소를 대체하는 이중 결합 황을 갖는 포스포로티오에이트로서 공지됨), 포스포로디티오에이트, 포스포노카르복실산, 포스포노카르복실레이트, 포스포노아세트산, 포스포노포름산, 메틸 포스포네이트, 보론 포스포네이트, 또는 O-메틸포스포로아미다이트 연결 (하기 문헌 참조: Eckstein, Oligonucleotides and Analogues: A Practical Approach, Oxford University Press) 뿐만 아니라 5-메틸 시티딘 또는 슈도우리딘에서와 같은 뉴클레오티드 염기에 대한 변형; 및 펩티드 핵산 백본 및 연결을 포함한다. 다른 유사체 핵산은 양성 백본; 비-이온성 백본, 변형된 당, 및 비-리보스 백본을 갖는 것들 (예: 당업계에 공지된 바와 같은 포스포로디아미데이트 모르폴리노 올리고 또는 락킹된 핵산 (LNA))을 포함하며, 이는 하기 문헌에 기재된 것들을 포함한다: 미국 특허 번호 5,235,033 및 5,034,506, 및 Chapters 6 and 7, ASC Symposium Series 580, Carbohydrate Modifications in Antisense Research, Sanghui & Cook, eds. 하나 이상의 카르보시클릭 당을 함유하는 핵산 또한 핵산의 하나의 정의 내에 포함된다. 리보스-포스페이트 백본의 변형은, 다양한 이유로, 예를 들어, 바이오칩 상의 프로브로서 또는 생리학적 환경에서 이러한 분자의 안정성 및 반감기를 증가시키기 위해 수행될 수 있다. 자연 발생 핵산 및 유사체의 혼합물이 제조될 수 있고; 대안적으로, 상이한 핵산 유사체의 혼합물, 자연 발생 핵산 및 유사체의 혼합물이 제조될 수 있다. 양태들에서, DNA에서의 뉴클레오티드간 연결은 포스포디에스테르, 포스포디에스테르 유도체, 또는 이들 둘 다의 조합이다.
핵산은 비특이적 서열을 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 "비특이적 서열"은 임의의 다른 핵산 서열에 대해 상보적이 되도록 디자인되지 않은 또는 단지 부분적으로 상보적인 일련의 잔기를 함유하는 핵산 서열을 지칭한다. 예로서, 비특이적 핵산 서열은 세포 또는 유기체와 접촉할 때 억제 핵산으로서 기능하지 않는 핵산 잔기의 서열이다.
용어 "상보적인" 또는 "상보성"은 핵산이 전형적인 왓슨-크릭(Watson-Crick) 또는 다른 비-전형적 유형에 의해 또 다른 핵산 서열과 수소 결합(들)을 형성하는 능력을 지칭한다. 예를 들어, 서열 A-G-T는 서열 T-C-A에 대해 상보적이다. 퍼센트 상보성은 제2 핵산 서열과 수소 결합 (예: 왓슨-크릭 염기 쌍형성)을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 나타낸다 (예를 들어, 10개 중 5, 6, 7, 8, 9, 10개는 각각 50%, 60%, 70%, 80%, 90%, 및 100% 상보적임). "완벽히 상보적인"은, 핵산 서열의 모든 인접 잔기가 제2 핵산 서열 내의 동일한 수의 인접 잔기와 수소 결합할 것임을 의미한다. 본원에서 사용되는 바와 같이 "실질적으로 상보적인"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50개, 또는 그 초과의 뉴클레오티드의 영역 상에서 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%. 97%, 98%, 99%, 또는 100%인 상보성의 정도를 지칭하거나, 엄격한 조건 (즉, 엄격한 하이브리드화 조건)하에 하이브리드화되는 2개의 핵산을 지칭한다.
어구 "엄격한 하이브리드화 조건"은, 프로브가, 전형적으로 핵산의 복합체 혼합물에서, 그의 표적 부분서열에 하이브리드화되지만, 다른 서열에는 하이브리드화되지 않을 조건을 지칭한다. 엄격한 조건은 서열-의존적이고, 상이한 상황에서 상이할 것이다. 보다 긴 서열은 보다 고온에서 특이적으로 하이브리드화된다. 핵산의 하이브리드화에 대한 광범위한 가이드는 하기 문헌에 나타나 있다: Tijssen, Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Probes, "Overview of principles of hybridization and the strategy of nucleic acid assays" (1993). 일반적으로, 엄격한 조건은 정의된 이온 강도 pH에서 특정 서열에 대하여 열 융점 (Tm)보다 약 5-10℃ 낮게 되도록 선택된다. Tm은 표적에 대해 상보적인 프로브의 50%가 평형에서 표적 서열에 하이브리드화되는 온도 (정의된 이온 강도, pH, 및 핵산 농도 하에)이다 (표적 서열이 과량으로 존재함에 따라, Tm에서, 프로브의 50%는 평형에서 점유됨). 엄격한 조건은 또한 포름아미드 등의 탈안정화제의 첨가로 달성될 수 있다. 선택적 또는 특이적 하이브리드화를 위해, 포지티브 신호는 백그라운드의 적어도 2배, 바람직하게는 백그라운드 하이브리드화의 10배이다. 예시적 엄격한 하이브리드화 조건은 하기와 같을 수 있다: 50% 포름아미드, 5x SSC, 및 1% SDS, 42℃에서 인큐베이션, 또는, 5x SSC, 1% SDS, 65℃에서 인큐베이션, 이와 함께 65℃에서 0.2x SSC, 및 0.1% SDS 중에서의 세척.
엄격한 조건 하에 서로에 대해 하이브리드화하지 않는 핵산은, 이들이 인코딩하는 폴리펩티드가 실질적으로 동일하다면, 여전히 실질적으로 동일하다. 이는, 예를 들어, 유전자 코드에 의해 허용되는 최대 코돈 축퇴를 사용하여 핵산의 카피가 생성될 때 나타난다. 이러한 경우, 핵산은 전형적으로 적당히 엄격한 하이브리드화 조건 하에 하이브리드화한다. 예시적 "적당히 엄격한 하이브리드화 조건"은 37℃에서 40% 포름아미드, 1 M NaCl, 1% SDS의 완충제 중에서의 하이브리드화, 및 45℃에서 1X SSC 중에서의 세척을 포함한다. 포지티브 하이브리드화는 백그라운드의 적어도 2배이다. 당업자는, 유사한 엄격성의 조건을 제공하기 위해 대안적 하이브리드화 및 세척 조건이 활용될 수 있음을 용이하게 인식할 것이다. 많은 참조문헌, 예를 들어, 문헌 [Current Protocols in Molecular Biology, ed. Ausubel, 등, supra]에 하이브리드화 파라미터를 결정하기 위한 추가의 가이드라인이 제공되어 있다.
용어 "유전자"는 단백질 생성에 관여하는 DNA의 세그먼트를 의미하고; 이는 코딩 영역 이전 및 이후의 영역 (리더 및 트레일러) 뿐만 아니라 개개의 코딩 세그먼트 (엑손) 사이의 개재 서열 (인트론)을 포함한다. 리더, 트레일러 뿐만 아니라 인트론은 유전자의 전사 및 번역 동안 필수적인 조절 요소를 포함한다. 또한, "단백질 유전자 생성물"은 특정 유전자로부터 발현되는 단백질이다.
유전자와 관련하여 본원에서 사용되는 바와 같이 단어 "발현" 또는 "발현된"은 그 유전자의 전사 및/또는 번역 생성물을 의미한다. 세포에서의 DNA 분자의 발현 수준은 세포 내에 존재하는 상응하는 mRNA의 양 또는 세포에 의해 생성된 그 DNA에 의해 인코딩된 단백질의 양에 기초하여 결정될 수 있다. 비-코딩 핵산 분자 (예: sgRNA)의 발현 수준은 당업계에 널리 공지된 표준 PCR 또는 노던(Northern) 블롯 방법에 의해 검출될 수 있다. 하기 문헌 참조: Sambrook 등, 1989 Molecular Cloning: A Laboratory Manual, 18.1-18.88.
본원에서 제공되는 바와 같이 용어 "전사 조절 서열"은 유기체 내의 특정 유전자의 전사 (예: 발현)를 증가 또는 감소시킬 수 있는 DNA의 세그먼트를 지칭한다. 전사 조절 서열의 비-제한적 예는 프로모터, 인핸서, 및 사일렌서를 포함한다.
용어 "전사 출발 부위" 및 전사 개시 부위"는 본원에서 RNA 폴리머라제 (예: DNA-지향된 RNA 폴리머라제)가 RNA 전사체 합성을 시작하는 유전자 서열 (예: DNA 서열)의 5' 말단을 지칭하기 위해 상호교환가능하게 사용될 수 있다. 전사 출발 부위는 RNA 폴리머라제가 RNA 전사체 합성을 시작하는 전사된 DNA 서열의 제1 뉴클레오티드일 수 있다. 당업자는 일상적 실험 및 분석을 통해, 예를 들어 유출 전사 검정을 수행함으로써 또는 FANTOM5 데이터베이스에 따른 정의에 의해 전사 출발 부위를 결정할 수 있다.
본원에서 사용되는 바와 같이 용어 "프로모터"는 특정 유전자의 전사를 개시하는 DNA의 영역을 지칭한다. 프로모터는 전형적으로 유전자의 전사 출발 부위 근처, 유전자의 상류 및 DNA 상의 동일한 가닥 (즉, 센스 가닥 상의 5') 상에 위치한다. 프로모터는 길이가 약 100 내지 약 1000개의 염기 쌍일 수 있다.
본원에서 제공되는 바와 같이 "가이드 RNA" 또는 "gRNA"는 표적 서열과 하이브리드화하기 위한 표적 폴리뉴클레오티드 서열과의 충분한 상보성 및 표적 서열에 대한 CRISPR 복합체의 직접적 서열-특이적 결합을 갖는 임의의 폴리뉴클레오티드 서열을 지칭한다. 양태들에서, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성의 정도는, 적합한 정렬 알고리즘을 사용하여 최적 정렬시, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 그 초과이거나 이보다 크다.
구현예들에서, 폴리뉴클레오티드 (예: gRNA)는 단일-가닥 리보핵산이다. 양태들에서, 폴리뉴클레오티드 (예: gRNA)는 길이가 약 10 내지 약 200개의 핵산 잔기이다. 양태들에서, 폴리뉴클레오티드 (예: gRNA)는 길이가 약 50 내지 약 150개의 핵산 잔기이다. 양태들에서, 폴리뉴클레오티드 (예: gRNA)는 길이가 약 80 내지 약 140개의 핵산 잔기이다. 양태들에서, 폴리뉴클레오티드 (예: gRNA)는 길이가 약 90 내지 약 130개의 핵산 잔기이다. 양태들에서, 폴리뉴클레오티드 (예: gRNA)는 길이가 약 100 내지 약 120개의 핵산 잔기이다. 양태들에서, 폴리뉴클레오티드 (예: gRNA)의 길이는 길이가 약 113개의 핵산 잔기이다.
일반적으로, 가이드 서열 (즉, DNA-표적화 서열)은 표적 서열 (예: 게놈 또는 미토콘드리아 DNA 표적 서열)과 하이브리드화하기 위한 표적 폴리뉴클레오티드 서열과의 충분한 상보성 및 표적 서열에 대한 복합체 (예: CRISPR 복합체)의 직접적 서열-특이적 결합을 갖는 임의의 폴리뉴클레오티드 서열이다. 양태들에서, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성의 정도는, 적합한 정렬 알고리즘을 사용하여 최적 정렬시, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 그 초과이거나 이보다 크다. 양태들에서, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성의 정도는, 적합한 정렬 알고리즘을 사용하여 최적 정렬시, 적어도 약 80%, 85%, 90%, 95%, 또는 100%이다. 양태들에서, 상보성의 정도는 적어도 90%이다. 최적 정렬은 서열 정렬을 위한 임의의 적합한 알고리즘의 사용으로 결정될 수 있고, 그의 비-제한적 예는 Smith-Waterman 알고리즘, Needleman-Wunsch 알고리즘, Burrows-Wheeler 변환에 기초한 알고리즘 (예: Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies, ELAND (미국 캘리포니아주 샌디에고 일루미나), SOAP (soap.genomics.org.cn에서 이용가능), 및 Maq (maq.sourceforge.net에서 이용가능)를 포함한다. 양태들에서, 가이드 서열은 길이가 약 10, 20, 30, 35, 40, 45, 50, 75개, 또는 그 초과의 뉴클레오티드이거나 이보다 크다. 양태들에서, 가이드 서열은 길이가 약 10 내지 약 150, 약 15 내지 약 100개 뉴클레오티드이다. 양태들에서, 가이드 서열은 길이가 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 미만의 뉴클레오티드이거나 이보다 작다. 양태들에서, 가이드 서열은 길이가 약 20개 뉴클레오티드 또는 그 초과이다. 가이드 서열이 표적 서열에 대한 복합체 (예: CRISPR 복합체)의 서열-특이적 결합을 지향시키는 능력은 임의의 적합한 검정에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함한, 복합체 (예: CRISPR 복합체)를 형성하기에 충분한 CRISPR 시스템의 구성요소가, CRISPR 서열의 구성요소를 인코딩하는 벡터로의 트랜스펙션 후, 표적 서열 내의 우선적 절단의 평가에 의해, 예컨대 당업계에 공지된 Surveyor 검정에 의한 것 등으로, 상응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있다. 유사하게, 표적 서열, 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조 가이드 서열을 포함한, 복합체 (예: CRISPR 복합체)의 구성요소를 제공하고, 시험 및 대조 가이드 서열 반응 사이의 표적 서열에서의 절단의 비율 또는 결합을 비교함으로써, 표적 폴리뉴클레오티드 서열의 절단을 시험관에서 평가할 수 있다. 다른 검정도 가능하고, 당업자에게 나타날 것이다.
용어 "sgRNA", "단일 가이드 RNA", 및 "단일 가이드 RNA 서열"은 상호교환가능하게 사용되고, crRNA 서열 및 임의로 tracrRNA 서열을 포함한 폴리뉴클레오티드 서열을 지칭한다. crRNA 서열은 가이드 서열 (즉, "가이드" 또는 "스페이서") 및 tracr 메이트 서열 (즉, 직접적 반복(들)")을 포함한다. 용어 "가이드 서열"은 표적 부위를 특정하는 서열을 지칭한다. 양태들에서, 2개의 RNA는 2개의 RNA 분자로서 crRNA 및 tracrRNA에 의해 별도로 인코딩될 수 있고, 이는 이어서 crRNA와 tracrRNA 사이의 상보적인 염기 쌍형성으로 인해 RNA/RNA 복합체를 형성한다 (즉, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소에 결합하는 능력을 갖지 전에). 양태들에서, 제1 핵산은 tracrRNA 서열을 포함하고, 별도의 제2 핵산은 tracrRNA 서열이 없는 gRNA 서열을 포함한다. 양태들에서, tracrRNA 서열을 포함하는 제1 핵산 및 gRNA 서열을 포함하는 제2 핵산은 서로 상호작용하고, 임의로 복합체 (예: CRISPR 복합체)에 포함된다. 예시적 sgRNA, 및 그의 표적화된 서열이 표 2, 3, 및 4에 나타나 있다.
표 2
표 3
표 4
표 2, 3, 및 4의 서열은 표적화 crRNA 서열이다. 일례로, 서열 번호:38에 대한 전체 단일 가이드 RNA (sgRNA)는 하기와 같다: GACGCUCAAAUUUCCGCAGUGUUUAAGAGCUAAGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU (서열 번호:114). Sp Cas9에 대한 각각의 단일 가이드의 공통 tracr 서열은 하기와 같다: GUUUAAGAGCUAAGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU (서열 번호:115). 당업자는, 표 2, 3, 및 4의 sgRNA 서열이 19개의 염기 쌍이고 각각의 sgRNA가 전사의 개시를 위해 pol-III 프로모터로부터 발현되는 경우 요구되는 G로 출발함을 반영하지 않음을 인지할 것이다. 따라서, 서열 번호:38에 대하여, 서열은 ACGCUCAAAUUUCCGCAGU (서열 번호:38)보다는 GACGCUCAAAUUUCCGCAGU (서열 번호:116)이다. 구현예들에서, 서열 번호:38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 및 96은 각각 제1 뉴클레오티드로서 G를 함유한다.
일반적으로, tracr 메이트 서열은 하기 중 하나 이상을 촉진하도록 tracrRNA 서열과 충분한 상보성을 갖는 임의의 서열을 포함한다: (1) 상응하는 tracr 서열을 함유하는 세포에서의 tracr 메이트 서열에 의해 플랭킹된 가이드 서열의 삭제; 및 (2) 표적 서열에서의 복합체 (예: CRISPR 복합체)의 형성, 여기서 복합체 (예: CRISPR 복합체)는 tracr 서열에 대해 하이브리드화된 tracr 메이트 서열을 포함한다. 일반적으로, 상보성의 정도는, tracr 메이트 서열 및 tracrRNA 서열의, 두 서열 중 더 짧은 것의 길이를 따르는, 최적 정렬에 대한 것이다. 최적 정렬은 임의의 적합한 알고리즘에 의해 결정될 수 있고, tracrRNA 서열 또는 tracr 메이트 서열 내의 자가-상보성과 같은, 2차 구조를 추가로 설명할 수 있다. 양태들에서, tracrRNA 서열과 tracr 메이트 서열 사이의, 둘 중 더 짧은 것의 길이를 따르는, 상보성의 정도는, 최적 정렬시, 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99%, 또는 그 초과이거나 이보다 크다. 양태들에서, 상보성의 정도는 약 또는 적어도 약 80%, 90%, 95%, 또는 100%이다. 양태들에서, tracrRNA 서열은 길이가 약 5, 10, 15, 20, 30, 40, 50개, 또는 그 초과의 뉴클레오티드이거나 이보다 크다. 양태들에서, tracrRNA 서열 및 tracr 메이트 서열은, 둘 사이의 하이브리드화가 헤어핀과 같은 2차 구조를 갖는 전사체를 생성하도록, 단일 전사 내에 함유된다.
용어 "아미노산"은 자연 발생 및 합성 아미노산, 뿐만 아니라 아미노산 유사체 및 자연 발생 아미노산과 유사한 방식으로 기능하는 아미노산 모방체를 지칭한다. 자연 발생 아미노산은 유전 코드에 의해 인코딩된 것들, 뿐만 아니라 이후에 변형된 아미노산, 예를 들어, 히드록시프롤린, γ-카르복시글루타메이트, 및 O-포스포세린이다. 아미노산 유사체는 자연 발생 아미노산과 동일한 기본 화학 구조, 즉, 수소에 결합된 α 탄소, 카르복실 기, 아미노 기, 및 R 기를 갖는 화합물, 예를 들어, 호모세린, 노르류신, 메티오닌 술폭시드, 메티오닌 메틸 술포늄을 지칭한다. 이러한 유사체는 변형된 R 기 (예: 노르류신) 또는 변형된 펩티드 백본을 갖지만, 자연 발생 아미노산과 동일한 기본 화학 구조를 보유한다. 아미노산 모방체는 아미노산의 일반적 화학 구조와 상이한 구조를 갖지만 자연 발생 아미노산과 유사한 방식으로 기능하는 화학적 화합물을 지칭한다. 용어 "비-자연 발생 아미노산" 및 "비자연적 아미노산"은 자연에서 나타나지 않는 아미노산 유사체, 합성 아미노산, 및 아미노산 모방체를 지칭한다.
아미노산은 그의 통상적으로 공지된 3개 문자 기호에 의해 또는 IUPAC-IUB 생화학 명명법 위원회에 의해 권고되는 1개-문자 기호에 의해 본원에서 언급될 수 있다. 뉴클레오티드도, 마찬가지로, 그의 통상적으로 허용되는 단일-문자 코드에 의해 언급될 수 있다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 지칭하기 위해 본원에서 상호교환가능하게 사용되며, 여기서 중합체는, 양태들에서, 아미노산으로 이루어지지 않은 모이어티에 컨쥬게이션될 수 있다. 용어는, 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학 모방체인 아미노산 중합체, 뿐만 아니라 자연 발생 아미노산 중합체 및 비-자연 발생 아미노산 중합체에 적용된다. "융합 단백질"은 단일 모이어티로서 재조합 발현되는 2개 이상의 별도의 단백질 서열을 인코딩하는 키메라 단백질을 지칭한다.
"보존적으로 변형된 변이체"는 아미노산 및 핵산 서열 둘 다에 적용된다. 특정 핵산 서열에 대하여, "보존적으로 변형된 변이체"는 동일한 또는 본질적으로 동일한 아미노산 서열을 인코딩하는 핵산을 지칭한다. 유전 코드의 축퇴로 인해, 많은 핵산 서열이 임의의 주어진 단백질을 인코딩할 수 있다. 예를 들어, 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산 알라닌을 인코딩한다. 따라서, 알라닌이 코돈에 의해 특정되는 모든 위치에서, 코돈은 인코딩된 폴리펩티드를 변경시키지 않으면서 기재된 상응하는 코돈 중 임의의 것으로 변경될 수 있다. 이러한 핵산 변이는, 보존적으로 변형된 변이의 일종인 "사일런트 변이"이다. 폴리펩티드를 인코딩하는 본원에서의 모든 핵산 서열은 또한 핵산의 모든 가능한 사일런트 변이를 기재한다. 당업자는 핵산 내의 각각의 코돈 (통상적으로 메티오닌에 대한 유일한 코돈인 AUG, 및 통상적으로 트립토판에 대한 유일한 코돈인 TGG 제외)이 변형되어 기능적으로 동일한 분자를 제공할 수 있음을 인식할 것이다. 따라서, 폴리펩티드를 인코딩하는 핵산의 각각의 사일런트 변이는 각각의 기재된 서열 내에 내포된다.
아미노산 서열에 대하여, 당업자는, 인코딩된 서열에서 단일 아미노산 또는 작은 백분율의 아미노산을 변경시키거나, 부가하거나 또는 결실시키는 핵산, 펩티드, 폴리펩티드, 또는 단백질 서열에 대한 개개의 치환, 결실 또는 부가는, 변경이 아미노산의 화학적으로 유사한 아미노산으로의 치환을 제공하는 경우 "보존적으로 변형된 변이체"임을 인식할 것이다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 당업계에 널리 공지되어 있다. 이러한 보존적으로 변형된 변이체는 개시내용의 다형성 변이체, 종간 상동체 및 대립유전자에 추가되며 이를 배제하지 않는다. 하기 8개 그룹 각각은 서로에 대하여 보존적 치환인 아미노산을 함유한다: (1) 알라닌 (A), 글리신 (G); (2) 아스파르트산 (D), 글루탐산 (E); (3) 아스파라긴 (N), 글루타민 (Q); (4) 아르기닌 (R), 리신 (K); (5) 이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V); (6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W); (7) 세린 (S), 트레오닌 (T); 및 (8) 시스테인 (C), 메티오닌 (M) (예를 들어, 하기 문헌 참조: Creighton, Proteins (1984)).
"서열 동일성의 백분율"은 비교 윈도우 상에서 2개의 최적 정렬된 서열을 비교함으로써 결정되며, 여기서 비교 윈도우 내의 폴리뉴클레오티드 또는 폴리펩티드 서열의 부분은 두 서열의 최적 정렬에 대하여 참조 서열 (부가 또는 결실을 포함하지 않음)에 비해 부가 또는 결실 (즉, 갭)을 포함할 수 있다. 동일한 핵산 염기 또는 아미노산 잔기가 두 서열 모두에서 나타나는 위치의 수를 결정하여 매칭된 위치의 수를 얻고, 매칭된 위치의 수를 비교 윈도우에서의 위치의 총 수로 나누고, 결과에 100을 곱하여 서열 동일성의 백분율을 얻음으로써 백분율이 계산된다.
둘 이상의 핵산 또는 폴리펩티드 서열과 관련하여, 용어 "동일한" 또는 퍼센트 "동일성"은, 하기에 기재되는 디폴트 파라미터로 BLAST 또는 BLAST 2.0 서열 비교 알고리즘을 사용하여, 또는 수동 정렬 및 가시적 검사에 의해 측정된, 동일한 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정된 백분율 (즉, 비교 윈도우 또는 지정된 영역 상에서의 최대 대응을 위해 비교 및 정렬시, 특정된 영역 상에서 약 60% 동일성, 바람직하게는 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 초과의 동일성)을 갖는 둘 이상의 서열 또는 부분서열을 지칭한다 (예를 들어, NCBI 웹 사이트 ncbi.nlm.nih.gov/BLAST/ 등 참조). 이에 따라 이러한 서열은 "실질적으로 동일한" 것으로 언급된다. 이 정의는 또한, 시험 서열의 상보성을 지칭하거나 이에 적용될 수 있다. 정의는 또한 결실 및/또는 부가를 갖는 서열, 뿐만 아니라 치환을 갖는 것들을 포함한다. 하기에 기재되는 바와 같이, 바람직한 알고리즘은 갭 등을 설명할 수 있다. 바람직하게는, 동일성은 길이가 적어도 약 25개 아미노산 또는 뉴클레오티드인 영역 상에서, 또는 보다 바람직하게는 길이가 50-100개 아미노산 또는 뉴클레오티드인 영역 상에서 존재한다.
아미노산 또는 뉴클레오티드 염기 "위치"는 N-말단 (또는 5'-말단)에 대한 그의 위치에 기초하여 참조 서열 내의 각각의 아미노산 (또는 뉴클레오티드 염기)을 연속적으로 식별하는 번호로 표시된다. 최적 정렬 결정시 고려되어야 하는 결실, 삽입, 절단, 융합 등으로 인해, 일반적으로 단순히 N-말단으로부터 카운팅하여 결정된 시험 서열 내의 아미노산 잔기 번호는 참조 서열 내의 그의 상응하는 위치의 번호와 반드시 동일하지는 않을 것이다. 예를 들어, 변이체가 정렬된 참조 서열에 대하여 결실을 갖는 경우, 결실 부위에서의 참조 서열 내의 위치에 상응하는 변이체 내의 아미노산은 존재하지 않을 것이다. 정렬된 참조 서열에서 삽입이 존재하는 경우, 그 삽입은 참조 서열 내의 번호부여된 아미노산 위치에 상응하지 않을 것이다. 절단 또는 융합의 경우, 상응하는 서열 내의 임의의 아미노산에 상응하지 않는 참조 또는 정렬된 서열 내의 아미노산 스트레치가 존재할 수 있다.
주어진 아미노산 또는 폴리뉴클레오티드 서열의 번호부여와 관련하여 사용시, 용어 "~에 대하여 번호부여된" 또는 "~에 상응하는"은, 주어진 아미노산 또는 폴리뉴클레오티드 서열과 참조 서열 비교시 특정된 참조 서열의 잔기의 번호부여를 지칭한다.
본원에 기재된 특정 단백질 (예: TET1, dCas9)에 대하여, 명명된 단백질은 단백질 활성 (예를 들어, 네이티브 단백질에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 단백질의 자연 발생 형태, 또는 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 형태에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 양태들에서, 단백질은 그의 NCBI 서열 참조에 의해 식별된 단백질이다. 양태들에서, 단백질은 그의 NCBI 서열 참조에 의해 식별된 단백질 또는 그의 기능적 단편 또는 상동체이다.
용어 "RNA-가이드된 DNA 엔도뉴클레아제" 등은, 통상적 및 관습적 의미에서, DNA 폴리뉴클레오티드 내의 포스포디에스테르 결합을 절단하는 효소를 지칭하며, 여기서 포스포디에스테르 결합의 인식은 별도의 RNA 서열 (예를 들어, 단일 가이드 RNA)에 의해 용이해진다.
용어 "클래스 II CRISPR 엔도뉴클레아제"는 Cas9와 유사한 엔도뉴클레아제 활성을 갖고 클래스 II CRISPR 시스템에 참여하는 엔도뉴클레아제를 지칭한다. 클래스 II CRISPR 시스템의 일례는, 4개의 유전자 Cas9, Cas1, Cas2, 및 Csn1, 뿐만 아니라 2개의 비-코딩 RNA 요소, tracrRNA 및 비-반복적 서열 (스페이서, 각각 약 30 bp)의 짧은 스트레치 사이에 배치된 반복 서열 (직접 반복)의 특징적 어레이의 클러스터를 함유하는 스트렙토콕쿠스 프요게네스(Streptococcus pyogenes) SF370으로부터의 유형 II CRISPR 자리이다. Cpf1 효소는 추정 유형 V CRISPR-Cas 시스템에 속한다. 유형 II 및 유형 V 시스템 둘 다 CRISPR-Cas 시스템의 클래스 II에 포함된다.
"핵 국소화 서열" 또는 "핵 국소화 신호" 또는 "NLS"는 단백질을 핵으로 지향시키는 펩티드이다. 양태들에서, NLS는 5개의 염기성, 양으로 대전된 아미노산을 포함한다. NLS는 펩티드 사슬 상의 어디든 위치할 수 있다. 양태들에서, NLS는 SV40으로부터 유래된 NLS이다. 양태들에서, NLS는 서열 번호:4로 기재된 서열을 포함한다. 양태들에서, NLS는 서열 번호:4로 기재된 서열이다. 양태들에서, NLS는 서열 번호:4와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4의 아미노산 서열을 갖는다.
본원에서 사용되는 바와 같이 "세포"는 그의 게놈 DNA를 보존하거나 복제하기에 충분한 대사 또는 다른 기능을 수행하는 세포를 지칭한다. 세포는, 예를 들어, 온전한 멤브레인의 존재, 특정 염료에 의한 염색, 후손을 생산하는 능력, 또는 배우자의 경우 제2 배우자와 조합하여 생존가능 자손을 생산하는 능력을 포함한, 당업계에 널리 공지된 방법에 의해 식별될 수 있다. 세포는 원핵 및 진핵 세포를 포함할 수 있다. 원핵 세포는 박테리아를 포함하나 이에 제한되지는 않는다. 진핵 세포는 효모 세포 및 식물 및 동물, 예를 들어 포유동물, 곤충 (예: 스포도프테라(spodoptera)) 및 인간 세포로부터 유래된 세포를 포함하나 이에 제한되지는 않는다. 세포는 자연적으로 비부착성이거나 표면에 부착되지 않도록 처리 (예를 들어, 트립신 처리)된 경우에 유용할 수 있다.
본원에서 사용되는 바와 같이, 용어 "벡터"는 그것이 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터의 하나의 유형은 "플라스미드"이고, 이는 추가의 DNA 세그먼트가 결찰될 수 있는 선형 또는 원형 이중 가닥 DNA 루프를 지칭한다. 벡터의 또 다른 유형은 바이러스 벡터이며, 여기서 추가의 DNA 세그먼트는 바이러스 게놈으로 결찰될 수 있다. 특정 벡터는 이들이 도입되는 숙주 세포에서 자율적 복제가 가능하다 (예를 들어, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터 (예: 비-에피솜 포유동물 벡터)는 숙주 세포 내로 도입됨에 따라 숙주 세포의 게놈에 통합되고, 이로써 숙주 게놈과 함께 복제된다. 또한, 특정 벡터는 이들이 작동가능하게 연결되는 유전자의 발현을 지향할 수 있다. 이러한 벡터는 본원에서 "발현 벡터"로서 언급된다. 일반적으로, 재조합 DNA 기술에서 유용성을 갖는 발현 벡터는 종종 플라스미드의 형태이다. 본 명세서에서, "플라스미드" 및 "벡터"는, 플라스미드가 벡터의 가장 통상적으로 사용되는 형태임에 따라, 상호교환가능하게 사용될 수 있다. 그러나, 본 발명은 동등한 기능을 제공하는 이러한 다른 형태의 발현 벡터, 예컨대 바이러스 벡터 (예: 복제 결함 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스)를 포함하도록 의도된다. 추가로, 일부 바이러스 벡터는 특정 세포 유형을 특이적으로 또는 비-특이적으로 표적화할 수 있다. 복제-무능 바이러스 벡터 또는 복제-결함 바이러스 벡터는 그의 표적 세포를 감염시키고 그의 바이러스 페이로드를 전달할 수 있지만, 이어서 세포 용해 및 사멸로 이어지는 전형적인 용해 경로를 계속하지 못하는 바이러스 벡터를 지칭한다.
용어 "트랜스펙션", "형질도입", "트랜스펙션하는" 또는 "형질도입하는"은 상호교환가능하게 사용되며, 핵산 분자 및/또는 단백질이 세포로 도입되는 과정으로서 정의된다. 핵산은 비-바이러스 또는 바이러스-기반 방법을 사용하여 세포로 도입될 수 있다. 핵산 분자는 완전 단백질 또는 그의 기능적 부분을 인코딩하는 서열일 수 있다. 전형적으로, 핵산 벡터는 단백질 발현을 위해 필수적인 요소 (예: 프로모터, 전사 출발 부위 등)를 포함한다. 트랜스펙션의 비-바이러스 방법은 핵산 분자를 세포 내로 도입하기 위한 전달 시스템으로서 바이러스 DNA 또는 바이러스 입자를 사용하지 않는 임의의 적절한 방법을 포함한다. 예시적 비-바이러스 트랜스펙션 방법은 융합 단백질을 인코딩하는 핵산의 나노입자 캡슐화 (예: 지질 나노입자, 금 나노입자 등), 인산칼슘 트랜스펙션, 리포솜 트랜스펙션, 뉴클레오펙션, 소노포레이션, 열 충격을 통한 트랜스펙션, 자기감염 및 전기천공을 포함한다. 바이러스-기반 방법의 경우, 임의의 유용한 바이러스 벡터가 본원에 기재된 방법에서 사용될 수 있다. 바이러스 벡터의 예는 레트로바이러스, 아데노바이러스, 렌티바이러스 및 아데노-관련 바이러스 벡터를 포함하나, 이에 제한되지는 않는다. 양태들에서, 핵산 분자는 당업계에 널리 공지된 표준 절차에 따라 레트로바이러스 벡터를 사용하여 세포 내로 도입된다. 용어 "트랜스펙션" 또는 "형질도입"은 또한 외부 환경으로부터 세포 내로 단백질을 도입하는 것을 지칭한다. 전형적으로, 단백질의 형질도입 또는 트랜스펙션은 관심 단백질에 대한 세포 멤브레인을 교차할 수 있는 펩티드 또는 단백질의 부착에 의존한다. 예를 들어, 하기 문헌 참조: Ford 등 (2001) Gene Therapy 8:1-4 및 Prochiantz (2007) Nat. Methods 4:119-20.
본원에 제공되는 바와 같은 "펩티드 링커"는 펩티드 모이어티를 포함한 링커이다. 구현예들에서, 펩티드 링커는 N-말단 및 C-말단에서 화합물의 나머지 부분에 부착된 아미노산 서열과 같은 2가 펩티드이다 (예: 본원에서 제공되는 융합 단백질. 펩티드 링커는 절단될 수 있는 펩티드 모이어티 (2가 펩티드 모이어티)일 수 있다 (예: P2A 절단가능 폴리펩티드). 본원에서 제공되는 바와 같은 펩티드 링커는 또한 상호교환가능하게 아미노산 링커로서 언급될 수 있다. 양태들에서, 펩티드 링커는 1 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 1 내지 약 70개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 1 내지 약 60개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 1 내지 약 50개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 1 내지 약 40개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 1 내지 약 30개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 1 내지 약 25개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 1 내지 약 20개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 20개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 19개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 18개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 17개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 16개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 15개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 14개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 13개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 12개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 11개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 10개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 9개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 8개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 7개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 6개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 5개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 4개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2 내지 약 3개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 19개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 18개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 17개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 16개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 15개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 14개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 13개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 12개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 11개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 10개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 9개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 8개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 7개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 6개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 5개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3 내지 약 4개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 10 내지 약 20개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 15 내지 약 20개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 2개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 3개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 4개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 5개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 6개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 7개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 8개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 9개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 10개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 11개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 12개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 13개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 14개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 15개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 16개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 17개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 18개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 19개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 20개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 21개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 22개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 23개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 24개의 아미노산 잔기를 포함한다. 양태들에서, 펩티드 링커는 약 25개의 아미노산 잔기를 포함한다.
본원에서 사용되는 바와 같이 용어 "XTEN", "XTEN 링커", 또는 "XTEN 폴리펩티드"는 소수성 아미노산 잔기를 갖지 않는 재조합 폴리펩티드 (예: 구조화되지 않은 재조합 펩티드)를 지칭한다. XTEN의 개발 및 사용은, 예를 들어, 하기 문헌에서 찾아볼 수 있다: Schellenberger 등, Nature Biotechnology 27, 1186-1190 (2009). 양태들에서, XTEN 링커는 서열 번호:5, 6, 또는 98로 기재된 서열을 포함한다.
"에피토프 택"은, 재조합 단백질로 유전자 조작된, 또한 상업적으로 입수가능한 검정 또는 항체에 의해 용이하게 검출되고 단백질의 고유 구조 또는 기능을 손상시키지 않는 범용 에피토프로서 기능하는, 펩티드 등의 생물학적 모이어티를 지칭한다.
"검출가능 작용제" 또는 "검출가능 모이어티"는 분광학적, 광화학적, 생화학적, 면역화학적, 화학적, 자기 공명 이미징, 또는 다른 물리적 수단 등의 적절한 수단에 의해 검출가능한 조성물이다. 예를 들어, 유용한 검출가능 작용제는 18F, 32P, 33P, 45Ti, 47Sc, 52Fe, 59Fe, 62Cu, 64Cu, 67Cu, 67Ga, 68Ga, 77As, 86Y, 90Y. 89Sr, 89Zr, 94Tc, 94Tc, 99mTc, 99Mo, 105Pd, 105Rh, 111Ag, 111In, 123I, 124I, 125I, 131I, 142Pr, 143Pr, 149Pm, 153Sm, 154-1581Gd, 161Tb, 166Dy, 166Ho, 169Er, 175Lu, 177Lu, 186Re, 188Re, 189Re, 194Ir, 198Au, 199Au, 211At, 211Pb, 212Bi, 212Pb, 213Bi, 223Ra, 225Ac, Cr, V, Mn, Fe, Co, Ni, Cu, La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb, Lu, 32P, 형광단 (예: 형광 염료), 전자-치밀 시약, 효소 (예를 들어, ELISA에서 통상적으로 사용되는 것), 비오틴, 디곡시제닌, 상자성 분자, 상자성 나노입자, 초소형 초상자성 산화철 ("USPIO") 나노입자, USPIO 나노입자 응집물, 초상자성 산화철 ("SPIO") 나노입자, SPIO 나노입자 응집물, 단결정 산화철 나노입자, 단결정 산화철, 나노입자 조영제, 리포솜 또는 가돌리늄 킬레이트 ("Gd-킬레이트") 분자를 함유하는 다른 전달 비히클, 가돌리늄, 방사성동위원소, 방사성핵종 (예: 탄소-11, 질소-13, 산소-15, 플루오린-18, 루비듐-82), 플루오로데옥시글루코스 (예: 플루오린-18 라벨링됨), 임의의 감마선 방출 방사성핵종, 양전자-방출 방사성핵종, 방사성라벨링된 글루코스, 방사성라벨링된 물, 방사성라벨링된 암모니아, 바이오콜로이드, 마이크로버블 (예를 들어, 알부민, 갈락토스, 지질, 및/또는 중합체를 포함한 마이크로버블 쉘; 공기, 중가스(들), 퍼플루오르탄소, 질소, 옥타플루오로프로판, 퍼플렉산 지질 마이크로스피어, 퍼플루트렌 등을 포함한 마이크로버블 가스 코어 포함), 아이오딘화된 조영제 (예: 이오헥솔, 이오딕사놀, 이오베르솔, 이오파미돌, 이옥실란, 이오프로미드, 디아트리조에이트, 메트리조에이트, 이옥사글레이트), 황산바륨, 삼산화토륨, 금, 금 나노입자, 금 나노입자 응집물, 형광단, 2-광자 형광단, 또는 합텐 및 예를 들어 표적 펩티드와 특이적으로 반응성인 펩티드 또는 항체에 방사성라벨을 혼입함으로써 검출가능해질 수 있는 단백질 또는 다른 엔티티(entity)를 포함한다.
검출가능 모이어티는 1가 검출가능 작용제 또는 또 다른 조성물과 결합을 형성할 수 있는 검출가능 작용제이다. 양태들에서, 검출가능 작용제는 에피토프 택이다. 양태들에서, 에피토프 택은 HA 택이다. 양태들에서, HA 택은 서열 번호:7로 기재된 서열을 포함한다. 양태들에서, HA 택은 서열 번호:7로 기재된 서열이다. 양태들에서, HA 택은 서열 번호:7과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, HA 택은 서열 번호:7과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, HA 택은 서열 번호:7과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, HA 택은 서열 번호:7과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
양태들에서, 검출가능 작용제는 형광 단백질이다. 양태들에서, 형광 단백질은 청색 형광 단백질 (BFP)이다. 양태들에서, BFP는 서열 번호:8로 기재된 서열을 포함한다. 양태들에서, BFP는 서열 번호:8로 기재된 서열이다. 양태들에서, BFP는 서열 번호:8과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, BFP는 서열 번호:8과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, BFP는 서열 번호:8과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, BFP는 서열 번호:8과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
개시내용의 양태에 따른 이미징 및/또는 라벨링 작용제로서 사용될 수 있는 방사성 물질 (예: 방사성동위원소)은 18F, 32P, 33P, 45Ti, 47Sc, 52Fe, 59Fe, 62Cu, 64Cu, 67Cu, 67Ga, 68Ga, 77As, 86Y, 90Y. 89Sr, 89Zr, 94Tc, 94Tc, 99mTc, 99Mo, 105Pd, 105Rh, 111Ag, 111In, 123I, 124I, 125I, 131I, 142Pr, 143Pr, 149Pm, 153Sm, 154-1581Gd, 161Tb, 166Dy, 166Ho, 169Er, 175Lu, 177Lu, 186Re, 188Re, 189Re, 194Ir, 198Au, 199Au, 211At, 211Pb, 212Bi, 212Pb, 213Bi, 223Ra 및 225Ac를 포함하나, 이에 제한되지는 않는다. 개시내용의 양태에 따른 추가의 이미징 작용제로서 사용될 수 있는 상자성 이온은 전이 및 란타나이드 금속 (예: 21-29, 42, 43, 44, 또는 57-71의 원자 번호를 갖는 금속)의 이온을 포함하나, 이에 제한되지는 않는다. 이들 금속은 Cr, V, Mn, Fe, Co, Ni, Cu, La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb 및 Lu의 이온을 포함한다.
"접촉"은 그의 단순한 통상적 의미에 따라 사용되고, 적어도 2개의 별개의 종이 반응하거나 상호작용하거나 물리적으로 닿기에 충분히 근접하게 되는 것을 가능하게 하는 과정을 지칭한다. 그러나, 생성된 반응 생성물은 첨가된 시약 사이의 반응으로부터 직접 또는 반응 혼합물로 생성될 수 있는 첨가된 시약 중 하나 이상으로부터 중간체로부터 생성될 수 있음을 인지하여야 한다.
용어 "접촉"은 2개의 종이 반응하거나 상호작용하거나 물리적으로 닿는 것을 가능하게 하는 것을 포함할 수 있으며, 여기서 2개의 종은, 예를 들어, 본원에서 제공되는 바와 같은 융합 단백질 및 핵산 서열 (예: 표적 DNA 서열)일 수 있다.
본원에서 정의된 바와 같이, 용어 "활성화", "활성화하다", "활성화하는", "향상시키다", "재활성화", "재활성화하다", "재활성화하는" 등은, 본원에서 제공되는 바와 같은 조성물 (예: 융합 단백질, 복합체, 핵산, 벡터)과 관련하여 사용시, 조성물 (예: 융합 단백질, 복합체, 핵산, 벡터)의 부재 하에 핵산 서열의 활성 (예: 유전자의 전사)에 비해 핵산 서열의 활성 (예: 전사)에 긍정적으로 영향을 주는 (예를 들어, 이를 증가시키는) (예를 들어, 유전자의 전사를 증가시키는) 것을 지칭한다. 따라서, 활성화 또는 재활성화는, 적어도 부분적으로 발현 (예: 전사)의 증가 또는 상향조절, 또는 핵산 서열의 발현 (예: 전사)의 감소 또는 지연의 방지 또는 역전을 포함한다. 활성화된 또는 재활성화된 활성 (예: 전사)은 대조군에서의 것보다 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10%, 또는 그 초과로 더 클 수 있다. 양태들에서, 활성화 또는 재활성화는 대조군과 비교하여 1.5배, 2배, 3배, 4배, 5배, 10배, 또는 그 초과이다. 구현예들에서, 활성화는 이전에 사일런싱되었던 유전자의 활성화일 수 있다. 구현예들에서, 재활성화는 이전에 사일런싱 되었던 유전자의 재활성화일 수 있다.
본원에서 사용되는 바와 같이 용어 "인핸서" 또는 "활성화제"는, 유전자의 전사가 일어날 가능성을 증가시키기 위해 단백질 (예: 전사 활성화제) 및/또는 폴리뉴클레오티드에 의해 결합될 수 있는 DNA의 영역을 지칭한다. 인핸서는 길이가 약 50 내지 약 35,000개의 염기 쌍일 수 있다. 구현예들에서, 인핸서는 길이가 약 50 내지 약 1500개의 염기 쌍일 수 있다. 인핸서는 이것이 조절하는 전사 개시 부위의 하류 또는 상류에 위치할 수 있고, 전사 개시 부위로부터 수백 내지 적어도 백만개의 염기 쌍으로 떨어져 있을 수 있다. 구현예들에서, 인핸서는 전사 개시 부위로부터 수백개의 염기 쌍으로 떨어져 있을 수 있다. 구현예들에서, 인핸서는 적어도 하나의 전사 활성화제 (예: VP64, p65, Rta)에 의해 결합될 수 있다. 구현예들에서, 인핸서는 에피게놈 편집에 적합한 표적 폴리뉴클레오티드 서열일 수 있다. 구현예들에서, 인핸서는 유전자의 전사를 활성화 또는 재활성화할 수 있는 하나 이상의 단백질 및/또는 폴리뉴클레오티드에 의해 표적화될 수 있다.
본원에서 정의된 바와 같이, 용어 "억제", "억제하다", "억제하는", "억압", 억압하는", "사일런싱하는", "사일런싱하다" 등은, 본원에서 제공되는 바와 같은 조성물 (예: 융합 단백질, 복합체, 핵산, 벡터)과 관련하여 사용시, 조성물 (예: 융합 단백질, 복합체, 핵산, 벡터)의 부재 하에 핵산 서열의 활성 (예: 유전자의 전사)에 비해 핵산 서열의 활성 (예: 전사)에 부정적으로 영향을 주는 (예를 들어, 이를 감소시키는) (예를 들어, 유전자의 전사를 감소시키는) 것을 지칭한다. 양태들에서, 억제는 질환 또는 질환의 증상 (예: 암)의 감소를 지칭한다. 따라서, 억제는, 적어도 부분적으로, 활성화 (예: 전사)를 부분적으로 또는 전적으로 차단하는 것, 또는 핵산 서열의 활성화 (예: 전사)를 감소시키거나, 방지하거나, 지연시키는 것을 포함한다. 억제된 활성 (예: 전사)은 대조군에서의 것보다 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10%, 또는 그 미만으로 더 작을 수 있다. 양태들에서, 억제는 대조군에 비해 1.5배, 2배, 3배, 4배, 5배, 10배, 또는 그 초과이다.
본원에서 사용되는 바와 같이 용어 "사일렌서"는 억압제로서 공지된 전사 조절 인자에 결합함으로써 유전자의 전사에 부정적으로 영향을 줄 수 있는 DNA 서열을 지칭한다. 사일렌서 DNA 서열은, 그것이 유전자의 전사를 억압 (예를 들어, 유전자 발현을 사일런싱)하도록 작용하는 표적 유전자의 상류를 포함하나 이에 제한되지는 않는 DNA 전반에 걸쳐 많은 상이한 위치에서 나타날 수 있다.
"대조군" 샘플 또는 값은, 시험 샘플과의 비교를 위한, 참조, 통상적으로 공지된 참조의 역할을 하는 샘플을 지칭한다. 예를 들어, 시험 샘플은, 예를 들어, 시험 화합물의 존재 하에, 시험 조건으로부터 채취되고, 공지된 조건으로부터의, 예를 들어, 시험 화합물의 부재 하에 (네가티브 대조군) 또는 공지된 화합물의 존재 하에 (포지티브 대조군) 샘플과 비교될 수 있다. 대조군은 또한 많은 시험 또는 결과로부터 모아진 평균 값을 나타낼 수 있다. 당업자는, 대조군이 임의의 수의 파라미터의 평가에 대해 디자인될 수 있음을 인식할 것이다. 예를 들어, 대조군은 약리학적 데이터 (예: 반감기) 또는 치료 조치에 기초하여 치료적 이점을 비교 (예: 부작용의 비교)하기 위해 고안될 수 있다. 당업자는, 어떠한 대조군이 주어진 상황에서 가치 있고 대조군 값과의 비교에 기초하여 데이터를 분석할 수 있는지를 이해할 것이다. 대조군은 또한, 데이터의 중요성을 결정하는 데 있어 가치가 있다. 예를 들어, 주어진 파라미터에 대한 값이 대조군에서 폭넓게 달라지는 경우, 시험 샘플에서의 변동은 중요한 것으로 고려되지 않을 것이다.
용어 "탈메틸화 도메인"은 DNA 탈메틸화가 가능한 단백질 서열 또는 구조의 부분을 지칭한다. 예를 들어, 탈메틸화 도메인은 핵염기로부터 메틸 기를 제거할 수 있다 (즉, 5-메틸시토신의 시토신으로의 전환). 구현예들에서, 탈메틸화 도메인은 10-11 전좌 (TET) 효소 또는 TET 효소의 기능적 도메인을 포함한다. 구현예들에서, 탈메틸화 도메인은 박테리아 DNA 데메틸라제이다.
용어 "10-11 전좌" 또는 "TET"는 TET1, TET2 및 TET3을 포함한 효소의 패밀리를 지칭한다. 임의의 이론에 의해 국한되도록 의도하지 않으며, TET 효소는 억압 5mC 마크를 제거하고/거나 5-메틸시토신 (5mC)의 메틸 기의 산화를 촉매하여 5-히드록시메틸시토신 (5hmC) 및 다른 산화된 메틸시토신을 생성하여, 탈메틸화를 촉진할 수 있다.
본원에서 제공되는 바와 같이 용어 "TET1" 또는 "TET1 단백질"은, 메틸시토신 디옥시게나제 TET1로서 또한 공지된, 10-11 전좌 메틸시토신 디옥시게나제 1 (TET1)의 재조합 또는 자연-발생 형태, CXXC-유형 아연 핑거 단백질 6, CXXC 도메인을 갖는 백혈병-관련 단백질, 또는 TET1 단백질 활성 (예를 들어, TET1 단백질에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 TET1 단백질 폴리펩티드에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 구현예들에서, TET1 단백질은 UniProt 참조 번호 Q8NFU7로 식별되는 단백질, 또는 그의 변이체, 상동체 또는 기능적 단편이다. 양태들에서, TET1은 서열 번호:1의 아미노산 서열을 포함한다. 양태들에서, TET1은 서열 번호:1의 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:1과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:1과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:1과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:1과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:1과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:1과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:86의 아미노산 서열을 포함한다. 양태들에서, TET1은 서열 번호:86의 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:86과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:86과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:86과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:86과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:86과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:86과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:97의 아미노산 서열을 포함한다. 양태들에서, TET1은 서열 번호:97의 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:97과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:97과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:97과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:97과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:97과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET1은 서열 번호:97과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
본원에서 제공되는 바와 같이 용어 "TET2" 또는 "TET2 단백질"은, 메틸시토신 디옥시게나제 TET2로서 또한 공지된, 10-11 전좌 메틸시토신 디옥시게나제 2 (TET2)의 재조합 또는 자연-발생 형태, 또는 TET2 단백질 활성 (예를 들어, TET2 단백질에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 TET2 단백질 폴리펩티드에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 구현예들에서, TET2 단백질은 UniProt 참조 번호 Q6N021로 식별되는 단백질, 또는 그의 변이체, 상동체 또는 기능적 단편이다. 양태들에서, TET2는 서열 번호:2의 아미노산 서열을 포함한다. 양태들에서, TET2는 서열 번호:2의 아미노산 서열을 갖는다. 양태들에서, TET2는 서열 번호:2와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET2는 서열 번호:2와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET2는 서열 번호:2와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET2는 서열 번호:2와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET2는 서열 번호:2와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET2는 서열 번호:2와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
본원에서 제공되는 바와 같은 용어 "TET3" 또는 "TET3 단백질"은, 메틸시토신 디옥시게나제 TET3으로서 또한 공지된, 10-11 전좌 메틸시토신 디옥시게나제 3 (TET3)의 재조합 또는 자연-발생 형태, 또는 TET3 단백질 활성 (예를 들어, TET3 단백질에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 TET3 단백질 폴리펩티드에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 구현예들에서, TET3 단백질은 UniProt 참조 번호 O43151로 식별되는 단백질, 또는 그의 변이체, 상동체 또는 기능적 단편이다. 양태들에서, TET3은 서열 번호:3의 아미노산 서열을 포함한다. 양태들에서, TET3은 서열 번호:3의 아미노산 서열을 갖는다. 양태들에서, TET3은 서열 번호:3과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET3은 서열 번호:3과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET3은 서열 번호:3과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET3은 서열 번호:3과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET3은 서열 번호:3과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, TET3은 서열 번호:3과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
용어 "전사 활성화제", "활성화제" 등은, 통상적 및 관습적 의미에서, 유전자 또는 유전자의 세트의 유전자 전사를 증가시키는 단백질 (즉, 전사 인자)을 지칭한다. 예를 들어, 전사 활성화제는 인핸서 또는 프로모터-근위 요소에 결합하는 DNA-결합 단백질일 수 있다. 구현예들에서, 전사 활성화제는 VP64, p65, 또는 Rta이다. 구현예들에서, 전사 활성화제는 이전에 사일런싱되었던 유전자 또는 유전자의 세트의 유전자 전사를 증가시킬 수 있다. 전사 활성화제 및 그의 용도는, 예를 들어, 그 전체가 모든 목적상 본원에 참조로 포함되는 하기 문헌에서 찾아볼 수 있다: Tanenbaum 등, A Protein-Tagging System for Signal Amplification in Gene Expression and Fluorescence Imaging. Cell. 2014 Oct 23;159(3):635-46 및 Zalatan 등, Engineering Complex Synthetic Transcriptional Programs With CRISPR RNA Scaffolds. Cell. 2015 Jan 15;160(1-2):339-50.
본원에서 제공되는 바와 같은 용어 "p65" 또는 "p65 단백질"은, 핵 인자 NF-카파-B p65 서브유닛으로서 또한 공지된 전사 인자 p65 (p65)의 재조합 또는 자연-발생 형태, 또는 p65 단백질 활성 (예를 들어, p65 단백질에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 p65 단백질 폴리펩티드에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 구현예들에서, p65 단백질은 UniProt 참조 번호 Q04206으로 식별되는 단백질, 또는 그의 변이체, 상동체 또는 기능적 단편이다. 양태들에서, p65는 서열 번호:13의 아미노산 서열을 포함한다. 양태들에서, p65는 서열 번호:13의 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:13과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:13과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:13과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:13과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:13과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:13과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:14의 아미노산 서열을 포함한다. 양태들에서, p65는 서열 번호:14의 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:14와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:14와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:14와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:14와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:14와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:14와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:100의 아미노산 서열을 포함한다. 양태들에서, p65는 서열 번호:100의 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:100과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:100과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:100과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:100과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:100과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, p65는 서열 번호:100과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
본원에서 제공되는 바와 같은 용어 "Rta" 또는 "Rta 단백질"은, R 전이활성화제로서 또한 공지된 복제 및 전사 활성화제 (Rta)의 재조합 또는 자연-발생 형태, 즉각-초기(Immediate-early) 단백질 Rta, 또는 Rta 단백질 활성 (예를 들어, Rta 단백질에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 Rta 단백질 폴리펩티드에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 구현예들에서, Rta 단백질은 UniProt 참조 번호 P03209로 식별되는 단백질, 또는 그의 변이체, 상동체 또는 기능적 단편이다. 양태들에서, Rta는 서열 번호:15의 아미노산 서열을 포함한다. 양태들에서, Rta는 서열 번호:15의 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:15와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:15와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:15와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:15와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:15와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:15와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:16의 아미노산 서열을 포함한다. 양태들에서, Rta는 서열 번호:16의 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:16과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:16과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:16과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:16과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:16과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, Rta는 서열 번호:16과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
본원에서 제공되는 바와 같은 용어 "VP64" 또는 "VP64 단백질"은, 알파 트랜스-유도 단백질로서 또한 공지된 외피(Tegument) 단백질 VP16 (VP64)의 재조합 또는 자연-발생 형태, 알파-TIF, 또는 VP64 단백질 활성 (예를 들어, VP64 단백질에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 VP64 단백질 폴리펩티드에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 구현예들에서, VP64 단백질은 UniProt 참조 번호 P06492로 식별되는 단백질, 또는 그의 변이체, 상동체 또는 기능적 단편이다. 양태들에서, VP64는 서열 번호:17의 아미노산 서열을 포함한다. 양태들에서, VP64는 서열 번호:17의 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:17과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:17과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:17과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:17과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:17과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:17과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:18의 아미노산 서열을 포함한다. 양태들에서, VP64는 서열 번호:18의 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:18과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:18과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:18과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:18과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64는 서열 번호:18과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, VP64 서열 번호:18과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
본원에서 제공되는 바와 같은 용어 "MCP " 또는 "MCP 단백질"은, CP로서 또한 공지된 캡시드 단백질 (MCP)의 재조합 또는 자연-발생 형태, 코트 단백질, 또는 MCP 단백질 활성 (예를 들어, MCP 단백질에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 MCP 단백질 폴리펩티드에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 구현예들에서, MCP 단백질은 UniProt 참조 번호 P03612로 식별되는 단백질, 또는 그의 변이체, 상동체 또는 기능적 단편이다. 양태들에서, MCP는 서열 번호:21의 아미노산 서열을 포함한다. 양태들에서, MCP는 서열 번호:21의 아미노산 서열을 갖는다. 양태들에서, MCP는 서열 번호:21과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, MCP는 서열 번호:21과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, MCP는 서열 번호:21과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, MCP는 서열 번호:21과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, MCP는 서열 번호:21과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, MCP는 서열 번호:21과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
용어 "뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소" 등은, 통상적 및 관습적 의미에서, DNA 폴리뉴클레오티드 내의 특정 포스포디에스테르 결합을 표적화하는 RNA-가이드된 DNA 엔도뉴클레아제 (예: 자연 발생 RNA-가이드된 DNA 엔도뉴클레아제의 돌연변이 형태)를 지칭하며, 여기서 포스포디에스테르 결합의 인식은 별도의 폴리뉴클레오티드 서열 (예를 들어, RNA 서열 (예: 단일 가이드 RNA (sgRNA))에 의해 용이해지지만, 이는 표적 포스포디에스테르 결합을 유의한 정도로 절단할 수는 없다 (예를 들어, 생리학적 조건 하에 포스포디에스테르 결합의 측정가능한 절단이 존재하지 않음). 따라서 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제는, 폴리뉴클레오티드 (예: sgRNA)와 복합체화시 DNA-결합능 (예를 들어, 표적 서열에 대한 특이적 결합)을 보유하지만, 유의한 엔도뉴클레아제 활성 (예: 임의의 양의 검출가능 엔도뉴클레아제 활성)은 없다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 CRISPR-관련 단백질이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCas9, dCas12a, dCpfl, ddCpf1, Cas-phi, 뉴클레아제-결핍 Cas9 변이체, 뉴클레아제-결핍 클래스 II CRISPR 엔도뉴클레아제, 류신 지퍼 도메인, 날개형 나선 도메인, 나선-회전(turn)-나선 모티프, 나선-루프-나선 도메인, HMB-박스 도메인, Wor3 도메인, OB-폴드 도메인, 면역글로불린 도메인, 또는 B3 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 류신 지퍼 도메인, 날개형 나선 도메인, 나선-회전-나선 모티프, 나선-루프-나선 도메인, HMB-박스 도메인, Wor3 도메인, OB-폴드 도메인, 면역글로불린 도메인, 또는 B3 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 류신 지퍼 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 날개형 나선 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 나선-회전-나선 모티프이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 나선-루프-나선 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 HMB-박스 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 Wor3 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 OB-폴드 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 면역글로불린 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 B3 도메인이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCas9, dCas12a, ddCpf1, Cas-phi, 뉴클레아제-결핍 Cas9 변이체, 또는 뉴클레아제-결핍 클래스 II CRISPR 엔도뉴클레아제이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCas9이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 에스. 프요게네스로부터의 dCas9이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 에스. 아우레우스(S. aureus)로부터의 dCas9이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCas12a이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 라크노스피라세아에 박테리움(Lachnospiraceae bacterium)으로부터의 dCas12a이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCas12이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 ddCas12a이다. 양태들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 Cas-phi이다.
용어 "CRISPR-관련 단백질" 또는 "CRISPR 단백질"은 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소로서 기능하는 임의의 CRISPR 단백질, 즉, 엔도뉴클레아제 활성에 대한 촉매작용 부위가 결함을 갖거나 활성이 결핍된 CRISPR 단백질을 지칭한다. 예시적 CRISPR 단백질은 dCas9, dCpfl, ddCpf1, dCas12, ddCas12, dCas12Cas-phi, 뉴클레아제-결핍 Cas9 변이체, 뉴클레아제-결핍 클래스 II CRISPR 엔도뉴클레아제 등을 포함한다.
용어 "뉴클레아제-결핍 DNA 엔도뉴클레아제 효소"는 DNA 폴리뉴클레오티드 내의 특정 포스포디에스테르 결합을 표적화하지만 RNA 가이드를 필요로 하지 않는 DNA 엔도뉴클레아제 (예: 자연 발생 DNA 엔도뉴클레아제의 돌연변이 형태)를 지칭한다. 구현예들에서, "뉴클레아제-결핍 DNA 엔도뉴클레아제 효소"는 아연 핑거 도메인 또는 전사 활성화제-유사 이펙터 (TALE)이다.
구현예들에서, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소는 "아연 핑거 도메인"이다. 용어 "아연 핑거 도메인" 또는 "아연 핑거 결합 도메인" 또는 "아연 핑거 DNA 결합 도메인"은 상호교환가능하게 사용되며, 그 구조가 아연 이온의 배위를 통해 안정화되는 결합 도메인 내의 아미노산 서열의 영역인, 하나 이상의 아연 핑거를 통해 서열-특이적 방식으로 DNA에 결합하는 단백질, 또는 보다 큰 단백질 내의 도메인을 지칭한다. 구현예들에서, 아연 핑거 도메인은 선택 표적 부위에 결합하도록 조작된다는 점에서 비-자연 발생이다. 양태들에서, 아연 핑거 결합 도메인은, 아연 핑거의 C2H2 유형, CCHC 유형, PHD 유형, 또는 RING 유형 등의, 당업계에 공지된 임의의 아연 핑거에 결합할 수 있는 단백질, 보다 큰 단백질 내의 도메인, 또는 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 지칭한다.
본원에서 사용되는 바와 같이, "아연 핑거"는 결합된 아연 양이온 주위에서 폴딩된 폴리펩티드 구조적 모티프이다. 구현예들에서, 아연 핑거의 폴리펩티드는 형태 X3-Cys-X2-4 -Cys-X12-His-X3-5-His-X4의 서열을 가지며, 여기서 X는 임의의 아미노산이다 (예를 들어, X2-4는 길이가 2-4개의 아미노산인 올리고펩티드를 나타냄). 일반적으로, 공지된 아연 핑거 폴리펩티드의 28-31개 아미노산에서 폭넓은 범위의 서열 변동이 존재한다. 중심 아연 원자에 결합된 2개의 공통 히스티딘 잔기 및 2개의 공통 시스테인 잔기만이 불변이다. 나머지 잔기 중, 3 내지 5개는 고도로 보존되지만, 다른 잔기 사이에는 상당한 변동이 존재할 수 있다. 폴리펩티드에서의 폭넓은 범위의 서열 변동에도 불구하고, 이 유형의 아연 핑거는 유사한 3차원 구조를 갖는다. 그러나, 상이한 아연 핑거 사이에는 폭넓은 범위의 결합 특이성이 존재하며, 즉 상이한 아연 핑거가 폭넓은 범위의 뉴클레오티드 서열을 갖는 이중 가닥 폴리뉴클레오티드에 결합한다. 양태들에서, 아연 핑거는 C2H2 유형이다. 양태들에서, 아연 핑거는 CCHC 유형이다. 양태들에서, 아연 핑거는 PHD 유형이다. 양태들에서, 아연 핑거는 RING 유형이다.
구현예들에서, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소는 TALE이다. "TALE" 또는 "전사 활성화제-유사 이펙터"는 DNA 절단 도메인에 TAL 이펙터 DNA 결합 도메인을 융합시킴으로써 생성된 인공 제한 효소를 지칭한다. TALE는 효율적인, 프로그램가능, 및 특이적 DNA 절단을 가능하게 하고 계내 게놈 편집을 위한 강력한 도구를 나타낸다. 전사 활성화제-유사 이펙터 (TALE)는 사실상 임의의 DNA 서열에 결합하도록 빠르게 조작될 수 있다. 본원에서 사용되는 바와 같이, 용어 TALE는 광범위하고 또 다른 TALE로부터의 보조 없이 이중 가닥 DNA를 절단할 수 있는 단량체 TALE를 포함한다. 용어 TALE는 또한, 함께 작용하여 동일한 부위에서 DNA를 절단하도록 조작되는 한 쌍의 TALE의 하나 또는 둘 다의 구성원을 지칭하기 위해 사용된다. 함께 작용하는 TALE는 DNA의 손잡이성(handedness)을 참조하는 좌측-TALE 및 우측-TALE로서 언급될 수 있다. TALE는 크산토모나스(Xanthomonas) 박테리아에 의해 분비되는 단백질이다. DNA 결합 도메인은 제12 및 제13 아미노산을 제외하고는 고도로 보존된 33-34개의 아미노산 서열을 함유한다. 이들 두 위치는 고도로 가변성이고 (반복 가변 2-잔기 (RVD)) 특정 뉴클레오티드 인식과 강한 상관성을 나타낸다. 아미노산 서열과 DNA 인식 사이의 이러한 단순한 관계는 적절한 RVD를 함유하는 반복 세그먼트의 조합을 선택함으로써 특정 DNA 결합 도메인의 조작을 가능하게 하였다.
구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCas9이다. 본원에서 언급되는 바와 같은 용어 "dCas9" 또는 "dCas9 단백질"은 엔도뉴클레아제 활성에 대한 두 촉매작용 부위가 모두 결함을 갖거나 활성이 결핍된 Cas9 단백질이다. 양태들에서, dCas9 단백질은 에스. 프요게네스 Cas9의 D10A 및 H840A에 상응하는 위치에서 돌연변이를 갖는다. 양태들에서, dCas9 단백질은 야생형 Cas9의 두 엔도뉴클레아제 촉매작용 부위 모두 (RuvC 및 HNH)에서 점 돌연변이로 인해 엔도뉴클레아제 활성이 결핍된다. 점 돌연변이는 D10A 및 H840A일 수 있다. 양태들에서, dCas9는 검출가능 엔도뉴클레아제 (예: 엔도데옥시리보뉴클레아제) 활성을 실질적으로 갖지 않는다. 양태들에서, dCas9는 서열 번호:9의 아미노산 서열을 포함한다. 양태들에서, dCas9는 서열 번호:9의 아미노산 서열을 갖는다. 양태들에서, dCas9는 서열 번호:9와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dCas9는 서열 번호:9와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dCas9는 서열 번호:9와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dCas9는 서열 번호:9와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dCas9는 서열 번호:9와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dCas9는 서열 번호:9와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
본원에서 언급되는 바와 같은 "CRISPR 관련 단백질 9", "Cas9", "Csn1" 또는 "Cas9 단백질"은 Cas9 엔도뉴클레아제의 재조합 또는 자연-발생 형태 또는 Cas9 엔도뉴클레아제 효소 활성 (예: Cas9에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 Cas9 단백질에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 양태들에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2로 식별되는 단백질 또는 그와 상당한 동일성을 갖는 변이체 또는 상동체와 실질적으로 동일하다. 양태들에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2로 식별되는 단백질의 아미노산 서열과 적어도 75% 서열 동일성을 갖는다. 양태들에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2로 식별되는 단백질의 아미노산 서열과 적어도 80% 서열 동일성을 갖는다. 양태들에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2로 식별되는 단백질의 아미노산 서열과 적어도 85% 서열 동일성을 갖는다. 양태들에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2로 식별되는 단백질의 아미노산 서열과 적어도 90% 서열 동일성을 갖는다. 양태들에서, Cas9 단백질은 UniProt 참조 번호 Q99ZW2로 식별되는 단백질의 아미노산 서열과 적어도 95% 서열 동일성을 갖는다.
구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 "ddCpf1" 또는 "ddCas12a"이다. 용어 "DNAse-사멸 Cpf1" 또는 "ddCpf1"은 Cpf1 DNAse 활성의 불활성화를 초래하는 돌연변이된 아시다미노콕쿠스종(Acidaminococcus sp.) Cpf1 (AsCpf1)을 지칭한다. 양태들에서, ddCpf1은 AsCpf1의 RuvC 도메인에서의 E993A 돌연변이를 포함한다. 양태들에서, ddCpf1은 검출가능한 엔도뉴클레아제 (예: 엔도데옥시리보뉴클레아제) 활성을 실질적으로 갖지 않는다. 양태들에서, ddCpf1은 서열 번호:10의 아미노산 서열을 포함한다. 양태들에서, ddCpf1은 서열 번호:10의 아미노산 서열을 갖는다. 양태들에서, ddCpf1은 서열 번호:10과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, ddCpf1은 서열 번호:10과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, ddCpf1은 서열 번호:10과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, ddCpf1은 서열 번호:10과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, ddCpf1은 서열 번호:10과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, ddCpf1은 서열 번호:10과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dLbCpf1이다. 용어 "dLbCpf1:은 DNAse 활성이 결핍된 라크노스피라세아에 박테리움 ND2006으로부터의 돌연변이된 Cpf1 (LbCpf1)을 지칭한다. 양태들에서, dLbCpf1은 D832A 돌연변이를 포함한다. 양태들에서, dLbCpf1은 검출가능한 엔도뉴클레아제 (예: 엔도데옥시리보-뉴클레아제) 활성을 실질적으로 갖지 않는다. 양태들에서, dLbCpf1은 서열 번호:11의 아미노산 서열을 포함한다. 양태들에서, dLbCpf1은 서열 번호:11의 아미노산 서열을 갖는다. 양태들에서, dLbCpf1은 서열 번호:11과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dLbCpf1은 서열 번호:11과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dLbCpf1은 서열 번호:11과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dLbCpf1은 서열 번호:11과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dLbCpf1은 서열 번호:11과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dLbCpf1은 서열 번호:11과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dFnCpf1이다. 용어 "dFnCpf1"은 DNAse 활성이 결핍된 프란시셀라 노비시다(Francisella novicida) U112로부터의 돌연변이된 Cpf1 (FnCpf1)을 지칭한다. 양태들에서, dFnCpf1은 D917A 돌연변이를 포함한다. 양태들에서, dFnCpf1은 검출가능한 엔도뉴클레아제 (예: 엔도데옥시리보-뉴클레아제) 활성을 실질적으로 갖지 않는다. 양태들에서, dFnCpf1은 서열 번호: 12의 아미노산 서열을 포함한다. 양태들에서, dFnCpf1은 서열 번호:12의 아미노산 서열을 갖는다. 양태들에서, dFnCpf1은 서열 번호:12와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dFnCpf1은 서열 번호:12와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dFnCpf1은 서열 번호:12와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dFnCpf1은 서열 번호:12와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dFnCpf1은 서열 번호:12와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, dFnCpf1은 서열 번호:12와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
본원에서 언급되는 바와 같은 "Cpf1" 또는 " Cpf1 단백질"은 Cpf1 (프레보텔라(Prevotella) 및 프란시셀라 1로부터의 CRISPR) 엔도뉴클레아제의 재조합 또는 자연-발생 형태 또는 Cpf1 엔도뉴클레아제 효소 활성 (예: Cpf1에 비해 적어도 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성 이내)을 유지하는 그의 변이체 또는 상동체 중 임의의 것을 포함한다. 양태들에서, 변이체 또는 상동체는 자연 발생 Cpf1 단백질에 비해 전체 서열 또는 서열의 부분 (예: 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질 또는 그와 상당한 동일성을 갖는 변이체 또는 상동체와 실질적으로 동일하다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질과 동일하다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질의 아미노산 서열과 적어도 75% 서열 동일성을 갖는다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질의 아미노산 서열과 적어도 80% 서열 동일성을 갖는다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질과 동일하다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질의 아미노산 서열과 적어도 85% 서열 동일성을 갖는다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질과 동일하다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질의 아미노산 서열과 적어도 90% 서열 동일성을 갖는다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질과 동일하다. 양태들에서, Cpf1 단백질은 UniProt 참조 번호 U2UMQ6으로 식별되는 단백질의 아미노산 서열과 적어도 95% 서열 동일성을 갖는다.
구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 뉴클레아제-결핍 Cas9 변이체이다. 용어 "뉴클레아제-결핍 Cas9 변이체"는 야생형 Cas9에 비해 PAM에 대한 그의 결합 특이성을 증가시키고 단백질을 심하게 손상된 엔도뉴클레아제 활성을 갖게 또는 이것이 불가능하게 만드는 돌연변이를 추가로 포함하는 하나 이상의 돌연변이를 갖는 Cas9 단백질을 지칭한다. 이론에 의해 국한되길 바라지 않으며, 표적 서열은 PAM (프로토스페이서 인접 모티프); 즉, CRISPR 복합체에 의해 인식되는 짧은 서열과 관련되어야 하는 것으로 믿어진다. PAM에 대한 정확한 서열 및 길이 요건은 사용되는 CRISPR 효소에 따라 달라지지만, PAM은 전형적으로 프로토스페이서 (즉, 표적 서열)에 인접한 2-5개의 염기 쌍 서열이다. PAM에 대한 뉴클레아제-결핍 Cas9 변이체의 결합 특이성은 당업계에 공지된 임의의 방법에 의해 결정될 수 있다. 공지된 Cas9 변이체에 대한 설명 및 용도는, 예를 들어, 그 전체가 모든 목적상 본원에 참조로 포함되는 하기 문헌에서 찾아볼 수 있다: Shmakov 등, Diversity and evolution of class 2 CRISPR-Cas systems. Nat. Rev. Microbiol. 15, 2017 및 Cebrian-Serrano 등, CRISPR-Cas orthologues and variants: optimizing the repertoire, specificity and delivery of genome engineering tools. Mamm. Genome 7-8, 2017. 예시적 Cas9 변이체가 하기 표 1에 열거된다.
표 1
구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 뉴클레아제-결핍 클래스 II CRISPR 엔도뉴클레아제이다. 본원에서 사용되는 바와 같이, 용어 "뉴클레아제-결핍 클래스 II CRISPR 엔도뉴클레아제"는 감소된, 손상된, 또는 불활성 엔도뉴클레아제 활성을 초래하는 돌연변이를 갖는 임의의 클래스 II CRISPR 엔도뉴클레아제를 지칭한다.
구현예들에서, 펩티드 링커는 XTEN 링커이다. 양태들에서, XTEN 링커는 약 16 내지 약 864개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 17 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 18 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 19 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 20 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 30 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 40 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 50 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 70 내지 약 80개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16 내지 약 70개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16 내지 약 60개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16 내지 약 50개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16 내지 약 40개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16 내지 약 35개의 아미노산 잔기. 양태들에서, XTEN 링커는 약 16 내지 약 30개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16 내지 약 25개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16 내지 약 20개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 17개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 18개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 19개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 20개의 아미노산 잔기를 포함한다.
양태들에서, 융합 단백질은 동일하거나 상이한 적어도 2개의 XTEN 링커를 포함한다. 양태들에서, 융합 단백질은 제2 XTEN 링커보다 더 많은 아미노산 잔기를 갖는 제1 XTEN 링커를 포함한다. 양태들에서, 융합 단백질은 제2 XTEN 링커보다 10 내지 150개의 아미노산 잔기를 갖는 제1 XTEN 링커를 포함한다. 양태들에서, 융합 단백질은 제2 XTEN 링커보다 20 내지 120개의 아미노산 잔기를 갖는 제1 XTEN 링커를 포함한다. 양태들에서, 융합 단백질은 제2 XTEN 링커보다 30 내지 110개의 아미노산 잔기를 갖는 제1 XTEN 링커를 포함한다. 양태들에서, 융합 단백질은 제2 XTEN 링커보다 40 내지 110개의 아미노산 잔기를 갖는 제1 XTEN 링커를 포함한다. 양태들에서, 융합 단백질은 제2 XTEN 링커보다 50 내지 100개의 아미노산 잔기를 갖는 제1 XTEN 링커를 포함한다. 양태들에서, 융합 단백질은 제2 XTEN 링커보다 60 내지 100개의 아미노산 잔기를 갖는 제1 XTEN 링커를 포함한다.
구현예들에서, XTEN 링커는 약 50 내지 약 864개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 50 내지 약 200개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 55 내지 약 180개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 150개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 120개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 110개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 100개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 70 내지 약 90개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 75 내지 약 85개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 80개의 아미노산 잔기를 포함한다. 양태들에서, 융합 단백질이 적어도 2개의 XTEN 펩티드 링커를 포함하는 경우, 약 50 내지 약 200개의 아미노산 잔기를 포함하는 XTEN 링커가 제1 XTEN 펩티드 링커로서 언급된다.
구현예들에서, XTEN 링커는 약 5 내지 약 55개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 5 내지 약 50개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 5 내지 약 40개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 10 내지 약 30개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 10 내지 약 25개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 10 내지 약 20개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 14 내지 약 18개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16개의 아미노산 잔기를 포함한다. 양태들에서, 융합 단백질이 적어도 2개의 XTEN 펩티드 링커를 포함하는 경우, 약 5 내지 약 55개의 아미노산 잔기를 포함하는 XTEN 링커가 제2 XTEN 펩티드 링커로서 언급된다.
구현예들에서, XTEN 링커는 서열 번호:5로 기재된 서열을 포함한다. 양태들에서, XTEN 링커는 서열 번호:5로 기재된 서열이다. 양태들에서, XTEN 링커는 서열 번호:5와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:5와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:5와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:5와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:5와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:5와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, XTEN 링커는 서열 번호:6으로 기재된 서열을 포함한다. 양태들에서, XTEN 링커는 서열 번호:6으로 기재된 서열이다. 양태들에서, XTEN 링커는 서열 번호:6과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:6과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:6과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:6과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:6과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:6과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, XTEN 링커는 서열 번호:98로 기재된 서열을 포함한다. 양태들에서, XTEN 링커는 서열 번호:98로 기재된 서열이다. 양태들에서, XTEN 링커는 서열 번호:98과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:98과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:98과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:98과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:98과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, XTEN 링커는 서열 번호:98과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
융합 단백질은 세포의 특정 영역 (예: 세포질, 핵)에 대하여 융합 단백질을 표적화하기에 유용한 아미노산 서열을 포함할 수 있다. 따라서, 양태들에서, 융합 단백질은 핵 국소화 신호 (NLS) 펩티드를 추가로 포함한다. 양태들에서, NLS는 서열 번호:4로 기재된 서열을 포함한다. 양태들에서, NLS는 서열 번호:4로 기재된 서열이다. 양태들에서, NLS는 서열 번호:4와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, NLS는 서열 번호:4와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
융합 단백질
특히, 인간 유전자의 발현을 장기적으로 활성화하기 위해 인간 게놈의 임의의 자리에 표적화될 수 있고 (즉, 다수의 세포 분열을 통해 유전됨), mRNA, DNA, 또는 RNP로서 일시적으로 전달될 수 있는 융합 단백질이 본원에서 제공된다. 융합 단백질은 전사를 활성화하기 위한 다중 후생유전학적 편집 능력을 갖고, 핵염기 상의 메틸 기와 억압 히스톤 변형을 포함한 후생유전학적 표지를 제거함으로써 전사를 제어한다. 본원에서 제공되는 융합 단백질은 전사를 강건하게 활성화하기 위해 협력하여 작용하는 다중 도메인을 추가로 포함한다.
구현예들에서, 개시내용은 N-말단으로부터 C-말단까지, 탈메틸화 도메인, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질을 제공한다. 구현예들에서, 융합 단백질은 N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 엔도뉴클레아제 효소는 CRISPR-관련 단백질이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET2 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET3 도메인이다. 양태들에서, 융합 단백질은 핵 국소화 서열을 추가로 포함한다. 양태들에서, 융합 단백질은 2 또는 3개의 핵 국소화 서열을 추가로 포함한다. 구현예들에서, 융합 단백질은 화학식 (I): R1-L1-R2의 화합물과 적어도 85% 서열 동일성을 갖고; 여기서 R1은 서열 번호:1, 서열 번호:2, 서열 번호:3, 서열 번호:86, 또는 서열 번호:97을 포함하고; L1은 부재하거나, 서열 번호:5, 서열 번호:6, 또는 서열 번호:98이고; R2는 서열 번호:9를 포함한다. 구현예들에서, 융합 단백질은 화학식 (I)의 화합물과 적어도 90% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (I)의 화합물과 적어도 92% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (I)의 화합물과 적어도 94% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (I)의 화합물과 적어도 95% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (I)의 화합물과 적어도 96% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (I)의 화합물과 적어도 98% 서열 동일성을 갖는다.
구현예들에서, 개시내용은 N-말단으로부터 C-말단까지, RNA-결합 서열, 및 적어도 하나의 전사 활성화제를 포함하는 융합 단백질을 제공한다. 구현예들에서, 융합 단백질은 N-말단으로부터 C-말단까지, RNA-결합 서열, XTEN 링커, 및 적어도 하나의 전사 활성화제를 포함한다. 구현예들에서, 융합 단백질은 N-말단으로부터 C-말단까지, RNA-결합 서열, XTEN 링커, 및 VP64, p65, Rta, 또는 이들 둘 이상의 조합으로 이루어진 군으로부터 선택된 적어도 하나의 전사 활성화제를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합이다. 구현예들에서, 전사 활성화제는 VP64이다. 구현예들에서, 전사 활성화제는 p65이다. 구현예들에서, 전사 활성화제는 Rta이다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64를 포함한다. 구현예들에서, 전사 활성화제는 p65를 포함한다. 구현예들에서, 전사 활성화제는 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 p65 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta를 포함한다. 구현예들에서, 융합 단백질은 화학식 (II): R4-L1-R3의 화합물과 적어도 85% 서열 동일성을 갖고; 여기서 R4는 서열 번호:21을 포함하고; L1은 부재하거나, 서열 번호:5, 서열 번호:6, 또는 서열 번호:98이고; R3은 서열 번호:13, 서열 번호:14, 서열 번호:15, 서열 번호:16, 서열 번호:17, 서열 번호:18, 서열 번호:100, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, R3은 서열 번호:14, 서열 번호:15, 서열 번호:17, 서열 번호:100, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 융합 단백질은 화학식 (II)의 화합물과 적어도 90% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (II)의 화합물과 적어도 92% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (II)의 화합물과 적어도 94% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (II)의 화합물과 적어도 95% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (II)의 화합물과 적어도 96% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (III)의 화합물과 적어도 98% 서열 동일성을 갖는다.
구현예들에서, N-말단으로부터 C-말단까지, RNA-결합 서열, XTEN 링커, 및 적어도 하나의 전사 활성화제를 갖는 융합 단백질은 서열 번호:104, 서열 번호:105, 서열 번호:106, 서열 번호:107, 서열 번호:108, 서열 번호:109, 또는 서열 번호:110을 포함한다. 양태들에서, 융합 단백질은 서열 번호:104, 서열 번호:105, 서열 번호:106, 서열 번호:107, 서열 번호:108, 서열 번호:109, 또는 서열 번호:110과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함한다. 양태들에서, 융합 단백질은 서열 번호:104, 서열 번호:105, 서열 번호:106, 서열 번호:107, 서열 번호:108, 서열 번호:109, 또는 서열 번호:110과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함한다. 양태들에서, 융합 단백질은 서열 번호:104, 서열 번호:105, 서열 번호:106, 서열 번호:107, 서열 번호:108, 서열 번호:109, 또는 서열 번호:110과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함한다. 양태들에서, 융합 단백질은 서열 번호:104, 서열 번호:105, 서열 번호:106, 서열 번호:107, 서열 번호:108, 서열 번호:109, 또는 서열 번호:110과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다.
구현예들에서, 개시내용은 N-말단으로부터 C-말단까지, 탈메틸화 도메인, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소, 및 전사 활성화제를 포함하는 융합 단백질을 제공한다. 구현예들에서, 융합 단백질은 N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소, 및 전사 활성화제를 포함한다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 엔도뉴클레아제 효소는 CRISPR-관련 단백질이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET2 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET3 도메인이다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64를 포함한다. 구현예들에서, 전사 활성화제는 p65를 포함한다. 구현예들에서, 전사 활성화제는 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 p65 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta를 포함한다. 양태들에서, 융합 단백질은 핵 국소화 서열을 추가로 포함한다. 양태들에서, 융합 단백질은 2 또는 3개의 핵 국소화 서열을 추가로 포함한다. 구현예들에서, 융합 단백질은 화학식 (III): R1-L1-R2-R3의 화합물과 적어도 85% 서열 동일성을 갖고; 여기서 R1은 서열 번호:1, 서열 번호:2, 서열 번호:3, 서열 번호:86, 서열 번호:97을 포함하고; L1은 부재하거나, 서열 번호:5, 서열 번호:6, 또는 서열 번호:98이고; R2는 서열 번호:9를 포함하고; R3은 서열 번호:13, 서열 번호:14, 서열 번호:15, 서열 번호:16, 서열 번호:17, 서열 번호:18, 서열 번호:100, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, R3은 서열 번호:14, 서열 번호:15, 서열 번호:17, 서열 번호:100, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 융합 단백질은 화학식 (III)의 화합물과 적어도 90% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (III)의 화합물과 적어도 92% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (III)의 화합물과 적어도 94% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (III)의 화합물과 적어도 95% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (III)의 화합물과 적어도 96% 서열 동일성을 갖는다. 구현예들에서, 융합 단백질은 화학식 (III)의 화합물과 적어도 98% 서열 동일성을 갖는다.
구현예들에서, 융합 단백질은 N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 엔도뉴클레아제 효소는 CRISPR-관련 단백질이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET2 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET3 도메인이다. 구현예들에서, 융합 단백질은 전사 활성화제를 추가로 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 양태들에서, 융합 단백질은 핵 국소화 서열을 추가로 포함한다. 양태들에서, 융합 단백질은 2 또는 3개의 핵 국소화 서열을 추가로 포함한다.
구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCas9, dCas12a, dCpf1, 아연 핑거 도메인, 류신 지퍼 도메인, 날개형 나선 도메인, TALE, 나선-회전-나선 모티프, 나선-루프-나선 도메인, HMB-박스 도메인, Wor3 도메인, OB-폴드 도메인, 면역글로불린 도메인, 또는 B3 도메인이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 CRISPR-관련 단백질이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCas9이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 dCpf1이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 Cas-phi이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 류신 지퍼 도메인이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 날개형 나선 도메인이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 나선-회전-나선 모티프이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 나선-루프-나선 도메인이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 HMB-박스 도메인이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 Wor3 도메인이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 OB-폴드 도메인이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 면역글로불린 도메인이다. 구현예들에서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 B3 도메인이다.
구현예들에서, 융합 단백질은 N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 뉴클레아제-결핍 엔도뉴클레아제 효소는 아연 핑거 도메인이다. 구현예들에서, 뉴클레아제-결핍 엔도뉴클레아제 효소는 TALE이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET2 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET3 도메인이다. 양태들에서, 융합 단백질은 핵 국소화 서열을 추가로 포함한다. 양태들에서, 융합 단백질은 2 또는 3개의 핵 국소화 서열을 추가로 포함한다.
구현예들에서, 융합 단백질은 N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소, 및 전사 활성화제를 포함한다. 구현예들에서, 뉴클레아제-결핍 엔도뉴클레아제 효소는 아연 핑거 도메인이다. 구현예들에서, 뉴클레아제-결핍 엔도뉴클레아제 효소는 TALE이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET2 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET3 도메인이다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64를 포함한다. 구현예들에서, 전사 활성화제는 p65를 포함한다. 구현예들에서, 전사 활성화제는 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 p65 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta를 포함한다. 양태들에서, 융합 단백질은 핵 국소화 서열을 추가로 포함한다. 양태들에서, 융합 단백질은 2 또는 3개의 핵 국소화 서열을 추가로 포함한다.
구현예들에서, 융합 단백질은 N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, 뉴클레아제-결핍 엔도뉴클레아제 효소는 아연 핑거 도메인이다. 구현예들에서, 뉴클레아제-결핍 엔도뉴클레아제 효소는 TALE이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합이다. 구현예들에서, 탈메틸화 도메인은 TET1 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET2 도메인이다. 구현예들에서, 탈메틸화 도메인은 TET3 도메인이다. 구현예들에서, 융합 단백질은 전사 활성화제를 추가로 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 양태들에서, 융합 단백질은 핵 국소화 서열을 추가로 포함한다. 양태들에서, 융합 단백질은 2 또는 3개의 핵 국소화 서열을 추가로 포함한다.
구현예들에서, XTEN 링커는 약 5 내지 약 864개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 10 내지 약 864개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 20 내지 약 864개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 30 내지 약 864개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 40 내지 약 864개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 50 내지 약 200개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 55 내지 약 180개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 150개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 120개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 110개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 60 내지 약 100개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 70 내지 약 90개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 75 내지 약 85개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 80개의 아미노산 잔기를 포함한다. 양태들에서, 융합 단백질이 적어도 2개의 XTEN 펩티드 링커를 포함하는 경우, 약 50 내지 약 200개의 아미노산 잔기를 포함하는 XTEN 링커가 제1 XTEN 펩티드 링커로서 언급된다.
구현예들에서, XTEN 링커는 약 5 내지 약 55개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 5 내지 약 50개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 5 내지 약 40개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 10 내지 약 30개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 10 내지 약 25개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 10 내지 약 20개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 14 내지 약 18개의 아미노산 잔기를 포함한다. 양태들에서, XTEN 링커는 약 16개의 아미노산 잔기를 포함한다. 양태들에서, 융합 단백질이 적어도 2개의 XTEN 펩티드 링커를 포함하는 경우, 약 5 내지 약 55개의 아미노산 잔기를 포함하는 XTEN 링커가 제2 XTEN 펩티드 링커로서 언급된다.
본원에서 제공되는 융합 단백질에 대하여, 구현예들에서, 융합 단백질은 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함한다. 구현예들에서, 융합 단백질은 에피토프 택을 추가로 포함한다. 구현예들에서, 융합 단백질은 2A 펩티드를 추가로 포함한다. 구현예들에서, 융합 단백질은 형광 단백질 택을 추가로 포함한다. 구현예들에서, 융합 단백질은 핵 국소화 신호 펩티드를 추가로 포함한다.
본원에서 제공되는 융합 단백질에 대하여, 구현예들에서, 융합 단백질은 적어도 하나의 전사 활성화제를 추가로 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64를 포함한다. 구현예들에서, 전사 활성화제는 p65를 포함한다. 구현예들에서, 전사 활성화제는 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 p65 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta를 포함한다.
구현예들에서, RNA-결합 서열은 MS2 RNA-결합 서열이다. 구현예들에서, MS2 RNA-결합 서열은 MCP 단백질을 포함한다.
융합 단백질은 본원에 기재된 바와 같은 XTEN 링커를 포함할 수 있다. 구현예들에서, XTEN 링커는 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함한다.
구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, CRISPR-관련 단백질, XTEN 링커, 핵 국소화 서열, 전사 활성화제, 및 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, 아연 핑거 도메인, XTEN 링커, 핵 국소화 서열, 전사 활성화제, 및 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, TALE, XTEN 링커, 핵 국소화 서열, Rta, 및 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, dCas9, XTEN 링커, 핵 국소화 서열, 전사 활성화제, 및 핵 국소화 서열을 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64를 포함한다. 구현예들에서, 전사 활성화제는 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 p65 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta를 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, 서열 번호:97, 서열 번호:98, 서열 번호:9, 서열 번호:6, 서열 번호:4, 서열 번호:15, 및 서열 번호:4를 포함한다. 구현예들에서, 융합 단백질은 서열 번호:99를 포함한다. 구현예들에서, 융합 단백질은 서열 번호:99이다. 양태들에서, 융합 단백질은 서열 번호:99와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:99와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:99와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:99와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:99와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:99와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, CRISPR-관련 단백질, XTEN 링커, 핵 국소화 서열, 2개의 전사 활성화제, 및 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, 아연 핑거 도메인, XTEN 링커, 핵 국소화 서열, p65, Rta, 및 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, TALE, XTEN 링커, 핵 국소화 서열, 2개의 전사 활성화제, 및 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, dCas9, XTEN 링커, 핵 국소화 서열, 2개의 전사 활성화제, 및 핵 국소화 서열을 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta 중 적어도 2개를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 p65 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta를 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, 서열 번호:97, 서열 번호:98, 서열 번호:9, 서열 번호:6, 서열 번호:4, 서열 번호:100, 서열 번호:15, 및 서열 번호:4를 포함한다. 구현예들에서, 융합 단백질은 서열 번호:101을 포함한다. 구현예들에서, 융합 단백질은 서열 번호:101이다. 양태들에서, 융합 단백질은 서열 번호:101과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:101과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:101과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:101과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:101과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:101과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, CAS-관련 단백질, 및 1 내지 3개의 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, 아연 핑거 도메인, 및 1 내지 3개의 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, TALE, 및 1 내지 3개의 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, TET1 도메인, XTEN 링커, dCas9, 및 1 내지 3개의 핵 국소화 서열을 포함한다. 구현예들에서, 융합 단백질은 전사 활성화제를 추가로 포함한다. 구현예들에서, 융합 단백질은, N-말단으로부터 C-말단까지, 서열 번호:97, 서열 번호:98, 서열 번호:9, 및 서열 번호:4를 포함한다. 구현예들에서, 융합 단백질은 서열 번호:102를 포함한다. 구현예들에서, 융합 단백질은 서열 번호:102이다. 양태들에서, 융합 단백질은 서열 번호:102와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:102와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:102와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:102와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:102와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:102와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, 융합 단백질은 서열 번호:103을 포함한다. 구현예들에서, 융합 단백질은 서열 번호:103이다. 양태들에서, 융합 단백질은 서열 번호:103과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:103과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:103과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:103과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:103과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:103과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, 융합 단백질은 서열 번호:111을 포함한다. 구현예들에서, 융합 단백질은 서열 번호:111이다. 양태들에서, 융합 단백질은 서열 번호:111과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:111과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:111과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:111과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:111과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:111과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, 융합 단백질은 서열 번호:112를 포함한다. 구현예들에서, 융합 단백질은 서열 번호:112이다. 양태들에서, 융합 단백질은 서열 번호:112와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:112와 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:112와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:112와 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:112와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:112와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
구현예들에서, 융합 단백질은 서열 번호:113을 포함한다. 구현예들에서, 융합 단백질은 서열 번호:113이다. 양태들에서, 융합 단백질은 서열 번호:113과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:113과 적어도 75% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:113과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:113과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:113과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는다. 양태들에서, 융합 단백질은 서열 번호:113과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 갖는다.
화학식 (III)의 화합물 또는 화학식 (III)의 화합물과 적어도 85% 서열 동일성을 갖는 화합물이 본원에서 제공되며, 여기서 화학식 (III)의 화합물은 R10-L1-R11-R12-L2-L3-(R13-L4)x-R14-X1-L5-X2-L6-X3-L7-R15이다. 구현예들에서, 화합물은 화학식 (III)의 화합물과 적어도 90% 서열 동일성을 갖는다. 구현예들에서, 화합물은 화학식 (III)의 화합물과 적어도 92% 서열 동일성을 갖는다. 구현예들에서, 화합물은 화학식 (III)의 화합물과 적어도 94% 서열 동일성을 갖는다. 구현예들에서, 화합물은 화학식 (III)의 화합물과 적어도 95% 서열 동일성을 갖는다. 구현예들에서, 화합물은 화학식 (III)의 화합물과 적어도 96% 서열 동일성을 갖는다. 구현예들에서, 화합물은 화학식 (III)의 화합물과 적어도 98% 서열 동일성을 갖는다. 구현예들에서, 화합물은 화학식 (III)을 갖는다. R10은 탈메틸화 도메인이다. 구현예들에서, R10은 서열 번호:1, 2, 3, 86, 97 (그의 구현예 포함)을 포함한다. 구현예들에서, R10은 서열 번호:97 (그의 구현예 포함)을 포함한다. L1은 결합 또는 펩티드 링커이다. 구현예들에서, L1은 결합이다. R11은 XTEN 링커이다. 구현예들에서, R11은 서열 번호:5, 6, 또는 98 (그의 구현예 포함을 포함한다. 구현예들에서, R11은 서열 번호:5 (그의 구현예 포함을 포함한다. 구현예들에서, R11은 서열 번호:6 (그의 구현예 포함을 포함한다. 구현예들에서, R11은 서열 번호:98 (그의 구현예 포함)을 포함한다. R12는 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소 또는 뉴클레아제-결핍 엔도뉴클레아제 효소를 포함한다. 구현예들에서, R12는 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함한다. 구현예들에서, R12는 CRISPR-관련 단백질을 포함한다. 구현예들에서, R12는 서열 번호:9 (그의 구현예 포함)를 포함한다. 구현예들에서, R12는 뉴클레아제-결핍 엔도뉴클레아제 효소를 포함한다. 구현예들에서, R12는 아연 핑거 도메인 또는 TALE를 포함한다. 구현예들에서, R12는 아연 핑거 도메인이다. 구현예들에서, R12는 TALE를 포함한다. L2는 결합 또는 XTEN 링커이다. 구현예들에서, L2는 결합 또는 XTEN 링커이다. 구현예들에서, L2는 결합이다. 구현예들에서, L2는 XTEN 링커이다. 구현예들에서, L2는 서열 번호:5, 6, 또는 98 (그의 구현예 포함)을 포함한다. 구현예들에서, L2는 서열 번호:5 (그의 구현예 포함을 포함한다. 구현예들에서, L2는 서열 번호:6 (그의 구현예 포함을 포함한다. 구현예들에서, L2는 서열 번호:98 (그의 구현예 포함)을 포함한다. L3은 결합 또는 펩티드 링커이다. 구현예들에서, L3은 결합이다. 구현예들에서, L3은 펩티드 링커이다. 구현예들에서, L3은 1개의 아미노산 내지 약 10개의 아미노산을 포함하는 펩티드 링커이다. 구현예들에서, L3은 3개의 아미노산 내지 약 5개의 아미노산을 포함하는 펩티드 링커이다. R13은 핵 국소화 서열을 포함한다. 구현예들에서, R13은 서열 번호:4 (그의 구현예 포함)를 포함한다. L4는 부재하거나 펩티드 링커이다. 구현예들에서, L4는 부재한다. 구현예들에서, L4는 펩티드 링커이다. 구현예들에서, L4는 1개의 아미노산 내지 약 10개의 아미노산을 포함하는 펩티드 링커이다. 구현예들에서, L4는 1개의 아미노산 내지 약 5개의 아미노산을 포함하는 펩티드 링커이다. 구현예들에서, L4는 1개의 아미노산 내지 약 4개의 아미노산을 포함하는 펩티드 링커이다. x는 0 내지 4의 정수이다. 구현예들에서, x는 0이다. 구현예들에서, x는 1이다. 구현예들에서, x는 2이다. 구현예들에서, x는 3이다. R14는 부재하거나 핵 국소화 서열이다. 구현예들에서, R14는 부재한다. 구현예들에서, R14는 핵 국소화 서열이다. 구현예들에서, R14는 서열 번호:4 (그의 구현예 포함)를 포함한다. X1, X2, 및 X3은 독립적으로 부재하거나 전사 활성화제이다. 구현예들에서, X1, X2, 및 X3은 독립적으로 전사 활성화제이다. 구현예들에서, X1, X2, 및 X3은 독립적으로 p65, Rta, 또는 VP64이다. 구현예들에서, X1, X2, 및 X3은 독립적으로 p65, Rta, 또는 VP64이며, 여기서 X1, X2, 및 X3은 각각 상이하다. 구현예들에서, X1 및 X2는 독립적으로 p65, Rta, 또는 VP64이고, X3은 부재한다. 구현예들에서, X1 및 X2는 독립적으로 p65, Rta, 또는 VP64이고; X3은 부재하고; X1 및 X2는 상이하다. 구현예들에서, X1은 p65, Rta, 또는 VP64이고; X2는 부재하고; X3은 부재한다. 구현예들에서, p65는 서열 번호:13, 14, 또는 100 (그의 구현예 포함)을 포함한다. 구현예들에서, p65는 서열 번호:13 (그의 구현예 포함)을 포함한다. 구현예들에서, p65는 서열 번호:14 (그의 구현예 포함)를 포함한다. 구현예들에서, p65는 서열 번호:100 (그의 구현예 포함)을 포함한다. 구현예들에서, Rta는 서열 번호:15 또는 16 (그의 구현예 포함)을 포함한다. 구현예들에서, Rta는 서열 번호:15 (그의 구현예 포함)를 포함한다. 구현예들에서, Rta는 서열 번호:16 (그의 구현예 포함)을 포함한다. 구현예들에서, VP64는 서열 번호:17 또는 18 (그의 구현예 포함)을 포함한다. 구현예들에서, VP64는 서열 번호:17 (그의 구현예 포함)을 포함한다. 구현예들에서, VP64는 서열 번호:18 (그의 구현예 포함)을 포함한다. L5는 부재하거나 펩티드 링커이다. 구현예들에서, L5는 부재한다. 구현예들에서, L5는 펩티드 링커를 포함한다. 구현예들에서, 펩티드 링커는 1개의 아미노산 내지 약 10개의 아미노산을 포함한다. 구현예들에서, 펩티드 링커는 3개의 아미노산 내지 약 5개의 아미노산을 포함한다. L6은 부재하거나 펩티드 링커이다. 구현예들에서, L6은 부재한다. 구현예들에서, L6은 펩티드 링커를 포함한다. 구현예들에서, 펩티드 링커는 1개의 아미노산 내지 약 10개의 아미노산을 포함한다. 구현예들에서, 펩티드 링커는 3개의 아미노산 내지 약 5개의 아미노산을 포함한다. L7은 부재하거나 펩티드 링커이다. 구현예들에서, L7은 부재한다. 구현예들에서, L7은 펩티드 링커를 포함한다. 구현예들에서, 펩티드 링커는 1개의 아미노산 내지 약 10개의 아미노산을 포함한다. 구현예들에서, 펩티드 링커는 3개의 아미노산 내지 약 5개의 아미노산을 포함한다. 구현예들에서, X1가 부재하는 경우, L5는 부재한다. 구현예들에서, X2가 부재하는 경우, L6은 부재한다. 구현예들에서, X3이 부재하는 경우, L7은 부재한다. 구현예들에서, X2가 부재하는 경우, X3은 부재하고, L6 및 L7은 부재한다. 구현예들에서, X1가 부재하는 경우, X2 및 X3은 부재하고, L5, L6, 및 L7은 부재한다. R15는 부재하거나 핵 국소화 서열이다. 구현예들에서, R15는 부재한다. 구현예들에서, R15는 핵 국소화 서열이다. 구현예들에서, R15는 서열 번호:4 (그의 구현예 포함)를 포함한다.
본원에 열거된 서열에서, 당업자는 번역을 개시하기 위해 단백질의 N-말단 상에 메티오닌 (M)이 존재할 수 있음을 인지할 것이다. 따라서, 본원에 기재된 서열은 임의로 N-말단 상에 메티오논을 추가로 포함할 수 있다.
복합체
융합 단백질이 에피게놈 편집을 수행하기 위해, 융합 단백질은 표적 폴리뉴클레오티드 서열 (예: 편집되는 표적 DNA 서열)에 대해 상보적이고 본원에 기재된 바와 같은 융합 단백질의 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 결합할 수 있는 서열 (즉, 결합 서열)을 추가로 포함하는 폴리뉴클레오티드 (예: sgRNA)와 상호작용한다 (예를 들어, 그에 비-공유적으로 결합함). 양태들에서, 표적 폴리뉴클레오티드 서열 (예: 편집되는 표적 게놈 DNA 서열)에 대해 상보적이고 본원에 기재된 바와 같은 융합 단백질의 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 결합할 수 있는 결합 서열을 추가로 포함하는 폴리뉴클레오티드는 sgRNA이다. 양태들에서, 표적 폴리뉴클레오티드 서열 (예: 편집되는 표적 게놈 DNA 서열)에 대해 상보적이고 본원에 기재된 바와 같은 융합 단백질의 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 결합할 수 있는 결합 서열을 추가로 포함하는 폴리뉴클레오티드는 cr:tracrRNA이다. 이 복합체를 형성함으로써, 융합 단백질은 에피게놈 편집을 수행하도록 적절히 배치된다. 용어 "복합체"는, 둘 이상의 성분을 포함하며, 여기서 성분들은 함께 결합하여 기능적 단위를 만드는 것인 조성물을 지칭한다. 양태들에서, 본원에 기재된 복합체는 본원에 기재된 융합 단백질 및 본원에 기재된 폴리뉴클레오티드를 포함한다. 따라서, 하나의 양태에서는, 그의 구현예 및 양태를 포함한, 본원에 기재된 바와 같은 융합 단백질, 및 sgRNA 또는 cr:tracrRNA (즉, (1) 표적 폴리뉴클레오티드 서열에 대해 상보적인 DNA-표적화 서열; 및 (2) 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소에 대한 결합 서열을 포함하며, 여기서 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소는 결합 서열 (예: DNA-표적화 서열에 결합할 수 있는 아미노산 서열)을 통해 폴리뉴클레오티드에 결합되는 것인, 폴리뉴클레오티드)가 제공된다. 양태들에서, 폴리뉴클레오티드는 적어도 하나의 MS2 루프를 포함한다.
양태들에서, 본원에 기재된 복합체는 본원에 기재된 융합 단백질, 본원에 기재된 폴리뉴클레오티드, 및 본원에 기재된 제2 융합 단백질을 포함한다. 양태들에서, 제2 융합 단백질은 본원에 기재된 전사 활성화제를 포함한다.
DNA-표적화 서열은 표적 폴리뉴클레오티드 서열 (DNA 또는 RNA)에 대해 상보적인 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 지칭한다. 양태들에서, DNA-표적화 서열은 "단일-가이드 RNA", 또는 "sgRNA"를 포함할 수 있는 단일 RNA 분자 (단일 RNA 폴리뉴클레오티드)일 수 있다. 양태들에서, DNA-표적화 서열은 가이드 RNA (gRNA)로서 언급되는 2개의 RNA 분자 (예: 2개의 sgRNA) (예를 들어, 결합 서열 (예: dCas9-결합 서열)에서 하이브리드화를 통해 함께 연합된 것을 포함한다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 표적 폴리뉴클레오티드 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 상보적이다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자의 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 상보적이다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자 서열에 결합한다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자의 서열에 대해 적어도 75% 상보적이다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자의 서열에 대해 적어도 80% 상보적이다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자 서열에 결합한다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자의 서열에 대해 적어도 85% 상보적이다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자 서열에 결합한다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자의 서열에 대해 적어도 90% 상보적이다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자 서열에 결합한다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자의 서열에 대해 적어도 95% 상보적이다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 세포 유전자 서열에 결합한다. 양태들에서, DNA-표적화 서열 (예: sgRNA)은 적어도 하나의 MS2 스템 루프를 포함한다. 구현예들에서, MS2 스템 루프는 서열 번호:19의 서열을 포함한다. 구현예들에서, MS2 스템 루프는 서열 번호:19의 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:19와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 갖는다.
본원에서 제공되는 바와 같은 "표적 폴리뉴클레오티드 서열"은 가이드 서열 (또는 DNA-표적화 서열)이 상보성을 갖도록 디자인된 세포 내에 존재하는 또는 그에 의해 발현되는 핵산 서열이며, 여기서 표적 서열과 가이드 서열 (또는 DNA-표적화 서열) 사이의 하이브리드화는 복합체 (예: CRISPR 복합체)의 형성을 촉진하다. 완전한 상보성이 필수적으로 요구되지는 않으며, 단 하이브리드화를 유발하고 복합체 (예: CRISPR 복합체)의 형성을 촉진하기에 충분한 상보성이 존재한다. 양태들에서, 표적 폴리뉴클레오티드 서열은 외생적 핵산 서열이다. 양태들에서, 표적 폴리뉴클레오티드 서열은 내생적 핵산 서열이다.
표적 폴리뉴클레오티드 서열은 에피게놈 편집에 적합한 폴리뉴클레오티드 (예: DNA 서열)의 임의의 영역일 수 있다. 양태들에서, 표적 폴리뉴클레오티드 서열은 유전자의 부분이다. 양태들에서, 표적 폴리뉴클레오티드 서열은 전사 조절 서열의 부분이다. 양태들에서, 표적 폴리뉴클레오티드 서열은 프로모터, 인핸서 또는 사일렌서의 부분이다. 양태들에서, 표적 폴리뉴클레오티드 서열은 프로모터의 부분이다. 양태들에서, 표적 폴리뉴클레오티드 서열은 인핸서의 부분이다. 양태들에서, 표적 폴리뉴클레오티드 서열은 사일렌서의 부분이다.
구현예들에서, 표적 폴리뉴클레오티드 서열은 과메틸화된 핵산 서열이다. "과메틸화된 핵산 서열"은 당업계의 표준 의미에 따라 본원에서 사용되며 시토신의 5-메틸시토신으로의 빈번한 메틸화 (예를 들어 CpG에서)를 지칭한다. 메틸 기의 빈도 또는 발생은 표준 대조군에 대한 것일 수 있다. 과메틸화는, 예를 들어, 각각, 비-암 세포에 대하여 암 (예를 들어, DNA 복구 또는 아팝토시스 경로에서)에서 나타날 수 있다. 따라서, 복합체는 정상적 (예를 들어, 비-질환 상태의) 메틸화 수준을 재확립하기에 유용할 수 있다.
구현예들에서, 표적 폴리뉴클레오티드 서열은 전사 출발 부위 내에 또는 그에 인접하여 있다. 양태들에서, 표적 폴리뉴클레오티드 서열은 전사 출발 부위를 플랭킹하는 약 3000, 2500, 2000, 1500, 500, 100, 80, 70, 60, 50, 40, 30, 20, 10개, 또는 그 미만의 염기 쌍 (bp) 내에 있다.
구현예들에서, 표적 폴리뉴클레오티드 서열은 프로모터 서열에, 그 근처에, 또는 그 안에 있다. 양태들에서, 표적 폴리뉴클레오티드 서열은 CpG 섬 내에 있다. 양태들에서, 표적 폴리뉴클레오티드 서열은 비-CpG 섬 내에 있다. 양태들에서, 표적 폴리뉴클레오티드 서열은 DNA 과메틸화 또는 저메틸화를 특징으로 하는 질환 또는 병태와 관련되는 것으로 공지되어 있다.
구현예들에서, 복합체는 폴리뉴클레오티드의 결합 서열의 결합 및 그에 의한 리보뉴클레오단백질 복합체의 형성을 통해 폴리뉴클레오티드에 결합된 dCas9이다. 양태들에서, 결합 서열은 헤어핀 구조를 형성한다. 양태들에서, 결합 서열은 길이가 10-200 nt, 15-150 nt, 20-140 nt, 30-100 nt이다.
구현예들에서, 결합 서열 (예: Cas9-결합 서열)은 Cas9 단백질 (예: dCas9 단백질)과 상호작용하거나 그에 결합하고, 이들은 함께 DNA-표적화 서열에 의해 인식된 표적 폴리뉴클레오티드 서열에 결합한다. 결합 서열 (예: Cas9-결합 서열)은 서로에 대해 하이브리드화되어 이중 가닥 RNA 듀플렉스 (dsRNA 듀플렉스)를 형성하는 뉴클레오티드의 2개의 상보적 스트레치를 포함한다. 뉴클레오티드의 이들 2개의 상보적 스트레치는 링커로서 공지된 개재 뉴클레오티드 또는 링커 뉴클레오티드 (예를 들어, 단일-분자 폴리뉴클레오티드의 경우)에 의해 공유 연결되고, 하이브리드화되어 결합 서열 (예: Cas9-결합 서열)의 이중 가닥 RNA 듀플렉스 (dsRNA 듀플렉스, 또는 "Cas9-결합 헤어핀")를 형성하고, 그에 따라 스템-루프 구조를 생성할 수 있다. 대안적으로, 일부 양태에서, 뉴클레오티드의 2개의 상보적 스트레치는 공유 연결되지 않을 수 있지만, 대신에 상보적 서열 (예: 2-분자 폴리뉴클레오티드) 사이의 하이브리드화에 의해 함께 유지된다.
결합 서열 (예: Cas9-결합 서열)은 10개 뉴클레오티드 내지 200개 뉴클레오티드, 예를 들어, 20개 뉴클레오티드 (nt) 내지 150 nt의 길이를 가질 수 있다. 양태들에서, 결합 서열은 80개 뉴클레오티드 (nt) 내지 100 nt의 길이를 갖는다. 결합 서열 (예: Cas9-결합 서열)의 dsRNA 듀플렉스는 6개 염기 쌍 (bp) 내지 200 bp의 길이를 가질 수 있다. 예를 들어, 결합 서열 (예: Cas9-결합 서열)의 dsRNA 듀플렉스는 6 bp 내지 200 bp, 10 bp 내지 180 bp, 10 bp 내지 150 bp, 80 bp 내지 100 bp 등의 길이를 가질 수 있다.
핵산 및 벡터
그의 구현예를 포함한 본원에 기재된 융합 단백질은, 당업계에 공지된 다양한 방법으로 세포로 전달될 수 있다. 융합 단백질은 바이러스 전달 방법의 필요성을 우회하여 일시적으로 발현될 수 있다. 융합 단백질은 변형된 또는 변형되지 않은 RNA 또는 플라스미드 DNA로서 세포로 전달된 RNA 또는 DNA 상에 인코딩될 수 있다. 단백질을 인코딩하는 RNA 또는 DNA는 트랜스펙션, 지질 나노입자, 바이러스 유사 입자 (VLP) 또는 바이러스에 의해 전달될 수 있다. 이론적으로, 단백질은 또한 트랜스펙션 또는 지질 나노입자 또는 VLP를 통해 직접 전달될 수 있다.
그의 구현예 및 양태를 포함한 본원에 기재된 융합 단백질은, 융합 단백질에 대해 코딩하는 핵산 서열로서 제공될 수 있다. 따라서, 하나의 양태에서는, 그의 구현예 및 양태를 포함한 본원에 기재된 융합 단백질을 인코딩하는 핵산 서열이 제공된다. 하나의 양태에서는, 그의 구현예 및 양태를 포함한 본원에 기재된 융합 단백질을 인코딩하는 핵산 서열 (DNA-표적화 서열 포함)이 제공된다. 양태들에서, 핵산 서열은, 본원에 기재된 특정 % 서열 동일성을 갖는 아미노산 서열을 갖는 융합 단백질을 포함한 본원에 기재된 융합 단백질에 대해 인코딩한다. 양태들에서, 핵산은 RNA이다. 양태들에서, 핵산은 메신저 RNA이다. 양태들에서, 융합 단백질은 DNA, mRNA, 단백질 또는 RNP로서 전달된다. RNP에 대하여 단백질은 dCas9이고 RNA는 sgRNA를 인코딩한다. 유사하게 sgRNA는 프로모터 및 sgRNA를 인코딩하는 DNA, 프로모터 및 sgRNA를 인코딩하는 RNA로서 전달될 수 있다. 양태들에서, 핵산 서열은 그의 구현예 및 양태를 포함한 본원에 기재된 융합 단백질에 대해 인코딩한다.
양태들에서, 그의 구현예를 포함한 본원에서 제공되는 융합 단백질 및 sgRNA 또는 cr:tracrRNA는 융합 단백질 및 sgRNA 또는 cr:tracrRNA에 대해 인코딩하는 단일 핵산으로서 제공될 수 있다. 양태들에서, 그의 구현예를 포함한 본원에서 제공되는 융합 단백질 및 sgRNA 또는 cr:tracrRNA는 융합 단백질 및 sgRNA 또는 cr:tracrRNA에 대해 인코딩하는 다중 핵산으로서 제공될 수 있다. 구현예들에서, 융합 단백질 및 sgRNA 또는 cr:tracrRNA는 별도의 전사체로서 제공된다.
하나의 양태에서는, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질을 인코딩하는 핵산이 제공된다.
하나의 양태에서는, sgRNA 또는 cr:tracrRNA를 인코딩하는 제2 핵산이 제공된다. 구현예들에서, sgRNA는 적어도 하나의 MS2 서열을 포함한다. 구현예들에서, sgRNA는 2개의 MS2 서열을 포함한다. 구현예들에서, 제2 핵산 서열은 MS2-RNA 결합 서열, 및 본원에서 제공되는 적어도 하나의 전사 활성화제를 추가로 인코딩한다.
하나의 양태에서는, 전사 활성화제를 인코딩하는 제3 핵산이 제공된다. 구현예들에서, 제3 핵산은 RNA-결합 서열 및 XTEN 링커를 추가로 인코딩한다. 구현예들에서, RNA-결합 서열은 MS2 RNA-결합 서열이다.
그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질을 인코딩하는 핵산 서열은 벡터 중에 포함될 수 있음이 추가로 고려된다. 따라서, 하나의 양태에서는, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 핵산 서열을 포함한 벡터가 제공된다. 양태들에서, 벡터는 본원에 기재된 특정 % 서열 동일성을 갖는 아미노산 서열을 갖는 융합 단백질을 포함한 본원에 기재된 융합 단백질에 대해 인코딩하는 핵산 서열을 포함한다. 양태들에서, 핵산은 메신저 RNA이다. 양태들에서, 메신저 RNA는 메신저 RNP이다.
구현예들에서, 벡터는 폴리뉴클레오티드를 추가로 포함하며, 여기서 폴리뉴클레오티드는 (1) 표적 폴리뉴클레오티드 서열에 대해 상보적인 DNA-표적화 서열; 및 (2) 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소에 대한 결합 서열을 포함한다. 양태들에서, 벡터는 폴리뉴클레오티드를 추가로 포함하며, 여기서 폴리뉴클레오티드는 sgRNA를 포함한다. 양태들에서, 벡터는 폴리뉴클레오티드를 추가로 포함하며, 여기서 폴리뉴클레오티드는 cr:tracrRNA를 포함한다. 따라서, 하나 이상의 벡터는 에피게놈 편집을 수행하기 위한 모든 필수적 성분을 포함할 수 있다.
세포
본원에 기재된 조성물은 세포 내에 혼입될 수 있다. 세포 내부에서, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 조성물은 에피게놈 편집을 수행할 수 있다. 따라서, 하나의 양태에서는, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 핵산, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 복합체, 또는 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 벡터를 포함한 세포가 제공된다. 양태들에서, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질을 포함한 세포가 제공된다. 양태들에서, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 핵산을 포함한 세포가 제공된다. 양태들에서, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 복합체를 포함한 세포가 제공된다. 양태들에서, 그의 구현예 및 양태를 포함한 본원에 기재된 바와 같은 벡터를 포함한 세포가 제공된다. 양태들에서, 세포는 진핵 세포이다.
양태들에서, 세포는 포유동물 세포이다. 구현예들에서, 포유동물 세포는 HEK293T 세포이다. 구현예들에서, 포유동물 세포는 T 세포이다. 구현예들에서, 포유동물 세포는 조혈 줄기 세포이다. 구현예들에서, 포유동물 세포는 유도 만능 줄기 세포이다. 구현예들에서, 포유동물 세포는 배아 줄기 세포이다.
방법
본원에 기재된 방법은 에피게놈 편집, 또한 보다 구체적으로 표적 핵산 서열 (예: 유전자)의 활성화 또는 재활성화를 제공하는 에피게놈 편집에 사용될 수 있음이 고려된다. 본원에서 제공되는 방법은 DNA 후생유전학적 코드 및 히스톤 코드의 다중 편집을 위한 하나 이상의 융합 단백질의 모집을 포함한다. 방법은 전사의 장기적이지만 가역적인 활성화를 가능하게 하며, 이전에 사일런싱된 유전자를 활성화하기 위해 사용될 수 있다. 본원에서 제공되는 방법은 치료 목적으로 사용될 수 있다. 예를 들어, 본원에서 제공되는 하나 이상의 융합 단백질의 모집은 네가티브 조절 서열의 편집에 의해 유전자 발현을 활성화할 수 있다. 이 방법은 유전자의 발현을 차단하는 서열의 편집에 사용될 수 있다.
본원에 기재된 융합 단백질은 시간에 따라 유전자 활성화의 내구성 있는 기억을 프로그래밍한다. 유전자 활성화 (또는 재활성화)는 본원에 기재된 융합 단백질을 인코딩하는 mRNA의 트랜스펙션에 의해 달성된다. 따라서, 융합 단백질의 일시적인 발현은 효과적인 유전자 활성화 (또는 재활성화)를 초래한다. 본원에 기재된 융합 단백질을 사용한 CRISPRon 후생유전학적 기억은 지속된 이식유전자 발현보다는 세포에 의해 전파된다.
구현예들에서, 개시내용은, (i) (예를 들어, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는) 그의 모든 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질을 인코딩하는 제1 폴리뉴클레오티드를, 표적 핵산을 함유하는 세포로 전달하는 단계; 및 (ii) (a) sgRNA 또는 (b) cr:tracrRNA를 포함하는 제2 폴리뉴클레오티드를 세포로 전달하고; 이로써 세포에서 표적 핵산 서열을 활성화하는 단계를 포함하는, 세포에서의 표적 핵산 서열의 활성화 방법을 제공한다. 구현예들에서, 제2 폴리뉴클레오티드는 sgRNA를 포함한다. 구현예들에서, sgRNA는 적어도 하나의 MS2 스템 루프를 포함한다. 구현예들에서, sgRNA는 2개의 MS2 스템 루프를 포함한다. 양태들에서, 표적 핵산 서열은 CpG 섬을 포함한다. 양태들에서, 표적 핵산 서열은 비-CpG 섬을 포함한다.
구현예들에서, 개시내용은, (예를 들어, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함하는) 그의 모든 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질을 인코딩하는 폴리뉴클레오티드를, 표적 핵산을 함유하는 세포로 전달하고; 이로써 세포에서 표적 핵산 서열을 활성화하는 것을 포함하는, 세포에서의 표적 핵산 서열의 활성화 방법을 제공한다. 양태들에서, 표적 핵산 서열은 CpG 섬을 포함한다. 양태들에서, 표적 핵산 서열은 비-CpG 섬을 포함한다.
구현예들에서, 개시내용은, (i) (예를 들어, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는) 그의 모든 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질을 인코딩하는 제1 폴리뉴클레오티드를, 사일런싱된 표적 핵산을 함유하는 세포로 전달하는 단계; 및 (ii) (a) sgRNA 또는 (b) cr:tracrRNA를 포함하는 제2 폴리뉴클레오티드를 세포로 전달하고; 이로써 세포에서 사일런싱된 표적 핵산 서열을 재활성화하는 단계를 포함하는, 세포에서의 사일런싱된 표적 핵산 서열의 재활성화 방법을 제공한다. 구현예들에서, 제2 폴리뉴클레오티드는 sgRNA를 포함한다. 구현예들에서, sgRNA는 적어도 하나의 MS2 스템 루프를 포함한다. 구현예들에서, sgRNA는 2개의 MS2 스템 루프를 포함한다. 양태들에서, 표적 핵산 서열은 CpG 섬을 포함한다. 양태들에서, 표적 핵산 서열은 비-CpG 섬을 포함한다.
구현예들에서, 개시내용은, (예를 들어, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함하는) 그의 모든 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질을 인코딩하는 폴리뉴클레오티드를, 표적 핵산을 함유하는 세포로 전달하고; 이로써 세포에서 표적 핵산 서열을 재활성화하는 것을 포함하는, 세포에서의 표적 핵산 서열의 재활성화 방법을 제공한다. 양태들에서, 표적 핵산 서열은 CpG 섬을 포함한다. 양태들에서, 표적 핵산 서열은 비-CpG 섬을 포함한다.
구현예들에서, 개시내용은, (i) (예를 들어, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는) 그의 모든 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질을 인코딩하는 폴리뉴클레오티드를, 표적 핵산을 함유하는 세포로 전달하며; 여기서 폴리뉴클레오티드는 (a) sgRNA 또는 (b) cr:tracrRNA를 추가로 인코딩하고; 이로써 세포에서 표적 핵산 서열을 활성화하는 것을 포함하는, 세포에서의 표적 핵산 서열의 활성화 방법을 제공한다. 구현예들에서, 폴리뉴클레오티드는 sgRNA를 포함한다. 구현예들에서, sgRNA는 적어도 하나의 MS2 스템 루프를 포함한다. 구현예들에서, sgRNA는 2개의 MS2 스템 루프를 포함한다. 양태들에서, 표적 핵산 서열은 CpG 섬을 포함한다. 양태들에서, 표적 핵산 서열은 비-CpG 섬을 포함한다.
구현예들에서, 개시내용은, (예를 들어, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는) 그의 모든 구현예 및 양태를 포함한 본원에 기재된 바와 같은 융합 단백질을 인코딩하는 폴리뉴클레오티드를, 사일런싱된 표적 핵산을 함유하는 세포로 전달하며; 여기서 폴리뉴클레오티드는 (a) sgRNA 또는 (b) cr:tracrRNA를 추가로 인코딩하고; 이로써 세포에서 사일런싱된 표적 핵산 서열을 재활성화하는 것을 포함하는, 세포에서의 사일런싱된 표적 핵산 서열의 재활성화 방법을 제공한다. 구현예들에서, 폴리뉴클레오티드는 sgRNA를 포함한다. 구현예들에서, sgRNA는 적어도 하나의 MS2 스템 루프를 포함한다. 구현예들에서, sgRNA는 2개의 MS2 스템 루프를 포함한다. 양태들에서, 표적 핵산 서열은 CpG 섬을 포함한다. 양태들에서, 표적 핵산 서열은 비-CpG 섬을 포함한다.
본원에 기재된 표적 핵산 서열의 활성화 또는 사일런싱된 표적 핵산 서열의 재활성화 방법에서, 표적 핵산은 CpG 섬 및 비-CpG 섬을 포함한다. "CpG 섬을 포함함" 또는 "비-CpG 섬을 포함함"은 각각 하나 이상의 CpG 섬 또는 비-CpG 섬을 지칭한다. 양태들에서, 표적 핵산 서열은 복수의 CpG 섬 (예: 2, 3, 4, 5개, 또는 그 초과의 CpG 섬)을 포함한다. 양태들에서, 표적 핵산 서열은 복수의 비-CpG 섬 (예: 2, 3, 4, 5개, 또는 그 초과의 비-CpG 섬)을 포함한다. 양태들에서, 표적 핵산 서열은 CpG 섬을 포함하지 않고 비-CpG 섬을 포함하지 않는다.
구현예들에서, MS2 스템 루프는 서열 번호:19의 서열을 포함한다. 구현예들에서, MS2 스템 루프는 서열 번호:19의 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:19와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:19와 적어도 85% 서열 동일성을 갖는 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:19와 적어도 90% 서열 동일성을 갖는 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:19와 적어도 95% 서열 동일성을 갖는 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:20과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:20과 적어도 85% 서열 동일성을 갖는 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:20과 적어도 90% 서열 동일성을 갖는 서열을 갖는다. 양태들에서, MS2 스템 루프는 서열 번호:20과 적어도 95% 서열 동일성을 갖는 서열을 갖는다.
구현예들에서, 제2 폴리뉴클레오티드는 전사 활성화제를 포함하는 제2 융합 단백질을 추가로 인코딩한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합이다. 구현예들에서, 전사 활성화제는 VP64이다. 구현예들에서, 전사 활성화제는 p65이다. 구현예들에서, 전사 활성화제는 Rta이다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64를 포함한다. 구현예들에서, 전사 활성화제는 p65를 포함한다. 구현예들에서, 전사 활성화제는 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 p65 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta를 포함한다.
구현예들에서, 제2 융합 단백질은 MS2 RNA-결합 서열을 포함한다. 구현예들에서, MS2 RNA-결합 서열은 MCP 단백질 또는 그의 기능적 단편을 포함한다.
구현예들에서, 방법은 전사 활성화제를 포함하는 제2 융합 단백질을 인코딩하는 제3 폴리뉴클레오티드를 세포로 전달하는 것을 추가로 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합이다. 구현예들에서, 전사 활성화제는 VP64이다. 구현예들에서, 전사 활성화제는 p65이다. 구현예들에서, 전사 활성화제는 Rta이다. 구현예들에서, 전사 활성화제는 VP64, p65, Rta, 또는 이들 둘 이상의 조합을 포함한다. 구현예들에서, 전사 활성화제는 VP64를 포함한다. 구현예들에서, 전사 활성화제는 p65를 포함한다. 구현예들에서, 전사 활성화제는 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 p65를 포함한다. 구현예들에서, 전사 활성화제는 VP64 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 p65 및 Rta를 포함한다. 구현예들에서, 전사 활성화제는 VP64, p65, 및 Rta를 포함한다.
본원에서 제공되는 방법에 대하여, 구현예들에서, 제2 융합 단백질은 XTEN 링커, 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함한다. 구현예들에서, 제2 융합 단백질은 XTEN 링커를 추가로 포함한다. 구현예들에서, 제2 융합 단백질은 에피토프 택을 추가로 포함한다. 구현예들에서, 제2 융합 단백질은 2A 펩티드를 추가로 포함한다. 구현예들에서, 제2 융합 단백질은 형광 단백질 택을 추가로 포함한다. 구현예들에서, 제2 융합 단백질은 핵 국소화 신호 펩티드를 추가로 포함한다.
용어 "CpG 섬"은 서로 인접한 뉴클레오티드 G 및 C (즉, CpG 디뉴클레오티드)의 높은 빈도를 갖는 핵산 내의 영역을 지칭하기 위해 그의 통상적 의미로 사용된다. 양태들에서, CpG 섬은 적어도 200개의 염기 쌍 및 50% 초과의 GC 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 초과인 핵산 서열의 영역을 지칭한다. 백분율 CpG는 길이에 대한 CpG 뉴클레오티드 염기 (CpG 카운트의 2배)의 비율이다. 관찰 대 예상 CpG의 비율은 하기 식에 따라 계산되며:
Obs/Exp CpG = CpG의 수 * N / (C의 수 * G의 수),
여기서 N = 서열의 길이이다. 하기 문헌 참조: Gardiner-Garden 등, Journal of Molecular Biology, 196(2):261-282 (1987)).
어구 "표적 핵산은 CpG 섬을 포함하지 않음" 또는 "CpG 섬을 포함하지 않는 표적 핵산" 또는 "비-CpG 섬"은, 그 용어가 본원에서 정의되는 바와 같은 "CpG 섬"을 함유하지 않는 표적 핵산을 지칭한다. 이 영역은 포유동물 (예: 인간) 게놈에 의해 인코딩되는 임의의 영역일 수 있다. 양태들에서, 어구 "표적 핵산은 CpG 섬을 포함하지 않음"은 서로 인접한 뉴클레오티드 G 및 C (즉, CpG 디뉴클레오티드)를 갖지 않는 또는 서로 인접한 뉴클레오티드 G 및 C의 낮은 빈도를 갖는 표적 핵산 내의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 50% 미만의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 미만인 영역을 갖는 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 50% 미만의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 50% 미만의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 50% 미만의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 50% 미만의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 45% 미만의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 55% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 40% 미만의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 50% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 1% 내지 45%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 1% 내지 45%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 55% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 1% 내지 45%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 50% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 5% 내지 40%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 5% 내지 40%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 55% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 5% 내지 40%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 50% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 10% 내지 40%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 60% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 10% 내지 40%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 55% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, 비-CpG 섬은 10% 내지 40%의 GC 디뉴클레오티드 함량을 가지며, 관찰-대-예상 CpG 비율이 50% 미만인 표적 핵산의 영역을 지칭한다. 양태들에서, CpG 섬을 포함하지 않는 표적 핵산은 200개 미만의 염기 쌍을 갖는다.
구현예 1-69.
구현예 1. N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질.
구현예 2. 탈메틸화 도메인이 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합인, 구현예 1의 융합 단백질.
구현예 3. 탈메틸화 도메인이 TET1 도메인인, 구현예 2의 융합 단백질.
구현예 4. TET1 도메인이 서열 번호:1, 서열 번호:86, 또는 서열 번호:97과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 구현예 2의 융합 단백질.
구현예 5. 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 dCas9, dCas12a, dCpf1, Cas-phi, 나선-회전-나선 모티프, 나선-루프-나선 도메인, HMB-박스 도메인, Wor3 도메인, OB-폴드 도메인, 면역글로불린 도메인, 또는 B3 도메인인, 구현예 1 내지 4 중 어느 하나의 융합 단백질.
구현예 6. 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 dCas9인, 구현예 5의 융합 단백질.
구현예 7. XTEN 링커가 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인, 구현예 1 내지 6 중 어느 하나의 융합 단백질.
구현예 8. XTEN 링커가 서열 번호:5, 서열 번호:6 또는 서열 번호:98과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 구현예 7의 융합 단백질.
구현예 9. 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함하는, 구현예 1 내지 8 중 어느 하나의 융합 단백질.
구현예 10. N-말단으로부터 C-말단까지, RNA-결합 서열, XTEN 링커, 및 적어도 하나의 전사 활성화제를 포함하는 융합 단백질.
구현예 11. 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인, 구현예 10의 융합 단백질.
구현예 12. p65가 서열 번호:13, 서열 번호:14, 또는 서열 번호:100과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 구현예 11의 융합 단백질.
구현예 13. Rta가 서열 번호:15 또는 서열 번호:16과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 구현예 11 또는 12의 융합 단백질.
구현예 14. VP64가 서열 번호:17 또는 서열 번호:18과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 구현예 11 내지 13 중 어느 하나의 융합 단백질.
구현예 15. RNA-결합 서열이 MS2 RNA-결합 서열인, 구현예 10 내지 14 중 어느 하나의 융합 단백질.
구현예 16. MS2 RNA-결합 서열이 서열 번호:21의 아미노산 서열을 포함하는 것인, 구현예 15의 융합 단백질.
구현예 17. XTEN 링커가 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인, 구현예 10 내지 16 중 어느 하나의 융합 단백질.
구현예 18. 서열 번호:104, 서열 번호:105, 서열 번호:106, 서열 번호:107, 서열 번호:108, 서열 번호:109, 또는 서열 번호:110과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는 구현예 10의 융합 단백질.
구현예 19. 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함하는 구현예 10 내지 18 중 어느 하나의 융합 단백질.
구현예 20. N-말단으로부터 C-말단까지, 탈메틸화 도메인, 제1 XTEN 링커, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소, 제2 XTEN 링커, 및 전사 활성화제를 포함하는 융합 단백질.
구현예 21. 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인, 구현예 20의 융합 단백질.
구현예 22. N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질.
구현예 23. 핵 국소화 서열을 추가로 포함하는 구현예 20 내지 22 중 어느 하나의 융합 단백질.
구현예 24. 탈메틸화 도메인이 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합인, 구현예 20 내지 23 중 어느 하나의 융합 단백질.
구현예 25. 탈메틸화 도메인이 TET1 도메인인, 구현예 24의 융합 단백질.
구현예 26. 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 dCas9, dCas12a, dCpf1, Cas-phi, 류신 지퍼 도메인, 날개형 나선 도메인, 나선-회전-나선 모티프, 나선-루프-나선 도메인, HMB-박스 도메인, Wor3 도메인, OB-폴드 도메인, 면역글로불린 도메인, 또는 B3 도메인인, 구현예 20 내지 25 중 어느 하나의 융합 단백질.
구현예 27. 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 dCas9인, 구현예 26의 융합 단백질.
구현예 28. 제1 XTEN 링커 및 제2 XTEN 링커가 각각 독립적으로 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인, 구현예 20 내지 27 중 어느 하나의 융합 단백질.
구현예 29. 에피토프 택, 2A 펩티드, 형광 단백질 택, 또는 이들 둘 이상의 조합을 추가로 포함하는 구현예 20 내지 28 중 어느 하나의 융합 단백질.
구현예 30. 서열 번호:99, 서열 번호:101, 서열 번호:102, 서열 번호:111, 서열 번호:112, 또는 서열 번호:113과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 융합 단백질.
구현예 31. 서열 번호:99, 서열 번호:101, 서열 번호:102, 서열 번호:111, 서열 번호:112, 또는 서열 번호:113과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 구현예 30의 융합 단백질.
구현예 32. 서열 번호:99, 서열 번호:101, 서열 번호:102, 서열 번호:111, 서열 번호:112, 또는 서열 번호:113을 포함하는 구현예 31의 융합 단백질.
구현예 33. (i) 구현예 1 내지 32 중 어느 하나의 융합 단백질을 인코딩하는 제1 폴리뉴클레오티드를 표적 핵산을 함유하는 세포로 전달하는 단계; 및 (ii) (a) sgRNA 또는 (b) cr:tracrRNA를 포함하는 제2 폴리뉴클레오티드를 세포로 전달하고; 이로써 세포에서 표적 핵산 서열을 활성화 또는 재활성화하는 단계를 포함하는, 세포에서의 표적 핵산 서열의 활성화 또는 재활성화 방법.
구현예 34. 표적 핵산 서열이 CpG 섬을 포함하는 것인, 구현예 32의 방법.
구현예 35. 표적 핵산 서열이 비-CpG 섬을 포함하는 것인, 구현예 32의 방법.
구현예 36. 제2 폴리뉴클레오티드가 sgRNA를 포함하는 것인, 구현예 32 내지 35 중 어느 하나의 방법.
구현예 37. sgRNA가 적어도 하나의 MS2 스템 루프를 포함하는 것인, 구현예 32 내지 36 중 어느 하나의 방법.
구현예 38. sgRNA가 2개의 MS2 스템 루프를 포함하는 것인, 구현예 37의 방법.
구현예 39. 제2 폴리뉴클레오티드가 전사 활성화제를 인코딩하는 것인, 구현예 32 내지 38 중 어느 하나의 방법.
구현예 40. 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인, 구현예 39의 방법.
구현예 41. 제2 폴리뉴클레오티드가 MS2 RNA-결합 서열을 추가로 인코딩하는 것인, 구현예 32 내지 40 중 어느 하나의 방법.
구현예 42. MS2 RNA-결합 서열이 서열 번호:21의 아미노산 서열을 포함하는 것인, 구현예 41의 방법.
구현예 43. 제2 폴리뉴클레오티드가 XTEN 링커, 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합에 대하여 추가로 인코딩하는 것인, 구현예 32 내지 42 중 어느 하나의 방법.
구현예 44. 전사 활성화제를 포함하는 제2 융합 단백질을 인코딩하는 제3 폴리뉴클레오티드를 세포로 전달하는 것을 추가로 포함하는, 구현예 32 내지 43 중 어느 하나의 방법.
구현예 45. 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인, 구현예 44의 방법.
구현예 46. 제2 융합 단백질이 MS2 RNA-결합 서열을 추가로 포함하는 것인, 구현예 44 또는 45의 방법.
구현예 47. MS2 RNA-결합 서열이 서열 번호:21의 아미노산 서열을 포함하는 것인, 구현예 46의 방법.
구현예 48. 제2 융합 단백질이 XTEN 링커, 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함하는 것인, 구현예 44 내지 47 중 어느 하나의 방법.
구현예 49. N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질.
구현예 50. 탈메틸화 도메인이 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합인, 구현예 49의 융합 단백질.
구현예 51. 탈메틸화 도메인이 TET1 도메인인, 구현예 49의 융합 단백질.
구현예 52. TET1 도메인이 서열 번호:1, 서열 번호:86, 또는 서열 번호:97과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 구현예 51의 융합 단백질.
구현예 53. 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소가 아연 핑거 도메인인, 구현예 49 내지 52 중 어느 하나의 융합 단백질.
구현예 54. 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소가 TALE인, 구현예 49 내지 52 중 어느 하나의 융합 단백질.
구현예 55. XTEN 링커가 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인, 구현예 49 내지 54 중 어느 하나의 융합 단백질.
구현예 56. XTEN 링커가 서열 번호:5, 서열 번호:6 또는 서열 번호:98과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 구현예 55의 융합 단백질.
구현예 57. 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함하는 구현예 49 내지 56 중 어느 하나의 융합 단백질.
구현예 58. N-말단으로부터 C-말단까지, 탈메틸화 도메인, 제1 XTEN 링커, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소, 제2 XTEN 링커, 및 전사 활성화제를 포함하는 융합 단백질.
구현예 59. 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인, 구현예 58의 융합 단백질.
구현예 60. N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질.
구현예 61. 핵 국소화 서열을 추가로 포함하는 구현예 58 내지 60 중 어느 하나의 융합 단백질.
구현예 62. 탈메틸화 도메인이 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합인, 구현예 58 내지 61 중 어느 하나의 융합 단백질.
구현예 63. 탈메틸화 도메인이 TET1 도메인인, 구현예 62의 융합 단백질.
구현예 64. 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소가 아연 핑거 도메인인, 구현예 58 내지 63 중 어느 하나의 융합 단백질.
구현예 65. 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소가 TALE인, 구현예 58 내지 63 중 어느 하나의 융합 단백질.
구현예 66. 제1 XTEN 링커 및 제2 XTEN 링커가 각각 독립적으로 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인, 구현예 58 내지 65 중 어느 하나의 융합 단백질.
구현예 67. 에피토프 택, 2A 펩티드, 형광 단백질 택, 또는 이들 둘 이상의 조합을 추가로 포함하는 구현예 58 내지 66 중 어느 하나의 융합 단백질.
구현예 68. 구현예 58 내지 67 중 어느 하나의 융합 단백질을 인코딩하는 폴리뉴클레오티드를 표적 핵산을 함유하는 세포로 전달하고; 이로써 세포에서 표적 핵산 서열을 활성화 또는 재활성화하는 것을 포함하는, 세포에서의 표적 핵산 서열의 활성화 또는 재활성화 방법.
구현예 69. 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인, 구현예 68의 방법.
실시예
본원에서의 구현예 및 양태를 하기 실시예에 의해 추가로 예시한다. 실시예는 단지 구현예 및 양태를 예시하도록 의도되며, 본원의 범위를 제한하는 것으로 해석되어선 안된다.
실시예 1
유전자 사일런싱은 표적화된 DNA 메틸화에 의해 가역적이다.
에피게놈 편집의 매력적인 특성은 인공 편집자에 의해 유도된 후생유전학적 변화를 역전시킬 수 있는 능력이다. CRISPRoff-매개된 유전자 사일런싱의 가역성을 시험하기 위해, 본 발명자들은 먼저 세포 분열 동안 DNA 메틸화 유지를 차단하는 전반적 방법을 활용하였다. 본 발명자들은 이전에 사일런싱된 H2B, CLTA, 또는 Snrpn-GFP를 갖는 HEK293T 세포에서 DNMT1 (포유동물 세포의 주요 DNA 메틸화 유지 효소)을 불활성화하기 위해 Cas9 유전자 편집을 사용하였다. DNMT1의 녹아웃 9일 후, 세포의 60-80%는 유전자 발현을 재활성화한다. 필수 유전자인 DNMT1의 손실은 눈에 띄는 세포독성 효과를 가지며 CRISPRoff-사일런싱된 유전자를 재활성화하는 실행가능한 방법으로서 DNMT1 녹아웃을 배제한다 (도 1). 유사하게, 5-aza-2'-데옥시시티딘 (5-aza-dC)인 DNMT1의 소분자 억제제로의 세포 처리는 CLTA 유전자 발현을 재활성화하였지만 DNMT1 녹아웃에 비해 효율은 더 낮았다 (도 2-3). 이들 결과는, DNA 메틸화의 결핍이 CRISPRoff 유전자 사일런싱을 역전시키기 위해 충분함을 입증한다. 따라서, 본 발명자들은 CRISPRoff-사일런싱된 유전자의 재활성화를 위한 유전자-특이적이고 프로그램가능한 도구를 조작하는 것을 추구하였다.
실시예 2
시토신-구아닌 다이애드(dyad) 내의 시토신의 DNA 메틸화는, 유전자 활성화를 위한 인간 유전자 프로모터의 프로그래밍가능 탈메틸화를 위해 용도가 변경된 TET (10-11 전좌) 패밀리 효소에 의해 능동적으로 제거될 수 있다. 본 발명자들은, 본 발명자들이 1년 초과 동안 사일런싱시킨 유전자, CLTA의 표적화된 DNA 탈메틸화에 의해 CRISPRoff-사일런싱된 유전자를 재활성화할 수 있는지의 여부를 시험하였다. 초기에, 본 발명들은 TET1 DNA 데메틸라제 촉매작용 도메인 (TETv1)에 대한 이전에 보고된 dCas9 융합을 사용하였다 (Liu 등, Cell, 167-233-247 (2016)). 본 발명자들은 CLTA 프로모터를 표적화하는 TETv1 및 sgRNA를 발현하는 플라스미드를 공동-트랜스펙션하고, 시간에 따라 CLTA 단백질 수준 (GFP)을 측정하였다. (도 4-5). 본 발명자들의 결과는 TETv1 재활성화된 유전자 발현에 의한 표적화된 DNA 탈메틸화를 입증하였지만, 트랜스펙션-후 28일에, 트랜스펙션된 세포의 단지 약 20%가 이전 연구에서 전형적인 가변적 재활성화와 일치하는 CLTA 발현을 유지한다. (도 6) 재활성화를 개선하기 위해, 본 발명자들은 dCas9와 TET1 사이의 XTEN 링커를 인코딩함으로써 융합 단백질을 최적화하고, dCas9의 N-말단에 TET1을 재배치하였다. 16개 아미노산 XTEN16 링커 (TETv3)와의 N-말단에서의 TET1의 배치는 CLTA 재활성화를 세포의 약 50%까지 개선하였다. 또한, 80개의 아미노산 XTEN80 링커 (TETv4)로의 TET1 및 dCas9의 분리는 세포의 70% 초과에서 안정적인 CLTA 재활성화를 제공하였다. CLTA 재활성화는 트랜스펙션-후 적어도 28일 동안 안정적이었다 (도 6-8). 유전자 재활성화는 하나의 sgRNA 서열로 TETv4-트랜스펙션된 세포의 최대 60%에서 달성되었지만, 유전자 프로모터에 걸쳐 3개의 sgRNA를 풀링함으로써 개선되었다 (도 7).
사일런싱된 유전자에 걸친 DNA 탈메틸화의 정도를 평가하기 위해, 본 발명자들은 dCas9-TET-매개된 재활성화 전과 후에 CLTA 자리의 비술파이트 시퀀싱을 수행하였다. 본 발명자들은, sgRNA 결합 부위의 하류 >400 bp를 포함한, CRISPRoff-매개된 사일런싱 후 전체 CLTA CGI를 따라 높은 수준의 DNA 메틸화를 관찰하였다. (도 9a-9b) TET1-매개된 유전자 재활성화 후, CGI는 CLTA 발현의 완전 재활성화와 상관되는 거의 완전한 상태로 탈메틸화된다 (도 9a).
본 발명자들은, CLTA 재활성화가 TET1 처리-후 9일에 출발하여 지속적으로 피크에 도달하고 안정화됨을 관찰하였다. (도 6). 본 발명자들은, TET1v4에 대한 전사 활성제 도메인의 모집에 의해 유전자 발현이 보다 조기 시점에 재활성화될 수 있다는 가설을 세웠다. 유전자 재활성화의 동역학을 변조하기 위한 노력으로, 본 발명자들은 전사 전이활성화제 도메인 VP64, p65 (p65-AD), 및 Rta의 다양한 조합에 융합된 TETv4, 이전에 보고된 2개의 MS2 줄기 서열을 인코딩하는 변형된 sgRNA, 및 MS2 코트 단백질 (MCP)로 구성된, CRISPRon이라 불리는 시스템을 디자인하였다 (Konermann 등, 2015a) (도 10-11). 본 발명자들은 먼저, dCas9 및 MCP-전이활성화제 융합 단백질의 공동-발현이 TET1의 부재 하에 유전자 발현을 증가시킬 수 있음을 확인하였고, 본 발명자들은 도메인을 MS2 코트 단백질 (MCP)에 융합시키고 MS2 루프를 인코딩하는 sgRNA로 내생적 발현된 CLTA의 프로모터에 대해 표적화된 dCas9에 대한 융합을 모집하였다. dCas9, MCP 융합, 및 sgRNA의 트랜스펙션 2일 후, 본 발명자들은 VPR 및 p65-Rta를 사용하여 최고 재활성화를 갖는 각각의 전이활성화제 조합으로 CLTA 유전자의 증가된 내생적 발현을 검출하였고 (도 12), 이는 이들 단백질이 전사 기계 모집에 있어 기능적임을 나타낸다.
이어서 본 발명자들은 CLTA 사일런싱된 세포에서 단지 TETv4 또는 다양한 CRISPRon 조합과 함께 CLTA-표적화 sgRNA (sg-A) 또는 네가티브 대조군 (NT)을 발현시키고, 시간에 따른 CLTA 발현을 모니터링하였다. 예상외로, 본 발명자들은, 선택 CRISPRon 조합, 예컨대 TETv4와 p65-Rta 및 TETv4와 VPR이, 2일 내에 CLTA 발현을 강건하게 재활성화시킴을 관찰하였다. 한편, TETv4는 이 시점에 유전자 재활성화를 거의 나타내지 않았다 (도 13 및 17). 본 발명자들은 다음으로 CRISPRoff-사일런싱된 CLTA 프로모터에 대하여 전이활성화제 및 TETv4를 공동-모집하였다. 트랜스펙션 2일 후, CLTA 발현은 단지 TETv4 및 전이활성화제의 존재 하에 재활성화된다 (도 13 및 14). 각각의 전이활성화제 조합은 단지 TETv4에 비해 2- 내지 46배 범위의 다양한 수준으로 재활성화된 CLTA를 갖는 세포의 분율을 증가시키며, VPR 및 p65-Rta는 최고 수준의 CLTA 발현을 끌어낸다. 트랜스펙션 후 8일까지, 단일부분 Rta 또는 VP64-p65의 모집은 다른 전이활성화제에 비해 재활성화된 세포의 분율에서 최고 증가를 제공한다 (도 14 및 15a). TETv4 및 sgRNA-공동활성화제는 이 시점에 세포에서 낮은 수준으로 존재하며 (세포의 <10%), 이는 p65-Rta 또는 VP64-p65와 TETv4를 사용한 재활성화된 유전자의 증가된 발현이 세포에 의해 유전되고 기억됨을 의미한다. 트랜스펙션-후 28일까지, 재활성화된 CLTA-GFP의 중간값 형광은 단지 TETv4에 비해 TETv4와 Rta 및 TETv4와 p65-Rta의 CRISPRon 조합에서 상당히 더 높았다 (도 15b). 본 발명자들은 이 시점에 TETv4 또는 MCP 융합 단백질 발현을 검출하지 않는다. 추가의 대조군으로서, 단일 융합 dCas9-VPR, 또는 dCas9와 MCP 전이활성화제 융합 (TET 없음)의 공동-발현은 단지 CLTA의 일시적인 활성화를 나타내었고, 트랜스펙션-후 10일까지, CLTA 수준은 사일런싱된 상태로 역전된다 (도 18). 종합하여, 이들 결과는, 본 발명자들의 최적화된 TET1-dCas9 융합 단백질이 전사 기억의 형태로 CRISPRoff-사일런싱된 유전자를 강건하게 재활성화시킬 수 있고, 재활성화의 역학이 본 발명자들의 CRISPRon 조합을 사용하여 추가로 변조될 수 있음을 보여준다. 종합하여, 이들 데이터는, CRISPRoff-사일런싱된 유전자의 재활성화의 역학을 변조하고, 히트-앤-런(hit-and-run) CRISPRa와 유사하게, 유전자 발현의 세포 기억을 인코딩하는 본 발명자들의 능력을 강조한다.
실시예 3
CpG 주석화가 없는 유전자의 사일런싱 및 재활성화
CRISPRoff가 주석화된 CGI 없이 유전자를 턴오프(turn off)할 수 있다는 본 발명자들의 관찰을 검증하기 위해, 본 발명자들은 mNeonGreen (mNG)으로 HEK293T에서 주석화된 CGI가 없는 5개의 유전자를 내생적으로 태깅하고 CRISPRoff에 의한 내구성 있는 사일런싱을 평가하였다. 트랜스펙션-후 9일에, 본 발명자들은 DYNC2LI1, LAMP2, MYL6, 및 VPS25를 턴오프한 높은 백분율의 세포를 검출한다. DYNC2LI1 및 LAMP2의 사일런싱은 트랜스펙션-후 14일 동안 안정적으로 남아 있고, MYL6 및 VPS25는 녹다운에 따라 세포 성장 결함을 나타내었다. CRISPRoff Dnmt3A 돌연변이체의 트랜스펙션은 유전자 사일런싱을 지속하지 않고, 따라서 관찰된 내구성 있는 표현형은 DNA 메틸화-의존적이다. 대조적으로, CALD1-mNG 세포로의 CRISPRoff 트랜스펙션은 CRISPRoff 또는 CRISPRoff 돌연변이체로 사일런싱을 일으키지 않았으며, 이는 유전자가 DNA 메틸화-의존적 히트-앤-런 에피게놈 편집에 적합하지 않음을 시사한다.
본 발명자들은 CRISPRoff에 의해 LAMP2, DYNC2LI1, 및 MYL6을 턴오프한 세포를 단리하였고, 비술파이트 시퀀싱에 의해 프로모터의 DNA 메틸화 상태를 프로파일링하였다. CG 컨텍스트 내의 시토신의 분석은 사일런싱된 세포에서 고도로 메틸화되었다. 또한, 본 발명자들은 DYNC2LI1 및 LAMP2-오프(off) 세포를 TETv4로 처리하였고, 세포의 약 70%가 TETv4의 트랜스펙션 후 14일까지 사일런싱된 유전자를 재활성화한다 (도 16).
실시예에서의 물질 및 방법
플라스미드 디자인 및 구축
TETv1 디자인을 Fuw-dCas9-Tet1CD (Addgene #84475)로부터의 dCas9-TET1CD 서열의 PCR 증폭에 의해 구축하였고 CAG-발현 플라스미드로 조립하였다. XTEN 링커 서열은 이전에 공개되었다 (Schellenberger 등). 모든 CRISPRoff 및 TET1 융합 단백질은 유동 세포계측에 의해 트랜스펙션 효율을 측정하도록 BFP를 직접 융합으로서 또는 P2A-절단 서열과 함께 포함한다. dSaCas9 (D10A, N508A) 서열은 pX603 (Addgene #61594)으로부터 PCR 증폭되었고, dLbCas12a 서열은 Tak 등로부터 PCR 증폭되었다. VP64, p65, 및 Rta는 SP-dCas9-VPR (Addgene #63798)로부터 PCR 증폭되었다. GAPDH-Snrpn-GFP 렌티바이러스 리포터는 Addgene #70148로부터 유래되었다 (Liu 등, 2016; Stelzer 등, 2015).
sgRNA 플라스미드를, 이전에 기재된 바와 같이, BstXI 및 BlpI 절단 부위를 사용하여 U6 프로모터 하류의 프로토스페이서의 제한 클로닝에 의해 구축하였다. sgRNA 발현 플라스미드는 또한 트랜스펙션 효율을 측정하도록 T2A-mCherry 마커를 발현한다. CRISPRoff 및 CRISPRon 실험에 사용된 sgRNA 서열은 표 1에 열거되어 있다. sgRNA 서열은 활성 CRISPRi sgRNA를 예측하기 위한 본 발명자들의 이전 알고리즘에 기초하여 선택하였다 (Horlbeck 등, 2016).
먼저 mU6 프로모터-sgRNA-EF1a-퓨로마이신-T2A-mCherry 카세트를 제한 클로닝에 의해 비-렌티바이러스 벡터로 전이시킴으로써 MS2 플라스미드를 구축하였다. MCP-XTEN80-NLS-(전이활성화제 도메인)-2xP2A 카세트는 4개의 gBlocks (IDT)로 주문되었고 Gibson 어셈블리에 의해 상기 언급된 비-렌티바이러스 플라스미드로 클로닝되었다. sgRNA-MS2 루프 서열은 본 발명자들의 이전 mU6 sgRNA 발현 디자인 (Addgene #84832)으로부터 통합된 BstXI 및 BlpI 제한 부위를 갖는 SAM 시스템 (Konermann 등, 2015b)에 기초하여 디자인하였다. MS2-sgRNA 스캐폴드를 인코딩하는 DNA 서열은 서열 번호:117이다. 전이활성화제 플라스미드의 구축을 위해, 각각의 도메인 또는 도메인의 조합을 PCR 증폭시키고 Gibson 어셈블리에 의해 sgRNA 및 MS2 코트 단백질 (MCP)을 인코딩하는 플라스미드로 클로닝하였다. 가이드 서열은 이전에 기재된 바와 같이 이중 분해(digest) 및 어닐링된 올리고의 결찰에 의해 클로닝하였다.
모든 mRNA 구축물은 mMESSAGE mMachineTM T7 울트라 전사 키트 (Thermo Fisher Scientific)를 사용하여 합성하였다. T7 프로모터 서열 (서열 번호:118)을 먼저 CRISPRoff 서열의 상류에서 클로닝하였다. T7-CRISPRoff 서열을 PCR 증폭시키고 시험관내 합성 반응을 위한 템플레이트로서 사용하였다. 합성을 위한 제조업체 프로토콜에 따라, 반응물을 클로로포름 추출 및 이소프로판올 침전에 의해 세정하였다.
세포 배양, DNA 트랜스펙션, 및 유동 세포계측
모든 세포 라인을 5% CO2 조직 배양 인큐베이터로 37℃에서 배양하였다. HEK293T (암컷), HeLa (암컷), 및 U2OS (암컷) 세포를 10% FBS (HyClone), 100 단위/mL 스트렙토마이신, 100 μg/ml 페니실린, 및 2 mM 글루타민 중에서 둘베코 변형 이글 배지 (DMEM)에서 배양하였다. K562 (암컷) 세포를 25 mM HEPES 및 10% FBS 중 2.0 g/L NaHCo3, 2 mM 글루타민, 100 단위/mL 스트렙토마이신, 및 100 mg/mL 페니실린과 RPMI-1640 중에서 유지하였다. WTC Gen1c iPSC (수컷)를 성장 인자-감소된 Matrigel (BD Biosciences) 상에서 무공급(feeder-free) 조건 하에 mTESR 배지 (STEMCELL Technologies)에서 배양하였다. 세포를 Accutase (STEMCELL Technologies)를 사용하여 패시징하고 p16-Rho-관련 코일드-코일(coiled-coil) 키나제 (ROCK) 억제제 Y-27632 (10 μM; Selleckchem)가 보충된 mTESR 배지로 Matrigel 코팅된 플레이트에 시딩하였다.
TransIT-LT1 트랜스펙션 시약 (Mirus, MIR2306)을 사용하여 표준 패키징 벡터를 HEK293T로 트랜스펙션함으로써 렌티바이러스 입자를 생성하였다. 배지를 15 mM HEPES가 보충된 완전 DMEM으로 트랜스펙션-후 24시간에 교체하였다. 바이러스 상청액을 트랜스펙션 48-60시간 후에 수확하고, 0.45 μm PVDF 시린지 필터를 통해 여과하였다. 렌티바이러스 감염은 폴리브렌 (8 μg/ml)을 포함하였다.
CRISPRon
모든 CRISPRon 실험을 24-웰 플레이트에서 수행하였다. 요약하면, 1x105 CLTA-GFP-사일런싱된 HEK293T 세포를 각각의 웰에서 시딩하였다. 다음날 세포가 60-80% 컨플루언시(confluency)에 도달하면, 세포를 500 ng의 dCas9 플라스미드 (dCas9 또는 TETv1-4) 및 300 ng의 sgRNA-전이활성화제 플라스미드 (단지 sgRNA, VP64, p65, Rta, VP64-p65, p65-Rta, 또는 VPR)로 트랜스펙션하였다. 세포를 트랜스펙션 24시간 후 BFP (dCas9 또는 TETv1-4) 및 mCherry (가이드-전이활성화제) 발현에 대해 모니터링하였다. 트랜스펙션-후 2일에, BD FACSAria 융합 선별기를 사용하여 7.5x104 BFP 및 mCherry 이중 포지티브 세포를 선별하였다. 세포를 선별 후 4일 동안 회수시키고 이어서 Attune NxT 세포계측기 (Thermo Fisher Scientific) 상에서 유동 세포계측을 사용하여 2-3일마다 분석하였다. 모든 유동 세포계측 데이터는 Flowjo를 사용하여 분석하였다.
RNA 시퀀싱
표적 유전자의 안정적인 사일런싱을 유지한 HEK293T 세포를 CRISPRoff 트랜스펙션 후 33일 (ITGB1, CD81, 및 CD151 ) 또는 28일 (CLTA, HIST2H2BE, RAB11A, 및 VIM)에 수확하였다. 세포를 PBS로 플레이트로부터 제거하고, 500 × g로 5 min 동안 원심분리하고, 다시 PBS로 세척하였다. 총 RNA를 Direct-zol RNA MiniPrep (Zymo R2051)을 사용하여 추출하였다. 1000 ng 총 RNA로부터 출발하여, TruSeq 가닥 mRNA 라이브러리 준비 키트 (Illumina RS-111-2101)를 사용하여 라이브러리 준비를 수행하였다. 최종 라이브러리를 2100 Bioanalyzer (Agilent)를 사용하여 평가하고, Qubit dsDNA HS 검정 키트 (Thermo Fisher Scientific)를 사용하여 정량화하고, HiSeq 4000 (Illumina) 상에서 단일 말단 50개의 염기 쌍 판독으로 시퀀싱하였다. 시퀀싱 판독을 처리하기 위해, FASTX-클리퍼 (FASTX-Toolkit)를 사용하여 링커 서열 (서열 번호:119)을 제거하였다. 이어서 Gencode Gene V24lift37 전사체 주석화에 대하여 STAR (Spliced Transcripts Alignment to a Reference, 버전 2.5) 정렬기를 사용하여 판독값을 인간 게놈 (GRCh37)에 대해 정렬하였다. 판독 정량화를 featureCounts (Liao 등, 2014)로 수행하였다. 모든 하류 분석은 Numpy (v1.12.1), Pandas (v0.17.1), 및 Scipy (v0.17.0) 라이브러리의 조합을 사용하여 Python (버전 2.7)으로 수행하였다. 실험 샘플에 대한 백만 당 유전자 전사 (TPM)를 대조군 (비-표적화) 샘플의 평균 TPM으로 정규화함으로써 녹다운 효율을 계산하였다. DESeq2 (Love 등, 2014)를 사용하여 차등 발현 분석을 수행하였다.
정량적 PCR
정량적 PCR (qPCR) 측정을 위해, 세포로부터 RNeasy 마이크로 키트 (Qiagen)를 사용하여 총 RNA를 먼저 추출하였다. RNaseOutTM 재조합 리보뉴클레아제 억제제 (Thermo Fisher Scientific)가 보충된 SuperscriptTM III 역전사효소 키트 (Thermo Fisher Scientific)를 사용하여 1 μg 총 RNA의 역전사를 수행하였다. 올리고(dT)20을 사용하여 역전사를 프라이밍하였다. KAPA SYBR FAST qPCR 마스터 믹스 (2X)로 정량적 PCR 반응을 준비하고, LightCycler 480 기기 (Roche) 상에서 실행시켰다. qPCR 실험을 위한 프라이머 서열이 표 2에 열거되어 있다.
비술파이트 시퀀싱 PCR
CLTA CGI의 메틸화 분석을 위해, ~2x106 CRISPRoff-사일런싱된 세포 및 TET-재활성화된 세포를 FACS에 의해 단리하였다. PureLink 게놈 DNA 미니 키트 (Invitrogen)를 사용하여 제조업체의 지시에 따라 세포로부터 게놈 DNA를 추출하였다. 각각의 조건에 대하여, EpiTect 비술파이트 키트 (Qiagen)를 사용하여 제조업체의 지시에 따라 1 ug 게놈 DNA를 비술파이트 전환 및 클린업에 적용하였다. 중첩된(nested) PCR 방법 (Liu 등, 2016)과 함께 EpiMark Hot Start Taq (NEB)를 사용하여 정제된 비술파이트-전환된 DNA를 증폭시켰다. 겔 DNA 회수 키트 (Zymo)를 사용하여 앰플리콘을 겔 정제하고, EpiMark Hot Start Taq를 사용하여 다시 PCR 증폭시켰다. TOPO TA 클로닝 키트 (Invitrogen)를 사용하여 제조업체의 지시에 따라 앰플리콘을 pCR2.1 TOPO 벡터로 클로닝하였다. 클로닝 생성물을 Stellar 대장균(E. coli) 세포 (Takara)로 형질전환시키고, 청백색 카르베니실린 플레이트 상에 플레이팅하였다. 조건 당 20개의 콜로니를 선택하고 Sanger 시퀀싱에 의해 시퀀싱하였다. 비술파이트-PCR 증폭을 위한 프라이머 서열이 표 2에 열거되어 있다. GAPDH-Snrpn 단편의 증폭을 위한 프라이머 서열은 Liu 등로부터 얻었다.
Cas9 게놈 편집 및 5-aza-dC 처리
에스. 프요게네스로부터의 Cas9를 발현하는 렌티바이러스 입자를, CRISPRoff-사일런싱된 Snrpn-GFP 또는 GFP-태깅된 CLTA 및 H2B를 갖는 HEK293T 세포로 형질도입하였다. 렌티바이러스 벡터에서 BFP 형광에 의해 마킹된 Cas9-발현 세포를 FACS-선별하였다. 불활성 DNMT1에 대하여, DNMT1을 표적화하는 sgRNA를 발현하는 렌티바이러스 입자를 세포 라인으로 감염시켰다. 사일런싱된 유전자의 재활성화를 GFP 활성화에 의해 평가하고, 유동 세포계측에 의해 측정하였다. 최종 시점은 sgRNA 감염 9일 후에 취하였는데, 이는 세포 생존능이 이 시점을 지나면서 심하게 감소하였기 때문이다.
5-aza-dC 처리를 위해, 1x105 CRISPRoff-사일런싱된 CLTA-GFP HEK293T 세포를 24-웰 플레이트의 각각의 웰에 시딩하였다. 24시간 후, 배지를 흡인하고, 웰 당 500 ml의 최종 부피에 대해 수성 5-아자-2'-데옥시시티딘 (5-aza-dC)이 보충된 배지로 교체하였다. 다음날, 5-aza-dC-함유 배지를 흡인하고, 세포를 탈착시키고, Attune NxT 유동 세포계측기 (Thermo Fisher Scientific) 상에서 생존능 및 GFP 활성화에 대해 분석하였다. 이어서 세포를 2-3일마다 신선한 배지로 패시징하고 Attune 세포계측기 상에서 분석하였다.
본 발명의 다양한 구현예 및 양태를 본원에 나타내고 기재하였지만, 이러한 구현예 및 양태는 단지 예로서 제공된 것임이 당업자에게 명백할 것이다. 이제 본 발명으로부터 벗어나지 않는 수많은 변형, 변화, 및 치환이 당업자에게 나타날 것이다. 본원에 기재된 본 발명의 구현예에 대한 다양한 대안이 본 발명의 실행에서 사용될 수 있음이 이해되어야 한다.
본원에서 사용된 섹션 제목은 단지 조직적 목적을 위한 것이며 기재된 주제를 제한하는 것으로 해석되어선 안된다. 제한 없이, 특허, 특허 출원, 기사, 서적, 매뉴얼, 및 논문을 포함한, 본 출원에서 인용된 모든 문헌, 또는 문헌의 부분은 임의의 목적상 명시적으로 그 전체가 본원에 참조로 포함된다.
참조문헌
비공식 서열 목록
본원에 열거된 서열에서, 당업자는 번역을 개시하기 위해 단백질의 N-말단 상에 메티오닌 (M)이 존재할 수 있음을 인지할 것이다. 따라서, 본원에 기재된 서열은 임의로 N-말단 상에 메티오논을 추가로 포함할 수 있다.
서열 번호: 1 = TET1 (UniProt: Q8NFU7)
서열 번호: 2 = TET2 (UniProt Q6N021)
서열 번호:3 = TET3 (Uniprot O43151)
서열 번호:4 (SV40 NLS)
서열 번호:5 (XTEN16 (16개 아미노산 서열))
서열 번호:6 (XTEN80 (80개 아미노산 서열))
서열 번호:7 (HA 택)
서열 번호:8 (BFP)
서열 번호:9 (dCas9)
서열 번호:10 (ddAsCfp1)
서열 번호:11 (ddLbCfp1)
서열 번호:12 (ddFnCfp1)
서열 번호:13 (p65; UniProt: Q04206)
서열 번호:14 (p65; Addgene으로부터)
서열 번호:15 (Rta; Addgene으로부터)
서열 번호:16 (Rta; UniProt P03209)
서열 번호: 17 (VP64; Addgene으로부터)
서열 번호: 18 (전장 외피 단백질 VP16; VP64; UniProt P06492)
서열 번호:19 (MS2 스템 루프 1)
서열 번호:20 (MS2 스템 루프 2)
서열 번호:21 (MS2 코트 단백질 (MCP))
서열 번호: 86 (TET1 촉매작용 도메인 (TET1CD))
서열 번호:97
(TET1)
서열 번호:98
XTEN100
서열 번호:99
융합 단백질 JKNp146
서열 번호:99는 하기 서열 번호 및 스페이서를 포함한다:
97-98-9-6-GSG-4-AGS-15-ASGSG-4; 여기서 GSG, AGS, 및 ASGSG는 펩티드 링커임.
서열 번호:100
(p65)
서열 번호:101
융합 단백질 JKNp147
서열 번호:101은 하기 서열 번호 및 스페이서를 포함한다:
97-98-9-6-GSG-4-AGS-100-GSGSGS-15-ASGSG-4; 여기서 GSG, AGS, GSGSGS, 및 ASGSG는 펩티드 링커임.
서열 번호:102
융합 단백질 GCP21
서열 번호:102는 하기 서열 번호 및 스페이서를 포함한다:
97-98-9-GGGGS-4-D-4-D-4; 여기서 GGGGS, D, 및 D는 펩티드 링커임.
서열 번호:103 - JKNp84: dCas9-TET1
서열 번호:103은 하기 서열 번호 및 스페이서를 포함한다:
9-GGGGS-4-D-4-D-4-GS-86; 여기서 GGGGS, D, D, 및 GS는 펩티드 링커임.
서열 번호:104 = GCPp3: MCP-XTEN80-VP64
서열 번호:104는 하기 서열 번호 및 스페이서를 포함한다:
21-6-GSG-4-AGS-17-ASGSGPKKKRKV; 여기서 GSG, AGS, 및 ASGSGPKKKRKV는 펩티드 링커임.
서열 번호:105 = GCPp4: MCP-XTEN80-VP64-p65
서열 번호:105는 하기 서열 번호 및 스페이서를 포함한다:
21-6-GSG-4-AGS-17-INSRSSGS-4-G-100-ASGSG-4; 여기서 GSG, AGS, INSRSSGS, G, 및 ASGSG는 펩티드 링커임.
서열 번호:106 = GCPp5: MCP-XTEN80-VP64-p65p-Rta
서열 번호:106은 하기 서열 번호 및 스페이서를 포함한다:
21-6-GSG-4-AGS-17-INSRSSGS-4-G-100-GSGSGS-15-ASGSG-4; 여기서 GSG, AGS, INSRSSGS, G, GSGSGS, 및 ASGSG는 펩티드 링커임.
서열 번호:107 = GCPp6: MCP-XTEN80-p65
서열 번호:107은 하기 서열 번호 및 스페이서를 포함한다:
21-6-GSG-4-AGS-100-ASGSG-4; 여기서 GSG, AGS, 및 ASGSG는 펩티드 링커임.
서열 번호:108 = GCPp7: MCP-XTEN80-Rta
서열 번호:108은 하기 서열 번호 및 스페이서를 포함한다:
21-6-GSG-4-AGS-15-ASGSG-4; 여기서 GSG, AGS, 및 ASGSG는 펩티드 링커임.
서열 번호:109 = GCPp8: MCP-XTEN80-p65-Rta
서열 번호:109는 하기 서열 번호 및 스페이서를 포함한다:
21-6-GSG-4-AGS-100-GSGSGS-15-ASGSG-4; 여기서 GSG, AGS, GSGSGS, 및 ASGSG는 펩티드 링커임.
서열 번호:110 = GCPp9: MCP-XTEN80-NLS
서열 번호:110은 하기 서열 번호 및 스페이서를 포함한다:
21-6-GSG-4-AGSASGSG-4; 여기서 GSG 및 AGSASGSG는 펩티드 링커임.
서열 번호:111 = GCPp11: dCas9-XTEN16-TET1
서열 번호:111은 하기 서열 번호 및 스페이서를 포함한다:
9-GGGGS-4-D-4-D-4-G-5-86; 여기서 GGGGS, D, D, 및 G는 펩티드 링커임.
서열 번호:112 = GCPp16: TET1-XTEN16-dCas9
서열 번호:112는 하기 서열 번호 및 스페이서를 포함한다:
97-5-9-GGGGS-4-D-4-D-4; 여기서 GGGGS, D, 및 D는 펩티드 링커임.
서열 번호:113 = GCP20: TET1-XTEN80-dCas9
서열 번호:113은 하기 서열 번호 및 스페이서를 포함한다:
97-6-9-GGGGS-4-D-4-D-4; 여기서 GGGGS, D, 및 D는 펩티드 링커임.
서열 번호:114
서열 번호:115
서열 번호:116
서열 번호:117
(MS2-sgRNA 스캐폴드를 인코딩하는 DNA 서열)
서열 번호:118
(T7 프로모터 서열)
서열 번호:119
SEQUENCE LISTING
<110> The Regents of the University of California
<120> COMPOSITIONS AND METHODS FOR EPIGENOME EDITING
<130> 048536-690001WO
<140> PCT/US21/35937
<141> 2021-06-04
<150> US 63/118,832
<151> 2020-11-27
<150> US 63/035,431
<151> 2020-06-05
<160> 120
<170> PatentIn version 3.5
<210> 1
<211> 2136
<212> PRT
<213> Homo sapiens
<400> 1
Met Ser Arg Ser Arg His Ala Arg Pro Ser Arg Leu Val Arg Lys Glu
1 5 10 15
Asp Val Asn Lys Lys Lys Lys Asn Ser Gln Leu Arg Lys Thr Thr Lys
20 25 30
Gly Ala Asn Lys Asn Val Ala Ser Val Lys Thr Leu Ser Pro Gly Lys
35 40 45
Leu Lys Gln Leu Ile Gln Glu Arg Asp Val Lys Lys Lys Thr Glu Pro
50 55 60
Lys Pro Pro Val Pro Val Arg Ser Leu Leu Thr Arg Ala Gly Ala Ala
65 70 75 80
Arg Met Asn Leu Asp Arg Thr Glu Val Leu Phe Gln Asn Pro Glu Ser
85 90 95
Leu Thr Cys Asn Gly Phe Thr Met Ala Leu Arg Ser Thr Ser Leu Ser
100 105 110
Arg Arg Leu Ser Gln Pro Pro Leu Val Val Ala Lys Ser Lys Lys Val
115 120 125
Pro Leu Ser Lys Gly Leu Glu Lys Gln His Asp Cys Asp Tyr Lys Ile
130 135 140
Leu Pro Ala Leu Gly Val Lys His Ser Glu Asn Asp Ser Val Pro Met
145 150 155 160
Gln Asp Thr Gln Val Leu Pro Asp Ile Glu Thr Leu Ile Gly Val Gln
165 170 175
Asn Pro Ser Leu Leu Lys Gly Lys Ser Gln Glu Thr Thr Gln Phe Trp
180 185 190
Ser Gln Arg Val Glu Asp Ser Lys Ile Asn Ile Pro Thr His Ser Gly
195 200 205
Pro Ala Ala Glu Ile Leu Pro Gly Pro Leu Glu Gly Thr Arg Cys Gly
210 215 220
Glu Gly Leu Phe Ser Glu Glu Thr Leu Asn Asp Thr Ser Gly Ser Pro
225 230 235 240
Lys Met Phe Ala Gln Asp Thr Val Cys Ala Pro Phe Pro Gln Arg Ala
245 250 255
Thr Pro Lys Val Thr Ser Gln Gly Asn Pro Ser Ile Gln Leu Glu Glu
260 265 270
Leu Gly Ser Arg Val Glu Ser Leu Lys Leu Ser Asp Ser Tyr Leu Asp
275 280 285
Pro Ile Lys Ser Glu His Asp Cys Tyr Pro Thr Ser Ser Leu Asn Lys
290 295 300
Val Ile Pro Asp Leu Asn Leu Arg Asn Cys Leu Ala Leu Gly Gly Ser
305 310 315 320
Thr Ser Pro Thr Ser Val Ile Lys Phe Leu Leu Ala Gly Ser Lys Gln
325 330 335
Ala Thr Leu Gly Ala Lys Pro Asp His Gln Glu Ala Phe Glu Ala Thr
340 345 350
Ala Asn Gln Gln Glu Val Ser Asp Thr Thr Ser Phe Leu Gly Gln Ala
355 360 365
Phe Gly Ala Ile Pro His Gln Trp Glu Leu Pro Gly Ala Asp Pro Val
370 375 380
His Gly Glu Ala Leu Gly Glu Thr Pro Asp Leu Pro Glu Ile Pro Gly
385 390 395 400
Ala Ile Pro Val Gln Gly Glu Val Phe Gly Thr Ile Leu Asp Gln Gln
405 410 415
Glu Thr Leu Gly Met Ser Gly Ser Val Val Pro Asp Leu Pro Val Phe
420 425 430
Leu Pro Val Pro Pro Asn Pro Ile Ala Thr Phe Asn Ala Pro Ser Lys
435 440 445
Trp Pro Glu Pro Gln Ser Thr Val Ser Tyr Gly Leu Ala Val Gln Gly
450 455 460
Ala Ile Gln Ile Leu Pro Leu Gly Ser Gly His Thr Pro Gln Ser Ser
465 470 475 480
Ser Asn Ser Glu Lys Asn Ser Leu Pro Pro Val Met Ala Ile Ser Asn
485 490 495
Val Glu Asn Glu Lys Gln Val His Ile Ser Phe Leu Pro Ala Asn Thr
500 505 510
Gln Gly Phe Pro Leu Ala Pro Glu Arg Gly Leu Phe His Ala Ser Leu
515 520 525
Gly Ile Ala Gln Leu Ser Gln Ala Gly Pro Ser Lys Ser Asp Arg Gly
530 535 540
Ser Ser Gln Val Ser Val Thr Ser Thr Val His Val Val Asn Thr Thr
545 550 555 560
Val Val Thr Met Pro Val Pro Met Val Ser Thr Ser Ser Ser Ser Tyr
565 570 575
Thr Thr Leu Leu Pro Thr Leu Glu Lys Lys Lys Arg Lys Arg Cys Gly
580 585 590
Val Cys Glu Pro Cys Gln Gln Lys Thr Asn Cys Gly Glu Cys Thr Tyr
595 600 605
Cys Lys Asn Arg Lys Asn Ser His Gln Ile Cys Lys Lys Arg Lys Cys
610 615 620
Glu Glu Leu Lys Lys Lys Pro Ser Val Val Val Pro Leu Glu Val Ile
625 630 635 640
Lys Glu Asn Lys Arg Pro Gln Arg Glu Lys Lys Pro Lys Val Leu Lys
645 650 655
Ala Asp Phe Asp Asn Lys Pro Val Asn Gly Pro Lys Ser Glu Ser Met
660 665 670
Asp Tyr Ser Arg Cys Gly His Gly Glu Glu Gln Lys Leu Glu Leu Asn
675 680 685
Pro His Thr Val Glu Asn Val Thr Lys Asn Glu Asp Ser Met Thr Gly
690 695 700
Ile Glu Val Glu Lys Trp Thr Gln Asn Lys Lys Ser Gln Leu Thr Asp
705 710 715 720
His Val Lys Gly Asp Phe Ser Ala Asn Val Pro Glu Ala Glu Lys Ser
725 730 735
Lys Asn Ser Glu Val Asp Lys Lys Arg Thr Lys Ser Pro Lys Leu Phe
740 745 750
Val Gln Thr Val Arg Asn Gly Ile Lys His Val His Cys Leu Pro Ala
755 760 765
Glu Thr Asn Val Ser Phe Lys Lys Phe Asn Ile Glu Glu Phe Gly Lys
770 775 780
Thr Leu Glu Asn Asn Ser Tyr Lys Phe Leu Lys Asp Thr Ala Asn His
785 790 795 800
Lys Asn Ala Met Ser Ser Val Ala Thr Asp Met Ser Cys Asp His Leu
805 810 815
Lys Gly Arg Ser Asn Val Leu Val Phe Gln Gln Pro Gly Phe Asn Cys
820 825 830
Ser Ser Ile Pro His Ser Ser His Ser Ile Ile Asn His His Ala Ser
835 840 845
Ile His Asn Glu Gly Asp Gln Pro Lys Thr Pro Glu Asn Ile Pro Ser
850 855 860
Lys Glu Pro Lys Asp Gly Ser Pro Val Gln Pro Ser Leu Leu Ser Leu
865 870 875 880
Met Lys Asp Arg Arg Leu Thr Leu Glu Gln Val Val Ala Ile Glu Ala
885 890 895
Leu Thr Gln Leu Ser Glu Ala Pro Ser Glu Asn Ser Ser Pro Ser Lys
900 905 910
Ser Glu Lys Asp Glu Glu Ser Glu Gln Arg Thr Ala Ser Leu Leu Asn
915 920 925
Ser Cys Lys Ala Ile Leu Tyr Thr Val Arg Lys Asp Leu Gln Asp Pro
930 935 940
Asn Leu Gln Gly Glu Pro Pro Lys Leu Asn His Cys Pro Ser Leu Glu
945 950 955 960
Lys Gln Ser Ser Cys Asn Thr Val Val Phe Asn Gly Gln Thr Thr Thr
965 970 975
Leu Ser Asn Ser His Ile Asn Ser Ala Thr Asn Gln Ala Ser Thr Lys
980 985 990
Ser His Glu Tyr Ser Lys Val Thr Asn Ser Leu Ser Leu Phe Ile Pro
995 1000 1005
Lys Ser Asn Ser Ser Lys Ile Asp Thr Asn Lys Ser Ile Ala Gln
1010 1015 1020
Gly Ile Ile Thr Leu Asp Asn Cys Ser Asn Asp Leu His Gln Leu
1025 1030 1035
Pro Pro Arg Asn Asn Glu Val Glu Tyr Cys Asn Gln Leu Leu Asp
1040 1045 1050
Ser Ser Lys Lys Leu Asp Ser Asp Asp Leu Ser Cys Gln Asp Ala
1055 1060 1065
Thr His Thr Gln Ile Glu Glu Asp Val Ala Thr Gln Leu Thr Gln
1070 1075 1080
Leu Ala Ser Ile Ile Lys Ile Asn Tyr Ile Lys Pro Glu Asp Lys
1085 1090 1095
Lys Val Glu Ser Thr Pro Thr Ser Leu Val Thr Cys Asn Val Gln
1100 1105 1110
Gln Lys Tyr Asn Gln Glu Lys Gly Thr Ile Gln Gln Lys Pro Pro
1115 1120 1125
Ser Ser Val His Asn Asn His Gly Ser Ser Leu Thr Lys Gln Lys
1130 1135 1140
Asn Pro Thr Gln Lys Lys Thr Lys Ser Thr Pro Ser Arg Asp Arg
1145 1150 1155
Arg Lys Lys Lys Pro Thr Val Val Ser Tyr Gln Glu Asn Asp Arg
1160 1165 1170
Gln Lys Trp Glu Lys Leu Ser Tyr Met Tyr Gly Thr Ile Cys Asp
1175 1180 1185
Ile Trp Ile Ala Ser Lys Phe Gln Asn Phe Gly Gln Phe Cys Pro
1190 1195 1200
His Asp Phe Pro Thr Val Phe Gly Lys Ile Ser Ser Ser Thr Lys
1205 1210 1215
Ile Trp Lys Pro Leu Ala Gln Thr Arg Ser Ile Met Gln Pro Lys
1220 1225 1230
Thr Val Phe Pro Pro Leu Thr Gln Ile Lys Leu Gln Arg Tyr Pro
1235 1240 1245
Glu Ser Ala Glu Glu Lys Val Lys Val Glu Pro Leu Asp Ser Leu
1250 1255 1260
Ser Leu Phe His Leu Lys Thr Glu Ser Asn Gly Lys Ala Phe Thr
1265 1270 1275
Asp Lys Ala Tyr Asn Ser Gln Val Gln Leu Thr Val Asn Ala Asn
1280 1285 1290
Gln Lys Ala His Pro Leu Thr Gln Pro Ser Ser Pro Pro Asn Gln
1295 1300 1305
Cys Ala Asn Val Met Ala Gly Asp Asp Gln Ile Arg Phe Gln Gln
1310 1315 1320
Val Val Lys Glu Gln Leu Met His Gln Arg Leu Pro Thr Leu Pro
1325 1330 1335
Gly Ile Ser His Glu Thr Pro Leu Pro Glu Ser Ala Leu Thr Leu
1340 1345 1350
Arg Asn Val Asn Val Val Cys Ser Gly Gly Ile Thr Val Val Ser
1355 1360 1365
Thr Lys Ser Glu Glu Glu Val Cys Ser Ser Ser Phe Gly Thr Ser
1370 1375 1380
Glu Phe Ser Thr Val Asp Ser Ala Gln Lys Asn Phe Asn Asp Tyr
1385 1390 1395
Ala Met Asn Phe Phe Thr Asn Pro Thr Lys Asn Leu Val Ser Ile
1400 1405 1410
Thr Lys Asp Ser Glu Leu Pro Thr Cys Ser Cys Leu Asp Arg Val
1415 1420 1425
Ile Gln Lys Asp Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly
1430 1435 1440
Pro Ser Val Ala Ala Val Arg Glu Ile Met Glu Asn Arg Tyr Gly
1445 1450 1455
Gln Lys Gly Asn Ala Ile Arg Ile Glu Ile Val Val Tyr Thr Gly
1460 1465 1470
Lys Glu Gly Lys Ser Ser His Gly Cys Pro Ile Ala Lys Trp Val
1475 1480 1485
Leu Arg Arg Ser Ser Asp Glu Glu Lys Val Leu Cys Leu Val Arg
1490 1495 1500
Gln Arg Thr Gly His His Cys Pro Thr Ala Val Met Val Val Leu
1505 1510 1515
Ile Met Val Trp Asp Gly Ile Pro Leu Pro Met Ala Asp Arg Leu
1520 1525 1530
Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr Asn Gly His Pro
1535 1540 1545
Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr Cys Thr Cys
1550 1555 1560
Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser Phe Gly
1565 1570 1575
Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg Ser
1580 1585 1590
Pro Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His
1595 1600 1605
Glu Lys Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu
1610 1615 1620
Ala Pro Ile Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln
1625 1630 1635
Val Glu Tyr Glu Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys
1640 1645 1650
Glu Gly Arg Pro Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys
1655 1660 1665
Ala His Pro His Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr
1670 1675 1680
Val Val Cys Thr Leu Thr Arg Glu Asp Asn Arg Ser Leu Gly Val
1685 1690 1695
Ile Pro Gln Asp Glu Gln Leu His Val Leu Pro Leu Tyr Lys Leu
1700 1705 1710
Ser Asp Thr Asp Glu Phe Gly Ser Lys Glu Gly Met Glu Ala Lys
1715 1720 1725
Ile Lys Ser Gly Ala Ile Glu Val Leu Ala Pro Arg Arg Lys Lys
1730 1735 1740
Arg Thr Cys Phe Thr Gln Pro Val Pro Arg Ser Gly Lys Lys Arg
1745 1750 1755
Ala Ala Met Met Thr Glu Val Leu Ala His Lys Ile Arg Ala Val
1760 1765 1770
Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys Asn Asn Ser Thr
1775 1780 1785
Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr Leu Gly Ser
1790 1795 1800
Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr Glu Pro
1805 1810 1815
His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser Leu
1820 1825 1830
Met Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe
1835 1840 1845
Ser Trp Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys
1850 1855 1860
Asn Asp Ala Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr
1865 1870 1875
Pro His Cys Thr Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala
1880 1885 1890
Ala Ala Ala Asp Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala
1895 1900 1905
Pro Leu Pro Thr Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn
1910 1915 1920
Ser Glu Pro Ser Thr Gly Val Thr Glu Pro Leu Thr Pro His Gln
1925 1930 1935
Pro Asn His Gln Pro Ser Phe Leu Thr Ser Pro Gln Asp Leu Ala
1940 1945 1950
Ser Ser Pro Met Glu Glu Asp Glu Gln His Ser Glu Ala Asp Glu
1955 1960 1965
Pro Pro Ser Asp Glu Pro Leu Ser Asp Asp Pro Leu Ser Pro Ala
1970 1975 1980
Glu Glu Lys Leu Pro His Ile Asp Glu Tyr Trp Ser Asp Ser Glu
1985 1990 1995
His Ile Phe Leu Asp Ala Asn Ile Gly Gly Val Ala Ile Ala Pro
2000 2005 2010
Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg Arg Glu Leu His
2015 2020 2025
Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His Pro Thr Arg
2030 2035 2040
Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys Pro Gln
2045 2050 2055
His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu Ala
2060 2065 2070
Lys Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala
2075 2080 2085
Asn Glu Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln
2090 2095 2100
Ile Pro Ser His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val
2105 2110 2115
Thr Val Ser Pro Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn
2120 2125 2130
His Trp Val
2135
<210> 2
<211> 1942
<212> PRT
<213> Homo sapiens
<400> 2
Tyr Gly Ile Pro Cys Met Lys Gly Ser Gln Asn Ser Arg Val Ser Pro
1 5 10 15
Asp Phe Thr Gln Glu Ser Arg Gly Tyr Ser Lys Cys Leu Gln Asn Gly
20 25 30
Gly Ile Lys Arg Thr Val Ser Glu Pro Ser Leu Ser Gly Leu Leu Gln
35 40 45
Ile Lys Lys Leu Lys Gln Asp Gln Lys Ala Asn Gly Glu Arg Arg Asn
50 55 60
Phe Gly Val Ser Gln Glu Arg Asn Pro Gly Glu Ser Ser Gln Pro Asn
65 70 75 80
Val Ser Asp Leu Ser Asp Lys Lys Glu Ser Val Ser Ser Val Ala Gln
85 90 95
Glu Asn Ala Val Lys Asp Phe Thr Ser Phe Ser Thr His Asn Cys Ser
100 105 110
Gly Pro Glu Asn Pro Glu Leu Gln Ile Leu Asn Glu Gln Glu Gly Lys
115 120 125
Ser Ala Asn Tyr His Asp Lys Asn Ile Val Leu Leu Lys Asn Lys Ala
130 135 140
Val Leu Met Pro Asn Gly Ala Thr Val Ser Ala Ser Ser Val Glu His
145 150 155 160
Thr His Gly Glu Leu Leu Glu Lys Thr Leu Ser Gln Tyr Tyr Pro Asp
165 170 175
Cys Val Ser Ile Ala Val Gln Lys Thr Thr Ser His Ile Asn Ala Ile
180 185 190
Asn Ser Gln Ala Thr Asn Glu Leu Ser Cys Glu Ile Thr His Pro Ser
195 200 205
His Thr Ser Gly Gln Ile Asn Ser Ala Gln Thr Ser Asn Ser Glu Leu
210 215 220
Pro Pro Lys Pro Ala Ala Val Val Ser Glu Ala Cys Asp Ala Asp Asp
225 230 235 240
Ala Asp Asn Ala Ser Lys Leu Ala Ala Met Leu Asn Thr Cys Ser Phe
245 250 255
Gln Lys Pro Glu Gln Leu Gln Gln Gln Lys Ser Val Phe Glu Ile Cys
260 265 270
Pro Ser Pro Ala Glu Asn Asn Ile Gln Gly Thr Thr Lys Leu Ala Ser
275 280 285
Gly Glu Glu Phe Cys Ser Gly Ser Ser Ser Asn Leu Gln Ala Pro Gly
290 295 300
Gly Ser Ser Glu Arg Tyr Leu Lys Gln Asn Glu Met Asn Gly Ala Tyr
305 310 315 320
Phe Lys Gln Ser Ser Val Phe Thr Lys Asp Ser Phe Ser Ala Thr Thr
325 330 335
Thr Pro Pro Pro Pro Ser Gln Leu Leu Leu Ser Pro Pro Pro Pro Leu
340 345 350
Pro Gln Val Pro Gln Leu Pro Ser Glu Gly Lys Ser Thr Leu Asn Gly
355 360 365
Gly Val Leu Glu Glu His His His Tyr Pro Asn Gln Ser Asn Thr Thr
370 375 380
Leu Leu Arg Glu Val Lys Ile Glu Gly Lys Pro Glu Ala Pro Pro Ser
385 390 395 400
Gln Ser Pro Asn Pro Ser Thr His Val Cys Ser Pro Ser Pro Met Leu
405 410 415
Ser Glu Arg Pro Gln Asn Asn Cys Val Asn Arg Asn Asp Ile Gln Thr
420 425 430
Ala Gly Thr Met Thr Val Pro Leu Cys Ser Glu Lys Thr Arg Pro Met
435 440 445
Ser Glu His Leu Lys His Asn Pro Pro Ile Phe Gly Ser Ser Gly Glu
450 455 460
Leu Gln Asp Asn Cys Gln Gln Leu Met Arg Asn Lys Glu Gln Glu Ile
465 470 475 480
Leu Lys Gly Arg Asp Lys Glu Gln Thr Arg Asp Leu Val Pro Pro Thr
485 490 495
Gln His Tyr Leu Lys Pro Gly Trp Ile Glu Leu Lys Ala Pro Arg Phe
500 505 510
His Gln Ala Glu Ser His Leu Lys Arg Asn Glu Ala Ser Leu Pro Ser
515 520 525
Ile Leu Gln Tyr Gln Pro Asn Leu Ser Asn Gln Met Thr Ser Lys Gln
530 535 540
Tyr Thr Gly Asn Ser Asn Met Pro Gly Gly Leu Pro Arg Gln Ala Tyr
545 550 555 560
Thr Gln Lys Thr Thr Gln Leu Glu His Lys Ser Gln Met Tyr Gln Val
565 570 575
Glu Met Asn Gln Gly Gln Ser Gln Gly Thr Val Asp Gln His Leu Gln
580 585 590
Phe Gln Lys Pro Ser His Gln Val His Phe Ser Lys Thr Asp His Leu
595 600 605
Pro Lys Ala His Val Gln Ser Leu Cys Gly Thr Arg Phe His Phe Gln
610 615 620
Gln Arg Ala Asp Ser Gln Thr Glu Lys Leu Met Ser Pro Val Leu Lys
625 630 635 640
Gln His Leu Asn Gln Gln Ala Ser Glu Thr Glu Pro Phe Ser Asn Ser
645 650 655
His Leu Leu Gln His Lys Pro His Lys Gln Ala Ala Gln Thr Gln Pro
660 665 670
Ser Gln Ser Ser His Leu Pro Gln Asn Gln Gln Gln Gln Gln Lys Leu
675 680 685
Gln Ile Lys Asn Lys Glu Glu Ile Leu Gln Thr Phe Pro His Pro Gln
690 695 700
Ser Asn Asn Asp Gln Gln Arg Glu Gly Ser Phe Phe Gly Gln Thr Lys
705 710 715 720
Val Glu Glu Cys Phe His Gly Glu Asn Gln Tyr Ser Lys Ser Ser Glu
725 730 735
Phe Glu Thr His Asn Val Gln Met Gly Leu Glu Glu Val Gln Asn Ile
740 745 750
Asn Arg Arg Asn Ser Pro Tyr Ser Gln Thr Met Lys Ser Ser Ala Cys
755 760 765
Lys Ile Gln Val Ser Cys Ser Asn Asn Thr His Leu Val Ser Glu Asn
770 775 780
Lys Glu Gln Thr Thr His Pro Glu Leu Phe Ala Gly Asn Lys Thr Gln
785 790 795 800
Asn Leu His His Met Gln Tyr Phe Pro Asn Asn Val Ile Pro Lys Gln
805 810 815
Asp Leu Leu His Arg Cys Phe Gln Glu Gln Glu Gln Lys Ser Gln Gln
820 825 830
Ala Ser Val Leu Gln Gly Tyr Lys Asn Arg Asn Gln Asp Met Ser Gly
835 840 845
Gln Gln Ala Ala Gln Leu Ala Gln Gln Arg Tyr Leu Ile His Asn His
850 855 860
Ala Asn Val Phe Pro Val Pro Asp Gln Gly Gly Ser His Thr Gln Thr
865 870 875 880
Pro Pro Gln Lys Asp Thr Gln Lys His Ala Ala Leu Arg Trp His Leu
885 890 895
Leu Gln Lys Gln Glu Gln Gln Gln Thr Gln Gln Pro Gln Thr Glu Ser
900 905 910
Cys His Ser Gln Met His Arg Pro Ile Lys Val Glu Pro Gly Cys Lys
915 920 925
Pro His Ala Cys Met His Thr Ala Pro Pro Glu Asn Lys Thr Trp Lys
930 935 940
Lys Val Thr Lys Gln Glu Asn Pro Pro Ala Ser Cys Asp Asn Val Gln
945 950 955 960
Gln Lys Ser Ile Ile Glu Thr Met Glu Gln His Leu Lys Gln Phe His
965 970 975
Ala Lys Ser Leu Phe Asp His Lys Ala Leu Thr Leu Lys Ser Gln Lys
980 985 990
Gln Val Lys Val Glu Met Ser Gly Pro Val Thr Val Leu Thr Arg Gln
995 1000 1005
Thr Thr Ala Ala Glu Leu Asp Ser His Thr Pro Ala Leu Glu Gln
1010 1015 1020
Gln Thr Thr Ser Ser Glu Lys Thr Pro Thr Lys Arg Thr Ala Ala
1025 1030 1035
Ser Val Leu Asn Asn Phe Ile Glu Ser Pro Ser Lys Leu Leu Asp
1040 1045 1050
Thr Pro Ile Lys Asn Leu Leu Asp Thr Pro Val Lys Thr Gln Tyr
1055 1060 1065
Asp Phe Pro Ser Cys Arg Cys Val Glu Gln Ile Ile Glu Lys Asp
1070 1075 1080
Glu Gly Pro Phe Tyr Thr His Leu Gly Ala Gly Pro Asn Val Ala
1085 1090 1095
Ala Ile Arg Glu Ile Met Glu Glu Arg Phe Gly Gln Lys Gly Lys
1100 1105 1110
Ala Ile Arg Ile Glu Arg Val Ile Tyr Thr Gly Lys Glu Gly Lys
1115 1120 1125
Ser Ser Gln Gly Cys Pro Ile Ala Lys Trp Val Val Arg Arg Ser
1130 1135 1140
Ser Ser Glu Glu Lys Leu Leu Cys Leu Val Arg Glu Arg Ala Gly
1145 1150 1155
His Thr Cys Glu Ala Ala Val Ile Val Ile Leu Ile Leu Val Trp
1160 1165 1170
Glu Gly Ile Pro Leu Ser Leu Ala Asp Lys Leu Tyr Ser Glu Leu
1175 1180 1185
Thr Glu Thr Leu Arg Lys Tyr Gly Thr Leu Thr Asn Arg Arg Cys
1190 1195 1200
Ala Leu Asn Glu Glu Arg Thr Cys Ala Cys Gln Gly Leu Asp Pro
1205 1210 1215
Glu Thr Cys Gly Ala Ser Phe Ser Phe Gly Cys Ser Trp Ser Met
1220 1225 1230
Tyr Tyr Asn Gly Cys Lys Phe Ala Arg Ser Lys Ile Pro Arg Lys
1235 1240 1245
Phe Lys Leu Leu Gly Asp Asp Pro Lys Glu Glu Glu Lys Leu Glu
1250 1255 1260
Ser His Leu Gln Asn Leu Ser Thr Leu Met Ala Pro Thr Tyr Lys
1265 1270 1275
Lys Leu Ala Pro Asp Ala Tyr Asn Asn Gln Ile Glu Tyr Glu His
1280 1285 1290
Arg Ala Pro Glu Cys Arg Leu Gly Leu Lys Glu Gly Arg Pro Phe
1295 1300 1305
Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Ala His Arg
1310 1315 1320
Asp Leu His Asn Met Gln Asn Gly Ser Thr Leu Val Cys Thr Leu
1325 1330 1335
Thr Arg Glu Asp Asn Arg Glu Phe Gly Gly Lys Pro Glu Asp Glu
1340 1345 1350
Gln Leu His Val Leu Pro Leu Tyr Lys Val Ser Asp Val Asp Glu
1355 1360 1365
Phe Gly Ser Val Glu Ala Gln Glu Glu Lys Lys Arg Ser Gly Ala
1370 1375 1380
Ile Gln Val Leu Ser Ser Phe Arg Arg Lys Val Arg Met Leu Ala
1385 1390 1395
Glu Pro Val Lys Thr Cys Arg Gln Arg Lys Leu Glu Ala Lys Lys
1400 1405 1410
Ala Ala Ala Glu Lys Leu Ser Ser Leu Glu Asn Ser Ser Asn Lys
1415 1420 1425
Asn Glu Lys Glu Lys Ser Ala Pro Ser Arg Thr Lys Gln Thr Glu
1430 1435 1440
Asn Ala Ser Gln Ala Lys Gln Leu Ala Glu Leu Leu Arg Leu Ser
1445 1450 1455
Gly Pro Val Met Gln Gln Ser Gln Gln Pro Gln Pro Leu Gln Lys
1460 1465 1470
Gln Pro Pro Gln Pro Gln Gln Gln Gln Arg Pro Gln Gln Gln Gln
1475 1480 1485
Pro His His Pro Gln Thr Glu Ser Val Asn Ser Tyr Ser Ala Ser
1490 1495 1500
Gly Ser Thr Asn Pro Tyr Met Arg Arg Pro Asn Pro Val Ser Pro
1505 1510 1515
Tyr Pro Asn Ser Ser His Thr Ser Asp Ile Tyr Gly Ser Thr Ser
1520 1525 1530
Pro Met Asn Phe Tyr Ser Thr Ser Ser Gln Ala Ala Gly Ser Tyr
1535 1540 1545
Leu Asn Ser Ser Asn Pro Met Asn Pro Tyr Pro Gly Leu Leu Asn
1550 1555 1560
Gln Asn Thr Gln Tyr Pro Ser Tyr Gln Cys Asn Gly Asn Leu Ser
1565 1570 1575
Val Asp Asn Cys Ser Pro Tyr Leu Gly Ser Tyr Ser Pro Gln Ser
1580 1585 1590
Gln Pro Met Asp Leu Tyr Arg Tyr Pro Ser Gln Asp Pro Leu Ser
1595 1600 1605
Lys Leu Ser Leu Pro Pro Ile His Thr Leu Tyr Gln Pro Arg Phe
1610 1615 1620
Gly Asn Ser Gln Ser Phe Thr Ser Lys Tyr Leu Gly Tyr Gly Asn
1625 1630 1635
Gln Asn Met Gln Gly Asp Gly Phe Ser Ser Cys Thr Ile Arg Pro
1640 1645 1650
Asn Val His His Val Gly Lys Leu Pro Pro Tyr Pro Thr His Glu
1655 1660 1665
Met Asp Gly His Phe Met Gly Ala Thr Ser Arg Leu Pro Pro Asn
1670 1675 1680
Leu Ser Asn Pro Asn Met Asp Tyr Lys Asn Gly Glu His His Ser
1685 1690 1695
Pro Ser His Ile Ile His Asn Tyr Ser Ala Ala Pro Gly Met Phe
1700 1705 1710
Asn Ser Ser Leu His Ala Leu His Leu Gln Asn Lys Glu Asn Asp
1715 1720 1725
Met Leu Ser His Thr Ala Asn Gly Leu Ser Lys Met Leu Pro Ala
1730 1735 1740
Leu Asn His Asp Arg Thr Ala Cys Val Gln Gly Gly Leu His Lys
1745 1750 1755
Leu Ser Asp Ala Asn Gly Gln Glu Lys Gln Pro Leu Ala Leu Val
1760 1765 1770
Gln Gly Val Ala Ser Gly Ala Glu Asp Asn Asp Glu Val Trp Ser
1775 1780 1785
Asp Ser Glu Gln Ser Phe Leu Asp Pro Asp Ile Gly Gly Val Ala
1790 1795 1800
Val Ala Pro Thr His Gly Ser Ile Leu Ile Glu Cys Ala Lys Arg
1805 1810 1815
Glu Leu His Ala Thr Thr Pro Leu Lys Asn Pro Asn Arg Asn His
1820 1825 1830
Pro Thr Arg Ile Ser Leu Val Phe Tyr Gln His Lys Ser Met Asn
1835 1840 1845
Glu Pro Lys His Gly Leu Ala Leu Trp Glu Ala Lys Met Ala Glu
1850 1855 1860
Lys Ala Arg Glu Lys Glu Glu Glu Cys Glu Lys Tyr Gly Pro Asp
1865 1870 1875
Tyr Val Pro Gln Lys Ser His Gly Lys Lys Val Lys Arg Glu Pro
1880 1885 1890
Ala Glu Pro His Glu Thr Ser Glu Pro Thr Tyr Leu Arg Phe Ile
1895 1900 1905
Lys Ser Leu Ala Glu Arg Thr Met Ser Val Thr Thr Asp Ser Thr
1910 1915 1920
Val Thr Thr Ser Pro Tyr Ala Phe Thr Arg Val Thr Gly Pro Tyr
1925 1930 1935
Asn Arg Tyr Ile
1940
<210> 3
<211> 1795
<212> PRT
<213> Homo sapiens
<400> 3
Met Ser Gln Phe Gln Val Pro Leu Ala Val Gln Pro Asp Leu Pro Gly
1 5 10 15
Leu Tyr Asp Phe Pro Gln Arg Gln Val Met Val Gly Ser Phe Pro Gly
20 25 30
Ser Gly Leu Ser Met Ala Gly Ser Glu Ser Gln Leu Arg Gly Gly Gly
35 40 45
Asp Gly Arg Lys Lys Arg Lys Arg Cys Gly Thr Cys Glu Pro Cys Arg
50 55 60
Arg Leu Glu Asn Cys Gly Ala Cys Thr Ser Cys Thr Asn Arg Arg Thr
65 70 75 80
His Gln Ile Cys Lys Leu Arg Lys Cys Glu Val Leu Lys Lys Lys Val
85 90 95
Gly Leu Leu Lys Glu Val Glu Ile Lys Ala Gly Glu Gly Ala Gly Pro
100 105 110
Trp Gly Gln Gly Ala Ala Val Lys Thr Gly Ser Glu Leu Ser Pro Val
115 120 125
Asp Gly Pro Val Pro Gly Gln Met Asp Ser Gly Pro Val Tyr His Gly
130 135 140
Asp Ser Arg Gln Leu Ser Ala Ser Gly Val Pro Val Asn Gly Ala Arg
145 150 155 160
Glu Pro Ala Gly Pro Ser Leu Leu Gly Thr Gly Gly Pro Trp Arg Val
165 170 175
Asp Gln Lys Pro Asp Trp Glu Ala Ala Pro Gly Pro Ala His Thr Ala
180 185 190
Arg Leu Glu Asp Ala His Asp Leu Val Ala Phe Ser Ala Val Ala Glu
195 200 205
Ala Val Ser Ser Tyr Gly Ala Leu Ser Thr Arg Leu Tyr Glu Thr Phe
210 215 220
Asn Arg Glu Met Ser Arg Glu Ala Gly Asn Asn Ser Arg Gly Pro Arg
225 230 235 240
Pro Gly Pro Glu Gly Cys Ser Ala Gly Ser Glu Asp Leu Asp Thr Leu
245 250 255
Gln Thr Ala Leu Ala Leu Ala Arg His Gly Met Lys Pro Pro Asn Cys
260 265 270
Asn Cys Asp Gly Pro Glu Cys Pro Asp Tyr Leu Glu Trp Leu Glu Gly
275 280 285
Lys Ile Lys Ser Val Val Met Glu Gly Gly Glu Glu Arg Pro Arg Leu
290 295 300
Pro Gly Pro Leu Pro Pro Gly Glu Ala Gly Leu Pro Ala Pro Ser Thr
305 310 315 320
Arg Pro Leu Leu Ser Ser Glu Val Pro Gln Ile Ser Pro Gln Glu Gly
325 330 335
Leu Pro Leu Ser Gln Ser Ala Leu Ser Ile Ala Lys Glu Lys Asn Ile
340 345 350
Ser Leu Gln Thr Ala Ile Ala Ile Glu Ala Leu Thr Gln Leu Ser Ser
355 360 365
Ala Leu Pro Gln Pro Ser His Ser Thr Pro Gln Ala Ser Cys Pro Leu
370 375 380
Pro Glu Ala Leu Ser Pro Pro Ala Pro Phe Arg Ser Pro Gln Ser Tyr
385 390 395 400
Leu Arg Ala Pro Ser Trp Pro Val Val Pro Pro Glu Glu His Ser Ser
405 410 415
Phe Ala Pro Asp Ser Ser Ala Phe Pro Pro Ala Thr Pro Arg Thr Glu
420 425 430
Phe Pro Glu Ala Trp Gly Thr Asp Thr Pro Pro Ala Thr Pro Arg Ser
435 440 445
Ser Trp Pro Met Pro Arg Pro Ser Pro Asp Pro Met Ala Glu Leu Glu
450 455 460
Gln Leu Leu Gly Ser Ala Ser Asp Tyr Ile Gln Ser Val Phe Lys Arg
465 470 475 480
Pro Glu Ala Leu Pro Thr Lys Pro Lys Val Lys Val Glu Ala Pro Ser
485 490 495
Ser Ser Pro Ala Pro Ala Pro Ser Pro Val Leu Gln Arg Glu Ala Pro
500 505 510
Thr Pro Ser Ser Glu Pro Asp Thr His Gln Lys Ala Gln Thr Ala Leu
515 520 525
Gln Gln His Leu His His Lys Arg Ser Leu Phe Leu Glu Gln Val His
530 535 540
Asp Thr Ser Phe Pro Ala Pro Ser Glu Pro Ser Ala Pro Gly Trp Trp
545 550 555 560
Pro Pro Pro Ser Ser Pro Val Pro Arg Leu Pro Asp Arg Pro Pro Lys
565 570 575
Glu Lys Lys Lys Lys Leu Pro Thr Pro Ala Gly Gly Pro Val Gly Thr
580 585 590
Glu Lys Ala Ala Pro Gly Ile Lys Pro Ser Val Arg Lys Pro Ile Gln
595 600 605
Ile Lys Lys Ser Arg Pro Arg Glu Ala Gln Pro Leu Phe Pro Pro Val
610 615 620
Arg Gln Ile Val Leu Glu Gly Leu Arg Ser Pro Ala Ser Gln Glu Val
625 630 635 640
Gln Ala His Pro Pro Ala Pro Leu Pro Ala Ser Gln Gly Ser Ala Val
645 650 655
Pro Leu Pro Pro Glu Pro Ser Leu Ala Leu Phe Ala Pro Ser Pro Ser
660 665 670
Arg Asp Ser Leu Leu Pro Pro Thr Gln Glu Met Arg Ser Pro Ser Pro
675 680 685
Met Thr Ala Leu Gln Pro Gly Ser Thr Gly Pro Leu Pro Pro Ala Asp
690 695 700
Asp Lys Leu Glu Glu Leu Ile Arg Gln Phe Glu Ala Glu Phe Gly Asp
705 710 715 720
Ser Phe Gly Leu Pro Gly Pro Pro Ser Val Pro Ile Gln Asp Pro Glu
725 730 735
Asn Gln Gln Thr Cys Leu Pro Ala Pro Glu Ser Pro Phe Ala Thr Arg
740 745 750
Ser Pro Lys Gln Ile Lys Ile Glu Ser Ser Gly Ala Val Thr Val Leu
755 760 765
Ser Thr Thr Cys Phe His Ser Glu Glu Gly Gly Gln Glu Ala Thr Pro
770 775 780
Thr Lys Ala Glu Asn Pro Leu Thr Pro Thr Leu Ser Gly Phe Leu Glu
785 790 795 800
Ser Pro Leu Lys Tyr Leu Asp Thr Pro Thr Lys Ser Leu Leu Asp Thr
805 810 815
Pro Ala Lys Arg Ala Gln Ala Glu Phe Pro Thr Cys Asp Cys Val Glu
820 825 830
Gln Ile Val Glu Lys Asp Glu Gly Pro Tyr Tyr Thr His Leu Gly Ser
835 840 845
Gly Pro Thr Val Ala Ser Ile Arg Glu Leu Met Glu Glu Arg Tyr Gly
850 855 860
Glu Lys Gly Lys Ala Ile Arg Ile Glu Lys Val Ile Tyr Thr Gly Lys
865 870 875 880
Glu Gly Lys Ser Ser Arg Gly Cys Pro Ile Ala Lys Trp Val Ile Arg
885 890 895
Arg His Thr Leu Glu Glu Lys Leu Leu Cys Leu Val Arg His Arg Ala
900 905 910
Gly His His Cys Gln Asn Ala Val Ile Val Ile Leu Ile Leu Ala Trp
915 920 925
Glu Gly Ile Pro Arg Ser Leu Gly Asp Thr Leu Tyr Gln Glu Leu Thr
930 935 940
Asp Thr Leu Arg Lys Tyr Gly Asn Pro Thr Ser Arg Arg Cys Gly Leu
945 950 955 960
Asn Asp Asp Arg Thr Cys Ala Cys Gln Gly Lys Asp Pro Asn Thr Cys
965 970 975
Gly Ala Ser Phe Ser Phe Gly Cys Ser Trp Ser Met Tyr Phe Asn Gly
980 985 990
Cys Lys Tyr Ala Arg Ser Lys Thr Pro Arg Lys Phe Arg Leu Ala Gly
995 1000 1005
Asp Asn Pro Lys Glu Glu Glu Val Leu Arg Lys Ser Phe Gln Asp
1010 1015 1020
Leu Ala Thr Glu Val Ala Pro Leu Tyr Lys Arg Leu Ala Pro Gln
1025 1030 1035
Ala Tyr Gln Asn Gln Val Thr Asn Glu Glu Ile Ala Ile Asp Cys
1040 1045 1050
Arg Leu Gly Leu Lys Glu Gly Arg Pro Phe Ala Gly Val Thr Ala
1055 1060 1065
Cys Met Asp Phe Cys Ala His Ala His Lys Asp Gln His Asn Leu
1070 1075 1080
Tyr Asn Gly Cys Thr Val Val Cys Thr Leu Thr Lys Glu Asp Asn
1085 1090 1095
Arg Cys Val Gly Lys Ile Pro Glu Asp Glu Gln Leu His Val Leu
1100 1105 1110
Pro Leu Tyr Lys Met Ala Asn Thr Asp Glu Phe Gly Ser Glu Glu
1115 1120 1125
Asn Gln Asn Ala Lys Val Gly Ser Gly Ala Ile Gln Val Leu Thr
1130 1135 1140
Ala Phe Pro Arg Glu Val Arg Arg Leu Pro Glu Pro Ala Lys Ser
1145 1150 1155
Cys Arg Gln Arg Gln Leu Glu Ala Arg Lys Ala Ala Ala Glu Lys
1160 1165 1170
Lys Lys Ile Gln Lys Glu Lys Leu Ser Thr Pro Glu Lys Ile Lys
1175 1180 1185
Gln Glu Ala Leu Glu Leu Ala Gly Ile Thr Ser Asp Pro Gly Leu
1190 1195 1200
Ser Leu Lys Gly Gly Leu Ser Gln Gln Gly Leu Lys Pro Ser Leu
1205 1210 1215
Lys Val Glu Pro Gln Asn His Phe Ser Ser Phe Lys Tyr Ser Gly
1220 1225 1230
Asn Ala Val Val Glu Ser Tyr Ser Val Leu Gly Asn Cys Arg Pro
1235 1240 1245
Ser Asp Pro Tyr Ser Met Asn Ser Val Tyr Ser Tyr His Ser Tyr
1250 1255 1260
Tyr Ala Gln Pro Ser Leu Thr Ser Val Asn Gly Phe His Ser Lys
1265 1270 1275
Tyr Ala Leu Pro Ser Phe Ser Tyr Tyr Gly Phe Pro Ser Ser Asn
1280 1285 1290
Pro Val Phe Pro Ser Gln Phe Leu Gly Pro Gly Ala Trp Gly His
1295 1300 1305
Ser Gly Ser Ser Gly Ser Phe Glu Lys Lys Pro Asp Leu His Ala
1310 1315 1320
Leu His Asn Ser Leu Ser Pro Ala Tyr Gly Gly Ala Glu Phe Ala
1325 1330 1335
Glu Leu Pro Ser Gln Ala Val Pro Thr Asp Ala His His Pro Thr
1340 1345 1350
Pro His His Gln Gln Pro Ala Tyr Pro Gly Pro Lys Glu Tyr Leu
1355 1360 1365
Leu Pro Lys Ala Pro Leu Leu His Ser Val Ser Arg Asp Pro Ser
1370 1375 1380
Pro Phe Ala Gln Ser Ser Asn Cys Tyr Asn Arg Ser Ile Lys Gln
1385 1390 1395
Glu Pro Val Asp Pro Leu Thr Gln Ala Glu Pro Val Pro Arg Asp
1400 1405 1410
Ala Gly Lys Met Gly Lys Thr Pro Leu Ser Glu Val Ser Gln Asn
1415 1420 1425
Gly Gly Pro Ser His Leu Trp Gly Gln Tyr Ser Gly Gly Pro Ser
1430 1435 1440
Met Ser Pro Lys Arg Thr Asn Gly Val Gly Gly Ser Trp Gly Val
1445 1450 1455
Phe Ser Ser Gly Glu Ser Pro Ala Ile Val Pro Asp Lys Leu Ser
1460 1465 1470
Ser Phe Gly Ala Ser Cys Leu Ala Pro Ser His Phe Thr Asp Gly
1475 1480 1485
Gln Trp Gly Leu Phe Pro Gly Glu Gly Gln Gln Ala Ala Ser His
1490 1495 1500
Ser Gly Gly Arg Leu Arg Gly Lys Pro Trp Ser Pro Cys Lys Phe
1505 1510 1515
Gly Asn Ser Thr Ser Ala Leu Ala Gly Pro Ser Leu Thr Glu Lys
1520 1525 1530
Pro Trp Ala Leu Gly Ala Gly Asp Phe Asn Ser Ala Leu Lys Gly
1535 1540 1545
Ser Pro Gly Phe Gln Asp Lys Leu Trp Asn Pro Met Lys Gly Glu
1550 1555 1560
Glu Gly Arg Ile Pro Ala Ala Gly Ala Ser Gln Leu Asp Arg Ala
1565 1570 1575
Trp Gln Ser Phe Gly Leu Pro Leu Gly Ser Ser Glu Lys Leu Phe
1580 1585 1590
Gly Ala Leu Lys Ser Glu Glu Lys Leu Trp Asp Pro Phe Ser Leu
1595 1600 1605
Glu Glu Gly Pro Ala Glu Glu Pro Pro Ser Lys Gly Ala Val Lys
1610 1615 1620
Glu Glu Lys Gly Gly Gly Gly Ala Glu Glu Glu Glu Glu Glu Leu
1625 1630 1635
Trp Ser Asp Ser Glu His Asn Phe Leu Asp Glu Asn Ile Gly Gly
1640 1645 1650
Val Ala Val Ala Pro Ala His Gly Ser Ile Leu Ile Glu Cys Ala
1655 1660 1665
Arg Arg Glu Leu His Ala Thr Thr Pro Leu Lys Lys Pro Asn Arg
1670 1675 1680
Cys His Pro Thr Arg Ile Ser Leu Val Phe Tyr Gln His Lys Asn
1685 1690 1695
Leu Asn Gln Pro Asn His Gly Leu Ala Leu Trp Glu Ala Lys Met
1700 1705 1710
Lys Gln Leu Ala Glu Arg Ala Arg Ala Arg Gln Glu Glu Ala Ala
1715 1720 1725
Arg Leu Gly Leu Gly Gln Gln Glu Ala Lys Leu Tyr Gly Lys Lys
1730 1735 1740
Arg Lys Trp Gly Gly Thr Val Val Ala Glu Pro Gln Gln Lys Glu
1745 1750 1755
Lys Lys Gly Val Val Pro Thr Arg Gln Ala Leu Ala Val Pro Thr
1760 1765 1770
Asp Ser Ala Val Thr Val Ser Ser Tyr Ala Tyr Thr Lys Val Thr
1775 1780 1785
Gly Pro Tyr Ser Arg Trp Ile
1790 1795
<210> 4
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 4
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 5
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 5
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 6
<211> 80
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 6
Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala
1 5 10 15
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
20 25 30
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
35 40 45
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
65 70 75 80
<210> 7
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 7
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 8
<211> 232
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 8
Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly
1 5 10 15
Thr Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys
20 25 30
Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly
35 40 45
Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly
50 55 60
Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys
65 70 75 80
Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu
85 90 95
Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly
100 105 110
Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn
115 120 125
Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu
130 135 140
Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala
145 150 155 160
Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr
165 170 175
Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr
180 185 190
Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr
195 200 205
Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro
210 215 220
Ser Lys Leu Gly His Lys Leu Asn
225 230
<210> 9
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 9
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 10
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 10
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 11
<211> 1228
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 11
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Ala
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly
1130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 12
<211> 1314
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 12
Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Gly Met Ser
1 5 10 15
Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr Leu Arg
20 25 30
Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys Ala Arg
35 40 45
Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys Lys Ala
50 55 60
Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu Ile Leu
65 70 75 80
Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser Asp Val
85 90 95
Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys Asp Phe
100 105 110
Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr Ile Lys
115 120 125
Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile Asp Ala
130 135 140
Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln Ser Lys
145 150 155 160
Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr Asp Ile
165 170 175
Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr Thr Tyr
180 185 190
Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser Asn Asp
195 200 205
Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu Pro Lys
210 215 220
Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys Ala Pro
225 230 235 240
Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu Glu Leu
245 250 255
Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg Val Phe
260 265 270
Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr Leu Asn
275 280 285
Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys Phe Val
290 295 300
Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile Asn Leu
305 310 315 320
Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys Met Ser
325 330 335
Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser Phe Val
340 345 350
Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met Gln Ser
355 360 365
Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys Ser Ile
370 375 380
Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln Lys Leu
385 390 395 400
Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr Asp Leu
405 410 415
Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala Val Leu
420 425 430
Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn Pro Ser
435 440 445
Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala Lys Tyr
450 455 460
Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn Lys His
465 470 475 480
Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala Asn Phe
485 490 495
Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys Asp Asn
500 505 510
Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys Asp Leu
515 520 525
Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp Leu Leu
530 535 540
Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His Ile Ser
545 550 555 560
Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His Phe Tyr
565 570 575
Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val Pro Leu
580 585 590
Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser Asp Glu
595 600 605
Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly Trp Asp
610 615 620
Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys Asp Asp
625 630 635 640
Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile Phe Asp
645 650 655
Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys Ile Val
660 665 670
Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val Phe Phe
675 680 685
Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile Leu Arg
690 695 700
Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln Lys Gly
705 710 715 720
Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe Ile Asp
725 730 735
Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp Phe Gly
740 745 750
Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu Phe Tyr
755 760 765
Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn Ile Ser
770 775 780
Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr Leu Phe
785 790 795 800
Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg Pro Asn
805 810 815
Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn Leu Gln
820 825 830
Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr Arg Lys
835 840 845
Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala Ile Ala
850 855 860
Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu Tyr Asp
865 870 875 880
Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe His Cys
885 890 895
Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe Asn Asp
900 905 910
Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His Ile Leu
915 920 925
Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu Val Asp
930 935 940
Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile Gly Asn
945 950 955 960
Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile Glu Lys
965 970 975
Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn Ile Lys
980 985 990
Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile Ala Lys
995 1000 1005
Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu Asn
1010 1015 1020
Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr
1025 1030 1035
Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val
1040 1045 1050
Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala
1055 1060 1065
Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys
1070 1075 1080
Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys
1085 1090 1095
Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr
1100 1105 1110
Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys
1115 1120 1125
Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe Asp
1130 1135 1140
Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr Ile
1145 1150 1155
Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp Lys
1160 1165 1170
Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu Leu
1175 1180 1185
Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly Glu
1190 1195 1200
Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe Phe
1205 1210 1215
Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg Asn
1220 1225 1230
Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val Ala
1235 1240 1245
Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys Asn
1250 1255 1260
Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu
1265 1270 1275
Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly
1280 1285 1290
Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe
1295 1300 1305
Val Gln Asn Arg Asn Asn
1310
<210> 13
<211> 551
<212> PRT
<213> Homo sapiens
<400> 13
Met Asp Glu Leu Phe Pro Leu Ile Phe Pro Ala Glu Pro Ala Gln Ala
1 5 10 15
Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met
20 25 30
Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly
35 40 45
Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn
50 55 60
Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp
65 70 75 80
Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg
85 90 95
Asp Gly Phe Tyr Glu Ala Glu Leu Cys Pro Asp Arg Cys Ile His Ser
100 105 110
Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln
115 120 125
Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe Gln Val Pro
130 135 140
Ile Glu Glu Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys
145 150 155 160
Phe Gln Val Thr Val Arg Asp Pro Ser Gly Arg Pro Leu Arg Leu Pro
165 170 175
Pro Val Leu Ser His Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala
180 185 190
Glu Leu Lys Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly
195 200 205
Gly Asp Glu Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile
210 215 220
Glu Val Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser
225 230 235 240
Gln Ala Asp Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro
245 250 255
Tyr Ala Asp Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu
260 265 270
Arg Arg Pro Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr
275 280 285
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg
290 295 300
Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly
305 310 315 320
Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg
325 330 335
Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr
340 345 350
Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe
355 360 365
Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro
370 375 380
Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val
385 390 395 400
Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly
405 410 415
Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly
420 425 430
Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu
435 440 445
Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr
450 455 460
Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln
465 470 475 480
Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr
485 490 495
Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp
500 505 510
Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu
515 520 525
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala
530 535 540
Leu Leu Ser Gln Ile Ser Ser
545 550
<210> 14
<211> 119
<212> PRT
<213> Pan paniscus
<400> 14
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
1 5 10 15
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
20 25 30
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
35 40 45
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
50 55 60
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
65 70 75 80
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
85 90 95
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
100 105 110
Met Asp Phe Ser Ala Leu Leu
115
<210> 15
<211> 190
<212> PRT
<213> Human gammaherpesvirus 4
<400> 15
Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser
1 5 10 15
Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg
20 25 30
Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu
35 40 45
Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val
50 55 60
Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro
65 70 75 80
Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu
85 90 95
Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile
100 105 110
Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His
115 120 125
Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser
130 135 140
Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn
145 150 155 160
Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met
165 170 175
His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
180 185 190
<210> 16
<211> 605
<212> PRT
<213> Human gammaherpesvirus 4
<400> 16
Met Arg Pro Lys Lys Asp Gly Leu Glu Asp Phe Leu Arg Leu Thr Pro
1 5 10 15
Glu Ile Lys Lys Gln Leu Gly Ser Leu Val Ser Asp Tyr Cys Asn Val
20 25 30
Leu Asn Lys Glu Phe Thr Ala Gly Ser Val Glu Ile Thr Leu Arg Ser
35 40 45
Tyr Lys Ile Cys Lys Ala Phe Ile Asn Glu Ala Lys Ala His Gly Arg
50 55 60
Glu Trp Gly Gly Leu Met Ala Thr Leu Asn Ile Cys Asn Phe Trp Ala
65 70 75 80
Ile Leu Arg Asn Asn Arg Val Arg Arg Arg Ala Glu Asn Ala Gly Asn
85 90 95
Asp Ala Cys Ser Ile Ala Cys Pro Ile Val Met Arg Tyr Val Leu Asp
100 105 110
His Leu Ile Val Val Thr Asp Arg Phe Phe Ile Gln Ala Pro Ser Asn
115 120 125
Arg Val Met Ile Pro Ala Thr Ile Gly Thr Ala Met Tyr Lys Leu Leu
130 135 140
Lys His Ser Arg Val Arg Ala Tyr Thr Tyr Ser Lys Val Leu Gly Val
145 150 155 160
Asp Arg Ala Ala Ile Met Ala Ser Gly Lys Gln Val Val Glu His Leu
165 170 175
Asn Arg Met Glu Lys Glu Gly Leu Leu Ser Ser Lys Phe Lys Ala Phe
180 185 190
Cys Lys Trp Val Phe Thr Tyr Pro Val Leu Glu Glu Met Phe Gln Thr
195 200 205
Met Val Ser Ser Lys Thr Gly His Leu Thr Asp Asp Val Lys Asp Val
210 215 220
Arg Ala Leu Ile Lys Thr Leu Pro Arg Ala Ser Tyr Ser Ser His Ala
225 230 235 240
Gly Gln Arg Ser Tyr Val Ser Gly Val Leu Pro Ala Cys Leu Leu Ser
245 250 255
Thr Lys Ser Lys Ala Val Glu Thr Pro Ile Leu Val Ser Gly Ala Asp
260 265 270
Arg Met Asp Glu Glu Leu Met Gly Asn Asp Gly Gly Ala Ser His Thr
275 280 285
Glu Ala Arg Tyr Ser Glu Ser Gly Gln Phe His Ala Phe Thr Asp Glu
290 295 300
Leu Glu Ser Leu Pro Ser Pro Thr Met Pro Leu Lys Pro Gly Ala Gln
305 310 315 320
Ser Ala Asp Cys Gly Asp Ser Ser Ser Ser Ser Ser Asp Ser Gly Asn
325 330 335
Ser Asp Thr Glu Gln Ser Glu Arg Glu Glu Ala Arg Ala Glu Ala Pro
340 345 350
Arg Leu Arg Ala Pro Lys Ser Arg Arg Thr Ser Arg Pro Asn Arg Gly
355 360 365
Gln Thr Pro Cys Pro Ser Asn Ala Ala Glu Pro Glu Gln Pro Trp Ile
370 375 380
Ala Ala Val His Gln Glu Ser Asp Glu Arg Pro Ile Phe Pro His Pro
385 390 395 400
Ser Lys Pro Thr Phe Leu Pro Pro Val Lys Arg Lys Lys Gly Leu Arg
405 410 415
Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala
420 425 430
Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile
435 440 445
Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro
450 455 460
Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly
465 470 475 480
Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala
485 490 495
Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr
500 505 510
Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro
515 520 525
Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro
530 535 540
Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met
545 550 555 560
Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu
565 570 575
Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His
580 585 590
Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
595 600 605
<210> 17
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 17
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu
50
<210> 18
<211> 490
<212> PRT
<213> Human herpesvirus 1
<400> 18
Met Asp Leu Leu Val Asp Glu Leu Phe Ala Asp Met Asn Ala Asp Gly
1 5 10 15
Ala Ser Pro Pro Pro Pro Arg Pro Ala Gly Gly Pro Lys Asn Thr Pro
20 25 30
Ala Ala Pro Pro Leu Tyr Ala Thr Gly Arg Leu Ser Gln Ala Gln Leu
35 40 45
Met Pro Ser Pro Pro Met Pro Val Pro Pro Ala Ala Leu Phe Asn Arg
50 55 60
Leu Leu Asp Asp Leu Gly Phe Ser Ala Gly Pro Ala Leu Cys Thr Met
65 70 75 80
Leu Asp Thr Trp Asn Glu Asp Leu Phe Ser Ala Leu Pro Thr Asn Ala
85 90 95
Asp Leu Tyr Arg Glu Cys Lys Phe Leu Ser Thr Leu Pro Ser Asp Val
100 105 110
Val Glu Trp Gly Asp Ala Tyr Val Pro Glu Arg Thr Gln Ile Asp Ile
115 120 125
Arg Ala His Gly Asp Val Ala Phe Pro Thr Leu Pro Ala Thr Arg Asp
130 135 140
Gly Leu Gly Leu Tyr Tyr Glu Ala Leu Ser Arg Phe Phe His Ala Glu
145 150 155 160
Leu Arg Ala Arg Glu Glu Ser Tyr Arg Thr Val Leu Ala Asn Phe Cys
165 170 175
Ser Ala Leu Tyr Arg Tyr Leu Arg Ala Ser Val Arg Gln Leu His Arg
180 185 190
Gln Ala His Met Arg Gly Arg Asp Arg Asp Leu Gly Glu Met Leu Arg
195 200 205
Ala Thr Ile Ala Asp Arg Tyr Tyr Arg Glu Thr Ala Arg Leu Ala Arg
210 215 220
Val Leu Phe Leu His Leu Tyr Leu Phe Leu Thr Arg Glu Ile Leu Trp
225 230 235 240
Ala Ala Tyr Ala Glu Gln Met Met Arg Pro Asp Leu Phe Asp Cys Leu
245 250 255
Cys Cys Asp Leu Glu Ser Trp Arg Gln Leu Ala Gly Leu Phe Gln Pro
260 265 270
Phe Met Phe Val Asn Gly Ala Leu Thr Val Arg Gly Val Pro Ile Glu
275 280 285
Ala Arg Arg Leu Arg Glu Leu Asn His Ile Arg Glu His Leu Asn Leu
290 295 300
Pro Leu Val Arg Ser Ala Ala Thr Glu Glu Pro Gly Ala Pro Leu Thr
305 310 315 320
Thr Pro Pro Thr Leu His Gly Asn Gln Ala Arg Ala Ser Gly Tyr Phe
325 330 335
Met Val Leu Ile Arg Ala Lys Leu Asp Ser Tyr Ser Ser Phe Thr Thr
340 345 350
Ser Pro Ser Glu Ala Val Met Arg Glu His Ala Tyr Ser Arg Ala Arg
355 360 365
Thr Lys Asn Asn Tyr Gly Ser Thr Ile Glu Gly Leu Leu Asp Leu Pro
370 375 380
Asp Asp Asp Ala Pro Glu Glu Ala Gly Leu Ala Ala Pro Arg Leu Ser
385 390 395 400
Phe Leu Pro Ala Gly His Thr Arg Arg Leu Ser Thr Ala Pro Pro Thr
405 410 415
Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala
420 425 430
Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
435 440 445
Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro
450 455 460
Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr
465 470 475 480
Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly
485 490
<210> 19
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 19
agccaacatg aggatcaccc atgtctgcag ggc 33
<210> 20
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 20
ggccaacatg aggatcaccc atgtctgcag ggcc 34
<210> 21
<211> 130
<212> PRT
<213> Bacteriophage MS2
<400> 21
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr
130
<210> 22
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 22
actgcggaaa tttgagcgt 19
<210> 23
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 23
acgctcaaat ttccgcagt 19
<210> 24
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 24
aggcaatggc tgcacatgc 19
<210> 25
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 25
gcatgtgcag ccattgcct 19
<210> 26
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 26
gacgcttggt tctgaggag 19
<210> 27
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 27
ctcctcagaa ccaagcgtc 19
<210> 28
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 28
tccggaaacg cattcctct 19
<210> 29
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 29
agaggaatgc gtttccgga 19
<210> 30
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 30
ccgcgtcagc ccggcccgg 19
<210> 31
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 31
ccgggccggg ctgacgcgg 19
<210> 32
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 32
cgactcccgc tgggcctct 19
<210> 33
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 33
agaggcccag cgggagtcg 19
<210> 34
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 34
ccgttgcgcg ctcgctctc 19
<210> 35
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 35
gagagcgagc gcgcaacgg 19
<210> 36
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 36
ccgcgcatcc tgccaggcc 19
<210> 37
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 37
actgcggaaa tttgagcgt 19
<210> 38
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 38
acgcucaaau uuccgcagu 19
<210> 39
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 39
aggcaatggc tgcacatgc 19
<210> 40
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 40
gcaugugcag ccauugccu 19
<210> 41
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 41
gacgcttggt tctgaggag 19
<210> 42
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 42
cuccucagaa ccaagcguc 19
<210> 43
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 43
tccggaaacg cattcctct 19
<210> 44
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 44
agaggaaugc guuuccgga 19
<210> 45
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 45
ccgcgtcagc ccggcccgg 19
<210> 46
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 46
ccgggccggg cugacgcgg 19
<210> 47
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 47
cgactcccgc tgggcctct 19
<210> 48
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 48
agaggcccag cgggagucg 19
<210> 49
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 49
ccgttgcgcg ctcgctctc 19
<210> 50
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 50
gagagcgagc gcgcaacgg 19
<210> 51
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 51
ccgcgcatcc tgccaggcc 19
<210> 52
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 52
ggccuggcag gaugcgcgg 19
<210> 53
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 53
ccaacttggc gcgtttcgg 19
<210> 54
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 54
ccgaaacgcg ccaaguugg 19
<210> 55
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 55
accacgcgtc cgagtccgg 19
<210> 56
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 56
ccggacucgg acgcguggu 19
<210> 57
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 57
tgctcattgt ccctggaca 19
<210> 58
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 58
uguccaggga caaugagca 19
<210> 59
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 59
ggacaccctg ctcattgtc 19
<210> 60
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 60
gacaaugagc agggugucc 19
<210> 61
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 61
accggcagcc tgcgcgtcc 19
<210> 62
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 62
ggacgcgcag gcugccggu 19
<210> 63
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 63
cgatgggcac ccactgctc 19
<210> 64
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 64
gagcaguggg ugcccaucg 19
<210> 65
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 65
ccttcacgtg gacgcgcag 19
<210> 66
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 66
cugcgcgucc acgugaagg 19
<210> 67
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 67
cgtgaaggtg gaagccttc 19
<210> 68
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 68
gaaggcuucc accuucacg 19
<210> 69
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 69
ctccttggtc aggcgccgg 19
<210> 70
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 70
ccggcgccug accaaggag 19
<210> 71
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 71
tggtcaggcg ccggttccg 19
<210> 72
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 72
cggaaccggc gccugacca 19
<210> 73
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 73
tagaggtcgc cttctcctc 19
<210> 74
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 74
gaggagaagg cgaccucua 19
<210> 75
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 75
cgacgctcgg gtcgcggtg 19
<210> 76
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 76
caccgcgacc cgagcgucg 19
<210> 77
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 77
atgctgtcgc cgcgcgggg 19
<210> 78
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 78
ccccgcgcgg cgacagcau 19
<210> 79
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 79
ctcaccctca ccggagcca 19
<210> 80
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 80
uggcuccggu gagggugag 19
<210> 81
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 81
ccgcaaactt tactcctta 19
<210> 82
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 82
uaaggaguaa aguuugcgg 19
<210> 83
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 83
ctcctaagat tggcttcac 19
<210> 84
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 84
gugaagccaa ucuuaggag 19
<210> 85
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 85
ccggagccac tcctaagat 19
<210> 86
<211> 718
<212> PRT
<213> Homo sapiens
<400> 86
Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp Lys Gly
1 5 10 15
Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala Ala Val Arg
20 25 30
Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn Ala Ile Arg Ile
35 40 45
Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys Ser Ser His Gly Cys
50 55 60
Pro Ile Ala Lys Trp Val Leu Arg Arg Ser Ser Asp Glu Glu Lys Val
65 70 75 80
Leu Cys Leu Val Arg Gln Arg Thr Gly His His Cys Pro Thr Ala Val
85 90 95
Met Val Val Leu Ile Met Val Trp Asp Gly Ile Pro Leu Pro Met Ala
100 105 110
Asp Arg Leu Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr Asn Gly
115 120 125
His Pro Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr Cys Thr
130 135 140
Cys Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser Phe Gly
145 150 155 160
Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg Ser Pro
165 170 175
Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His Glu Lys
180 185 190
Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala Pro Ile
195 200 205
Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu Tyr Glu
210 215 220
Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg Pro Phe
225 230 235 240
Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His Arg Asp
245 250 255
Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr Leu Thr Arg
260 265 270
Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp Glu Gln Leu His
275 280 285
Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp Glu Phe Gly Ser Lys
290 295 300
Glu Gly Met Glu Ala Lys Ile Lys Ser Gly Ala Ile Glu Val Leu Ala
305 310 315 320
Pro Arg Arg Lys Lys Arg Thr Cys Phe Thr Gln Pro Val Pro Arg Ser
325 330 335
Gly Lys Lys Arg Ala Ala Met Met Thr Glu Val Leu Ala His Lys Ile
340 345 350
Arg Ala Val Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys Asn Asn
355 360 365
Ser Thr Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr Leu Gly
370 375 380
Ser Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr Glu Pro
385 390 395 400
His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser Leu Met
405 410 415
Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe Ser Trp
420 425 430
Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn Asp Ala
435 440 445
Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His Cys Thr
450 455 460
Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala Asp Gly
465 470 475 480
Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr Leu Ser
485 490 495
Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser Thr Gly Val
500 505 510
Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln Pro Ser Phe Leu
515 520 525
Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met Glu Glu Asp Glu Gln
530 535 540
His Ser Glu Ala Asp Glu Pro Pro Ser Asp Glu Pro Leu Ser Asp Asp
545 550 555 560
Pro Leu Ser Pro Ala Glu Glu Lys Leu Pro His Ile Asp Glu Tyr Trp
565 570 575
Ser Asp Ser Glu His Ile Phe Leu Asp Ala Asn Ile Gly Gly Val Ala
580 585 590
Ile Ala Pro Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg Arg Glu
595 600 605
Leu His Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His Pro Thr
610 615 620
Arg Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys Pro Gln
625 630 635 640
His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu Ala Lys
645 650 655
Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala Asn Glu
660 665 670
Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile Pro Ser
675 680 685
His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val Ser Pro
690 695 700
Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
705 710 715
<210> 87
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 87
ttctctaccc tacgtctca 19
<210> 88
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 88
ugagacguag gguagagaa 19
<210> 89
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 89
tacgtctcat tctccgcaa 19
<210> 90
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 90
uugcggagaa ugagacgua 19
<210> 91
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 91
gctaggcctc cagcccttc 19
<210> 92
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 92
gaagggcugg aggccuagc 19
<210> 93
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 93
acaggtggcg ccgcaactt 19
<210> 94
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 94
aaguugcggc gccaccugu 19
<210> 95
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 95
agccggaggc gcgagagtc 19
<210> 96
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 96
gacucucgcg ccuccggcu 19
<210> 97
<211> 720
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 97
Met Ala Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp
1 5 10 15
Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala Ala
20 25 30
Val Arg Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn Ala Ile
35 40 45
Arg Ile Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys Ser Ser His
50 55 60
Gly Cys Pro Ile Ala Lys Trp Val Leu Arg Arg Ser Ser Asp Glu Glu
65 70 75 80
Lys Val Leu Cys Leu Val Arg Gln Arg Thr Gly His His Cys Pro Thr
85 90 95
Ala Val Met Val Val Leu Ile Met Val Trp Asp Gly Ile Pro Leu Pro
100 105 110
Met Ala Asp Arg Leu Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr
115 120 125
Asn Gly His Pro Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr
130 135 140
Cys Thr Cys Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser
145 150 155 160
Phe Gly Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg
165 170 175
Ser Pro Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His
180 185 190
Glu Lys Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala
195 200 205
Pro Ile Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu
210 215 220
Tyr Glu Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg
225 230 235 240
Pro Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His
245 250 255
Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr Leu
260 265 270
Thr Arg Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp Glu Gln
275 280 285
Leu His Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp Glu Phe Gly
290 295 300
Ser Lys Glu Gly Met Glu Ala Lys Ile Lys Ser Gly Ala Ile Glu Val
305 310 315 320
Leu Ala Pro Arg Arg Lys Lys Arg Thr Cys Phe Thr Gln Pro Val Pro
325 330 335
Arg Ser Gly Lys Lys Arg Ala Ala Met Met Thr Glu Val Leu Ala His
340 345 350
Lys Ile Arg Ala Val Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys
355 360 365
Asn Asn Ser Thr Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr
370 375 380
Leu Gly Ser Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr
385 390 395 400
Glu Pro His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser
405 410 415
Leu Met Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe
420 425 430
Ser Trp Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn
435 440 445
Asp Ala Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His
450 455 460
Cys Thr Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala
465 470 475 480
Asp Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr
485 490 495
Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser Thr
500 505 510
Gly Val Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln Pro Ser
515 520 525
Phe Leu Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met Glu Glu Asp
530 535 540
Glu Gln His Ser Glu Ala Asp Glu Pro Pro Ser Asp Glu Pro Leu Ser
545 550 555 560
Asp Asp Pro Leu Ser Pro Ala Glu Glu Lys Leu Pro His Ile Asp Glu
565 570 575
Tyr Trp Ser Asp Ser Glu His Ile Phe Leu Asp Ala Asn Ile Gly Gly
580 585 590
Val Ala Ile Ala Pro Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg
595 600 605
Arg Glu Leu His Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His
610 615 620
Pro Thr Arg Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys
625 630 635 640
Pro Gln His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu
645 650 655
Ala Lys Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala
660 665 670
Asn Glu Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile
675 680 685
Pro Ser His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val
690 695 700
Ser Pro Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
705 710 715 720
<210> 98
<211> 100
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 98
Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser
1 5 10 15
Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser
20 25 30
Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu
35 40 45
Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser
50 55 60
Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr
65 70 75 80
Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr
85 90 95
Pro Gly Ser Glu
100
<210> 99
<211> 2483
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 99
Met Ala Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp
1 5 10 15
Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala Ala
20 25 30
Val Arg Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn Ala Ile
35 40 45
Arg Ile Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys Ser Ser His
50 55 60
Gly Cys Pro Ile Ala Lys Trp Val Leu Arg Arg Ser Ser Asp Glu Glu
65 70 75 80
Lys Val Leu Cys Leu Val Arg Gln Arg Thr Gly His His Cys Pro Thr
85 90 95
Ala Val Met Val Val Leu Ile Met Val Trp Asp Gly Ile Pro Leu Pro
100 105 110
Met Ala Asp Arg Leu Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr
115 120 125
Asn Gly His Pro Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr
130 135 140
Cys Thr Cys Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser
145 150 155 160
Phe Gly Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg
165 170 175
Ser Pro Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His
180 185 190
Glu Lys Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala
195 200 205
Pro Ile Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu
210 215 220
Tyr Glu Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg
225 230 235 240
Pro Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His
245 250 255
Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr Leu
260 265 270
Thr Arg Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp Glu Gln
275 280 285
Leu His Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp Glu Phe Gly
290 295 300
Ser Lys Glu Gly Met Glu Ala Lys Ile Lys Ser Gly Ala Ile Glu Val
305 310 315 320
Leu Ala Pro Arg Arg Lys Lys Arg Thr Cys Phe Thr Gln Pro Val Pro
325 330 335
Arg Ser Gly Lys Lys Arg Ala Ala Met Met Thr Glu Val Leu Ala His
340 345 350
Lys Ile Arg Ala Val Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys
355 360 365
Asn Asn Ser Thr Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr
370 375 380
Leu Gly Ser Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr
385 390 395 400
Glu Pro His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser
405 410 415
Leu Met Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe
420 425 430
Ser Trp Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn
435 440 445
Asp Ala Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His
450 455 460
Cys Thr Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala
465 470 475 480
Asp Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr
485 490 495
Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser Thr
500 505 510
Gly Val Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln Pro Ser
515 520 525
Phe Leu Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met Glu Glu Asp
530 535 540
Glu Gln His Ser Glu Ala Asp Glu Pro Pro Ser Asp Glu Pro Leu Ser
545 550 555 560
Asp Asp Pro Leu Ser Pro Ala Glu Glu Lys Leu Pro His Ile Asp Glu
565 570 575
Tyr Trp Ser Asp Ser Glu His Ile Phe Leu Asp Ala Asn Ile Gly Gly
580 585 590
Val Ala Ile Ala Pro Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg
595 600 605
Arg Glu Leu His Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His
610 615 620
Pro Thr Arg Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys
625 630 635 640
Pro Gln His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu
645 650 655
Ala Lys Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala
660 665 670
Asn Glu Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile
675 680 685
Pro Ser His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val
690 695 700
Ser Pro Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
705 710 715 720
Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser
725 730 735
Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser
740 745 750
Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu
755 760 765
Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser
770 775 780
Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr
785 790 795 800
Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr
805 810 815
Pro Gly Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
820 825 830
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
835 840 845
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
850 855 860
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
865 870 875 880
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
885 890 895
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
900 905 910
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
915 920 925
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
930 935 940
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
945 950 955 960
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
965 970 975
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
980 985 990
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
995 1000 1005
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala
1010 1015 1020
Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
1025 1030 1035
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
1040 1045 1050
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu
1055 1060 1065
Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys
1070 1075 1080
Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
1085 1090 1095
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala
1100 1105 1110
Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
1115 1120 1125
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys
1130 1135 1140
Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
1145 1150 1155
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
1160 1165 1170
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
1175 1180 1185
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
1190 1195 1200
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
1205 1210 1215
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
1220 1225 1230
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
1235 1240 1245
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile
1250 1255 1260
Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
1265 1270 1275
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
1280 1285 1290
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala
1295 1300 1305
Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro
1310 1315 1320
Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
1325 1330 1335
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly
1340 1345 1350
Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
1355 1360 1365
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln
1370 1375 1380
Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
1385 1390 1395
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
1400 1405 1410
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
1415 1420 1425
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
1430 1435 1440
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
1445 1450 1455
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
1460 1465 1470
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
1475 1480 1485
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu
1490 1495 1500
Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
1505 1510 1515
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
1520 1525 1530
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
1535 1540 1545
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
1550 1555 1560
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
1565 1570 1575
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1580 1585 1590
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1595 1600 1605
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
1610 1615 1620
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
1625 1630 1635
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
1640 1645 1650
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
1655 1660 1665
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
1670 1675 1680
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
1685 1690 1695
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
1700 1705 1710
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1715 1720 1725
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
1730 1735 1740
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1745 1750 1755
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
1760 1765 1770
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1775 1780 1785
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1790 1795 1800
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1805 1810 1815
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1820 1825 1830
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1835 1840 1845
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1850 1855 1860
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1865 1870 1875
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1880 1885 1890
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1895 1900 1905
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1910 1915 1920
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1925 1930 1935
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1940 1945 1950
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1955 1960 1965
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1970 1975 1980
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1985 1990 1995
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
2000 2005 2010
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
2015 2020 2025
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
2030 2035 2040
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
2045 2050 2055
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
2060 2065 2070
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
2075 2080 2085
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
2090 2095 2100
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
2105 2110 2115
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
2120 2125 2130
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
2135 2140 2145
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
2150 2155 2160
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
2165 2170 2175
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly Gly Pro Ser Ser
2180 2185 2190
Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr
2195 2200 2205
Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly
2210 2215 2220
Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser
2225 2230 2235
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
2240 2245 2250
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
2255 2260 2265
Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Arg Asp
2270 2275 2280
Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala
2285 2290 2295
Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg
2300 2305 2310
Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro
2315 2320 2325
Leu Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu
2330 2335 2340
Pro Val Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp
2345 2350 2355
Pro Ala Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp
2360 2365 2370
Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met
2375 2380 2385
Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly
2390 2395 2400
Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu
2405 2410 2415
Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp
2420 2425 2430
Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu
2435 2440 2445
Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu
2450 2455 2460
Ser Ile Phe Asp Thr Ser Leu Phe Ala Ser Gly Ser Gly Pro Lys
2465 2470 2475
Lys Lys Arg Lys Val
2480
<210> 100
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 100
Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys
1 5 10 15
Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro
20 25 30
Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val
35 40 45
Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr
50 55 60
Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr
65 70 75 80
Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro
85 90 95
Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro
100 105 110
Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu
115 120 125
Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr
130 135 140
Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe
145 150 155 160
Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala
165 170 175
Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu
180 185 190
Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu
195 200 205
Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg
210 215 220
Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn
225 230 235 240
Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp
245 250 255
Phe Ser Ala Leu Leu
260
<210> 101
<211> 2750
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 101
Met Ala Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp
1 5 10 15
Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala Ala
20 25 30
Val Arg Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn Ala Ile
35 40 45
Arg Ile Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys Ser Ser His
50 55 60
Gly Cys Pro Ile Ala Lys Trp Val Leu Arg Arg Ser Ser Asp Glu Glu
65 70 75 80
Lys Val Leu Cys Leu Val Arg Gln Arg Thr Gly His His Cys Pro Thr
85 90 95
Ala Val Met Val Val Leu Ile Met Val Trp Asp Gly Ile Pro Leu Pro
100 105 110
Met Ala Asp Arg Leu Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr
115 120 125
Asn Gly His Pro Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr
130 135 140
Cys Thr Cys Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser
145 150 155 160
Phe Gly Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg
165 170 175
Ser Pro Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His
180 185 190
Glu Lys Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala
195 200 205
Pro Ile Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu
210 215 220
Tyr Glu Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg
225 230 235 240
Pro Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His
245 250 255
Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr Leu
260 265 270
Thr Arg Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp Glu Gln
275 280 285
Leu His Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp Glu Phe Gly
290 295 300
Ser Lys Glu Gly Met Glu Ala Lys Ile Lys Ser Gly Ala Ile Glu Val
305 310 315 320
Leu Ala Pro Arg Arg Lys Lys Arg Thr Cys Phe Thr Gln Pro Val Pro
325 330 335
Arg Ser Gly Lys Lys Arg Ala Ala Met Met Thr Glu Val Leu Ala His
340 345 350
Lys Ile Arg Ala Val Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys
355 360 365
Asn Asn Ser Thr Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr
370 375 380
Leu Gly Ser Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr
385 390 395 400
Glu Pro His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser
405 410 415
Leu Met Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe
420 425 430
Ser Trp Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn
435 440 445
Asp Ala Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His
450 455 460
Cys Thr Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala
465 470 475 480
Asp Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr
485 490 495
Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser Thr
500 505 510
Gly Val Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln Pro Ser
515 520 525
Phe Leu Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met Glu Glu Asp
530 535 540
Glu Gln His Ser Glu Ala Asp Glu Pro Pro Ser Asp Glu Pro Leu Ser
545 550 555 560
Asp Asp Pro Leu Ser Pro Ala Glu Glu Lys Leu Pro His Ile Asp Glu
565 570 575
Tyr Trp Ser Asp Ser Glu His Ile Phe Leu Asp Ala Asn Ile Gly Gly
580 585 590
Val Ala Ile Ala Pro Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg
595 600 605
Arg Glu Leu His Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His
610 615 620
Pro Thr Arg Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys
625 630 635 640
Pro Gln His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu
645 650 655
Ala Lys Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala
660 665 670
Asn Glu Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile
675 680 685
Pro Ser His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val
690 695 700
Ser Pro Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
705 710 715 720
Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser
725 730 735
Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser
740 745 750
Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu
755 760 765
Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser
770 775 780
Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr
785 790 795 800
Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr
805 810 815
Pro Gly Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
820 825 830
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
835 840 845
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
850 855 860
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
865 870 875 880
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
885 890 895
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
900 905 910
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
915 920 925
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
930 935 940
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
945 950 955 960
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
965 970 975
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
980 985 990
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
995 1000 1005
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala
1010 1015 1020
Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
1025 1030 1035
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
1040 1045 1050
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu
1055 1060 1065
Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys
1070 1075 1080
Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
1085 1090 1095
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala
1100 1105 1110
Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
1115 1120 1125
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys
1130 1135 1140
Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
1145 1150 1155
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
1160 1165 1170
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
1175 1180 1185
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
1190 1195 1200
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
1205 1210 1215
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
1220 1225 1230
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
1235 1240 1245
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile
1250 1255 1260
Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
1265 1270 1275
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
1280 1285 1290
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala
1295 1300 1305
Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro
1310 1315 1320
Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
1325 1330 1335
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly
1340 1345 1350
Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
1355 1360 1365
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln
1370 1375 1380
Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
1385 1390 1395
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
1400 1405 1410
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
1415 1420 1425
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
1430 1435 1440
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
1445 1450 1455
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
1460 1465 1470
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
1475 1480 1485
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu
1490 1495 1500
Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
1505 1510 1515
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
1520 1525 1530
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
1535 1540 1545
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
1550 1555 1560
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
1565 1570 1575
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1580 1585 1590
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1595 1600 1605
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
1610 1615 1620
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
1625 1630 1635
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
1640 1645 1650
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
1655 1660 1665
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
1670 1675 1680
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
1685 1690 1695
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
1700 1705 1710
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1715 1720 1725
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
1730 1735 1740
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1745 1750 1755
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
1760 1765 1770
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1775 1780 1785
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1790 1795 1800
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1805 1810 1815
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1820 1825 1830
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1835 1840 1845
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1850 1855 1860
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1865 1870 1875
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1880 1885 1890
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1895 1900 1905
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1910 1915 1920
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1925 1930 1935
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1940 1945 1950
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1955 1960 1965
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1970 1975 1980
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1985 1990 1995
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
2000 2005 2010
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
2015 2020 2025
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
2030 2035 2040
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
2045 2050 2055
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
2060 2065 2070
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
2075 2080 2085
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
2090 2095 2100
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
2105 2110 2115
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
2120 2125 2130
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
2135 2140 2145
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
2150 2155 2160
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
2165 2170 2175
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly Gly Pro Ser Ser
2180 2185 2190
Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr
2195 2200 2205
Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly
2210 2215 2220
Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser
2225 2230 2235
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
2240 2245 2250
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
2255 2260 2265
Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Ser Gln
2270 2275 2280
Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg
2285 2290 2295
Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro
2300 2305 2310
Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala
2315 2320 2325
Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
2330 2335 2340
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu
2345 2350 2355
Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser
2360 2365 2370
Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala
2375 2380 2385
Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro
2390 2395 2400
Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala
2405 2410 2415
Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser
2420 2425 2430
Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala
2435 2440 2445
Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala
2450 2455 2460
Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile
2465 2470 2475
Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro
2480 2485 2490
Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp
2495 2500 2505
Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu
2510 2515 2520
Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe
2525 2530 2535
Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser Arg Glu
2540 2545 2550
Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser Asp
2555 2560 2565
Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro
2570 2575 2580
Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala
2585 2590 2595
Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly
2600 2605 2610
Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro
2615 2620 2625
Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu
2630 2635 2640
Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr
2645 2650 2655
Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp
2660 2665 2670
Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr
2675 2680 2685
Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu
2690 2695 2700
Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu
2705 2710 2715
Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe
2720 2725 2730
Asp Thr Ser Leu Phe Ala Ser Gly Ser Gly Pro Lys Lys Lys Arg
2735 2740 2745
Lys Val
2750
<210> 102
<211> 2216
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 102
Met Ala Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp
1 5 10 15
Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala Ala
20 25 30
Val Arg Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn Ala Ile
35 40 45
Arg Ile Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys Ser Ser His
50 55 60
Gly Cys Pro Ile Ala Lys Trp Val Leu Arg Arg Ser Ser Asp Glu Glu
65 70 75 80
Lys Val Leu Cys Leu Val Arg Gln Arg Thr Gly His His Cys Pro Thr
85 90 95
Ala Val Met Val Val Leu Ile Met Val Trp Asp Gly Ile Pro Leu Pro
100 105 110
Met Ala Asp Arg Leu Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr
115 120 125
Asn Gly His Pro Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr
130 135 140
Cys Thr Cys Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser
145 150 155 160
Phe Gly Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg
165 170 175
Ser Pro Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His
180 185 190
Glu Lys Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala
195 200 205
Pro Ile Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu
210 215 220
Tyr Glu Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg
225 230 235 240
Pro Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His
245 250 255
Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr Leu
260 265 270
Thr Arg Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp Glu Gln
275 280 285
Leu His Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp Glu Phe Gly
290 295 300
Ser Lys Glu Gly Met Glu Ala Lys Ile Lys Ser Gly Ala Ile Glu Val
305 310 315 320
Leu Ala Pro Arg Arg Lys Lys Arg Thr Cys Phe Thr Gln Pro Val Pro
325 330 335
Arg Ser Gly Lys Lys Arg Ala Ala Met Met Thr Glu Val Leu Ala His
340 345 350
Lys Ile Arg Ala Val Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys
355 360 365
Asn Asn Ser Thr Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr
370 375 380
Leu Gly Ser Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr
385 390 395 400
Glu Pro His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser
405 410 415
Leu Met Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe
420 425 430
Ser Trp Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn
435 440 445
Asp Ala Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His
450 455 460
Cys Thr Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala
465 470 475 480
Asp Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr
485 490 495
Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser Thr
500 505 510
Gly Val Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln Pro Ser
515 520 525
Phe Leu Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met Glu Glu Asp
530 535 540
Glu Gln His Ser Glu Ala Asp Glu Pro Pro Ser Asp Glu Pro Leu Ser
545 550 555 560
Asp Asp Pro Leu Ser Pro Ala Glu Glu Lys Leu Pro His Ile Asp Glu
565 570 575
Tyr Trp Ser Asp Ser Glu His Ile Phe Leu Asp Ala Asn Ile Gly Gly
580 585 590
Val Ala Ile Ala Pro Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg
595 600 605
Arg Glu Leu His Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His
610 615 620
Pro Thr Arg Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys
625 630 635 640
Pro Gln His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu
645 650 655
Ala Lys Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala
660 665 670
Asn Glu Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile
675 680 685
Pro Ser His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val
690 695 700
Ser Pro Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
705 710 715 720
Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser
725 730 735
Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser
740 745 750
Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu
755 760 765
Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser
770 775 780
Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr
785 790 795 800
Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr
805 810 815
Pro Gly Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
820 825 830
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
835 840 845
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
850 855 860
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
865 870 875 880
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
885 890 895
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
900 905 910
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
915 920 925
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
930 935 940
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
945 950 955 960
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
965 970 975
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
980 985 990
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
995 1000 1005
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala
1010 1015 1020
Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
1025 1030 1035
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
1040 1045 1050
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu
1055 1060 1065
Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys
1070 1075 1080
Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
1085 1090 1095
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala
1100 1105 1110
Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
1115 1120 1125
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys
1130 1135 1140
Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
1145 1150 1155
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
1160 1165 1170
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
1175 1180 1185
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
1190 1195 1200
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
1205 1210 1215
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
1220 1225 1230
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
1235 1240 1245
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile
1250 1255 1260
Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
1265 1270 1275
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
1280 1285 1290
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala
1295 1300 1305
Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro
1310 1315 1320
Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
1325 1330 1335
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly
1340 1345 1350
Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
1355 1360 1365
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln
1370 1375 1380
Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
1385 1390 1395
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
1400 1405 1410
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
1415 1420 1425
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
1430 1435 1440
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
1445 1450 1455
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
1460 1465 1470
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
1475 1480 1485
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu
1490 1495 1500
Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
1505 1510 1515
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
1520 1525 1530
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
1535 1540 1545
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
1550 1555 1560
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
1565 1570 1575
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1580 1585 1590
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1595 1600 1605
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
1610 1615 1620
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
1625 1630 1635
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
1640 1645 1650
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
1655 1660 1665
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
1670 1675 1680
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
1685 1690 1695
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
1700 1705 1710
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1715 1720 1725
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
1730 1735 1740
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1745 1750 1755
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
1760 1765 1770
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1775 1780 1785
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1790 1795 1800
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1805 1810 1815
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1820 1825 1830
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1835 1840 1845
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1850 1855 1860
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1865 1870 1875
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1880 1885 1890
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1895 1900 1905
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1910 1915 1920
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1925 1930 1935
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1940 1945 1950
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1955 1960 1965
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1970 1975 1980
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1985 1990 1995
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
2000 2005 2010
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
2015 2020 2025
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
2030 2035 2040
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
2045 2050 2055
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
2060 2065 2070
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
2075 2080 2085
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
2090 2095 2100
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
2105 2110 2115
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
2120 2125 2130
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
2135 2140 2145
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
2150 2155 2160
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
2165 2170 2175
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly Gly Gly Gly Ser
2180 2185 2190
Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val
2195 2200 2205
Asp Pro Lys Lys Lys Arg Lys Val
2210 2215
<210> 103
<211> 2116
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 103
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Pro Lys
1370 1375 1380
Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val Gly Ser
1385 1390 1395
Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp Lys
1400 1405 1410
Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala Ala
1415 1420 1425
Val Arg Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn Ala
1430 1435 1440
Ile Arg Ile Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys Ser
1445 1450 1455
Ser His Gly Cys Pro Ile Ala Lys Trp Val Leu Arg Arg Ser Ser
1460 1465 1470
Asp Glu Glu Lys Val Leu Cys Leu Val Arg Gln Arg Thr Gly His
1475 1480 1485
His Cys Pro Thr Ala Val Met Val Val Leu Ile Met Val Trp Asp
1490 1495 1500
Gly Ile Pro Leu Pro Met Ala Asp Arg Leu Tyr Thr Glu Leu Thr
1505 1510 1515
Glu Asn Leu Lys Ser Tyr Asn Gly His Pro Thr Asp Arg Arg Cys
1520 1525 1530
Thr Leu Asn Glu Asn Arg Thr Cys Thr Cys Gln Gly Ile Asp Pro
1535 1540 1545
Glu Thr Cys Gly Ala Ser Phe Ser Phe Gly Cys Ser Trp Ser Met
1550 1555 1560
Tyr Phe Asn Gly Cys Lys Phe Gly Arg Ser Pro Ser Pro Arg Arg
1565 1570 1575
Phe Arg Ile Asp Pro Ser Ser Pro Leu His Glu Lys Asn Leu Glu
1580 1585 1590
Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala Pro Ile Tyr Lys
1595 1600 1605
Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu Tyr Glu Asn
1610 1615 1620
Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg Pro Phe
1625 1630 1635
Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His Arg
1640 1645 1650
Asp Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr Leu
1655 1660 1665
Thr Arg Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp Glu
1670 1675 1680
Gln Leu His Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp Glu
1685 1690 1695
Phe Gly Ser Lys Glu Gly Met Glu Ala Lys Ile Lys Ser Gly Ala
1700 1705 1710
Ile Glu Val Leu Ala Pro Arg Arg Lys Lys Arg Thr Cys Phe Thr
1715 1720 1725
Gln Pro Val Pro Arg Ser Gly Lys Lys Arg Ala Ala Met Met Thr
1730 1735 1740
Glu Val Leu Ala His Lys Ile Arg Ala Val Glu Lys Lys Pro Ile
1745 1750 1755
Pro Arg Ile Lys Arg Lys Asn Asn Ser Thr Thr Thr Asn Asn Ser
1760 1765 1770
Lys Pro Ser Ser Leu Pro Thr Leu Gly Ser Asn Thr Glu Thr Val
1775 1780 1785
Gln Pro Glu Val Lys Ser Glu Thr Glu Pro His Phe Ile Leu Lys
1790 1795 1800
Ser Ser Asp Asn Thr Lys Thr Tyr Ser Leu Met Pro Ser Ala Pro
1805 1810 1815
His Pro Val Lys Glu Ala Ser Pro Gly Phe Ser Trp Ser Pro Lys
1820 1825 1830
Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn Asp Ala Thr Ala
1835 1840 1845
Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His Cys Thr Met
1850 1855 1860
Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala Asp Gly
1865 1870 1875
Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr Leu
1880 1885 1890
Ser Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser Thr
1895 1900 1905
Gly Val Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln Pro
1910 1915 1920
Ser Phe Leu Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met Glu
1925 1930 1935
Glu Asp Glu Gln His Ser Glu Ala Asp Glu Pro Pro Ser Asp Glu
1940 1945 1950
Pro Leu Ser Asp Asp Pro Leu Ser Pro Ala Glu Glu Lys Leu Pro
1955 1960 1965
His Ile Asp Glu Tyr Trp Ser Asp Ser Glu His Ile Phe Leu Asp
1970 1975 1980
Ala Asn Ile Gly Gly Val Ala Ile Ala Pro Ala His Gly Ser Val
1985 1990 1995
Leu Ile Glu Cys Ala Arg Arg Glu Leu His Ala Thr Thr Pro Val
2000 2005 2010
Glu His Pro Asn Arg Asn His Pro Thr Arg Leu Ser Leu Val Phe
2015 2020 2025
Tyr Gln His Lys Asn Leu Asn Lys Pro Gln His Gly Phe Glu Leu
2030 2035 2040
Asn Lys Ile Lys Phe Glu Ala Lys Glu Ala Lys Asn Lys Lys Met
2045 2050 2055
Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala Asn Glu Gly Pro Glu
2060 2065 2070
Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile Pro Ser His Lys
2075 2080 2085
Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val Ser Pro Tyr
2090 2095 2100
Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
2105 2110 2115
<210> 104
<211> 285
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 104
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser
130 135 140
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala
145 150 155 160
Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
165 170 175
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr
180 185 190
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro
195 200 205
Ser Glu Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Asp
210 215 220
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp
225 230 235 240
Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp
245 250 255
Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
260 265 270
Leu Ala Ser Gly Ser Gly Pro Lys Lys Lys Arg Lys Val
275 280 285
<210> 105
<211> 562
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 105
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser
130 135 140
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala
145 150 155 160
Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
165 170 175
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr
180 185 190
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro
195 200 205
Ser Glu Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Asp
210 215 220
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp
225 230 235 240
Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp
245 250 255
Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
260 265 270
Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys Val
275 280 285
Gly Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu
290 295 300
Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser
305 310 315 320
Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala
325 330 335
Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro
340 345 350
Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro
355 360 365
Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala
370 375 380
Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala
385 390 395 400
Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val
405 410 415
Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro
420 425 430
Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln
435 440 445
Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro
450 455 460
Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln
465 470 475 480
Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met
485 490 495
Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln
500 505 510
Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro
515 520 525
Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met
530 535 540
Asp Phe Ser Ala Leu Leu Ala Ser Gly Ser Gly Pro Lys Lys Lys Arg
545 550 555 560
Lys Val
<210> 106
<211> 758
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 106
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser
130 135 140
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala
145 150 155 160
Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
165 170 175
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr
180 185 190
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro
195 200 205
Ser Glu Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Asp
210 215 220
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp
225 230 235 240
Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp
245 250 255
Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
260 265 270
Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys Val
275 280 285
Gly Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu
290 295 300
Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser
305 310 315 320
Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala
325 330 335
Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro
340 345 350
Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro
355 360 365
Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala
370 375 380
Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala
385 390 395 400
Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val
405 410 415
Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro
420 425 430
Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln
435 440 445
Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro
450 455 460
Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln
465 470 475 480
Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met
485 490 495
Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln
500 505 510
Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro
515 520 525
Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met
530 535 540
Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser Arg
545 550 555 560
Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser Asp
565 570 575
Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro Phe
580 585 590
His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser Leu
595 600 605
Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu Thr
610 615 620
Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr Pro
625 630 635 640
Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala
645 650 655
Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu
660 665 670
Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg
675 680 685
Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp
690 695 700
Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp
705 710 715 720
Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr
725 730 735
Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe Ala Ser Gly Ser Gly Pro
740 745 750
Lys Lys Lys Arg Lys Val
755
<210> 107
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 107
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser
130 135 140
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala
145 150 155 160
Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
165 170 175
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr
180 185 190
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro
195 200 205
Ser Glu Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Ser
210 215 220
Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg
225 230 235 240
Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe
245 250 255
Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro
260 265 270
Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro
275 280 285
Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met
290 295 300
Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala
305 310 315 320
Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala
325 330 335
Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala
340 345 350
Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln
355 360 365
Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp
370 375 380
Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val
385 390 395 400
Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu
405 410 415
Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met
420 425 430
Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro
435 440 445
Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly
450 455 460
Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe
465 470 475 480
Ser Ala Leu Leu Ala Ser Gly Ser Gly Pro Lys Lys Lys Arg Lys Val
485 490 495
<210> 108
<211> 425
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 108
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser
130 135 140
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala
145 150 155 160
Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
165 170 175
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr
180 185 190
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro
195 200 205
Ser Glu Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Arg
210 215 220
Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala
225 230 235 240
Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile
245 250 255
Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro
260 265 270
Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly
275 280 285
Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala
290 295 300
Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr
305 310 315 320
Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro
325 330 335
Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro
340 345 350
Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met
355 360 365
Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu
370 375 380
Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His
385 390 395 400
Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe Ala Ser Gly
405 410 415
Ser Gly Pro Lys Lys Lys Arg Lys Val
420 425
<210> 109
<211> 692
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 109
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser
130 135 140
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala
145 150 155 160
Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
165 170 175
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr
180 185 190
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro
195 200 205
Ser Glu Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Ser
210 215 220
Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg
225 230 235 240
Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe
245 250 255
Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro
260 265 270
Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro
275 280 285
Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met
290 295 300
Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala
305 310 315 320
Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala
325 330 335
Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala
340 345 350
Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln
355 360 365
Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp
370 375 380
Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val
385 390 395 400
Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu
405 410 415
Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met
420 425 430
Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro
435 440 445
Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly
450 455 460
Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe
465 470 475 480
Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser Arg Glu Gly
485 490 495
Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser Asp Val Phe
500 505 510
Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro Phe His Pro
515 520 525
Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser Leu Ala Pro
530 535 540
Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu Thr Pro Ala
545 550 555 560
Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr Pro Glu Ala
565 570 575
Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys
580 585 590
Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala
595 600 605
Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His
610 615 620
Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn
625 630 635 640
Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe
645 650 655
Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu
660 665 670
Ser Ile Phe Asp Thr Ser Leu Phe Ala Ser Gly Ser Gly Pro Lys Lys
675 680 685
Lys Arg Lys Val
690
<210> 110
<211> 235
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 110
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser
130 135 140
Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala
145 150 155 160
Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
165 170 175
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr
180 185 190
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro
195 200 205
Ser Glu Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Gly Ser Ala
210 215 220
Ser Gly Ser Gly Pro Lys Lys Lys Arg Lys Val
225 230 235
<210> 111
<211> 2132
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 111
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Pro Lys
1370 1375 1380
Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val Gly Ser
1385 1390 1395
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1400 1405 1410
Ser Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp
1415 1420 1425
Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala
1430 1435 1440
Ala Val Arg Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn
1445 1450 1455
Ala Ile Arg Ile Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys
1460 1465 1470
Ser Ser His Gly Cys Pro Ile Ala Lys Trp Val Leu Arg Arg Ser
1475 1480 1485
Ser Asp Glu Glu Lys Val Leu Cys Leu Val Arg Gln Arg Thr Gly
1490 1495 1500
His His Cys Pro Thr Ala Val Met Val Val Leu Ile Met Val Trp
1505 1510 1515
Asp Gly Ile Pro Leu Pro Met Ala Asp Arg Leu Tyr Thr Glu Leu
1520 1525 1530
Thr Glu Asn Leu Lys Ser Tyr Asn Gly His Pro Thr Asp Arg Arg
1535 1540 1545
Cys Thr Leu Asn Glu Asn Arg Thr Cys Thr Cys Gln Gly Ile Asp
1550 1555 1560
Pro Glu Thr Cys Gly Ala Ser Phe Ser Phe Gly Cys Ser Trp Ser
1565 1570 1575
Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg Ser Pro Ser Pro Arg
1580 1585 1590
Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His Glu Lys Asn Leu
1595 1600 1605
Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala Pro Ile Tyr
1610 1615 1620
Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu Tyr Glu
1625 1630 1635
Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg Pro
1640 1645 1650
Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His
1655 1660 1665
Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr
1670 1675 1680
Leu Thr Arg Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp
1685 1690 1695
Glu Gln Leu His Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp
1700 1705 1710
Glu Phe Gly Ser Lys Glu Gly Met Glu Ala Lys Ile Lys Ser Gly
1715 1720 1725
Ala Ile Glu Val Leu Ala Pro Arg Arg Lys Lys Arg Thr Cys Phe
1730 1735 1740
Thr Gln Pro Val Pro Arg Ser Gly Lys Lys Arg Ala Ala Met Met
1745 1750 1755
Thr Glu Val Leu Ala His Lys Ile Arg Ala Val Glu Lys Lys Pro
1760 1765 1770
Ile Pro Arg Ile Lys Arg Lys Asn Asn Ser Thr Thr Thr Asn Asn
1775 1780 1785
Ser Lys Pro Ser Ser Leu Pro Thr Leu Gly Ser Asn Thr Glu Thr
1790 1795 1800
Val Gln Pro Glu Val Lys Ser Glu Thr Glu Pro His Phe Ile Leu
1805 1810 1815
Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser Leu Met Pro Ser Ala
1820 1825 1830
Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe Ser Trp Ser Pro
1835 1840 1845
Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn Asp Ala Thr
1850 1855 1860
Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His Cys Thr
1865 1870 1875
Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala Asp
1880 1885 1890
Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr
1895 1900 1905
Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser
1910 1915 1920
Thr Gly Val Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln
1925 1930 1935
Pro Ser Phe Leu Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met
1940 1945 1950
Glu Glu Asp Glu Gln His Ser Glu Ala Asp Glu Pro Pro Ser Asp
1955 1960 1965
Glu Pro Leu Ser Asp Asp Pro Leu Ser Pro Ala Glu Glu Lys Leu
1970 1975 1980
Pro His Ile Asp Glu Tyr Trp Ser Asp Ser Glu His Ile Phe Leu
1985 1990 1995
Asp Ala Asn Ile Gly Gly Val Ala Ile Ala Pro Ala His Gly Ser
2000 2005 2010
Val Leu Ile Glu Cys Ala Arg Arg Glu Leu His Ala Thr Thr Pro
2015 2020 2025
Val Glu His Pro Asn Arg Asn His Pro Thr Arg Leu Ser Leu Val
2030 2035 2040
Phe Tyr Gln His Lys Asn Leu Asn Lys Pro Gln His Gly Phe Glu
2045 2050 2055
Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu Ala Lys Asn Lys Lys
2060 2065 2070
Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala Asn Glu Gly Pro
2075 2080 2085
Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile Pro Ser His
2090 2095 2100
Lys Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val Ser Pro
2105 2110 2115
Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
2120 2125 2130
<210> 112
<211> 2132
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 112
Met Ala Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp
1 5 10 15
Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala Ala
20 25 30
Val Arg Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn Ala Ile
35 40 45
Arg Ile Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys Ser Ser His
50 55 60
Gly Cys Pro Ile Ala Lys Trp Val Leu Arg Arg Ser Ser Asp Glu Glu
65 70 75 80
Lys Val Leu Cys Leu Val Arg Gln Arg Thr Gly His His Cys Pro Thr
85 90 95
Ala Val Met Val Val Leu Ile Met Val Trp Asp Gly Ile Pro Leu Pro
100 105 110
Met Ala Asp Arg Leu Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr
115 120 125
Asn Gly His Pro Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr
130 135 140
Cys Thr Cys Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser
145 150 155 160
Phe Gly Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg
165 170 175
Ser Pro Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His
180 185 190
Glu Lys Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala
195 200 205
Pro Ile Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu
210 215 220
Tyr Glu Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg
225 230 235 240
Pro Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His
245 250 255
Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr Leu
260 265 270
Thr Arg Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp Glu Gln
275 280 285
Leu His Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp Glu Phe Gly
290 295 300
Ser Lys Glu Gly Met Glu Ala Lys Ile Lys Ser Gly Ala Ile Glu Val
305 310 315 320
Leu Ala Pro Arg Arg Lys Lys Arg Thr Cys Phe Thr Gln Pro Val Pro
325 330 335
Arg Ser Gly Lys Lys Arg Ala Ala Met Met Thr Glu Val Leu Ala His
340 345 350
Lys Ile Arg Ala Val Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys
355 360 365
Asn Asn Ser Thr Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr
370 375 380
Leu Gly Ser Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr
385 390 395 400
Glu Pro His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser
405 410 415
Leu Met Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe
420 425 430
Ser Trp Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn
435 440 445
Asp Ala Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His
450 455 460
Cys Thr Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala
465 470 475 480
Asp Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr
485 490 495
Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser Thr
500 505 510
Gly Val Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln Pro Ser
515 520 525
Phe Leu Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met Glu Glu Asp
530 535 540
Glu Gln His Ser Glu Ala Asp Glu Pro Pro Ser Asp Glu Pro Leu Ser
545 550 555 560
Asp Asp Pro Leu Ser Pro Ala Glu Glu Lys Leu Pro His Ile Asp Glu
565 570 575
Tyr Trp Ser Asp Ser Glu His Ile Phe Leu Asp Ala Asn Ile Gly Gly
580 585 590
Val Ala Ile Ala Pro Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg
595 600 605
Arg Glu Leu His Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His
610 615 620
Pro Thr Arg Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys
625 630 635 640
Pro Gln His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu
645 650 655
Ala Lys Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala
660 665 670
Asn Glu Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile
675 680 685
Pro Ser His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val
690 695 700
Ser Pro Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
705 710 715 720
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
725 730 735
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
740 745 750
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
755 760 765
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
770 775 780
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
785 790 795 800
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
805 810 815
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
820 825 830
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
835 840 845
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
850 855 860
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
865 870 875 880
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
885 890 895
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
900 905 910
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
915 920 925
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
930 935 940
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
945 950 955 960
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
965 970 975
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
980 985 990
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
995 1000 1005
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala
1010 1015 1020
Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
1025 1030 1035
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
1040 1045 1050
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
1055 1060 1065
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr
1070 1075 1080
Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
1085 1090 1095
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
1100 1105 1110
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys
1115 1120 1125
Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn
1130 1135 1140
Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
1145 1150 1155
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg
1160 1165 1170
Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
1175 1180 1185
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg
1190 1195 1200
Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val
1205 1210 1215
Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
1220 1225 1230
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
1235 1240 1245
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val
1250 1255 1260
Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
1265 1270 1275
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
1280 1285 1290
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
1295 1300 1305
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe
1310 1315 1320
Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
1325 1330 1335
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
1340 1345 1350
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile
1355 1360 1365
Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val
1370 1375 1380
Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu
1385 1390 1395
Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys
1400 1405 1410
Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn
1415 1420 1425
Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
1430 1435 1440
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
1445 1450 1455
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
1460 1465 1470
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
1475 1480 1485
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
1490 1495 1500
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
1505 1510 1515
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
1520 1525 1530
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
1535 1540 1545
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu
1550 1555 1560
Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val
1565 1570 1575
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
1580 1585 1590
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser
1595 1600 1605
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
1610 1615 1620
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
1625 1630 1635
Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1640 1645 1650
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1655 1660 1665
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
1670 1675 1680
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu
1685 1690 1695
Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
1700 1705 1710
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
1715 1720 1725
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1730 1735 1740
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1745 1750 1755
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1760 1765 1770
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1775 1780 1785
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1790 1795 1800
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1805 1810 1815
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1820 1825 1830
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1835 1840 1845
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1850 1855 1860
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1865 1870 1875
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1880 1885 1890
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1895 1900 1905
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1910 1915 1920
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1925 1930 1935
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1940 1945 1950
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1955 1960 1965
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1970 1975 1980
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1985 1990 1995
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
2000 2005 2010
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
2015 2020 2025
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
2030 2035 2040
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
2045 2050 2055
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
2060 2065 2070
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
2075 2080 2085
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
2090 2095 2100
Asp Gly Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Pro
2105 2110 2115
Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val
2120 2125 2130
<210> 113
<211> 2196
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 113
Met Ala Leu Pro Thr Cys Ser Cys Leu Asp Arg Val Ile Gln Lys Asp
1 5 10 15
Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly Pro Ser Val Ala Ala
20 25 30
Val Arg Glu Ile Met Glu Asn Arg Tyr Gly Gln Lys Gly Asn Ala Ile
35 40 45
Arg Ile Glu Ile Val Val Tyr Thr Gly Lys Glu Gly Lys Ser Ser His
50 55 60
Gly Cys Pro Ile Ala Lys Trp Val Leu Arg Arg Ser Ser Asp Glu Glu
65 70 75 80
Lys Val Leu Cys Leu Val Arg Gln Arg Thr Gly His His Cys Pro Thr
85 90 95
Ala Val Met Val Val Leu Ile Met Val Trp Asp Gly Ile Pro Leu Pro
100 105 110
Met Ala Asp Arg Leu Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr
115 120 125
Asn Gly His Pro Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr
130 135 140
Cys Thr Cys Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser
145 150 155 160
Phe Gly Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg
165 170 175
Ser Pro Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His
180 185 190
Glu Lys Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu Ala
195 200 205
Pro Ile Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln Val Glu
210 215 220
Tyr Glu Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys Glu Gly Arg
225 230 235 240
Pro Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys Ala His Pro His
245 250 255
Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr Val Val Cys Thr Leu
260 265 270
Thr Arg Glu Asp Asn Arg Ser Leu Gly Val Ile Pro Gln Asp Glu Gln
275 280 285
Leu His Val Leu Pro Leu Tyr Lys Leu Ser Asp Thr Asp Glu Phe Gly
290 295 300
Ser Lys Glu Gly Met Glu Ala Lys Ile Lys Ser Gly Ala Ile Glu Val
305 310 315 320
Leu Ala Pro Arg Arg Lys Lys Arg Thr Cys Phe Thr Gln Pro Val Pro
325 330 335
Arg Ser Gly Lys Lys Arg Ala Ala Met Met Thr Glu Val Leu Ala His
340 345 350
Lys Ile Arg Ala Val Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys
355 360 365
Asn Asn Ser Thr Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr
370 375 380
Leu Gly Ser Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr
385 390 395 400
Glu Pro His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser
405 410 415
Leu Met Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe
420 425 430
Ser Trp Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys Asn
435 440 445
Asp Ala Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr Pro His
450 455 460
Cys Thr Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala Ala Ala Ala
465 470 475 480
Asp Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala Pro Leu Pro Thr
485 490 495
Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn Ser Glu Pro Ser Thr
500 505 510
Gly Val Thr Glu Pro Leu Thr Pro His Gln Pro Asn His Gln Pro Ser
515 520 525
Phe Leu Thr Ser Pro Gln Asp Leu Ala Ser Ser Pro Met Glu Glu Asp
530 535 540
Glu Gln His Ser Glu Ala Asp Glu Pro Pro Ser Asp Glu Pro Leu Ser
545 550 555 560
Asp Asp Pro Leu Ser Pro Ala Glu Glu Lys Leu Pro His Ile Asp Glu
565 570 575
Tyr Trp Ser Asp Ser Glu His Ile Phe Leu Asp Ala Asn Ile Gly Gly
580 585 590
Val Ala Ile Ala Pro Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg
595 600 605
Arg Glu Leu His Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His
610 615 620
Pro Thr Arg Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys
625 630 635 640
Pro Gln His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu
645 650 655
Ala Lys Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala
660 665 670
Asn Glu Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln Ile
675 680 685
Pro Ser His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val Thr Val
690 695 700
Ser Pro Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn His Trp Val
705 710 715 720
Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala
725 730 735
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
740 745 750
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
755 760 765
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr
770 775 780
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
785 790 795 800
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
805 810 815
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
820 825 830
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
835 840 845
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
850 855 860
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
865 870 875 880
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
885 890 895
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
900 905 910
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
915 920 925
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
930 935 940
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
945 950 955 960
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
965 970 975
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
980 985 990
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
995 1000 1005
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu
1010 1015 1020
Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
1025 1030 1035
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
1040 1045 1050
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
1055 1060 1065
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly
1070 1075 1080
Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
1085 1090 1095
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
1100 1105 1110
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His
1115 1120 1125
His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu
1130 1135 1140
Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
1145 1150 1155
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr
1160 1165 1170
Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
1175 1180 1185
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg
1190 1195 1200
Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu
1205 1210 1215
Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
1220 1225 1230
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
1235 1240 1245
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala
1250 1255 1260
Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
1265 1270 1275
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
1280 1285 1290
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
1295 1300 1305
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu
1310 1315 1320
Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
1325 1330 1335
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
1340 1345 1350
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr
1355 1360 1365
Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val
1370 1375 1380
Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
1385 1390 1395
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
1400 1405 1410
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1415 1420 1425
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
1430 1435 1440
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
1445 1450 1455
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
1460 1465 1470
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
1475 1480 1485
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
1490 1495 1500
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
1505 1510 1515
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
1520 1525 1530
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
1535 1540 1545
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1550 1555 1560
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1565 1570 1575
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1580 1585 1590
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1595 1600 1605
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1610 1615 1620
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1625 1630 1635
Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1640 1645 1650
Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp
1655 1660 1665
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1670 1675 1680
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1685 1690 1695
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1700 1705 1710
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1715 1720 1725
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1730 1735 1740
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1745 1750 1755
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1760 1765 1770
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1775 1780 1785
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1790 1795 1800
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1805 1810 1815
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1820 1825 1830
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1835 1840 1845
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1850 1855 1860
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1865 1870 1875
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1880 1885 1890
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1895 1900 1905
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1910 1915 1920
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1925 1930 1935
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1940 1945 1950
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1955 1960 1965
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1970 1975 1980
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1985 1990 1995
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
2000 2005 2010
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
2015 2020 2025
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
2030 2035 2040
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
2045 2050 2055
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
2060 2065 2070
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
2075 2080 2085
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
2090 2095 2100
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
2105 2110 2115
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
2120 2125 2130
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
2135 2140 2145
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
2150 2155 2160
Gln Leu Gly Gly Asp Gly Gly Gly Gly Ser Pro Lys Lys Lys Arg
2165 2170 2175
Lys Val Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys
2180 2185 2190
Arg Lys Val
2195
<210> 114
<211> 113
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 114
gacgctcaaa tttccgcagt gtttaagagc taagctggaa acagcatagc aagtttaaat 60
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttt 113
<210> 115
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 115
gtttaagagc taagctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgctttt ttt 93
<210> 116
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 116
gacgctcaaa tttccgcagt 20
<210> 117
<211> 143
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 117
gtttaagagc taagccaaca tgaggatcac ccatgtctgc agggcatagc aagtttaaat 60
aaggctagtc cgttatcaac ttggccaaca tgaggatcac ccatgtctgc agggccaagt 120
ggcaccgagt cggtgctttt ttt 143
<210> 118
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 118
taatacgact cactatagg 19
<210> 119
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 119
agatcggaag agcacacgtc tgaactc 27
<210> 120
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 120
aucuuaggag uggcuccgg 19
Claims (69)
- N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질.
- 제1항에 있어서, 탈메틸화 도메인이 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합인 융합 단백질.
- 제2항에 있어서, 탈메틸화 도메인이 TET1 도메인인 융합 단백질.
- 제2항에 있어서, TET1 도메인이 서열 번호:1, 서열 번호:86, 또는 서열 번호:97과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항에 있어서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 dCas9, dCas12a, dCpf1, Cas-phi, 나선-회전-나선 모티프, 나선-루프-나선 도메인, HMB-박스 도메인, Wor3 도메인, OB-폴드 도메인, 면역글로불린 도메인, 또는 B3 도메인인 융합 단백질.
- 제5항에 있어서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 dCas9인 융합 단백질.
- 제1항에 있어서, XTEN 링커가 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인 융합 단백질.
- 제7항에 있어서, XTEN 링커가 서열 번호:5, 서열 번호:6 또는 서열 번호:98과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항에 있어서, 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함하는 융합 단백질.
- N-말단으로부터 C-말단까지, RNA-결합 서열, XTEN 링커, 및 적어도 하나의 전사 활성화제를 포함하는 융합 단백질.
- 제10항에 있어서, 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인 융합 단백질.
- 제11항에 있어서, p65가 서열 번호:13, 서열 번호:14, 또는 서열 번호:100과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제11항에 있어서, Rta가 서열 번호:15 또는 서열 번호:16과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제11항에 있어서, VP64가 서열 번호:17 또는 서열 번호:18과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제10항에 있어서, RNA-결합 서열이 MS2 RNA-결합 서열인 융합 단백질.
- 제15항에 있어서, MS2 RNA-결합 서열이 서열 번호:21의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제10항에 있어서, XTEN 링커가 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인 융합 단백질.
- 제10항에 있어서, 서열 번호:104, 서열 번호:105, 서열 번호:106, 서열 번호:107, 서열 번호:108, 서열 번호:109, 또는 서열 번호:110과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 갖는 융합 단백질.
- 제10항에 있어서, 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함하는 융합 단백질.
- N-말단으로부터 C-말단까지, 탈메틸화 도메인, 제1 XTEN 링커, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소, 제2 XTEN 링커, 및 전사 활성화제를 포함하는 융합 단백질.
- 제20항에 있어서, 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인 융합 단백질.
- N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질.
- 제20항에 있어서, 핵 국소화 서열을 추가로 포함하는 융합 단백질.
- 제20항에 있어서, 탈메틸화 도메인이 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합인 융합 단백질.
- 제24항에 있어서, 탈메틸화 도메인이 TET1 도메인인 융합 단백질.
- 제20항에 있어서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 dCas9, dCas12a, dCpf1, Cas-phi, 류신 지퍼 도메인, 날개형 나선 도메인, 나선-회전-나선 모티프, 나선-루프-나선 도메인, HMB-박스 도메인, Wor3 도메인, OB-폴드 도메인, 면역글로불린 도메인, 또는 B3 도메인인 융합 단백질.
- 제26항에 있어서, 뉴클레아제-결핍 RNA-가이드된 DNA 엔도뉴클레아제 효소가 dCas9인 융합 단백질.
- 제20항에 있어서, 제1 XTEN 링커 및 제2 XTEN 링커가 각각 독립적으로 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인 융합 단백질.
- 제20항에 있어서, 에피토프 택, 2A 펩티드, 형광 단백질 택, 또는 이들 둘 이상의 조합을 추가로 포함하는 융합 단백질.
- 서열 번호:99, 서열 번호:101, 서열 번호:102, 서열 번호:111, 서열 번호:112, 또는 서열 번호:113과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 융합 단백질.
- 제30항에 있어서, 서열 번호:99, 서열 번호:101, 서열 번호:102, 서열 번호:111, 서열 번호:112, 또는 서열 번호:113과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 융합 단백질.
- 제31항에 있어서, 서열 번호:99, 서열 번호:101, 서열 번호:102, 서열 번호:111, 서열 번호:112, 또는 서열 번호:113을 포함하는 융합 단백질.
- (i) 제1항의 융합 단백질을 인코딩하는 제1 폴리뉴클레오티드를 표적 핵산을 함유하는 세포로 전달하는 단계; 및
(ii) (a) sgRNA 또는 (b) cr:tracrRNA를 포함하는 제2 폴리뉴클레오티드를 세포로 전달하고;
이로써 세포에서 표적 핵산 서열을 활성화 또는 재활성화하는 단계
를 포함하는, 세포에서의 표적 핵산 서열의 활성화 또는 재활성화하는 방법. - 제32항에 있어서, 표적 핵산 서열이 CpG 섬을 포함하는 것인 방법.
- 제32항에 있어서, 표적 핵산 서열이 비-CpG 섬을 포함하는 것인 방법.
- 제32항에 있어서, 제2 폴리뉴클레오티드가 sgRNA를 포함하는 것인 방법.
- 제32항에 있어서, sgRNA가 적어도 하나의 MS2 스템 루프를 포함하는 것인 방법.
- 제37항에 있어서, sgRNA가 2개의 MS2 스템 루프를 포함하는 것인 방법.
- 제32항에 있어서, 제2 폴리뉴클레오티드가 전사 활성화제를 인코딩하는 것인 방법.
- 제39항에 있어서, 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인 방법.
- 제32항에 있어서, 제2 폴리뉴클레오티드가 MS2 RNA-결합 서열을 추가로 인코딩하는 것인 방법.
- 제41항에 있어서, MS2 RNA-결합 서열이 서열 번호:21의 아미노산 서열을 포함하는 것인 방법.
- 제32항에 있어서, 제2 폴리뉴클레오티드가 XTEN 링커, 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합에 대하여 추가로 인코딩하는 것인 방법.
- 제32항에 있어서, 전사 활성화제를 포함하는 제2 융합 단백질을 인코딩하는 제3 폴리뉴클레오티드를 세포로 전달하는 것을 추가로 포함하는 방법.
- 제44항에 있어서, 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인 방법.
- 제44항에 있어서, 제2 융합 단백질이 MS2 RNA-결합 서열을 추가로 포함하는 것인 방법.
- 제46항에 있어서, MS2 RNA-결합 서열이 서열 번호:21의 아미노산 서열을 포함하는 것인 방법.
- 제44항에 있어서, 제2 융합 단백질이 XTEN 링커, 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함하는 것인 방법.
- N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질.
- 제49항에 있어서, 탈메틸화 도메인이 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합인 융합 단백질.
- 제49항에 있어서, 탈메틸화 도메인이 TET1 도메인인 융합 단백질.
- 제51항에 있어서, TET1 도메인이 서열 번호:1, 서열 번호:86, 또는 서열 번호:97과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제49항에 있어서, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소가 아연 핑거 도메인인 융합 단백질.
- 제49항에 있어서, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소가 TALE인 융합 단백질.
- 제49항에 있어서, XTEN 링커가 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인 융합 단백질.
- 제55항에 있어서, XTEN 링커가 서열 번호:5, 서열 번호:6 또는 서열 번호:98과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
- 제49항에 있어서, 에피토프 택, 2A 펩티드, 형광 단백질 택, 핵 국소화 신호 펩티드, 또는 이들 둘 이상의 조합을 추가로 포함하는 융합 단백질.
- N-말단으로부터 C-말단까지, 탈메틸화 도메인, 제1 XTEN 링커, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소, 제2 XTEN 링커, 및 전사 활성화제를 포함하는 융합 단백질.
- 제58항에 있어서, 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인 융합 단백질.
- N-말단으로부터 C-말단까지, 탈메틸화 도메인, XTEN 링커, 및 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소를 포함하는 융합 단백질.
- 제58항에 있어서, 핵 국소화 서열을 추가로 포함하는 융합 단백질.
- 제58항에 있어서, 탈메틸화 도메인이 TET1 도메인, TET2 도메인, TET3 도메인, 또는 이들 둘 이상의 조합인 융합 단백질.
- 제62항에 있어서, 탈메틸화 도메인이 TET1 도메인인 융합 단백질.
- 제58항에 있어서, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소가 아연 핑거 도메인인 융합 단백질.
- 제58항에 있어서, 뉴클레아제-결핍 DNA 엔도뉴클레아제 효소가 TALE인 융합 단백질.
- 제58항에 있어서, 제1 XTEN 링커 및 제2 XTEN 링커가 각각 독립적으로 약 10개의 아미노산 잔기 내지 약 864개의 아미노산 잔기를 포함하는 것인 융합 단백질.
- 제58항에 있어서, 에피토프 택, 2A 펩티드, 형광 단백질 택, 또는 이들 둘 이상의 조합을 추가로 포함하는 융합 단백질.
- 제58항의 융합 단백질을 인코딩하는 폴리뉴클레오티드를 표적 핵산을 함유하는 세포로 전달하고; 이로써 세포에서 표적 핵산 서열을 활성화 또는 재활성화하는 단계를 포함하는, 세포에서의 표적 핵산 서열의 활성화 또는 재활성화 방법.
- 제68항에 있어서, 전사 활성화제가 VP64, p65, Rta, 또는 이들 둘 이상의 조합인 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063035431P | 2020-06-05 | 2020-06-05 | |
US63/035,431 | 2020-06-05 | ||
US202063118832P | 2020-11-27 | 2020-11-27 | |
US63/118,832 | 2020-11-27 | ||
PCT/US2021/035937 WO2021248023A2 (en) | 2020-06-05 | 2021-06-04 | Compositions and methods for epigenome editing |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230021081A true KR20230021081A (ko) | 2023-02-13 |
Family
ID=78831718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237000254A KR20230021081A (ko) | 2020-06-05 | 2021-06-04 | 에피게놈 편집을 위한 조성물 및 방법 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20230212323A1 (ko) |
EP (1) | EP4162054A2 (ko) |
JP (1) | JP2023529844A (ko) |
KR (1) | KR20230021081A (ko) |
CN (1) | CN116057180A (ko) |
AU (1) | AU2021282659A1 (ko) |
BR (1) | BR112022024747A2 (ko) |
CA (1) | CA3184882A1 (ko) |
GB (1) | GB2612466A (ko) |
IL (1) | IL298605A (ko) |
MX (1) | MX2022015284A (ko) |
WO (1) | WO2021248023A2 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113846019B (zh) * | 2021-03-05 | 2023-08-01 | 海南师范大学 | 一种海洋微拟球藻靶向表观基因组遗传调控方法 |
WO2023218021A1 (en) * | 2022-05-13 | 2023-11-16 | Integra Therapeutics | Use of transposases for improving transgene expression and nuclear localization |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016022363A2 (en) * | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
EP3574102A4 (en) * | 2017-01-26 | 2020-09-30 | The Regents of The University of California | TARGETED GENE METHYLATION IN PLANTS |
-
2021
- 2021-06-04 BR BR112022024747A patent/BR112022024747A2/pt unknown
- 2021-06-04 AU AU2021282659A patent/AU2021282659A1/en active Pending
- 2021-06-04 GB GB2219608.3A patent/GB2612466A/en active Pending
- 2021-06-04 CA CA3184882A patent/CA3184882A1/en active Pending
- 2021-06-04 WO PCT/US2021/035937 patent/WO2021248023A2/en unknown
- 2021-06-04 JP JP2022574471A patent/JP2023529844A/ja active Pending
- 2021-06-04 IL IL298605A patent/IL298605A/en unknown
- 2021-06-04 EP EP21818667.4A patent/EP4162054A2/en active Pending
- 2021-06-04 CN CN202180047868.5A patent/CN116057180A/zh active Pending
- 2021-06-04 US US17/999,762 patent/US20230212323A1/en active Pending
- 2021-06-04 KR KR1020237000254A patent/KR20230021081A/ko unknown
- 2021-06-04 MX MX2022015284A patent/MX2022015284A/es unknown
Also Published As
Publication number | Publication date |
---|---|
US20230212323A1 (en) | 2023-07-06 |
EP4162054A2 (en) | 2023-04-12 |
GB202219608D0 (en) | 2023-02-08 |
IL298605A (en) | 2023-01-01 |
MX2022015284A (es) | 2023-01-19 |
CN116057180A (zh) | 2023-05-02 |
AU2021282659A1 (en) | 2023-01-05 |
CA3184882A1 (en) | 2021-12-09 |
BR112022024747A2 (pt) | 2023-03-07 |
WO2021248023A2 (en) | 2021-12-09 |
WO2021248023A3 (en) | 2022-01-27 |
GB2612466A (en) | 2023-05-03 |
JP2023529844A (ja) | 2023-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109072235B (zh) | 通过核递送crispr/cas9追踪并操纵细胞rna | |
JP7038079B2 (ja) | Crisprハイブリッドdna/rnaポリヌクレオチドおよび使用方法 | |
US20230124253A1 (en) | Compositions and Methods for Gene Editing | |
US10093910B2 (en) | Engineered CRISPR-Cas9 nucleases | |
KR102285485B1 (ko) | Rna-가이드된 유전자 조절 및 편집을 위한 직교 cas9 단백질 | |
KR102512979B1 (ko) | Rna-가이드된 전사 조절 | |
JP2023529611A (ja) | ゲノム編集のための組成物及び方法 | |
Van Houten | Nucleotide excision repair in Escherichia coli | |
KR102602047B1 (ko) | Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용 | |
WO2017023974A1 (en) | Cas9 genome editing and transcriptional regulation | |
GB2617658A (en) | Class II, type V CRISPR systems | |
KR20230021081A (ko) | 에피게놈 편집을 위한 조성물 및 방법 | |
RU2804665C2 (ru) | Композиции и способы редактирования генов | |
CN116724058A (zh) | 用于基因编辑的组合物和方法 | |
CN117242184A (zh) | 向导RNA设计及用于V型Cas系统的复合物 | |
CN117062912A (zh) | 用于基于crispr的转录抑制的融合蛋白 |