KR20210030399A - 4'-에티닐 뉴클레오시드 유사체의 효소적 합성 - Google Patents
4'-에티닐 뉴클레오시드 유사체의 효소적 합성 Download PDFInfo
- Publication number
- KR20210030399A KR20210030399A KR1020217003533A KR20217003533A KR20210030399A KR 20210030399 A KR20210030399 A KR 20210030399A KR 1020217003533 A KR1020217003533 A KR 1020217003533A KR 20217003533 A KR20217003533 A KR 20217003533A KR 20210030399 A KR20210030399 A KR 20210030399A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- ala
- ser
- thr
- val
- Prior art date
Links
- 239000002777 nucleoside Substances 0.000 title claims abstract description 39
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 37
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 25
- 230000002255 enzymatic effect Effects 0.000 title abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 109
- 150000001875 compounds Chemical class 0.000 claims abstract description 65
- 125000003835 nucleoside group Chemical group 0.000 claims abstract description 14
- 238000006243 chemical reaction Methods 0.000 claims description 136
- 239000000243 solution Substances 0.000 claims description 85
- 108010015133 Galactose oxidase Proteins 0.000 claims description 70
- 108010021592 Pantothenate kinase Proteins 0.000 claims description 68
- 102100024122 Pantothenate kinase 1 Human genes 0.000 claims description 68
- 108010092060 Acetate kinase Proteins 0.000 claims description 65
- 102000030764 Purine-nucleoside phosphorylase Human genes 0.000 claims description 54
- 150000001768 cations Chemical class 0.000 claims description 54
- 108010001722 phosphopentomutase Proteins 0.000 claims description 51
- 101710101148 Probable 6-oxopurine nucleoside phosphorylase Proteins 0.000 claims description 49
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 49
- 108700016241 Deoxyribose-phosphate aldolases Proteins 0.000 claims description 48
- 102000030794 deoxyribose-phosphate aldolase Human genes 0.000 claims description 48
- 102100036629 Phosphoglucomutase-2 Human genes 0.000 claims description 46
- 229910019142 PO4 Inorganic materials 0.000 claims description 38
- 239000010452 phosphate Substances 0.000 claims description 37
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 claims description 32
- 108020000005 Sucrose phosphorylase Proteins 0.000 claims description 31
- 150000003839 salts Chemical class 0.000 claims description 30
- 239000000203 mixture Substances 0.000 claims description 29
- 102000016938 Catalase Human genes 0.000 claims description 27
- 108010053835 Catalase Proteins 0.000 claims description 27
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 22
- 150000003833 nucleoside derivatives Chemical class 0.000 claims description 21
- 239000001301 oxygen Substances 0.000 claims description 20
- 229910052760 oxygen Inorganic materials 0.000 claims description 20
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 19
- 229940125898 compound 5 Drugs 0.000 claims description 16
- 239000011541 reaction mixture Substances 0.000 claims description 16
- 102000003992 Peroxidases Human genes 0.000 claims description 15
- 150000007854 aminals Chemical class 0.000 claims description 15
- 108010042687 Pyruvate Oxidase Proteins 0.000 claims description 14
- 229930006000 Sucrose Natural products 0.000 claims description 14
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 14
- 108040007629 peroxidase activity proteins Proteins 0.000 claims description 14
- 239000005720 sucrose Substances 0.000 claims description 14
- 239000010949 copper Substances 0.000 claims description 11
- WAEMQWOKJMHJLA-UHFFFAOYSA-N Manganese(2+) Chemical class [Mn+2] WAEMQWOKJMHJLA-UHFFFAOYSA-N 0.000 claims description 10
- LIPOUNRJVLNBCD-UHFFFAOYSA-N acetyl dihydrogen phosphate Chemical compound CC(=O)OP(O)(O)=O LIPOUNRJVLNBCD-UHFFFAOYSA-N 0.000 claims description 10
- 239000008366 buffered solution Substances 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 10
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 9
- 239000007864 aqueous solution Substances 0.000 claims description 9
- 229910052802 copper Inorganic materials 0.000 claims description 9
- 229910052757 nitrogen Inorganic materials 0.000 claims description 9
- 239000007800 oxidant agent Substances 0.000 claims description 9
- 230000002194 synthesizing effect Effects 0.000 claims description 9
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 claims description 8
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 claims description 8
- 239000006227 byproduct Substances 0.000 claims description 8
- 239000011575 calcium Substances 0.000 claims description 8
- 229910052791 calcium Inorganic materials 0.000 claims description 8
- 229910052748 manganese Inorganic materials 0.000 claims description 8
- 239000011572 manganese Substances 0.000 claims description 8
- 239000003960 organic solvent Substances 0.000 claims description 8
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 claims description 7
- 239000007853 buffer solution Substances 0.000 claims description 7
- 238000011065 in-situ storage Methods 0.000 claims description 7
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 claims description 6
- 229940126214 compound 3 Drugs 0.000 claims description 6
- 229910052816 inorganic phosphate Inorganic materials 0.000 claims description 6
- 239000011777 magnesium Substances 0.000 claims description 6
- 229910052749 magnesium Inorganic materials 0.000 claims description 6
- 229910052751 metal Inorganic materials 0.000 claims description 5
- 239000002184 metal Substances 0.000 claims description 5
- 150000007522 mineralic acids Chemical class 0.000 claims description 4
- 150000007524 organic acids Chemical class 0.000 claims description 4
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 claims description 3
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 claims description 3
- 102000001253 Protein Kinase Human genes 0.000 claims description 3
- 102000004316 Oxidoreductases Human genes 0.000 claims description 2
- 108090000854 Oxidoreductases Proteins 0.000 claims description 2
- 150000001412 amines Chemical class 0.000 claims description 2
- 150000001414 amino alcohols Chemical class 0.000 claims description 2
- 150000004985 diamines Chemical class 0.000 claims description 2
- 241000282472 Canis lupus familiaris Species 0.000 claims 6
- 238000009472 formulation Methods 0.000 claims 1
- 238000002156 mixing Methods 0.000 claims 1
- 230000001172 regenerating effect Effects 0.000 claims 1
- IKKXOSBHLYMWAE-QRPMWFLTSA-N islatravir Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@H]1C[C@H](O)[C@](CO)(C#C)O1 IKKXOSBHLYMWAE-QRPMWFLTSA-N 0.000 abstract description 37
- 230000008569 process Effects 0.000 abstract description 17
- 238000006206 glycosylation reaction Methods 0.000 abstract description 11
- 239000000543 intermediate Substances 0.000 abstract description 10
- 125000006239 protecting group Chemical group 0.000 abstract description 10
- 230000013595 glycosylation Effects 0.000 abstract description 6
- 102000004190 Enzymes Human genes 0.000 description 79
- 108090000790 Enzymes Proteins 0.000 description 79
- 108090000765 processed proteins & peptides Proteins 0.000 description 73
- 235000001014 amino acid Nutrition 0.000 description 72
- 229920001184 polypeptide Polymers 0.000 description 72
- 102000004196 processed proteins & peptides Human genes 0.000 description 72
- 229920005989 resin Polymers 0.000 description 67
- 239000011347 resin Substances 0.000 description 67
- 150000001413 amino acids Chemical class 0.000 description 45
- 238000006467 substitution reaction Methods 0.000 description 45
- 238000005481 NMR spectroscopy Methods 0.000 description 42
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 36
- 229940024606 amino acid Drugs 0.000 description 34
- 239000000872 buffer Substances 0.000 description 34
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 32
- 239000000758 substrate Substances 0.000 description 31
- 125000003275 alpha amino acid group Chemical group 0.000 description 30
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 27
- GRMKBKTVVCARJI-UHFFFAOYSA-N 2-ethynylpropane-1,2,3-triol Chemical compound OCC(O)(CO)C#C GRMKBKTVVCARJI-UHFFFAOYSA-N 0.000 description 26
- 230000000694 effects Effects 0.000 description 26
- 108010047857 aspartylglycine Proteins 0.000 description 25
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 25
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 23
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 22
- 150000001299 aldehydes Chemical class 0.000 description 22
- OCDZBJSPHIMBAT-YFKPBYRVSA-N (2R)-2-hydroxy-2-(hydroxymethyl)but-3-ynal Chemical compound C(=O)[C@](O)(CO)C#C OCDZBJSPHIMBAT-YFKPBYRVSA-N 0.000 description 21
- 239000012148 binding buffer Substances 0.000 description 21
- 108010050848 glycylleucine Proteins 0.000 description 21
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 20
- 108010061238 threonyl-glycine Proteins 0.000 description 20
- 239000000047 product Substances 0.000 description 19
- 108010031719 prolyl-serine Proteins 0.000 description 19
- 108010026333 seryl-proline Proteins 0.000 description 19
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 18
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 17
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 17
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 17
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 16
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 16
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 16
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 15
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 15
- 241000588724 Escherichia coli Species 0.000 description 15
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 15
- 241000880493 Leptailurus serval Species 0.000 description 15
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical class [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 15
- ZYVMKADVRJJTTG-RNFRBKRXSA-N [(2R,3R)-2-ethynyl-2,3-dihydroxy-5-oxopentyl] dihydrogen phosphate Chemical compound P(=O)(O)(O)OC[C@]([C@@H](CC=O)O)(O)C#C ZYVMKADVRJJTTG-RNFRBKRXSA-N 0.000 description 15
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 15
- 235000021317 phosphate Nutrition 0.000 description 15
- 239000001488 sodium phosphate Substances 0.000 description 15
- 229910000162 sodium phosphate Inorganic materials 0.000 description 15
- 235000011008 sodium phosphates Nutrition 0.000 description 15
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 15
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 14
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 14
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 14
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 14
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 14
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 13
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 13
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 13
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 13
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 12
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 12
- 108010047495 alanylglycine Proteins 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- 238000011069 regeneration method Methods 0.000 description 12
- 241000894007 species Species 0.000 description 12
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 12
- 108010065920 Insulin Lispro Proteins 0.000 description 11
- 108010077245 asparaginyl-proline Proteins 0.000 description 11
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 11
- 230000006872 improvement Effects 0.000 description 11
- 238000006366 phosphorylation reaction Methods 0.000 description 11
- 108010073969 valyllysine Proteins 0.000 description 11
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 10
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 10
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 10
- -1 as shown in Scheme 2 Proteins 0.000 description 10
- 108010087823 glycyltyrosine Proteins 0.000 description 10
- 108010037850 glycylvaline Proteins 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- 108010057821 leucylproline Proteins 0.000 description 10
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 10
- 108010054155 lysyllysine Proteins 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- 235000000346 sugar Nutrition 0.000 description 10
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 9
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 9
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 9
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 9
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 9
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 9
- 239000007995 HEPES buffer Substances 0.000 description 9
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 9
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 9
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 9
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 9
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 9
- 108010068488 methionylphenylalanine Proteins 0.000 description 9
- 230000026731 phosphorylation Effects 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 9
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 8
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 8
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 8
- QVLDCOZALMRVRJ-YFKPBYRVSA-N C#C[C@](CO)(COP(O)(O)=O)O Chemical compound C#C[C@](CO)(COP(O)(O)=O)O QVLDCOZALMRVRJ-YFKPBYRVSA-N 0.000 description 8
- IAZDPXIOMUYVGZ-WFGJKAKNSA-N Dimethyl sulfoxide Chemical compound [2H]C([2H])([2H])S(=O)C([2H])([2H])[2H] IAZDPXIOMUYVGZ-WFGJKAKNSA-N 0.000 description 8
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 8
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 8
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 8
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 8
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 8
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 8
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 8
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 8
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 8
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 8
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 8
- GSEJCLTVZPLZKY-UHFFFAOYSA-N Triethanolamine Chemical compound OCCN(CCO)CCO GSEJCLTVZPLZKY-UHFFFAOYSA-N 0.000 description 8
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 8
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 8
- 238000007792 addition Methods 0.000 description 8
- 229910052799 carbon Inorganic materials 0.000 description 8
- ARUVKPQLZAKDPS-UHFFFAOYSA-L copper(II) sulfate Chemical compound [Cu+2].[O-][S+2]([O-])([O-])[O-] ARUVKPQLZAKDPS-UHFFFAOYSA-L 0.000 description 8
- 229910000366 copper(II) sulfate Inorganic materials 0.000 description 8
- 239000012467 final product Substances 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 108010040030 histidinoalanine Proteins 0.000 description 8
- 229910001629 magnesium chloride Inorganic materials 0.000 description 8
- 239000002904 solvent Substances 0.000 description 8
- 229960004418 trolamine Drugs 0.000 description 8
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 7
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 7
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 7
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 7
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 7
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 7
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 7
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 7
- MECFLTFREHAZLH-ACZMJKKPSA-N Asn-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N MECFLTFREHAZLH-ACZMJKKPSA-N 0.000 description 7
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 7
- JGIAYNNXZKKKOW-KKUMJFAQSA-N Asn-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N JGIAYNNXZKKKOW-KKUMJFAQSA-N 0.000 description 7
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 7
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 7
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 7
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 7
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 7
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 7
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 7
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 7
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 7
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 7
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 7
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 7
- 101000867659 Bos taurus Catalase Proteins 0.000 description 7
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 241000223195 Fusarium graminearum Species 0.000 description 7
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 7
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 7
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 7
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 7
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 7
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 7
- WTUSRDZLLWGYAT-KCTSRDHCSA-N Gly-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN WTUSRDZLLWGYAT-KCTSRDHCSA-N 0.000 description 7
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 7
- WCNXUTNLSRWWQN-DCAQKATOSA-N His-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WCNXUTNLSRWWQN-DCAQKATOSA-N 0.000 description 7
- CCHSQWLCOOZREA-GMOBBJLQSA-N Ile-Asp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N CCHSQWLCOOZREA-GMOBBJLQSA-N 0.000 description 7
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 7
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 7
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 7
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 7
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 7
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 7
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 7
- GSSMYQHXZNERFX-WDSOQIARSA-N Leu-Met-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N GSSMYQHXZNERFX-WDSOQIARSA-N 0.000 description 7
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 7
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 7
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 7
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 7
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 7
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 7
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 7
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 7
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 7
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 7
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 7
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 7
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 7
- 108010079364 N-glycylalanine Proteins 0.000 description 7
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 7
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 7
- VJEZWOSKRCLHRP-MELADBBJSA-N Phe-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O VJEZWOSKRCLHRP-MELADBBJSA-N 0.000 description 7
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 7
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 7
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 7
- KQUMFXGQTSAEJE-PMVMPFDFSA-N Phe-Trp-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KQUMFXGQTSAEJE-PMVMPFDFSA-N 0.000 description 7
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 7
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 7
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 7
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 7
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 7
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 7
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 7
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 7
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 7
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 7
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 7
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 7
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 7
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 7
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 7
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 7
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 7
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 7
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 7
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 7
- 239000007983 Tris buffer Substances 0.000 description 7
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 7
- BGWSLEYVITZIQP-DCPHZVHLSA-N Trp-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O BGWSLEYVITZIQP-DCPHZVHLSA-N 0.000 description 7
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 7
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 7
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 7
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 7
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 7
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 7
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 7
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 7
- 108010044940 alanylglutamine Proteins 0.000 description 7
- 108010070944 alanylhistidine Proteins 0.000 description 7
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 7
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 7
- 230000003197 catalytic effect Effects 0.000 description 7
- 238000002425 crystallisation Methods 0.000 description 7
- 230000008025 crystallization Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 238000006911 enzymatic reaction Methods 0.000 description 7
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 7
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 108010078274 isoleucylvaline Proteins 0.000 description 7
- 108010012058 leucyltyrosine Proteins 0.000 description 7
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 7
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 7
- 108010070643 prolylglutamic acid Proteins 0.000 description 7
- 108010053725 prolylvaline Proteins 0.000 description 7
- 108010071207 serylmethionine Proteins 0.000 description 7
- 239000011780 sodium chloride Substances 0.000 description 7
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 6
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 6
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 6
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 6
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 6
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 6
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 6
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 6
- 235000011330 Armoracia rusticana Nutrition 0.000 description 6
- 240000003291 Armoracia rusticana Species 0.000 description 6
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 6
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 6
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 6
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 6
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 6
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 6
- HSGOFISJLFDMBJ-CIUDSAMLSA-N Asp-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N HSGOFISJLFDMBJ-CIUDSAMLSA-N 0.000 description 6
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 6
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 6
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 6
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 6
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 6
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 6
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 6
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 6
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 6
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 6
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 6
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 6
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 6
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 6
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 6
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 6
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 6
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 6
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 6
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 6
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 6
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 6
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 6
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 6
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 6
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 6
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 6
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 6
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 6
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 6
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 6
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 6
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 6
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 6
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 6
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 6
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 6
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 6
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 6
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 6
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 6
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 6
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 6
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 6
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 6
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 6
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 6
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 6
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 6
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 6
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 6
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 6
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 6
- WLQRIHCMPFHGKP-PMVMPFDFSA-N Trp-Leu-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=CC=C1 WLQRIHCMPFHGKP-PMVMPFDFSA-N 0.000 description 6
- DDHFMBDACJYSKW-AQZXSJQPSA-N Trp-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DDHFMBDACJYSKW-AQZXSJQPSA-N 0.000 description 6
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 6
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 6
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 6
- YOTRXXBHTZHKLU-BVSLBCMMSA-N Tyr-Trp-Met Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(O)=O)C1=CC=C(O)C=C1 YOTRXXBHTZHKLU-BVSLBCMMSA-N 0.000 description 6
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 6
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 6
- ILMVQSHENUZYIZ-JYJNAYRXSA-N Val-Met-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N ILMVQSHENUZYIZ-JYJNAYRXSA-N 0.000 description 6
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 6
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 6
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical class [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 6
- 108010008355 arginyl-glutamine Proteins 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 108010084389 glycyltryptophan Proteins 0.000 description 6
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 6
- 239000008176 lyophilized powder Substances 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 150000007523 nucleic acids Chemical class 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 238000007254 oxidation reaction Methods 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- JOXIMZWYDAKGHI-UHFFFAOYSA-N toluene-4-sulfonic acid Chemical compound CC1=CC=C(S(O)(=O)=O)C=C1 JOXIMZWYDAKGHI-UHFFFAOYSA-N 0.000 description 6
- 239000001226 triphosphate Substances 0.000 description 6
- 229910052725 zinc Chemical class 0.000 description 6
- 239000011701 zinc Chemical class 0.000 description 6
- MEKOFIRRDATTAG-UHFFFAOYSA-N 2,2,5,8-tetramethyl-3,4-dihydrochromen-6-ol Chemical compound C1CC(C)(C)OC2=C1C(C)=C(O)C=C2C MEKOFIRRDATTAG-UHFFFAOYSA-N 0.000 description 5
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 5
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 5
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 5
- 102100021277 Beta-secretase 2 Human genes 0.000 description 5
- 101710150190 Beta-secretase 2 Proteins 0.000 description 5
- 241000283690 Bos taurus Species 0.000 description 5
- BDWIZLQVVWQMTB-XKBZYTNZSA-N Cys-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N)O BDWIZLQVVWQMTB-XKBZYTNZSA-N 0.000 description 5
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 5
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 5
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 5
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 5
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 5
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 5
- 239000007993 MOPS buffer Substances 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 5
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 5
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 5
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 5
- 238000001042 affinity chromatography Methods 0.000 description 5
- 239000002518 antifoaming agent Substances 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 239000007789 gas Substances 0.000 description 5
- 108010081551 glycylphenylalanine Proteins 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 229910021645 metal ion Inorganic materials 0.000 description 5
- 150000004682 monohydrates Chemical class 0.000 description 5
- 229910052759 nickel Inorganic materials 0.000 description 5
- 238000005580 one pot reaction Methods 0.000 description 5
- 230000003647 oxidation Effects 0.000 description 5
- 230000001590 oxidative effect Effects 0.000 description 5
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 229940076788 pyruvate Drugs 0.000 description 5
- 239000011734 sodium Substances 0.000 description 5
- 239000011550 stock solution Substances 0.000 description 5
- FFIWXBRSABBKTK-RNFRBKRXSA-N (3R,4R)-3,4-dihydroxy-4-(hydroxymethyl)hex-5-ynal Chemical compound C(#C)[C@@]([C@@H](CC=O)O)(O)CO FFIWXBRSABBKTK-RNFRBKRXSA-N 0.000 description 4
- WKMPTBDYDNUJLF-UHFFFAOYSA-N 2-fluoroadenine Chemical compound NC1=NC(F)=NC2=C1N=CN2 WKMPTBDYDNUJLF-UHFFFAOYSA-N 0.000 description 4
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 4
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 4
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 4
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 4
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 4
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 4
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 4
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 4
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 4
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 4
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 4
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 4
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 4
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 4
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 4
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 4
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 4
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 4
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 4
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 4
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 4
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 4
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 4
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 4
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 4
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 4
- MKWKNSIESPFAQN-UHFFFAOYSA-N N-cyclohexyl-2-aminoethanesulfonic acid Chemical compound OS(=O)(=O)CCNC1CCCCC1 MKWKNSIESPFAQN-UHFFFAOYSA-N 0.000 description 4
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 4
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 4
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 4
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 4
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 4
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 4
- 241000409584 Shewanella halifaxensis Species 0.000 description 4
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 4
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 4
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 4
- SYTQRRNVYPBNGQ-UHFFFAOYSA-N [2-(acetyloxymethyl)-2-hydroxybut-3-ynyl] acetate Chemical compound CC(=O)OCC(O)(C#C)COC(C)=O SYTQRRNVYPBNGQ-UHFFFAOYSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 4
- 229950006790 adenosine phosphate Drugs 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 229910017052 cobalt Inorganic materials 0.000 description 4
- 239000010941 cobalt Substances 0.000 description 4
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- IZASLLIUFQPKOG-UHFFFAOYSA-N diazanium;acetyl phosphate Chemical compound [NH4+].[NH4+].CC(=O)OP([O-])([O-])=O IZASLLIUFQPKOG-UHFFFAOYSA-N 0.000 description 4
- 238000004821 distillation Methods 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 4
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 150000003278 haem Chemical class 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 238000006395 oxidase reaction Methods 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 229910052700 potassium Inorganic materials 0.000 description 4
- 239000011591 potassium Substances 0.000 description 4
- 235000018102 proteins Nutrition 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 125000001424 substituent group Chemical group 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 235000011178 triphosphate Nutrition 0.000 description 4
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 4
- HZYMOTKCBLYLBK-OAQYLSRUSA-N (2S)-2-(1,3-dibenzylimidazolidin-2-yl)but-3-yne-1,2-diol Chemical compound C1CN(C(N1CC1=CC=CC=C1)[C@@](CO)(O)C#C)CC1=CC=CC=C1 HZYMOTKCBLYLBK-OAQYLSRUSA-N 0.000 description 3
- 0 *[C@](CC1)O[C@@]1(CO)C#C Chemical compound *[C@](CC1)O[C@@]1(CO)C#C 0.000 description 3
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 3
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 3
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 3
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 3
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 3
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 3
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 3
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 3
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 3
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 3
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 3
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 3
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 3
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 3
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 3
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 3
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 3
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 3
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 3
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 3
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 3
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 3
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 3
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 3
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 3
- KGAJCJXBEWLQDZ-UBHSHLNASA-N Asp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N KGAJCJXBEWLQDZ-UBHSHLNASA-N 0.000 description 3
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 3
- JTRDJYIZIKCIRC-AJNGGQMLSA-N Asp-Leu-Leu-Gln Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JTRDJYIZIKCIRC-AJNGGQMLSA-N 0.000 description 3
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 3
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 3
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 3
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 3
- HAYVLBZZBDCKRA-SRVKXCTJSA-N Cys-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N HAYVLBZZBDCKRA-SRVKXCTJSA-N 0.000 description 3
- RFSUNEUAIZKAJO-VRPWFDPXSA-N D-Fructose Natural products OC[C@H]1OC(O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-VRPWFDPXSA-N 0.000 description 3
- ZAFNJMIOTHYJRJ-UHFFFAOYSA-N Diisopropyl ether Chemical compound CC(C)OC(C)C ZAFNJMIOTHYJRJ-UHFFFAOYSA-N 0.000 description 3
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 3
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 3
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 3
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 3
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 3
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 3
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 3
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 3
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 3
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 3
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 3
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 3
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 3
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 3
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 3
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 3
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 3
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 3
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 3
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 3
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 3
- LMMPTUVWHCFTOT-GARJFASQSA-N His-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O LMMPTUVWHCFTOT-GARJFASQSA-N 0.000 description 3
- ORZGPQXISSXQGW-IHRRRGAJSA-N His-His-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O ORZGPQXISSXQGW-IHRRRGAJSA-N 0.000 description 3
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 3
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 3
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 3
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 3
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 3
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 3
- 102100034343 Integrase Human genes 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 3
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 3
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 3
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 3
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 3
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 3
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 3
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 3
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 3
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 3
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 3
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 3
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 3
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 3
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 3
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 3
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 3
- 241000282560 Macaca mulatta Species 0.000 description 3
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 3
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 3
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 3
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 3
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 3
- OOLVTRHJJBCJKB-IHRRRGAJSA-N Met-Tyr-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OOLVTRHJJBCJKB-IHRRRGAJSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- SKGLAZSLOGYCCA-PEFXOJROSA-N Neuromedin N (1-4) Chemical compound CC[C@@H](C)[C@@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@H]([C@H](C)CC)C(O)=O)CC1=CC=C(O)C=C1 SKGLAZSLOGYCCA-PEFXOJROSA-N 0.000 description 3
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 3
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 3
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 3
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 3
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 3
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 3
- 108091000080 Phosphotransferase Proteins 0.000 description 3
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 3
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 3
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 3
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 3
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 3
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 3
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 3
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 3
- 241000204666 Thermotoga maritima Species 0.000 description 3
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 3
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 3
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 3
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 3
- XUGYQLFEJYZOKQ-NGTWOADLSA-N Thr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XUGYQLFEJYZOKQ-NGTWOADLSA-N 0.000 description 3
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 3
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 3
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 3
- NDLHSJWPCXKOGG-VLCNGCBASA-N Thr-Trp-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N)O NDLHSJWPCXKOGG-VLCNGCBASA-N 0.000 description 3
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 3
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 3
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 3
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 3
- YRBHLWWGSSQICE-IHRRRGAJSA-N Tyr-Asp-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O YRBHLWWGSSQICE-IHRRRGAJSA-N 0.000 description 3
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 3
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 3
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 3
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 3
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 3
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 3
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 3
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 3
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 3
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- HXXFSFRBOHSIMQ-VFUOTHLCSA-N alpha-D-glucose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-VFUOTHLCSA-N 0.000 description 3
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 3
- 230000036436 anti-hiv Effects 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- JUHORIMYRDESRB-UHFFFAOYSA-N benzathine Chemical compound C=1C=CC=CC=1CNCCNCC1=CC=CC=C1 JUHORIMYRDESRB-UHFFFAOYSA-N 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 239000005549 deoxyribonucleoside Substances 0.000 description 3
- 108010054812 diprotin A Proteins 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 150000004677 hydrates Chemical class 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- JMMWKPVZQRWMSS-UHFFFAOYSA-N isopropanol acetate Natural products CC(C)OC(C)=O JMMWKPVZQRWMSS-UHFFFAOYSA-N 0.000 description 3
- 229940011051 isopropyl acetate Drugs 0.000 description 3
- GWYFCOCPABKNJV-UHFFFAOYSA-N isovaleric acid Chemical compound CC(C)CC(O)=O GWYFCOCPABKNJV-UHFFFAOYSA-N 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- SKTCDJAMAYNROS-UHFFFAOYSA-N methoxycyclopentane Chemical compound COC1CCCC1 SKTCDJAMAYNROS-UHFFFAOYSA-N 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 3
- 102000020233 phosphotransferase Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 239000012064 sodium phosphate buffer Substances 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 108700004896 tripeptide FEG Proteins 0.000 description 3
- 108010027345 wheylin-1 peptide Proteins 0.000 description 3
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 2
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 2
- HSJKGGMUJITCBW-UHFFFAOYSA-N 3-hydroxybutanal Chemical compound CC(O)CC=O HSJKGGMUJITCBW-UHFFFAOYSA-N 0.000 description 2
- 238000004679 31P NMR spectroscopy Methods 0.000 description 2
- 208000030507 AIDS Diseases 0.000 description 2
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 2
- 241001041927 Alloscardovia omnicolens Species 0.000 description 2
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 2
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 2
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- PYDIIVKGTBRIEL-SZMVWBNQSA-N Arg-Trp-Pro Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(O)=O PYDIIVKGTBRIEL-SZMVWBNQSA-N 0.000 description 2
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 2
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 2
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 2
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 2
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 2
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 2
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 description 2
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 2
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 2
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 2
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 2
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 2
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 239000008000 CHES buffer Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 2
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 241000186226 Corynebacterium glutamicum Species 0.000 description 2
- VMQMZMRVKUZKQL-UHFFFAOYSA-N Cu+ Chemical class [Cu+] VMQMZMRVKUZKQL-UHFFFAOYSA-N 0.000 description 2
- JPVYNHNXODAKFH-UHFFFAOYSA-N Cu2+ Chemical class [Cu+2] JPVYNHNXODAKFH-UHFFFAOYSA-N 0.000 description 2
- PJWWRFATQTVXHA-UHFFFAOYSA-N Cyclohexylaminopropanesulfonic acid Chemical compound OS(=O)(=O)CCCNC1CCCCC1 PJWWRFATQTVXHA-UHFFFAOYSA-N 0.000 description 2
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 2
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 2
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 2
- KKZFLSZAWCYPOC-VPENINKCSA-N Deoxyribose 5-phosphate Chemical compound O[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KKZFLSZAWCYPOC-VPENINKCSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 2
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 2
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 2
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 2
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 2
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 2
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 208000031886 HIV Infections Diseases 0.000 description 2
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 2
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 2
- JWLWNCVBBSBCEM-NKIYYHGXSA-N His-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O JWLWNCVBBSBCEM-NKIYYHGXSA-N 0.000 description 2
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 2
- FZKFYOXDVWDELO-KBPBESRZSA-N His-Gly-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FZKFYOXDVWDELO-KBPBESRZSA-N 0.000 description 2
- JIUYRPFQJJRSJB-QWRGUYRKSA-N His-His-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JIUYRPFQJJRSJB-QWRGUYRKSA-N 0.000 description 2
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 2
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 2
- 101900297506 Human immunodeficiency virus type 1 group M subtype B Reverse transcriptase/ribonuclease H Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 2
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 2
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 2
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 2
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 2
- LWWILHPVAKKLQS-QXEWZRGKSA-N Ile-Gly-Met Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N LWWILHPVAKKLQS-QXEWZRGKSA-N 0.000 description 2
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 2
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 2
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 2
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 2
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 2
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 2
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 2
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- 108010093096 Immobilized Enzymes Proteins 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 2
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 2
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 2
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 2
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 2
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 2
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 2
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 2
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 2
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 2
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 2
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 2
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 2
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 2
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- FSVCELGFZIQNCK-UHFFFAOYSA-N N,N-bis(2-hydroxyethyl)glycine Chemical compound OCCN(CCO)CC(O)=O FSVCELGFZIQNCK-UHFFFAOYSA-N 0.000 description 2
- 229940122313 Nucleoside reverse transcriptase inhibitor Drugs 0.000 description 2
- 229940123527 Nucleotide reverse transcriptase inhibitor Drugs 0.000 description 2
- MSWSERRZJBWUIB-YFKPBYRVSA-N P(=O)(O)(O)OC[C@](C=O)(O)C#C Chemical compound P(=O)(O)(O)OC[C@](C=O)(O)C#C MSWSERRZJBWUIB-YFKPBYRVSA-N 0.000 description 2
- 239000007990 PIPES buffer Substances 0.000 description 2
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 2
- IQXOZIDWLZYYAW-IHRRRGAJSA-N Phe-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IQXOZIDWLZYYAW-IHRRRGAJSA-N 0.000 description 2
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 2
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 2
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 2
- BFXZQMWKTYWGCF-PYJNHQTQSA-N Pro-His-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BFXZQMWKTYWGCF-PYJNHQTQSA-N 0.000 description 2
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 2
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 2
- DBIDZNUXSLXVRG-FXQIFTODSA-N Ser-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N DBIDZNUXSLXVRG-FXQIFTODSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 2
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 2
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- OUUQCZGPVNCOIJ-UHFFFAOYSA-M Superoxide Chemical compound [O-][O] OUUQCZGPVNCOIJ-UHFFFAOYSA-M 0.000 description 2
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 2
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 2
- UCCNDUPVIFOOQX-CUJWVEQBSA-N Thr-Cys-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 UCCNDUPVIFOOQX-CUJWVEQBSA-N 0.000 description 2
- WPSDXXQRIVKBAY-NKIYYHGXSA-N Thr-His-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O WPSDXXQRIVKBAY-NKIYYHGXSA-N 0.000 description 2
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 2
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 2
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 2
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 2
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 2
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 2
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 2
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 2
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 2
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 2
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 2
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 2
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 229960001456 adenosine triphosphate Drugs 0.000 description 2
- 238000005273 aeration Methods 0.000 description 2
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 2
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 2
- YXJDFQJKERBOBM-TXICZTDVSA-N alpha-D-ribose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H]1O YXJDFQJKERBOBM-TXICZTDVSA-N 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000002210 biocatalytic effect Effects 0.000 description 2
- 229920001429 chelating resin Polymers 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000013375 chromatographic separation Methods 0.000 description 2
- 108010037176 copper oxidase Proteins 0.000 description 2
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 2
- JZCCFEFSEZPSOG-UHFFFAOYSA-L copper(II) sulfate pentahydrate Chemical compound O.O.O.O.O.[Cu+2].[O-]S([O-])(=O)=O JZCCFEFSEZPSOG-UHFFFAOYSA-L 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 238000006392 deoxygenation reaction Methods 0.000 description 2
- RJYMRRJVDRJMJW-UHFFFAOYSA-L dibromomanganese Chemical compound Br[Mn]Br RJYMRRJVDRJMJW-UHFFFAOYSA-L 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- YAGKRVSRTSUGEY-UHFFFAOYSA-N ferricyanide Chemical compound [Fe+3].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] YAGKRVSRTSUGEY-UHFFFAOYSA-N 0.000 description 2
- VWWQXMAJTJZDQX-UYBVJOGSSA-N flavin adenine dinucleotide Chemical compound C1=NC2=C(N)N=CN=C2N1[C@@H]([C@H](O)[C@@H]1O)O[C@@H]1CO[P@](O)(=O)O[P@@](O)(=O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C2=NC(=O)NC(=O)C2=NC2=C1C=C(C)C(C)=C2 VWWQXMAJTJZDQX-UYBVJOGSSA-N 0.000 description 2
- 235000019162 flavin adenine dinucleotide Nutrition 0.000 description 2
- 239000011714 flavin adenine dinucleotide Substances 0.000 description 2
- 229940093632 flavin-adenine dinucleotide Drugs 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 150000002256 galaktoses Chemical class 0.000 description 2
- 125000003147 glycosyl group Chemical group 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 238000011577 humanized mouse model Methods 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-M hydroxide Chemical group [OH-] XLYOFNOQVPJJNP-UHFFFAOYSA-M 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000006317 isomerization reaction Methods 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 159000000003 magnesium salts Chemical class 0.000 description 2
- 239000011565 manganese chloride Substances 0.000 description 2
- 235000002867 manganese chloride Nutrition 0.000 description 2
- 229940099607 manganese chloride Drugs 0.000 description 2
- 229940099596 manganese sulfate Drugs 0.000 description 2
- 239000011702 manganese sulphate Substances 0.000 description 2
- 235000007079 manganese sulphate Nutrition 0.000 description 2
- MIVBAHRSNUNMPP-UHFFFAOYSA-N manganese(2+);dinitrate Chemical compound [Mn+2].[O-][N+]([O-])=O.[O-][N+]([O-])=O MIVBAHRSNUNMPP-UHFFFAOYSA-N 0.000 description 2
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 2
- MMIPFLVOWGHZQD-UHFFFAOYSA-N manganese(3+) Chemical class [Mn+3] MMIPFLVOWGHZQD-UHFFFAOYSA-N 0.000 description 2
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 2
- QWYFOIJABGVEFP-UHFFFAOYSA-L manganese(ii) iodide Chemical compound [Mn+2].[I-].[I-] QWYFOIJABGVEFP-UHFFFAOYSA-L 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 239000012299 nitrogen atmosphere Substances 0.000 description 2
- 229940127073 nucleoside analogue Drugs 0.000 description 2
- 239000012074 organic phase Substances 0.000 description 2
- 229940014662 pantothenate Drugs 0.000 description 2
- 235000019161 pantothenic acid Nutrition 0.000 description 2
- 239000011713 pantothenic acid Substances 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- JRKICGRDRMAZLK-UHFFFAOYSA-L peroxydisulfate Chemical class [O-]S(=O)(=O)OOS([O-])(=O)=O JRKICGRDRMAZLK-UHFFFAOYSA-L 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 150000003138 primary alcohols Chemical class 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000003419 rna directed dna polymerase inhibitor Substances 0.000 description 2
- 150000003335 secondary amines Chemical class 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000002002 slurry Substances 0.000 description 2
- 239000001632 sodium acetate Substances 0.000 description 2
- 235000017281 sodium acetate Nutrition 0.000 description 2
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 2
- 238000001179 sorption measurement Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 150000003512 tertiary amines Chemical class 0.000 description 2
- 235000008170 thiamine pyrophosphate Nutrition 0.000 description 2
- 239000011678 thiamine pyrophosphate Substances 0.000 description 2
- YXVCLPJQTZXJLH-UHFFFAOYSA-N thiamine(1+) diphosphate chloride Chemical compound [Cl-].CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N YXVCLPJQTZXJLH-UHFFFAOYSA-N 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- UQCJFKIZCSWJEH-UHFFFAOYSA-N (1-acetyloxy-2-oxopropyl) acetate Chemical compound CC(=O)OC(C(C)=O)OC(C)=O UQCJFKIZCSWJEH-UHFFFAOYSA-N 0.000 description 1
- MSWSERRZJBWUIB-UHFFFAOYSA-N (2-formyl-2-hydroxybut-3-ynyl) dihydrogen phosphate Chemical compound P(=O)(O)(O)OCC(C=O)(O)C#C MSWSERRZJBWUIB-UHFFFAOYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- NOLHIMIFXOBLFF-KVQBGUIXSA-N (2r,3s,5r)-5-(2,6-diaminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-ol Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@H]1C[C@H](O)[C@@H](CO)O1 NOLHIMIFXOBLFF-KVQBGUIXSA-N 0.000 description 1
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 1
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 1
- KEJGAYKWRDILTF-JDDHQFAOSA-N (3ar,5s,6s,6ar)-5-[(4r)-2,2-dimethyl-1,3-dioxolan-4-yl]-2,2-dimethyl-3a,5,6,6a-tetrahydrofuro[2,3-d][1,3]dioxol-6-ol Chemical compound O1C(C)(C)OC[C@@H]1[C@@H]1[C@H](O)[C@H]2OC(C)(C)O[C@H]2O1 KEJGAYKWRDILTF-JDDHQFAOSA-N 0.000 description 1
- LFRDGHVRPSURMV-YFKPBYRVSA-N (4s)-4,5-dihydroxypentanal Chemical compound OC[C@@H](O)CCC=O LFRDGHVRPSURMV-YFKPBYRVSA-N 0.000 description 1
- GCJHLHSDTYXUDS-NKWVEPMBSA-N (5S,6R)-5,6,7-trihydroxyhept-1-yn-3-one Chemical compound OC[C@@H](O)[C@@H](O)CC(=O)C#C GCJHLHSDTYXUDS-NKWVEPMBSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 1
- XHFVGHPGDLDEQO-ZETCQYMHSA-N (R)-4'-phosphopantothenic acid Chemical compound OP(=O)(O)OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O XHFVGHPGDLDEQO-ZETCQYMHSA-N 0.000 description 1
- MIOPJNTWMNEORI-GMSGAONNSA-N (S)-camphorsulfonic acid Chemical compound C1C[C@@]2(CS(O)(=O)=O)C(=O)C[C@@H]1C2(C)C MIOPJNTWMNEORI-GMSGAONNSA-N 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- ZWPYUXAXLRFWQC-KVQBGUIXSA-N 2'-deoxy-2-fluoroadenosine Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 ZWPYUXAXLRFWQC-KVQBGUIXSA-N 0.000 description 1
- XNIOWJUQPMKCIJ-UHFFFAOYSA-N 2-(benzylamino)ethanol Chemical compound OCCNCC1=CC=CC=C1 XNIOWJUQPMKCIJ-UHFFFAOYSA-N 0.000 description 1
- NOLHIMIFXOBLFF-UHFFFAOYSA-N 2-Amino-2'-deoxyadenosine Natural products C12=NC(N)=NC(N)=C2N=CN1C1CC(O)C(CO)O1 NOLHIMIFXOBLFF-UHFFFAOYSA-N 0.000 description 1
- GJMPSRSMBJLKKB-UHFFFAOYSA-N 3-methylphenylacetic acid Chemical compound CC1=CC=CC(CC(O)=O)=C1 GJMPSRSMBJLKKB-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- XKHLBBQNPSOGPI-GUBZILKMSA-N Ala-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N XKHLBBQNPSOGPI-GUBZILKMSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- IJPNNYWHXGADJG-GUBZILKMSA-N Arg-Ala-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O IJPNNYWHXGADJG-GUBZILKMSA-N 0.000 description 1
- WOPFJPHVBWKZJH-SRVKXCTJSA-N Arg-Arg-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O WOPFJPHVBWKZJH-SRVKXCTJSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- SXNJBDYEBOUYOJ-DCAQKATOSA-N Asn-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N SXNJBDYEBOUYOJ-DCAQKATOSA-N 0.000 description 1
- UYXXMIZGHYKYAT-NHCYSSNCSA-N Asn-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N UYXXMIZGHYKYAT-NHCYSSNCSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 1
- XFQOQUWGVCVYON-DCAQKATOSA-N Asp-Met-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XFQOQUWGVCVYON-DCAQKATOSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- QVLDCOZALMRVRJ-UHFFFAOYSA-N C#CC(CO)(COP(O)(O)=O)O Chemical class C#CC(CO)(COP(O)(O)=O)O QVLDCOZALMRVRJ-UHFFFAOYSA-N 0.000 description 1
- PIGNSJBCTZRHTO-DFWYDOINSA-N CC([CH2-])=O.OC[C@@H](O)C=O Chemical compound CC([CH2-])=O.OC[C@@H](O)C=O PIGNSJBCTZRHTO-DFWYDOINSA-N 0.000 description 1
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 1
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 1
- KPENUVBHAKRDQR-GUBZILKMSA-N Cys-His-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPENUVBHAKRDQR-GUBZILKMSA-N 0.000 description 1
- BSGXXYRIDXUEOM-IHRRRGAJSA-N Cys-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N BSGXXYRIDXUEOM-IHRRRGAJSA-N 0.000 description 1
- DGQJGBDBFVGLGL-ZKWXMUAHSA-N Cys-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DGQJGBDBFVGLGL-ZKWXMUAHSA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- BRDJPCFGLMKJRU-UHFFFAOYSA-N DDAO Chemical compound ClC1=C(O)C(Cl)=C2C(C)(C)C3=CC(=O)C=CC3=NC2=C1 BRDJPCFGLMKJRU-UHFFFAOYSA-N 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- XLRHXNIVIZZOON-WFUPGROFSA-L Flavin adenine dinucleotide disodium Chemical compound [Na+].[Na+].C1=NC2=C(N)N=CN=C2N1[C@@H]([C@H](O)[C@@H]1O)O[C@@H]1COP([O-])(=O)OP([O-])(=O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C2=NC(=O)NC(=O)C2=NC2=C1C=C(C)C(C)=C2 XLRHXNIVIZZOON-WFUPGROFSA-L 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 1
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 1
- XBWGJWXGUNSZAT-CIUDSAMLSA-N Gln-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XBWGJWXGUNSZAT-CIUDSAMLSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- RBSKVTZUFMIWFU-XEGUGMAKSA-N Gln-Trp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O RBSKVTZUFMIWFU-XEGUGMAKSA-N 0.000 description 1
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- NPMSEUWUMOSEFM-CIUDSAMLSA-N Glu-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N NPMSEUWUMOSEFM-CIUDSAMLSA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 1
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 1
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- GZBZACMXFIPIDX-WHFBIAKZSA-N Gly-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)C(=O)O GZBZACMXFIPIDX-WHFBIAKZSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 108010078851 HIV Reverse Transcriptase Proteins 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- VOKCBYNCZVSILJ-KKUMJFAQSA-N His-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O VOKCBYNCZVSILJ-KKUMJFAQSA-N 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- TXLQHACKRLWYCM-DCAQKATOSA-N His-Glu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O TXLQHACKRLWYCM-DCAQKATOSA-N 0.000 description 1
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 1
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 1
- UVDDTHLDZBMBAV-SRVKXCTJSA-N His-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N UVDDTHLDZBMBAV-SRVKXCTJSA-N 0.000 description 1
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 1
- WSEITRHJRVDTRX-QTKMDUPCSA-N His-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N)O WSEITRHJRVDTRX-QTKMDUPCSA-N 0.000 description 1
- YAEKRYQASVCDLK-JYJNAYRXSA-N His-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YAEKRYQASVCDLK-JYJNAYRXSA-N 0.000 description 1
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 1
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 1
- JUCZDDVZBMPKRT-IXOXFDKPSA-N His-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O JUCZDDVZBMPKRT-IXOXFDKPSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- HIJIJPFILYPTFR-ACRUOGEOSA-N His-Tyr-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HIJIJPFILYPTFR-ACRUOGEOSA-N 0.000 description 1
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical group [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- AYLAAGNJNVZDPY-CYDGBPFRSA-N Ile-Met-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N AYLAAGNJNVZDPY-CYDGBPFRSA-N 0.000 description 1
- XGPNARQELVNWIP-UHFFFAOYSA-N Ile-Phe-Thr-Pro Chemical compound C1CCC(C(O)=O)N1C(=O)C(C(C)O)NC(=O)C(NC(=O)C(N)C(C)CC)CC1=CC=CC=C1 XGPNARQELVNWIP-UHFFFAOYSA-N 0.000 description 1
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- KWURTLAFFDOTEQ-GUBZILKMSA-N Leu-Cys-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KWURTLAFFDOTEQ-GUBZILKMSA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- VHFFQUSNFFIZBT-CIUDSAMLSA-N Lys-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N VHFFQUSNFFIZBT-CIUDSAMLSA-N 0.000 description 1
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 1
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- YFGWNAROEYWGNL-GUBZILKMSA-N Lys-Gln-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YFGWNAROEYWGNL-GUBZILKMSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- QWTGQXGNNMIUCW-BPUTZDHNSA-N Met-Asn-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QWTGQXGNNMIUCW-BPUTZDHNSA-N 0.000 description 1
- HKRYNJSKVLZIFP-IHRRRGAJSA-N Met-Asn-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HKRYNJSKVLZIFP-IHRRRGAJSA-N 0.000 description 1
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 1
- HGKJFNCLOHKEHS-FXQIFTODSA-N Met-Cys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(O)=O HGKJFNCLOHKEHS-FXQIFTODSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 229940094881 Nucleoside reverse transcriptase translocation inhibitor Drugs 0.000 description 1
- 108700020962 Peroxidase Proteins 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 1
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- DEZCWWXTRAKZKJ-UFYCRDLUSA-N Phe-Phe-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DEZCWWXTRAKZKJ-UFYCRDLUSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- QVIZLAUEAMQKGS-GUBZILKMSA-N Pro-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 QVIZLAUEAMQKGS-GUBZILKMSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- VBZXFFYOBDLLFE-HSHDSVGOSA-N Pro-Trp-Thr Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H]([C@H](O)C)C(O)=O)C(=O)[C@@H]1CCCN1 VBZXFFYOBDLLFE-HSHDSVGOSA-N 0.000 description 1
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 1
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 1
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 101900230550 Thermotoga maritima Acetate kinase Proteins 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- IGGFFPOIFHZYKC-PBCZWWQYSA-N Thr-His-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O IGGFFPOIFHZYKC-PBCZWWQYSA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- YOPQYBJJNSIQGZ-JNPHEJMOSA-N Thr-Tyr-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 YOPQYBJJNSIQGZ-JNPHEJMOSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- XSTXAVWGXDQKEL-UHFFFAOYSA-N Trichloroethylene Chemical compound ClC=C(Cl)Cl XSTXAVWGXDQKEL-UHFFFAOYSA-N 0.000 description 1
- TZNNEYFZZAHLBL-BPUTZDHNSA-N Trp-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O TZNNEYFZZAHLBL-BPUTZDHNSA-N 0.000 description 1
- PNHABSVRPFBUJY-UMPQAUOISA-N Trp-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PNHABSVRPFBUJY-UMPQAUOISA-N 0.000 description 1
- RNFZZCMCRDFNAE-WFBYXXMGSA-N Trp-Asn-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O RNFZZCMCRDFNAE-WFBYXXMGSA-N 0.000 description 1
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 1
- WCTYCXZYBNKEIV-SXNHZJKMSA-N Trp-Glu-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)=CNC2=C1 WCTYCXZYBNKEIV-SXNHZJKMSA-N 0.000 description 1
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 1
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 1
- GRSCONMARGNYHA-PMVMPFDFSA-N Trp-Lys-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GRSCONMARGNYHA-PMVMPFDFSA-N 0.000 description 1
- VDCGPCSLAJAKBB-XIRDDKMYSA-N Trp-Ser-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N VDCGPCSLAJAKBB-XIRDDKMYSA-N 0.000 description 1
- ZPZNQAZHMCLTOA-PXDAIIFMSA-N Trp-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 ZPZNQAZHMCLTOA-PXDAIIFMSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- FBVGQXJIXFZKSQ-GMVOTWDCSA-N Tyr-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FBVGQXJIXFZKSQ-GMVOTWDCSA-N 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 1
- AVFGBGGRZOKSFS-KJEVXHAQSA-N Tyr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O AVFGBGGRZOKSFS-KJEVXHAQSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 1
- XOVDRAVPGHTYLP-JYJNAYRXSA-N Tyr-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O XOVDRAVPGHTYLP-JYJNAYRXSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- MJUTYRIMFIICKL-JYJNAYRXSA-N Tyr-Val-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJUTYRIMFIICKL-JYJNAYRXSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 1
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 206010058874 Viraemia Diseases 0.000 description 1
- ZYVMKADVRJJTTG-NKWVEPMBSA-N [(2R,3S)-2-ethynyl-2,3-dihydroxy-5-oxopentyl] dihydrogen phosphate Chemical compound P(=O)(O)(O)OC[C@]([C@H](CC=O)O)(O)C#C ZYVMKADVRJJTTG-NKWVEPMBSA-N 0.000 description 1
- GRMKBKTVVCARJI-SMZGMGDZSA-N [2H]C([2H])(C(CO)(C#C)O)O Chemical compound [2H]C([2H])(C(CO)(C#C)O)O GRMKBKTVVCARJI-SMZGMGDZSA-N 0.000 description 1
- BUMPFXRZUYYODO-QRPMWFLTSA-N [[(2r,3s,5r)-5-(6-amino-2-fluoropurin-9-yl)-2-ethynyl-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@H]1C[C@H](O)[C@](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)(C#C)O1 BUMPFXRZUYYODO-QRPMWFLTSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- IKHGUXGNUITLKF-XPULMUKRSA-N acetaldehyde Chemical compound [14CH]([14CH3])=O IKHGUXGNUITLKF-XPULMUKRSA-N 0.000 description 1
- HLNYTZYPKARXKH-UHFFFAOYSA-N acetic acid;phosphono acetate Chemical compound CC(O)=O.CC(=O)OP(O)(O)=O HLNYTZYPKARXKH-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 238000006668 aldol addition reaction Methods 0.000 description 1
- 238000005575 aldol reaction Methods 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001345 alkine derivatives Chemical class 0.000 description 1
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000001195 anabolic effect Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 229940124522 antiretrovirals Drugs 0.000 description 1
- 239000003903 antiretrovirus agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000011914 asymmetric synthesis Methods 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000011097 chromatography purification Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 239000006184 cosolvent Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- BXRRQHBNBXJZBQ-UHFFFAOYSA-L dichloromanganese;hydrate Chemical compound O.Cl[Mn]Cl BXRRQHBNBXJZBQ-UHFFFAOYSA-L 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- SYELZBGXAIXKHU-UHFFFAOYSA-N dodecyldimethylamine N-oxide Chemical compound CCCCCCCCCCCC[N+](C)(C)[O-] SYELZBGXAIXKHU-UHFFFAOYSA-N 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 238000011930 enantioselective total synthesis Methods 0.000 description 1
- 238000010597 enzymatic desymmetrization reaction Methods 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012065 filter cake Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 229950010772 glucose-1-phosphate Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 1
- 150000002374 hemiaminals Chemical class 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 238000005984 hydrogenation reaction Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 229910003002 lithium salt Inorganic materials 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- GWGVDNZFTPIGDY-UHFFFAOYSA-M magnesium;ethyne;chloride Chemical compound [Mg+2].[Cl-].[C-]#C GWGVDNZFTPIGDY-UHFFFAOYSA-M 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 229940098779 methanesulfonic acid Drugs 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- CAAULPUQFIIOTL-UHFFFAOYSA-M methyl hydrogen phosphate Chemical compound COP(O)([O-])=O CAAULPUQFIIOTL-UHFFFAOYSA-M 0.000 description 1
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 1
- 235000019799 monosodium phosphate Nutrition 0.000 description 1
- KVKFRMCSXWQSNT-UHFFFAOYSA-N n,n'-dimethylethane-1,2-diamine Chemical compound CNCCNC KVKFRMCSXWQSNT-UHFFFAOYSA-N 0.000 description 1
- NOUUUQMKVOUUNR-UHFFFAOYSA-N n,n'-diphenylethane-1,2-diamine Chemical compound C=1C=CC=CC=1NCCNC1=CC=CC=C1 NOUUUQMKVOUUNR-UHFFFAOYSA-N 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 239000012044 organic layer Substances 0.000 description 1
- 125000004043 oxo group Chemical group O=* 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 230000036470 plasma concentration Effects 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 150000003141 primary amines Chemical group 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 239000002212 purine nucleoside Substances 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000013557 residual solvent Substances 0.000 description 1
- 230000027756 respiratory electron transport chain Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 150000008223 ribosides Chemical class 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 229940054269 sodium pyruvate Drugs 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- WAGFXJQAIZNSEQ-UHFFFAOYSA-M tetraphenylphosphonium chloride Chemical compound [Cl-].C1=CC=CC=C1[P+](C=1C=CC=CC=1)(C=1C=CC=CC=1)C1=CC=CC=C1 WAGFXJQAIZNSEQ-UHFFFAOYSA-M 0.000 description 1
- 229960002363 thiamine pyrophosphate Drugs 0.000 description 1
- GDQBPBMIAFIRIU-UHFFFAOYSA-N thieno[2,3-c]pyridine Chemical compound C1=NC=C2SC=CC2=C1 GDQBPBMIAFIRIU-UHFFFAOYSA-N 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- HHLJUSLZGFYWKW-UHFFFAOYSA-N triethanolamine hydrochloride Chemical compound Cl.OCCN(CCO)CCO HHLJUSLZGFYWKW-UHFFFAOYSA-N 0.000 description 1
- 229940117957 triethanolamine hydrochloride Drugs 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H19/00—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
- C07H19/02—Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
- C07H19/04—Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
- C07H19/16—Purine radicals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/38—Nucleosides
- C12P19/40—Nucleosides having a condensed ring system containing a six-membered ring having two nitrogen atoms in the same ring, e.g. purine nucleosides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C29/00—Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C29/00—Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring
- C07C29/09—Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring by hydrolysis
- C07C29/095—Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring by hydrolysis of esters of organic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C33/00—Unsaturated compounds having hydroxy or O-metal groups bound to acyclic carbon atoms
- C07C33/04—Acyclic alcohols with carbon-to-carbon triple bonds
- C07C33/042—Acyclic alcohols with carbon-to-carbon triple bonds with only one triple bond
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C67/00—Preparation of carboxylic acid esters
- C07C67/28—Preparation of carboxylic acid esters by modifying the hydroxylic moiety of the ester, such modification not being an introduction of an ester group
- C07C67/293—Preparation of carboxylic acid esters by modifying the hydroxylic moiety of the ester, such modification not being an introduction of an ester group by isomerisation; by change of size of the carbon skeleton
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07F—ACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
- C07F9/00—Compounds containing elements of Groups 5 or 15 of the Periodic Table
- C07F9/02—Phosphorus compounds
- C07F9/06—Phosphorus compounds without P—C bonds
- C07F9/08—Esters of oxyacids of phosphorus
- C07F9/09—Esters of phosphoric acids
- C07F9/091—Esters of phosphoric acids with hydroxyalkyl compounds with further substituents on alkyl
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07F—ACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
- C07F9/00—Compounds containing elements of Groups 5 or 15 of the Periodic Table
- C07F9/02—Phosphorus compounds
- C07F9/06—Phosphorus compounds without P—C bonds
- C07F9/08—Esters of oxyacids of phosphorus
- C07F9/09—Esters of phosphoric acids
- C07F9/113—Esters of phosphoric acids with unsaturated acyclic alcohols
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07F—ACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
- C07F9/00—Compounds containing elements of Groups 5 or 15 of the Periodic Table
- C07F9/02—Phosphorus compounds
- C07F9/547—Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom
- C07F9/655—Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom having oxygen atoms, with or without sulfur, selenium, or tellurium atoms, as the only ring hetero atoms
- C07F9/65515—Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom having oxygen atoms, with or without sulfur, selenium, or tellurium atoms, as the only ring hetero atoms the oxygen atom being part of a five-membered ring
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H13/00—Compounds containing saccharide radicals esterified by carbonic acid or derivatives thereof, or by organic acids, e.g. phosphonic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/04—Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P9/00—Preparation of organic compounds containing a metal or atom other than H, N, C, O, S or halogen
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/02—Pentosyltransferases (2.4.2)
- C12Y204/02001—Purine-nucleoside phosphorylase (2.4.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/02—Aldehyde-lyases (4.1.2)
- C12Y401/02004—Deoxyribose-phosphate aldolase (4.1.2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y504/00—Intramolecular transferases (5.4)
- C12Y504/02—Phosphotransferases (phosphomutases) (5.4.2)
- C12Y504/02007—Phosphopentomutase (5.4.2.7)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/55—Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 중간체 상의 보호기의 사용을 제거하고, 글리코실화의 입체선택성을 개선시키고, 화합물을 제조하는 데 필요한 공정 단계의 수를 감소시키는, 4'-에티닐-2'-데옥시 뉴클레오시드 및 그의 유사체, 예를 들어 EFdA의 효소적 합성에 관한 것이다. 이는 또한 공정에 이용되는 신규한 중간체에 관한 것이다.
Description
전자적으로 제출된 서열 목록에 대한 언급
본 출원의 서열 목록은 2019년 7월 2일의 생성일 및 80.5 kb의 크기를 갖는 파일명 "24608WOPCT-SEQLIST-02JUl2019.txt"로 ASCII 형식화된 서열 목록으로서 EFS-웹을 통해 전자적으로 제출된다. EFS-웹을 통해 제출된 이 서열 목록은 명세서의 일부이며, 그 전문이 본원에 참조로 포함된다.
4'-에티닐-2'-데옥시 뉴클레오시드 유사체는 HIV, AIDS 및 관련된 질환에 대한 활성에 대해 공지되어 있다.
4'-에티닐 뉴클레오시드 유사체의 한 예는 시험관내에서 (Kawamoto, A., Kodama, E., Sarafianos S. F. et al, Int. J. Biochem. Cell Biol.; 40(11):2410-20 [2008]; Ohrui, H., Kohgo, S., Hayakawa, H. et al, Nucleosides, Nucleotides & Nucleic Acids, 26, 1543-1546 [2007]) 및 생체내에서 (Hattori, S., Ide, K., Nakata, H. et al. Antimicrobial. Agents and Chemotherapy, 53, 3887-3893 [2009]) HIV-1 및 SIV 바이러스 복제를 차단하는 뉴클레오시드 리버스 트랜스크립타제 전위 억제제인 4'-에티닐-2-플루오로-2'-데옥시아데노신 (EFdA, 또한 MK-8591로 공지됨)이다. EFdA는 미국 특허 번호 7,339,053에 청구되어 있다 ('053 특허에서 2'-데옥시-4'-C-에티닐-2-플루오로아데노신으로 지칭됨). EFdA는 하기 화학 구조를 갖는다:
EFdA는 세포에서 HIV 리버스 트랜스크립타제를 억제하는 그의 활성 트리포스페이트 동화산물로 대사된다. 들어오는 뉴클레오티드의 혼입을 차단하는 3'-OH 기가 결여된 HIV 감염의 치료에 현재 이용가능한 뉴클레오시드 리버스 트랜스크립타제 억제제 (NsRTI) 및 뉴클레오티드 리버스 트랜스크립타제 억제제 (NtRTI)와 대조적으로, EFdA는 3' OH 기를 보유하며, 리버스 트랜스크립타제 (RT) 활성 부위에서 프라이머:주형의 전위를 방지하고, 들어오는 데옥시리보뉴클레오티드 트리포스페이트 (dNTP)의 결합을 방지함으로써 쇄 종결자로서 작용한다. 또한, EFdA의 변형된 리보스 고리의 주름은 들어오는 뉴클레오티드로부터의 인산전이가 비효율적인 벡터에서 3'-OH를 정치시킴으로써 리버스 트랜스크립타제의 억제에 기여하는 것으로 여겨진다. (Michailidis E, et al., Mechanism of inhibition of HIV-1 reverse transcriptase by 4'-ethynyl-2-fluoro-2'-deoxyadenosine triphosphate, J Biol Chem 284:35681-35691 [2009]; Michailidis E, et al., 4'-Ethynyl-2-fluoro-2'-deoxyadenosine (EFdA) inhibits HIV-1 reverse transcriptase with multiple mechanisms, J Biol Chem 289:24533-24548 [2014]).
시험관내 HIV 복제 검정에서, EFdA는 강력한 항레트로바이러스제이며, 평가된 모든 서브타입에 걸쳐 임상 분리주에 대해 필적하는 항바이러스 활성을 나타낸다. 이는 림프 유래된 세포주 및 말초 혈액 단핵 세포 둘 다에서 시험관내에서 활성 트리포스페이트로 급속하게 동화되며, EFdA 트리포스페이트 (EFdA-TP)의 세포내 반감기는 72시간을 초과한다. (Stoddart, C. A., Galkina, et al., Oral Administration of the Nucleoside EFdA (4'-Ethynyl-2-Fluoro-2'-Deoxyadenosine) Provides Rapid Suppression of HIV Viremia in Humanized Mice and Favorable Pharmacokinetic Properties in Mice and the Rhesus Macaque, Antimicrob Agents Chemother, 2015 Jul; 59(7): 4190-4198, Published online 2015 May 4).
EFdA는 인간화 마우스 모델 및 SIV 감염된 레수스 마카크 모델을 비롯한 HIV 감염의 동물 모델에서 효능을 갖는 것으로 나타났다. 마우스 및 레수스 원숭이에서의 경구 투여된 EFdA의 약동학 연구는 급속한 흡수 및 높은 혈장 농도를 입증하였다. 긴 세포내 반감기는 레수스 마카크로부터의 단리된 말초 혈액 단핵 세포가 약물 투여 후 24시간에 SIV 감염에 대해 불응성이었다는 사실에 의해 입증되었다. (상기 문헌).
EFdA를 비롯한 4'-에티닐 뉴클레오시드 유사체의 이전의 합성은 에티닐-데옥시리보스 당 및 2-플루오로아데닌 (또한 2-플루오로-9H-퓨린-6-아민으로 지칭됨) 핵염기 사이의 C-N 결합의 형성에서 보통의 입체선택성을 겪는다. 이전의 합성은 또한 합성의 효율을 감소시키는 글리코실화 반응을 수행하기 위해 보호기를 요구한다.
문헌 [Kei Fukuyama, et al., Synthesis of EFdA via a Diastereoselective Aldol Reaction of a Protected 3-Keto Furanose, Organic Letters 2015, 17(4), pp. 828-831; DOI: 10.1021/ol5036535)]에 기재된 합성은 3개의 입체중심을 설정하는 부분입체선택적 반응을 사용하는 D-글루코스 디아세토나이드로부터의 14-단계 합성이다. 아노머성 중심의 입체화학은 후속적으로 가수분해 및 탈산소화에 의해 제거되는 2'-아세톡시 지향성기에 의해 제어된다. 이 경로는 4회의 크로마토그래피 정제, 및 후기 탈산소화를 위한 독성 오르가노틴 시약의 화학량론적 사용을 요구한다.
또다른 경로에서 (문헌 [Mark McLaughlin, et al., Enantioselective Synthesis of 4'-Ethynyl-2-fluoro-2'-deoxyadenosine (EFdA) via Enzymatic Desymmetrization, Organic Letters 2017, 19 (4), pp. 926-929] 참조), 완전히 치환된 4'-카르비놀은 효소적 비대칭화로 입체선택적으로 생성된다. 3'-입체중심은 촉매적 비대칭 전이 수소화로 설정되고, 아노머성 1'-연결은 기질 대조군을 사용하여 보통의 입체선택성에서 확립되며, 입체화학적 순도의 승급은 중간체의 결정화에 의해 달성된다. 이 공정은 15 단계를 요구하고, 몇몇 보호기의 사용을 요구하며, 낮은 입체선택성 (1.8:1)으로 핵염기 및 당 단편 사이의 글리코실 연결을 생성한다.
R-글리세르알데히드 아세토나이드로부터 EFdA를 제조하는 12-단계 합성은 문헌 [Kageyama, M., et al., Concise Synthesis of the Anti-HIV Nucleoside EFdA, Biosci. Biotechnol. Biochem, 2012, 76, pp. 1219-1225]; 및 [Enantioselective Total Synthesis of the Potent Anti-HIV Nucleoside EFdA, Masayuki Kageyama, et al., Organic Letters 2011 13 (19), pp. 5264-5266 [DOI: 10.1021/ol202116k]]에 기재되어 있다. 합성은 적당한 부분입체선택성을 갖는 3'-입체중심을 설정하는 키랄 출발 물질을 사용한다. 입체이성질체의 크로마토그래피 분리 후, 새로운 입체중심을 사용하여 부분입체선택적 알킨 첨가를 가이드하여 완전히 치환된 4'-입체중심을 설정한다. 아노머성 1'-위치는 적은 입체제어로 확립되며, 아노머를 분리하기 위해 크로마토그래피를 요구한다. 이 경로는 2개의 상이한 단계에서 부분입체이성질체의 크로마토그래피 분리를 요구하며, 고가의 키랄 출발 물질로부터 시작한다.
문헌 [Kohgo, S., et al., Design, Efficient Synthesis, and Anti-HIV Activity of 4'-C-Cyano- and 4'-C-Ethynyl-2'-deoxy Purine Nucleosides, Nucleosides, Nucleotides and Nucleic Acids, 2004, 23, pp. 671-690 [DOI: 10.1081/NCN-120037508]]은 기존의 뉴클레오시드로부터 시작하고, 당 및 핵염기 부분 둘 다를 변형시키는 합성 경로를 기재한다. 이는 2-아미노-2'-데옥시아데노신으로부터 시작하는 낮은 2.5% 전체 수율을 갖는 18-단계 합성이다.
퓨린 뉴클레오시드 포스포릴라제 (PNP, EC 2.4.2.1)와 같은 효소는 높은 입체선택성으로 및 보호기의 사용 없이 뉴클레오시드 및 뉴클레오시드 유사체에서 글리코실 연결을 형성할 수 있는 것으로 공지되어 있다. 예를 들어 리뷰: 문헌 [New Trends in Nucleoside Biotechnology, Mikhailopulo, I.A., Miroshnikov, A.I,. Acta Naturae 2010, 2, pp. 36-58]을 참조한다. 그러나, PNP에 의해 촉매되는 반응을 겪을 수 있는 당 단편의 현재 범위는 C2' 및 C3' 위치에 작은 H, NH2, 또는 F 치환기 및 C5' OH 기의 대체를 갖는 소수의 유사체와 함께 천연 리보스 및 데옥시리보스의 α-1-포스페이트에 제한되었다. 고리 상의 탄소 치환기 또는 C4' 위치에 임의의 치환을 갖는 당을 사용한 PNP에 의해 촉매되는 성공적인 글리코실화에 대한 보고는 없었다.
PNP-촉매된 글리코실화를 위한 리보스 및 데옥시리보스 α-1-포스페이트 기질에 대한 접근은 효소 포스포펜토뮤타제 (PPM, EC 5.4.2.7)로의 5'-히드록실로부터 1'-히드록실 위치로의 포스페이트 기의 전위에 의해 입증되었다 ([Mikhailopulo, I.A., et al. 상기 문헌] 참조). 그러나, PPM이 이 반응을 촉매할 수 있는 당의 범위는 리보스, 아라비노스, 2-데옥시리보스, 및 2,3-디데옥시리보스에 제한되었다. 임의의 추가의 치환기를 함유하는 당 포스페이트로의 성공적인 반응의 예는 보고되지 않았다.
데옥시리보스 포스페이트 알돌라제 (DERA, EC 4.1.2.4) 효소는 다른 단쇄 알데히드에의 아세트알데히드의 알돌 첨가를 촉매하는 것으로 공지되어 있다 (리뷰: [Stephen M. Dean, et al., Recent Advances in Aldolase-Catalyzed Asymmetric Synthesis, Adv. Synth. Catal. 2007, 349, pp. 1308 - 1320; DOI: 10.1002/adsc.200700115] 참조). 그러나, 알데히드에의 완전히 치환된 탄소 α를 함유하는 알데히드로의 예는 보고되지 않았다.
미국 특허 7,229,797은 퓨린 뉴클레오시드 포스포릴라제 (PNP)의 사용에 의한 및 추가적으로 효소, 예컨대 수크로스 포스포릴라제를 사용하여 무기 포스페이트 부산물을 제거하고 평형을 유도하는 천연 비치환된 데옥시리보스 1-포스페이트로부터의 데옥시리보뉴클레오시드의 형성을 기재한다. 이는 비천연 4-에티닐-D-2-데옥시리보스 1-포스페이트로부터 뉴클레오시드를 생성할 수 있는 PNP 효소의 생성을 위한 효소 조작을 개시하지 않으며, 비천연 기질 상에 작용하는 PPM 및 DERA 효소의 조작을 통해, 4-에티닐-D-2-데옥시리보스 1-포스페이트가 생성될 수 있음도 개시하지 않는다.
4'-에티닐 뉴클레오시드 유사체를 생산하기 위한 현재까지 개발된 어렵고 너무 긴 합성 선택안을 고려하여, 공정 단계의 수를 감소시키고, 보호기의 사용을 최소화하고, 글리코실화의 입체선택성을 개선시키고, 독성 물질의 사용을 회피하는 4'-에티닐 뉴클레오시드 유사체, 예컨대 EFdA에 대한 개선된 효소적 합성을 개발하는 것이 바람직할 수 있다.
놀랍게도, PPM 효소는 리보스 상의 4' 위치에 3-원자 에티닐 치환기로 일부 활성을 가지며, PPM 효소 활성은 돌연변이를 효소 내로 도입함으로써 PPM에 의해 촉매되는 4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)의 4-에티닐-D-2-데옥시리보스 1-포스페이트 (6.5)로의 이성질체화를 위한 반응을 성공적으로 개발하여 4'-에티닐-2'-데옥시 뉴클레오시드의 생산을 위한 보다 효율적인 방법을 가능하게 함으로써 개선될 수 있음이 밝혀졌다.
추가적으로, PNP 효소는 데옥시리보스 상의 4 위치에 3-원자 에티닐 치환기로 일부 활성을 가지며, PNP 효소 활성은 돌연변이를 효소 내로 도입하여 PNP에 의해 촉매되는 글리코실화 반응을 성공적으로 개발하여 4'-에티닐-2'-데옥시 뉴클레오시드의 생산을 위한 보다 효율적인 방법을 가능하게 함으로써 개선될 수 있음이 또한 밝혀졌다.
전체 합성 방법에 대한 훨씬 추가의 개선은 DERA 효소, 특히 슈와넬라 할리팍센시스(Shewanella halifaxensis)로부터의 DERA가 완전히 치환된 α-탄소를 갖는 2-에티닐-글리세르알데히드 3-포스페이트와의 알돌 반응에 대한 활성을 갖는다는 발견으로부터 왔다. 이 발견은 예를 들어, EFdA를 비롯한 4'-에티닐-2'-데옥시 뉴클레오시드 유사체에 대한 전구체인 4-에티닐-D-2-데옥시리보스 5-포스페이트의 효율적인 합성을 허용하였다.
본 발명은 다른 공정 개선 중에서도, 중간체 상의 보호기의 사용을 제거하고, 글리코실화의 입체선택성을 개선시키고, 이전의 방법에 비해 상기 화합물을 제조하는 데 필요한 공정 단계의 수를 크게 감소시키는 EFdA를 비롯한 4'-에티닐-2'-데옥시 뉴클레오시드 유사체의 신규한 효소적 합성에서 조작된 효소의 사용을 포함한다. 이는 또한 효소적 공정의 필수적인 부분인 신규한 중간체에 관한 것이다.
전체 공정을 하기 반응식 1 및 반응식 2에 요약한다; 후자의 반응식은 화합물 5를 제조하기 위한 대안적인 방법을 제공한다:
반응식 1
반응식 1A
포스페이트 중간체의 산 형태 또는 염은 본원에 기재된 공정에 이용될 수 있으며, 본원의 공정 단계의 예시에서 제공된 구체적인 산 또는 염 형태에 제한되지는 않는다. 본원에 기재된 모든 포스페이트 중간체에 대해, 2X+는 2개의 양성자, 1개의 양성자와 1개의 다른 1가 양이온, 2개의 1가 양이온 (동일하거나 상이함) 또는 1개의 2가 양이온의 임의의 조합을 나타낸다. -HO3PO-로 본원에서 그려진 포스페이트 중간체는 마찬가지로 포스페이트 기와 회합된 2개의 양성자, 1개의 양성자와 1개의 다른 1가 양이온, 2개의 1가 양이온 (동일하거나 상이함) 또는 1개의 2가 양이온의 임의의 조합을 가질 수 있다. 예로는 칼슘, 마그네슘, 또는 아연의 염; 모노 또는 디-나트륨 염, 모노 또는 디-칼륨 염, 모노 또는 디-리튬 염; 모노 또는 디-암모늄 염; 또는 1차, 2차 또는 3차 아민과의 1 또는 2가 염을 들 수 있으나, 이에 제한되지는 않는다.
관련 기술분야에 널리 이해되어 있는 바와 같이, 본원의 합성 단계에서 알데히드 또는 히드레이트로서 본원에 나타내어지거나 명명된 중간체 화합물은 본원에 기재된 반응에서 형태 또는 이러한 형태의 혼합물로 존재할 수 있다. 예를 들어, 화합물 (4) 및 (5)는 반응식 1에서 각각 히드레이트 및 알데히드로서 나타내어지지만, 각각은 각각이 존재하는 반응 단계에서 히드레이트 또는 알데히드 형태 또는 이들의 혼합물로 존재할 수 있다. 각각의 이러한 형태는 본원의 공정 단계 내에서 화합물 번호 (4) 또는 (5)에 대한 언급에 의해 포함된다:
화합물 (3)은 비키랄이며, 하기 중 어느 하나로서 본원에서 나타내어질 수 있다:
화합물 (6)은 그것이 존재하는 반응 단계에서, 그의 고리 형태로 또는 개방 쇄 알데히드 또는 히드레이트로서, 각각 산 또는 그의 염으로서 존재할 수 있다:
아노머성 C-N 연결을 갖는 4'-에티닐-2'-데옥시 뉴클레오시드 및 그의 유사체
는 HIV, AIDS 및 관련된 질환에 대한 활성에 대해 탐구되었다. 4'-에티닐-2'-데옥시 뉴클레오시드 및 그의 유사체는 아노머성 C-N 연결을 통해 퓨린 또는 피리미딘 핵염기 (아데닌, 구아닌, 시토신, 티민 또는 우라실) 또는 변형된 퓨린 또는 피리미딘 핵염기에 부착된 4'-에티닐-2'-데옥시 리보스를 포함한다.
4'-에티닐-2'-데옥시 뉴클레오시드 유사체, 예컨대 EFdA는 반응식 2에 나타내어진 바와 같이, 4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)를 2가지 효소, 포스포펜토뮤타제 (PPM) [예를 들어 서열식별번호(SEQ ID NO.): 8 (그러나 이에 제한되지는 않음)] 및 퓨린 뉴클레오시드 포스포릴라제 (PNP) [예를 들어 서열식별번호: 9, 서열식별번호: 15 (그러나 이에 제한되지는 않음)]와 배합함으로써 최종 단계 원-포트 공정을 이용하여 합성될 수 있음이 밝혀졌다.
반응식 2
반응식 2A
반응식 2에 나타내어진 바와 같이, 합성의 최종 단계는 바람직한 최종 생성물을 향한 반응의 평형을 유도하기 위해 임의적 제3 효소와의 2-효소 반응을 이용한다. 최종 단계는 화합물 (6) 또는 그의 염으로 시작하며, 여기서 (6)은 상기 나타내어진 바와 같은 고리 형태의 4-에티닐-2-데옥시리보스 5-포스페이트 또는 그의 개방 쇄 알데히드 또는 히드레이트 형태이다.
화합물 (6)을 망간 (II) 염을 함유하며, 필요에 따라 약 6.5 내지 8.0, 또는 보다 특히 약 7.0 내지 7.5의 범위의 pH로 조정된 완충된 용액에서, 포스포펜토뮤타제 (PPM), 퓨린 뉴클레오시드 포스포릴라제 (PNP), 수크로스 포스포릴라제, 수크로스, 및 핵염기, 예를 들어, 비치환된 또는 치환된 아데닌과 배합한다. 수크로스:화합물 (6)의 몰 비는 약 1:1 내지 4:1일 수 있으나, 이에 제한되지는 않는다. 이 원-포트 반응의 성분은 임의의 순서로 배합될 수 있다.
반응물을 효소를 변성시키지 않는 온도 범위, 예를 들어, 약 30 내지 45 ℃, 및 보다 특히 약 35 내지 45 ℃ 내에서 교반한다. 특정 지점까지, 냉각기 온도는 작동할 수 있지만, 반응 속도를 감속시킬 것이다.
적합한 pH를 가지며 망간 (II) 염을 함유하는 임의의 완충액은 반응에 사용될 수 있다. 이러한 완충액의 예로는 트리에탄올아민; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올; 및 BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올을 들 수 있으나, 이에 제한되지는 않는다. 보다 특히, 완충액은 트리에탄올아민이다. 완충액 중 망간 (II) 염은 예를 들어, 염화망간, 수화염화망간, 브로민화망간, 아이오드화망간, 질산망간, 및/또는 황산망간일 수 있다. 완충액 중 망간 농도는 약 0.05 mM 내지 약 10 mM의 범위일 수 있으며, 특히 이는 약 5 mM이다.
평형 반응은 반응 혼합물에 첨가된 수크로스 포스포릴라제 (EC 2.4.1.7)에 의해 촉매되는, 수크로스의 D-프룩토스 및 α-D-글루코스-1-포스페이트로의 가인산분해에 의한 부산물 무기 포스페이트 염의 소비에 의해 최종 생성물의 높은 전환율로 전방향으로 유도될 수 있다. 그러나, 반응 동안 포스페이트를 제거하기 위한 임의의 다른 선택안, 예를 들어, 수크로스 포스포릴라제 및 수크로스를 사용하는 대신 칼슘, 마그네슘, 또는 망간을 반응물에 첨가하여 포스페이트 염을 침전시키는 것이 이용될 수 있다. 이 매우 효율적이고 생태학적으로 친화적인 공정은 보호기 또는 유기 용매의 사용 없이 매우 높은 입체선택성으로 당 및 핵염기 사이의 아노머성 연결을 형성하는 이점을 가지며, 원 포트 반응으로서 수행될 수 있다.
반응이 완결되면, 최종 생성물은 관련 기술분야의 통상의 기술자에게 공지된 표준 절차, 예컨대 최종 생성물의 결정화에 의한 단리 및 여과에 의한 수집, 또는 적절한 용매 내로의 추출, 이어서 결정화 (그러나 이에 제한되지는 않음)를 사용하여 단리될 수 있다.
반응식 2A에 나타내어진 바와 같이, 합성의 최종 단계는 대안적으로 바람직한 최종 생성물을 향한 반응의 평형을 유도하기 위해 임의적 제4 효소와의 3-효소 반응을 이용할 수 있다. 최종 단계는 화합물 (5) 또는 그의 염으로 시작하며, 여기서 (5)는 (R)-2-에티닐-글리세르알데히드 3-포스페이트 또는 그의 히드레이트 형태이다.
화합물 (5)를 망간 (II) 염을 함유하며, 필요에 따라 약 4 내지 10, 또는 특히 약 6.5 내지 8.0, 또는 보다 특히 약 7.0 내지 7.5의 범위의 pH로 조정된 완충된 용액에서, 데옥시리보스-포스페이트 알돌라제 (DERA), 아세트알데히드, 포스포펜토뮤타제 (PPM), 퓨린 뉴클레오시드 포스포릴라제 (PNP), 수크로스 포스포릴라제, 수크로스, 및 핵염기 또는 그의 유사체, 예를 들어, 비치환된 또는 치환된 아데닌과 배합한다. 수크로스:화합물 (5)의 몰 비는 약 1:1 내지 4:1일 수 있으나, 이에 제한되지는 않는다. 이 원-포트 반응의 성분은 임의의 순서로 배합될 수 있다.
반응은 효소를 변성시키지 않는 온도 범위, 예를 들어 약 30 내지 45 ℃, 또는 특히 약 35 내지 45 ℃ 내에서 수행된다. 특정 지점까지, 냉각기 온도는 작동할 수 있지만, 반응 속도를 감속시킬 것이다.
아세트알데히드는 용액으로서, 및 보다 특히 이소프로필 알콜 중 40 중량% 용액으로서 첨가된다. 아세트알데히드의 임의의 적합한 용액 또는 순수한 아세트알데히드는 반응에 사용될 수 있다. 이러한 용액의 예로는 이소프로판올 중 아세트알데히드 용액, 에탄올 중 아세트알데히드 용액, 물 중 아세트알데히드 용액, THF 중 아세트알데히드 용액을 들 수 있으나, 이에 제한되지는 않는다. 알데히드:화합물 (5)의 몰 비는 약 0.5:1 내지 4:1, 및 보다 특히 1.5:1일 수 있으나, 이에 제한되지는 않는다.
적합한 pH를 가지며 망간 (II) 염을 함유하는 임의의 완충액은 반응에 사용될 수 있다. 이러한 완충액의 예로는 트리에탄올아민; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올; 및 BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올을 들 수 있으나, 이에 제한되지는 않는다. 보다 특히, 완충액은 트리에탄올아민이다. 완충액 중 망간 (II) 염은 예를 들어, 염화망간, 수화염화망간, 브로민화망간, 아이오드화망간, 질산망간, 및/또는 황산망간일 수 있다. 완충액 중 망간 농도는 약 0.05 mM 내지 약 10 mM의 범위일 수 있으며, 특히 이는 약 5 mM이다.
평형 반응은 반응 혼합물에 첨가된 수크로스 포스포릴라제 (EC 2.4.1.7)에 의해 촉매되는 수크로스의 D-프룩토스 및 α-D-글루코스-1-포스페이트로의 가인산분해에 의한 부산물 무기 포스페이트 염의 소비에 의해 최종 생성물의 높은 전환율로 전방향으로 유도될 수 있다. 그러나, 반응 동안 포스페이트를 제거하기 위한 임의의 다른 선택안, 예를 들어, 수크로스 포스포릴라제 및 수크로스를 사용하는 대신 칼슘, 마그네슘, 또는 망간을 반응물에 첨가하여 포스페이트 염을 침전시키는 것이 이용될 수 있다. 이 매우 효율적이고 생태학적으로 친화적인 공정은 보호기 또는 유기 용매의 사용 없이 매우 높은 입체선택성으로 당 및 핵염기 사이의 아노머성 연결을 형성하는 이점을 가지며, 원 포트 반응으로서 수행될 수 있다.
반응이 완결되면, 최종 생성물은 관련 기술분야의 통상의 기술자에게 공지된 표준 절차, 예컨대 최종 생성물의 결정화에 의한 단리 및 여과에 의한 수집, 또는 적절한 용매 내로의 추출, 이어서 결정화 (그러나 이에 제한되지는 않음)를 사용하여 단리될 수 있다.
최종 생성물 4'-에티닐-2'-데옥시 뉴클레오시드 및 그의 유사체의 합성을 위한 본 공정에서 사용되는 몇몇 상류 중간체는 또한 반응식 3; 반응식 3A 및 반응식 3B에 나타내어진 바와 같은 효소적 반응 방법을 사용하여 제조된다.
반응식 3
반응식 3A
반응식 3B
화합물 4: 옥시다제 반응
반응식 3에 나타내어진 바와 같이, (R)-2-에티닐-글리세르알데히드 (4)는 갈락토스 옥시다제를 필요에 따라 약 3 내지 10, 또는 보다 특히 약 6 내지 8의 범위의 pH로 조정된 완충된 용액에서 2-에티닐-프로판-1,2,3-트리올 (3)과 반응시킴으로써 제조된다. 적합한 pH 범위를 갖는 임의의 완충액, 예를 들어 인산나트륨; 아세트산나트륨; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올; 및 BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; CAPS, 예를 들어, N-시클로헥실-3-아미노프로판술폰산,; MES, 예를 들어 2-(N-모르폴리노)에탄술폰산; CHES, 예를 들어, N-시클로헥실-2-아미노에탄술폰산; 글리신; 또는 비신 (N,N-비스(2-히드록시에틸)글리신) (그러나 이에 제한되지는 않음); (인산나트륨이 바람직함)이 사용될 수 있다.
구리 및 퍼옥시다제는 둘 다 갈락토스 옥시다제 (GOase)를 활성화시키기 위해 반응에 사용된다. 구리는 CuSO4, Cu(OAc)2, CuCl2 또는 Cu(II) 또는 Cu(I)의 다른 염의 첨가에 의해 반응 혼합물에 공급될 수 있다. 퍼옥시다제는 서양고추냉이 퍼옥시다제, 또는 다른 유기체로부터 유래된 퍼옥시다제일 수 있거나, 이는 산화제, 예컨대 페리시아나이드, 이리데이트, 망간 (III) 염, 퍼술페이트 염 및 다른 1 전자 또는 2 전자 산화제, 또는 무기 또는 유기 산화제에 의해 대체될 수 있다. 바람직하게는, 퍼옥시다제는 서양고추냉이 퍼옥시다제이다. 카탈라제는 또한 GOase 탈활성화를 방지하는 것을 돕기 위해 첨가된다. 카탈라제는 포유동물 공급원 (소)으로부터의 또는 박테리아 또는 진균 공급원, 예컨대 코리네박테리움(Corynebacterium), 아스페르길루스(Aspergillus) 또는 이 목적을 위해 관련 기술분야에 공지된 다른 유기체로부터의 것일 수 있다.
반응은 산소의 존재 하에서 진행된다. 한 편리한 방법은 반응물을 공기로 살포하는 것이다. 대안적으로, 산소를 생성하는 다른 시스템, 예컨대 과산화수소/카탈라제, 슈퍼옥시드 또는 이 목적을 위해 관련 기술분야에 공지된 다른 방법의 사용이 이용될 수 있다.
반응은 약 10 내지 180 g/L, 및 특히 20 내지 50 g/L의 기질 농도로 수행될 수 있다. 반응은 약 0 내지 40 ℃, 및 특히 약 10 내지 30 ℃의 온도에서 실행될 수 있다.
화합물 8: 아미날 형성
반응식 3A에 예시된 바와 같이, (R)-2-에티닐-글리세르알데히드 (4)는 이를 안정한 N,N-아세탈 또는 N,O-아세탈을 형성하는 임의의 아민, 디아민 또는 아미노 알콜, 예를 들어 N,N'-디벤질에탄-1,2-디아민, N,N'-디메틸에탄-1,2-디아민, N,N'-디페닐에탄-1,2-디아민, 및 N-벤질에탄올아민 (그러나 이에 제한되지는 않음); (N,N'-디벤질에탄-1,2-디아민이 바람직함)과 반응시킴으로써 그의 아미날 형태 (예를 들어, 화합물 8)로 단리될 수 있다. 반응은 아미날의 분해를 회피하기 위해 유기 용매에서 약 50 ℃ 이하, 바람직하게는 20 내지 30 ℃의 온도에서 수행된다. 물과 혼화성이 아닌 임의의 용매, 예를 들어 MTBE, 2-MeTHF, CPME, 디에틸 에테르, 디이소프로필 에테르, 에틸 아세테이트, 이소프로필 아세테이트, 톨루엔, DCM 또는 이들의 혼합물 (그러나 이에 제한되지는 않음) (MTBE가 바람직함)이 사용될 수 있다. 반응은 약 10 내지 100 g/L, 및 특히 20 내지 50 g/L의 기질 농도로 수행될 수 있다.
임의로 아미날은 유기 용매, 예를 들어 MTBE, 2-MeTHF, CPME, 디에틸 에테르, 디이소프로필 에테르, 에틸 아세테이트, 이소프로필 아세테이트, 톨루엔, DCM 또는 이들의 혼합물 (그러나 이에 제한되지는 않음) (MTBE가 바람직함)로부터의 결정화에 의해 추가로 정제될 수 있다. 결정화는 아미날의 분해를 회피하기 위해 50 ℃ 이하에서, 예를 들어 약 40 ℃에서 수행된다.
반응은 산소의 부재 하에서 진행된다. 한 편리한 방법은 반응물을 N2로 살포하는 것이다. 대안적으로, 산소를 배제하는 다른 시스템, 예컨대 아르곤, 헬륨, 또는 이 목적을 위해 관련 기술분야에 공지된 다른 방법의 사용이 이용될 수 있다.
화합물 4: 아미날 8로부터의 알데히드 4 재생
(R)-2-에티닐-글리세르알데히드 (4)는 이를 물과 혼화성이 아닌 유기 용매의 존재 하에서, 아미날의 분해를 회피하기 위해 50 ℃ 이하의 온도, 예를 들어 약 0 내지 15 ℃에서 유기 또는 무기 산과 반응시킴으로써 그의 각각의 아미날로부터 재생될 수 있다. 임의의 유기 또는 무기 산, 예를 들어 p-톨루엔술폰산, 메탄술폰산, 캄포르술폰산, 아세트산, 염산, 인산, 황산 (그러나 이에 제한되지는 않음)이 사용될 수 있다. p-톨루엔술폰산은 물 중 N,N'-디벤질에탄-1,2-디아민 비스 p-톨루엔술포네이트 염의 낮은 용해도로 인해 아미날 8과의 반응에서 바람직하다. 물과 혼화성이 아닌 임의의 용매, 예를 들어 MTBE, 2-MeTHF, CPME, 디에틸 에테르, 디이소프로필 에테르, 에틸 아세테이트, 이소프로필 아세테이트, 톨루엔, DCM 또는 이들의 혼합물 (그러나 이에 제한되지는 않음); (MTBE 및 2-MeTHF가 바람직함)이 사용될 수 있다. 반응은 약 5 내지 100 g/L, 및 특히 20 내지 50 g/L의 기질 농도로 수행될 수 있다.
임의로 알데히드 4 용액은 과량의 유기 또는 무기 산을 제거하기 위해 수지로 추가로 처리될 수 있다. 수지 처리는 염기성 수지, 예컨대 도웩스(DOWEX)™ 마라톤(MARATHON)™ A 수지 (히드록시드 형태) 및 암벌리스트(AMBERLYST)® 15 수지 (수소 형태), 또는 이들의 혼합물, 바람직하게는 혼합물 도웩스™ 마라톤™ A 수지 (히드록시드 형태) 및 암벌리스트® 15 수지로 수행될 수 있다.
임의로 알데히드 4 용액은 과량의 유기 용매를 제거하기 위해 추가로 진공 하에서 증발되거나, 기체로 스윕될 수 있다.
화합물 5: 키나제 반응
반응식 3 및 반응식 3A에 나타내어진 바와 같이, (R)-2-에티닐-글리세르알데히드 3-포스페이트 히드레이트 (5)는 이. 콜라이(E. coli)로부터의 판토테네이트 키나제 (PanK) 야생형 또는 그의 변이체를 필요에 따라 약 4 내지 10, 또는 특히 약 6.5 내지 8.5 또는 보다 특히 5.5 내지 8.5의 범위의 pH로 조정된 완충된 용액에서 화합물 (4)와 반응시킴으로써 제조된다. 적합한 pH 범위를 갖는 임의의 완충액, 예를 들어 인산나트륨, PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; 트리에탄올아민 및 TRIS, 예를 들어, TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올 (그러나 이에 제한되지는 않음); (인산나트륨이 바람직함)이 사용될 수 있다. 반응은 임의의 적합한 2가 금속 염, 예를 들어 마그네슘 염, 예를 들어 염화마그네슘, 및 코발트, 망간, 아연 또는 칼슘의 염 (그러나 이에 제한되지는 않음)의 존재 하에서 수행될 수 있다.
이 반응은 5'-트리포스페이트 (ATP)로 재생시키는 것을 요구하는 포스페이트 공급원으로서 아데노신 5'-디포스페이트 (ADP)를 이용한다. ATP는 계내에서 생성되고, 이어서 관련 기술분야에 공지된 임의의 방법에 의해 ADP, 아데노신 5'-모노포스페이트 (AMP) 또는 아데노신으로부터 재생될 수 있다. 예를 들어, 아세테이트 키나제와 함께 아세틸 포스페이트의 조합은 ADP를 ATP로 재생시키는데 사용될 수 있다. 예를 들어, 피루베이트, 포스페이트 및 산소의 존재 하에서, 피루베이트 옥시다제 및 카탈라제의 조합은 아세틸 포스페이트를 생성하고, 따라서 아세테이트 키나제의 존재 하에서, ADP를 ATP로 재생시키는데 사용될 수 있다.
반응은 약 10 내지 100 g/L, 및 특히 약 20 내지 40 g/L의 기질 농도로 수행될 수 있다. 반응은 약 0 내지 40 ℃의 온도에서, 및 특히 약 10 내지 25 ℃에서 실행될 수 있다.
반응은 또한 수지 상에 고정화된 판토테네이트 키나제 (PanK)로, 또는 수지 상에 고정화된 PanK 및 아세테이트 키나제 둘 다로 수행될 수 있다. 관련 기술분야에 공지된 임의의 적합한 효소 고정화 방법, 예를 들어 고정화된 금속-이온 친화도 크로마토그래피 (IMAC) 수지, 또는 다른 생물학적 태그를 사용한 친화도 수지-고정화, 공유 고정화, 이온성 수지 상의 고정화, 흡착, 캡슐화, 및/또는 가교된 효소에 의한 고정화 (그러나 이에 제한되지는 않음)가 사용될 수 있다. 예를 들어, 금속-이온 친화도 크로마토그래피 (IMAC) 수지가 사용될 수 있거나, IMAC 수지 및 2가 양이온의 임의의 적합한 조합이 사용될 수 있으며, 여기서 양이온은 예를 들어 니켈, 코발트, 구리, 아연, 철, 및/또는 알루미늄일 수 있으나, 이에 제한되지는 않는다. 특히, 니켈로 충전된 IMAC 수지가 사용될 수 있다. 바람직하게는, 아세테이트 키나제 및 판토테네이트 키나제 (PanK) 둘 다는 수지 상에 고정화된다.
화합물 9: 키나제 반응
반응식 3B에 나타내어진 바와 같이, (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9)는 이. 콜라이로부터의 판토테네이트 키나제 (PanK) 야생형 또는 그의 변이체를 필요에 따라 약 4 내지 10, 또는 특히 약 6.5 내지 8.5 또는 보다 특히 5.5 내지 8.5의 범위의 pH로 조정된 완충된 용액에서 화합물 (3)과 반응시킴으로써 제조된다. 적합한 pH 범위를 갖는 임의의 완충액, 예를 들어 인산나트륨, PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산;, 트리에탄올아민 및 TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올 (그러나 이에 제한되지는 않음) (인산나트륨이 바람직함)이 사용될 수 있다. 반응은 임의의 적합한 2가 금속 염, 예를 들어 마그네슘 염, 예를 들어 염화마그네슘, 및 코발트, 망간, 아연 또는 칼슘의 염 (그러나 이에 제한되지는 않음)의 존재 하에서 수행될 수 있다.
이 반응은 5'-트리포스페이트 (ATP)로 재생시키는 것을 요구하는 포스페이트 공급원으로서 아데노신 5'-디포스페이트 (ADP)를 이용한다. ATP는 계내에서 생성되고, 이어서 관련 기술분야에 공지된 임의의 방법에 의해 ADP, 아데노신 5'-모노포스페이트 (AMP) 또는 아데노신으로부터 재생될 수 있다. 예를 들어, 아세테이트 키나제와 함께 아세틸 포스페이트의 조합은 ADP를 ATP로 재생시키는데 사용될 수 있다. 대안적으로, (a) 피루베이트, 포스페이트 및 산소의 존재 하에서 피루베이트 옥시다제, 카탈라제 및 아세테이트 키나제의 조합은 ADP를 ATP로 재생시키는데 사용될 수 있거나, (b) 아세틸 포스페이트 및 아세테이트 키나제와 조합으로 피루베이트, 포스페이트, 및 산소의 존재 하에서 피루베이트 옥시다제, 카탈라제 및 아세테이트 키나제의 조합은 ADP로부터의 ATP 재생에 사용될 수 있다.
반응은 약 10 내지 100 g/L, 및 특히 약 20 내지 40 g/L의 기질 농도로 수행될 수 있다. 반응은 약 0 내지 40 ℃의 온도에서, 및 특히 약 10 내지 25 ℃에서 실행될 수 있다.
반응은 또한 수지 상에 고정화된 판토테네이트 키나제 (PanK)로, 또는 수지 상에 고정화된 PanK 및 아세테이트 키나제 둘 다로 수행될 수 있다. 관련 기술분야에 공지된 임의의 적합한 효소 고정화 방법, 예를 들어 고정화된 금속-이온 친화도 크로마토그래피 (IMAC) 수지, 또는 다른 생물학적 태그를 사용한 친화도 수지-고정화, 공유 고정화, 이온성 수지 상의 고정화, 흡착, 캡슐화, 및/또는 가교된 효소에 의한 고정화 (그러나 이에 제한되지는 않음)가 사용될 수 있다. 예를 들어, 금속-이온 친화도 크로마토그래피 (IMAC) 수지가 사용될 수 있거나, IMAC 수지 및 2가 양이온의 임의의 적합한 조합이 사용될 수 있으며, 여기서 양이온은 예를 들어 니켈, 코발트, 구리, 아연, 철, 및/또는 알루미늄일 수 있으나, 이에 제한되지는 않는다. 특히, 니켈로 충전된 IMAC 수지가 사용될 수 있다. 바람직하게는, 아세테이트 키나제 및 판토테네이트 키나제 (PanK) 둘 다는 수지 상에 고정화된다.
화합물 5: 옥시다제 반응
반응식 3B에 나타내어진 바와 같이, (R)-2-에티닐-글리세르알데히드 히드레이트 3-포스페이트 (5)는 갈락토스 옥시다제를 필요에 따라 약 3 내지 10, 또는 보다 특히 약 6 내지 8의 범위의 pH로 조정된 완충된 용액에서 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9)와 반응시킴으로써 제조된다. 적합한 pH 범위를 갖는 임의의 완충액, 예를 들어 인산나트륨; 아세트산나트륨; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올; 및 BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; CAPS, 예를 들어, N-시클로헥실-3-아미노프로판술폰산,; MES, 예를 들어 2-(N-모르폴리노)에탄술폰산; CHES, 예를 들어, N-시클로헥실-2-아미노에탄술폰산; 글리신; 또는 비신 (N,N-비스(2-히드록시에틸)글리신) (그러나 이에 제한되지는 않음); (인산나트륨이 바람직함)이 사용될 수 있다.
구리 및 퍼옥시다제는 둘 다 갈락토스 옥시다제 (GOase)를 활성화시키기 위해 반응에 사용된다. 구리는 CuSO4, Cu(OAc)2, CuCl2 또는 Cu(II) 또는 Cu(I)의 다른 염의 첨가에 의해 반응 혼합물에 공급될 수 있다. 퍼옥시다제는 서양고추냉이 퍼옥시다제, 또는 다른 유기체로부터 유래된 퍼옥시다제일 수 있거나, 이는 산화제, 예컨대 페리시아나이드, 이리데이트, 망간 (III) 염, 퍼술페이트 염 및 다른 1 전자 또는 2 전자 산화제, 또는 무기 또는 유기 산화제에 의해 대체될 수 있다. 바람직하게는, 퍼옥시다제는 서양고추냉이 퍼옥시다제이다. 카탈라제는 또한 GOase 탈활성화를 방지하는 것을 돕기 위해 첨가된다. 카탈라제는 포유동물 공급원 (소)으로부터의 또는 박테리아 또는 진균 공급원, 예컨대 코리네박테리움, 아스페르길루스 또는 이 목적을 위해 관련 기술분야에 공지된 다른 유기체로부터의 것일 수 있다.
반응은 산소의 존재 하에서 진행된다. 한 편리한 방법은 반응물을 공기로 살포하는 것이다. 대안적으로, 산소를 생성하는 다른 시스템, 예컨대 과산화수소/카탈라제, 슈퍼옥시드 또는 이 목적을 위해 관련 기술분야에 공지된 다른 방법의 사용이 이용될 수 있다.
반응은 약 10 내지 180 g/L, 및 특히 20 내지 50 g/L의 기질 농도로 수행될 수 있다. 반응은 약 0 내지 40 ℃, 및 특히 약 10 내지 30 ℃의 온도에서 실행될 수 있다.
화합물 6: 데옥시리보스-포스페이트 알돌라제 (DERA) 반응
이전의 공지된 공정에 비해 화합물 (6)을 생산하기 위한 이 새로운 경로의 중요한 이점은 이것이 보호기의 사용 없이 정확한 산화 상태에서 당 프레임워크를 생성한다는 것이다.
4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)는 데옥시리보스-포스페이트 알돌라제 (DERA)를 필요에 따라 약 5 내지 9, 또는 보다 특히 약 6 내지 8의 범위의 pH로 조정된 수용액에서 산으로서 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5) 또는 그의 염, 및 아세트알데히드와 반응시킴으로써 제조된다. (5)의 염의 예로는 칼슘, 마그네슘, 아연, 모노- 또는 디-Na 염, 모노- 또는 디-K 염, 또는 모노- 또는 디-Li 염; 모노- 또는 디-암모늄 또는 염; 또는 1차, 2차 또는 3차 아민과의 1가 또는 2가 염을 들 수 있으나, 이에 제한되지는 않는다. 반응은 개방된 용기에서 수행될 수 있거나, 바람직하게는 아세트알데히드의 증발을 방지하기 위해 밀봉된 용기에서 수행된다.
반응은 약 10 내지 100 g/L, 특히 약 30 내지 60 g/L의 기질 농도로 수행될 수 있다. 이는 약 0 내지 40 ℃, 및 특히 약 25 내지 35 ℃의 온도에서 실행될 수 있다.
반응은 임의의 완충액 없이 실행될 수 있다. 대안적으로, 완충액, 예를 들어 트리에탄올아민; 포스페이트; MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MES, 예를 들어, 2-(N-모르폴리노)에탄술폰산; 및 보레이트; 또는 임의의 1차 아민 기를 갖지 않는 적합한 pH 범위를 갖는 다른 완충액 (그러나 이에 제한되지는 않음)이 사용될 수 있다.
1종 이상의 효소의 사용을 포함하는 본원에 기재된 공정의 각각의 단계 및 방법은 상기 1종 이상의 효소를 변성시키지 않는 온도에서 수행된다. 1종 이상의 효소의 사용을 포함하는 본원에 기재된 공정의 각각의 단계 및 방법은 약 3 내지 10 또는 약 4 내지 10의 범위의 pH에서 수행될 수 있다.
"핵염기" (또는 "질소성 염기" 또는 "염기")는 핵산, 예컨대 DNA 및 RNA의 피리미딘 또는 퓨린 헤테로사이클이다. 본원에 사용된 바와 같은 핵염기는 아데닌, 구아닌, 시토신, 티민 또는 우라실, 뿐만 아니라 비-천연 변형을 갖는 핵염기를 포함하며, 예를 들어, 여기서 염기는 1개 이상의 비-천연 치환기, 또는 아노머성 C-N 연결에 대한 임의의 변화를 배제하는 염기에서의 헤테로원자(들)에 영향을 미치는 변형을 갖는다.
4'-에티닐-2'-데옥시 뉴클레오시드는 핵염기를 함유한다. 본원에 사용된 바와 같은 4'-에티닐-2'-데옥시 뉴클레오시드의 유사체는 뉴클레오시드의 염기에 대한 비-천연 변형을 의미하며, 예를 들어 여기서 염기는 1개 이상의 비-천연 치환기, 또는 아노머성 C-N 연결에 대한 임의의 변화를 제외하고 염기에서의 헤테로원자(들)에 영향을 미치는 변형을 갖는다.
본원에 사용된 바와 같은 "포스포펜토뮤타제" ("PPM") 효소 (예를 들어 EC 5.4.2.7)는 리보스 1-포스페이트의 리보스 5-포스페이트 및 관련된 화합물, 예컨대 데옥시리보스 포스페이트 및 리보스 포스페이트 및 데옥시리보스 포스페이트의 유사체로의 가역적 이성질체화를 촉매하는 효소이다.
본원에 사용된 바와 같은 "퓨린 뉴클레오시드 포스포릴라제" ("PNP") 효소 (EC 2.4.2.2)는 퓨린 리보뉴클레오시드 및 관련된 화합물 (예를 들어, 데옥시리보뉴클레오시드 및 리보뉴클레오시드 및 데옥시리보뉴클레오시드의 유사체)의 유리 퓨린 염기 및 리보스-1-포스페이트 (및 그의 유사체)로의 가역적 가인산분해를 촉매하는 효소이다.
본원에 사용된 바와 같은 "수크로스 포스포릴라제" ("SP") 효소 (EC 2.4.1.7)는 수크로스의 D-프룩토스 염기 및 글루코스-1-포스페이트 (및 그의 유사체)로의 가역적 가인산분해를 촉매하는 효소이다. 수크로스와 조합으로 수크로스 포스포릴라제 (SP)는 퓨린 뉴클레오시드 포스포릴라제 (PNP) 및 포스포뮤타제 (PPM)와 조합으로 이용되어 반응으로부터 유리 포스페이트 이온을 제거하며, 여기서 효소의 조합은 뉴클레오시드 MK-8591 (EFdA)의 형성을 촉매하는 반면, 일부 실시양태에서 이는 관련 기술분야에 공지된 다른 방법에 의해 대체될 수 있다.
본원에 사용된 바와 같은 "데옥시리보스-포스페이트 알돌라제" ("DERA") (예를 들어, EC 4.1.2.4)는 탄소-탄소 결합을 가역적으로 절단하거나 생성하는 리아제의 패밀리 중의 효소를 지칭한다. 본원에 사용된 바와 같은 데옥시리보스-포스페이트 알돌라제는 천연 발생 (야생형) 데옥시리보스-포스페이트 알돌라제 뿐만 아니라 인간 조작에 의해 생성된 비-천연 발생 조작된 폴리펩티드를 포함한다. 야생형 데옥시리보스-포스페이트 알돌라제는 2-데옥시-D-리보스 5-포스페이트의 D-글리세르알데히드 3-포스페이트 및 아세트알데히드로의 가역적 반응을 촉매한다.
본원에 사용된 바와 같은 "판토테네이트 키나제" ("PanK")는 자연에서 판토테네이트를 인산화하여 4'-포스포판토테네이트를 형성하는 효소 (EC 2.7.1.33)를 지칭한다. 이러한 PanK 효소로부터 유래된 변이체 효소는 이러한 변이체가 판토테네이트에 대한 그들의 천연 기능을 보유하는지 여부와 무관하게 개선된 활성 및 D-에티닐글리세르알데히드의 3'OH-기에 대한 입체선택성을 나타낼 수 있다.
본원에 사용된 바와 같은 "갈락토스 옥시다제" ("GOase"; EC 1.1.3.9) 효소는 2분자성 산소의 존재 하에서 1차 알콜의 상응하는 알데히드로의 산화를 촉매하는 구리-의존성 효소이다. 이들은 위치- 및 거울상특이적 방식 둘 다로 작용하여, 관능기 보호를 거의 또는 전혀 요구하지 않고, 바람직한 입체이성질체를 생성하는 합성 접근법을 가능하게 한다. 산화의 방식은 활성이 알콜의 그의 상응하는 카르복실산으로의 과다-산화를 초래하지 않도록 온건하고 제어된다.
본원에 사용된 바와 같은 "서양고추냉이 퍼옥시다제" (HRP, EC 1.11.1.7) 효소는 정상 GOase 촉매적 환화 동안 일어나는 활성 부위의 불활성 산화환원 상태를 산화시킴으로써 GOase 촉매 활성을 활성화시키고 유지하는 철-의존성 효소이다. 유형 I HRP는 본원에 포함되는 실시예에서 촉매적 방식으로 이용되지만, 이는 이 역할에서 배타적인 것으로 의미되지 않는데, 이는 이 및 다른 효소 부류에 속하는 다른 전자-전달 효소 뿐만 아니라 이 역할을 달성할 수 있는 화학적 시약이 있기 때문이다.
본원에 사용된 바와 같은 "카탈라제"는 효소를 과산화수소의 특정 수준 초과로 불활성이 되게 할 수 있는 갈락토스 옥시다제 또는 피루베이트 옥시다제 반응의 부산물인 과산화수소에 대해 작용하는 헴-의존성 효소 (EC 1.11.1.6)를 지칭한다. 카탈라제는 본원의 실시예에서 촉매적 유지 효소로서 이용되어 과산화수소를 물 및 산소로 전환시키는 반면, 일부 실시양태에서 이는 다른 방법, 예컨대 과산화수소의 전기화학적 분해에 의해 대체될 수 있다. 헴-의존성 카탈라제는 본원에 포함된 실시예에서 촉매적 방식으로 이용되지만, 이는 이 역할에서 배타적인 것으로 의미되지 않는데, 이는 이 역할을 달성할 수 있는 이 부류에 속하는 다른 효소가 있기 때문이다.
본원에 사용된 바와 같은 "아세테이트 키나제" ("AcK")는 아세테이트 및 아데노신 트리포스페이트 (ATP)로부터의 아세틸 포스페이트의 형성을 촉매하는 효소 (EC 2.7.2.1)를 지칭한다. 이는 또한 역반응을 촉매할 수 있으며, 여기서 이는 아세틸 포스페이트의 존재 하에서 아데노신 5'-디포스페이트 (ADP)를 아데노신 5'-트리포스페이트 (ATP)로 인산화한다. 아세테이트 키나제는 본원의 실시예에서 판토테네이트 키나제 (PanK)에 의해 요구되는 ATP를 재사용하기 위해 이용되는 반면, 일부 실시양태에서 아세틸 포스페이트- 아세테이트 키나제 재사용 조합은 관련 기술분야에 공지된 다른 방법에 의해 대체될 수 있다.
본원에 사용된 바와 같은 "피루베이트 옥시다제" ("PO")는 플라빈 아데닌 디뉴클레오티드 (FAD) 및 티아민 디포스페이트에 의존성인 효소 (EC 1.2.3.3)를 지칭한다. 피루베이트 옥시다제는 옥시도리덕타제, 구체적으로 수용자로서 산소를 갖는 공여자의 알데히드 또는 옥소 기에 대해 작용하는 것들의 패밀리에 속하는 효소이며, 이는 피루베이트, 포스페이트 이온 및 2분자성 산소 사이의 화학 반응을 촉매하여 아세틸 포스페이트, 이산화탄소 및 과산화수소를 형성한다. 피루베이트 옥시다제 (PO)는 본원의 실시예에서 촉매적 ATP-재생 조합으로서 아세테이트 키나제 (AcK) 및 카탈라제와 조합으로 이용되며, 여기서 효소의 조합은 산소, 피루베이트 및 포스페이트 이온의 존재 하에서 ADP로부터의 ATP의 형성을 촉매하는 반면, 일부 실시양태에서 이는 관련 기술분야에 공지된 다른 방법에 의해 대체될 수 있다.
본원에 사용된 바와 같은 "야생형" 및 "천연-발생" 효소는 자연에서 발견되는 형태를 지칭한다. 예를 들어, 야생형 폴리펩티드 서열은 자연에서 공급원으로부터 단리될 수 있는 유기체에 존재하며, 인간 조작에 의해 의도적으로 변형되지 않은 서열이다.
폴리펩티드를 포함하여 효소에 관하여 사용되는 경우 본원에 사용된 바와 같은 "조작된", "변이체", "돌연변이체" 및 "비-천연 발생"은 그렇지 않다면 자연에서 존재하지 않을 방식으로 변형된 물질, 또는 물질의 천연 또는 네이티브 형태에 상응하는 물질을 지칭한다. 일부 실시양태에서, 폴리펩티드는 천연 발생 폴리펩티드와 동일하지만, 합성 물질로부터, 및/또는 재조합 기법을 사용한 조작에 의해 생산되거나 유래된다.
효소에 관하여 "서열 동일성의 백분율", "퍼센트 동일성", 및 "퍼센트 동일한"은 폴리뉴클레오티드 서열 또는 폴리펩티드 서열 사이의 비교를 지칭하기 위해 본원에서 사용되고, 2개의 최적으로 정렬된 서열을 비교 창에 비해 비교함으로써 결정되며, 여기서 비교 창에서의 폴리뉴클레오티드 또는 폴리펩티드 서열의 부분은 2개의 서열의 최적 정렬을 위해 참조 서열에 비해 부가 또는 결실 (즉, 갭)을 포함할 수 있다. 백분율은 동일한 핵산 염기 또는 아미노산 잔기 중 어느 하나가 둘 다의 서열에서 발생하거나, 핵산 염기 또는 아미노산 잔기가 갭을 갖고 정렬되어 매칭된 위치의 수를 생성하는 위치의 수를 결정하고, 매칭된 위치의 수를 비교의 창에서의 위치의 총 수로 나누고, 결과에 100을 곱하여 서열 동일성의 백분율을 생성함으로써 계산된다. 최적 정렬 및 퍼센트 서열 동일성의 결정은 BLAST 및 BLAST 2.0 알고리듬을 사용하여 수행된다 (예를 들어, 문헌 [Altschul et al., 1990, J. Mol. Biol. 215: 403-410] 및 [Altschul et al., 1977, Nucleic Acids Res. 3389-3402] 참조). BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보 센터(National Center for Biotechnology Information) 웹사이트를 통해 공개적으로 이용가능하다.
간략하게, BLAST 분석은 먼저 데이터베이스 서열에서 동일한 길이의 단어로 정렬되는 경우 일부 양의 값 역치 점수 T를 매칭하거나 만족시키는, 의문 서열에서의 길이 W의 짧은 단어를 확인함으로써 높은 점수화 서열 쌍 (HSP)을 확인하는 것을 포함한다. T는 이웃 단어 점수 역치로 지칭된다 (Altschul et al., 상기 문헌). 이들 초기 이웃 단어 히트는 그들을 함유하는 보다 긴 HSP를 발견하기 위한 검색을 개시하기 위한 시드로서 작용한다. 그 후, 단어 히트는 누적 정렬 점수가 증가될 수 있는 한, 각각의 서열을 따라 둘 다의 방향에서 연장된다. 누적 점수는 뉴클레오티드 서열에 대해, 파라미터 M (매칭 잔기의 쌍에 대한 보상 점수; 항상 >0) 및 N (미스매칭 잔기에 대한 페널티 점수; 항상 <0)을 사용하여 계산된다. 아미노산 서열에 대해, 점수화 행렬을 사용하여 누적 점수를 계산한다. 각각의 방향에서의 단어 히트의 연장은 누적 정렬 점수가 그의 최대 달성된 값으로부터 양 X에 의해 저하되거나; 누적 점수가 1개 이상의 음-점수화 잔기 정렬의 축적으로 인해 0 이하로 가거나; 어느 하나의 서열의 말단이 도달되는 경우 중단된다. BLAST 알고리듬 파라미터 W, T, 및 X는 정렬의 민감도 및 속도를 결정한다. BLASTN 프로그램 (뉴클레오티드 서열에 대해)은 디폴트로서 11의 단어길이 (W), 10의 기대값 €, M=5, N=-4, 및 둘다의 가닥의 비교를 사용한다. 아미노산 서열에 대해, BLASTP 프로그램은 디폴트로서 3의 단어길이 (W), 10의 기대값 €(E), 및BLOSUM62 점수화 행렬을 사용한다 (문헌 [Henikoff and Henikoff, 1989, Proc Natl Acad Sci USA 89:10915] 참조).
2개의 서열에 대한 퍼센트 동일성을 제공하는데 있어서 BLAST와 유사하게 기능하는 다수의 다른 알고리듬이 이용가능하다. 비교를 위한 서열의 최적 정렬은 예를 들어, 문헌 [Smith and Waterman, 1981, Adv. Appl. Math. 2:482]의 국소 상동성 알고리듬에 의해, 문헌 [Needleman and Wunsch, 1970, J. Mol. Biol. 48:443]의 상동성 정렬 알고리듬에 의해, 문헌 [Pearson and Lipman, 1988, Proc. Natl. Acad. Sci. USA 85:2444]의 유사성 방법에 대한 검색에 의해, 이들 알고리듬의 컴퓨터화된 실행 (GCG 위스콘신 소프트웨어 패키지에서의 GAP, BESTFIT, FASTA, 및 TFASTA)에 의해, 또는 육안 검사에 의해 수행될 수 있다 (일반적으로, 문헌 [Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (1995 Supplement) (Ausubel)] 참조). 추가적으로, 서열 정렬 및 퍼센트 서열 동일성의 결정은 제공된 디폴트 파라미터를 사용하여 GCG 위스콘신 소프트웨어 패키지 (액셀러리스(Accelerys), 미국 위스콘신주 매디슨)에서의 BESTFIT 또는 GAP를 이용할 수 있다.
"실질적 동일성"은 적어도 20개 잔기 위치의 비교 창에 비해, 빈번히 적어도 30-50개 잔기의 창에 비해 참조 서열에 비해, 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭하며, 여기서 서열 동일성의 백분율은 참조 서열을 비교의 창에 비해 참조 서열의 총 20 퍼센트 이하인 결실 또는 부가를 포함하는 서열과 비교함으로써 계산된다. 폴리펩티드에 적용되는 구체적인 실시양태에서, 용어 "실질적 동일성"은 2개의 폴리펩티드 서열이 예컨대 디폴트 갭 가중치를 사용하여 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬되는 경우, 적어도 80 퍼센트 서열 동일성, 바람직하게는 적어도 89 퍼센트 서열 동일성, 보다 바람직하게는 적어도 95 퍼센트 서열 동일성 이상 (예를 들어, 99 퍼센트 서열 동일성)을 공유하는 것을 의미한다. 바람직하게는, 동일하지 않은 잔기 위치는 보존적 아미노산 치환에 의해 상이하다.
"입체선택성"은 또 다른 것에 비해 하나의 입체이성질체의 화학적 또는 효소적 반응에서의 우선적 형성을 지칭한다. 입체선택성은 하나의 입체이성질체의 형성이 다른 것에 비해 선호되는 경우 부분적일 수 있거나, 이는 단지 하나의 입체이성질체가 형성되는 경우 완전할 수 있다. 입체이성질체가 거울상이성질체인 경우, 입체선택성은 거울상선택성, 둘 다의 합계 중 하나의 거울상이성질체의 분율 (전형적으로 백분율로서 보고됨)로 지칭된다. 이는 통상적으로 대안적으로 관련 기술분야에서 식 [주 거울상이성질체 - 부 거울상이성질체]/[주 거울상이성질체 + 부 거울상이성질체]에 따라 그로부터 계산되는 거울상이성질체 과량 (e.e.)으로서 (전형적으로 백분율로서) 보고된다. 입체이성질체가 부분입체이성질체인 경우, 입체선택성은 부분입체선택성, 2개의 부분입체이성질체의 혼합물 중 하나의 부분입체이성질체의 분율 (전형적으로 백분율로서 보고됨)로 지칭되며, 통상적으로 대안적으로 부분입체이성질체 과량 (d.e.)으로 보고된다. 거울상이성질체 과량 및 부분입체이성질체 과량은 입체이성질체 과량의 유형이다.
어구 "적합한 반응 조건"은 본 발명에 사용되는 각각의 폴리펩티드가 기질을 바람직한 생성물 화합물로 전환시킬 수 있는 효소적 전환 반응 용액에서의 조건 (예를 들어, 효소 로딩, 기질 로딩, 온도, pH, 완충액, 공-용매 등의 범위)을 지칭한다. 일부 예시적인 적합한 반응 조건은 본원에 제공된다.
효소적 전환 반응 공정의 맥락에서 본원에 사용된 바와 같은 "기질"은 본원에 사용된 조작된 효소에 의해 작용되는 화합물 또는 분자를 지칭한다.
효소적 전환 공정의 맥락에서 본원에 사용된 바와 같은 "생성물"은 기질 상의 효소적 폴리펩티드의 작용으로부터 초래되는 화합물 또는 분자를 지칭한다.
본원에 사용된 바와 같은 반응으로부터의 생성물 (예를 들어, 4'-에티닐-2'-데옥시리보스 포스페이트 유사체 또는 4'-에티닐-2'-데옥시 뉴클레오시드 유사체)의 "증가하는" 수율은 반응 동안 존재하는 특정한 성분 (예를 들어, 효소)이 동일한 기질로의 동일한 반응 하에서, 그러나 관심의 성분의 부재 하에서 수행되는 반응에 비해, 보다 많은 생성물이 생산되는 것을 유발하는 경우 발생한다.
본원에 사용된 바와 같이, 본원에 사용된 바와 같은 "평형(equilibration)" 또는 "평형(equilibrium)"은 화학적 또는 효소적 반응의 전방향 속도 상수 및 역방향 속도 상수에 의해 결정 시, 입체이성질체의 상호전환을 비롯한 화학적 또는 효소적 반응 (예를 들어, 2개의 종 A 및 B의 상호전환)에서의 화학적 종의 정상 상태 농도를 초래하는 공정을 지칭한다.
"거울상이성질체 과량" (ee)은 키랄 물질에 대해 사용되는 순도의 측정이다. 이는 샘플이 하나의 거울상이성질체를 다른 것보다 더 많은 양으로 함유하는 정도를 반영한다. 예를 들어, 라세미 혼합물은 0%의 e.e.를 갖는 반면, 단일 완전히 순수한 거울상이성질체는 100%의 e.e.를 가지며; 70%의 하나의 거울상이성질체 및 30%의 다른 것을 갖는 샘플은 40% (70% - 30%)의 e.e.를 갖는다. 부분입체이성질체 과량 (de)은 단지 2개의 부분입체이성질체가 혼합물에 존재하는 경우 e.e.와 동일한 방식으로 계산된다.
"단백질", "효소", "폴리펩티드", 및 "펩티드"는 길이 또는 번역후 변형 (예를 들어, 글리코실화, 인산화, 지질화, 미리스틸화, 10 유비퀴틴화 등)과 무관하게, 아미드 결합에 의해 공유 연결된 적어도 2개의 아미노산의 중합체를 나타내기 위해 본원에서 상호교환가능하게 사용된다. 이 정의 내에 포함되는 것은 D- 및 L-아미노산, 및 D- 및 L-아미노산의 혼합물이다.
본원에 사용된 바와 같은 용어 "약"은 특정한 값에 대한 허용가능한 오차를 의미한다. 일부 예에서, "약"은 주어진 값 범위의 하단 및 상단에서 0.05%, 0.5%, 1.0%, 또는 2.0% 내를 의미한다. pH에 관하여, "약"은 플러스 또는 마이너스 0.5를 의미한다.
본원에 사용된 바와 같은 "실질적으로 순수한" 폴리펩티드 또는 "정제된" 단백질은 폴리펩티드 종이 존재하는 우세한 종인 (즉, 몰 또는 질량 기준으로 그것이 조성물에서의 임의의 다른 개별적 거대분자 종보다 더 풍부한) 조성물을 지칭하며, 일반적으로 대상 종이 몰 또는 % 중량으로 존재하는 거대분자 종의 적어도 약 50 퍼센트를 포함하는 경우 실질적으로 정제된 조성물이다. 그러나, 일부 실시양태에서, 폴리펩티드를 포함하는 조성물은 50% 미만 (예를 들어, 약 10%, 약 20%, 약 30%, 약 40%, 또는 약 50%) 순수한 폴리펩티드를 포함한다. 일반적으로, 실질적으로 순수한 폴리펩티드 조성물은 조성물에 존재하는 몰 또는 % 중량으로 모든 거대분자 종의 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 및 약 98% 이상을 포함한다. 일부 실시양태에서, 폴리펩티드는 본질적인 균질성까지 정제되며 (즉, 오염물 종이 통상적인 검출 방법에 의해 조성물에서 검출될 수 없음), 여기서 조성물은 본질적으로 단일 거대분자 종으로 이루어진다. 용매 종, 소분자 (<500 달톤), 및 원소 이온 종은 거대분자 종으로 간주되지 않는다. 일부 실시양태에서, 단리된 폴리펩티드는 실질적으로 순수한 폴리펩티드 조성물이다.
본원에 사용된 바와 같은 효소의 "개선된 특성"은 효소의 적어도 1종의 개선된 특성을 지칭한다. 일부 실시양태에서, 본 발명은 각각 참조 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 폴리펩티드, 및/또는 각각 야생형 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 폴리펩티드, 및/또는 각각 또 다른 조작된 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 폴리펩티드에 비해 임의의 효소 특성의 개선을 나타내는 조작된 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 폴리펩티드를 이용한다. 따라서, "개선"의 수준은 야생형, 뿐만 아니라 조작된 폴리펩티드를 비롯한 다양한 폴리펩티드 사이에 결정되고 비교될 수 있다. 개선된 특성은 증가된 단백질 발현, 의도된 생성물의 증가된 생산, 증가된 기질 특이성 또는 친화도 (즉, 기질에 대한 증가된 활성), 증가된 열활성, 증가된 열안정성, 증가된 pH 활성, 증가된 안정성, 증가된 효소적 활성, 증가된 특이적 활성, 기질 또는 최종-생성물 억제에 대한 증가된 저항성, 증가된 화학적 안정성, 개선된 화학선택성, 개선된 용매 안정성, 산성 pH에 대한 증가된 내성, 단백질분해적 활성에 대한 증가된 내성 (즉, 단백질분해에 대한 감소된 민감성), 감소된 응집, 증가된 용해도, 및 변경된 온도 프로파일과 같은 특성을 포함하나, 이에 제한되지는 않는다. 추가의 실시양태에서, 상기 용어는 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 효소의 적어도 1종의 개선된 특성에 관하여 사용된다. 일부 실시양태에서, 본 발명은 각각 참조 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 폴리펩티드; 및/또는 야생형 폴리펩티드, 및/또는 각각 또 다른 조작된 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 폴리펩티드에 비해 임의의 효소 특성의 개선을 나타내는 조작된 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 폴리펩티드를 이용한다. 따라서, "개선"의 수준은 야생형, 뿐만 아니라 조작된 폴리펩티드를 비롯한 다양한 폴리펩티드 사이에 결정되고 비교될 수 있다.
본원에 사용된 바와 같은 "전환" ("conv" 또는 "conv.")은 기질(들)의 상응하는 생성물(들)로의 효소적 전환 (또는 생물전환)을 지칭한다. "퍼센트" 전환은 특정된 조건 하에서 시간의 기간 내에 생성물로 전환되는 기질의 퍼센트를 지칭한다. 따라서, 폴리펩티드의 "효소적 활성" 또는 "활성"은 특정된 시간의 기간에서 기질의 생성물로의 퍼센트 전환으로서 표현될 수 있다.
본원에 사용된 바와 같은 "입체선택성"은 또 다른 것에 비해 하나의 입체이성질체의 화학적 또는 효소적 반응에서의 우선적 형성을 지칭한다. 입체선택성은 하나의 입체이성질체의 형성이 다른 것에 비해 선호되는 경우 부분적일 수 있거나, 이는 단지 하나의 입체이성질체가 형성되는 경우 완전할 수 있다. 입체이성질체가 거울상이성질체인 경우, 입체선택성은 거울상선택성, 둘 다의 합계 중 하나의 거울상이성질체의 분율 (전형적으로 백분율로서 보고됨)로 지칭된다. 이는 통상적으로 대안적으로 관련 기술분야에서 식 [주 거울상이성질체 - 부 거울상이성질체]/[주 거울상이성질체 + 부 거울상이성질체]에 따라 그로부터 계산되는 거울상이성질체 과량 ("e.e.")으로서 (전형적으로 백분율로서) 보고된다. 입체이성질체가 부분입체이성질체인 경우, 입체선택성은 부분입체선택성, 2개의 부분입체이성질체의 혼합물 중 하나의 부분입체이성질체의 분율 (전형적으로 백분율로서 보고됨)로 지칭되며, 통상적으로 대안적으로 부분입체이성질체 과량 ("d.e.")으로 보고된다. 거울상이성질체 과량 및 부분입체이성질체 과량은 입체이성질체 과량의 유형이다.
본 공정 발명은 조작된 PPM, PNP, DERA, PanK, AcK, SP 및 GOase 폴리펩티드, 특히 서열식별번호 1 내지 21을 갖는 것들, 및 서열식별번호 1 내지 21의 각각의 보존적으로 변형된 변이체로 지칭될 수 있는 1개 이상의 보존적 아미노산 치환을 포함하는 상기 서열의 사용을 포괄한다.
본원에 사용된 바와 같은 "보존적" 아미노산 치환은 변화가 단백질의 생물학적 활성을 변경시키지 않으면서 빈번히 이루어질 수 있도록, 유사한 특징 (예를 들어 산성, 염기성, 양으로 또는 음으로 하전된, 극성 또는 비-극성, 측쇄 크기, 소수성/친수성, 백본 형태 및 강성 등)을 갖는 다른 아미노산으로의 단백질에서의 아미노산의 치환을 지칭한다. 이는 동일하거나 유사한 한정된 부류의 아미노산 내의 상이한 아미노산으로의 폴리펩티드에서의 아미노산의 1개 이상의 치환을 포함한다. 관련 기술분야의 통상의 기술자는 일반적으로 폴리펩티드의 비-필수 영역에서의 단일 아미노산 치환이 생물학적 활성을 실질적으로 변경시키지 않음을 인식한다 (예를 들어, 문헌 [Watson et al. (1987) Molecular Biology of the Gene, The Benjamin/Cummings Pub. Co., p. 224 (4th Ed.)] 참조). 또한, 구조적으로 또는 기능적으로 유사한 아미노산의 치환은 생물학적 활성을 방해할 가능성이 적다. 예로서 및 제한 없이, 일부 실시양태에서, 지방족 측쇄를 갖는 아미노산은 또 다른 지방족 아미노산 (예를 들어, 알라닌, 발린, 류신, 및 이소류신)으로 치환되고/거나; 히드록실 측쇄를 갖는 아미노산은 히드록실 측쇄를 갖는 또 다른 아미노산 (예를 들어, 세린 및 트레오닌)으로 치환되고/거나; 방향족 측쇄를 갖는 아미노산은 방향족 측쇄를 갖는 또 다른 아미노산 (예를 들어, 페닐알라닌, 티로신, 및 히스티딘)으로 치환되고/거나; 염기성 측쇄를 갖는 아미노산은 염기성 측쇄를 갖는 또 다른 아미노산 (예를 들어, 리신 및 아르기닌)으로 치환되고/거나; 산성 측쇄를 갖는 아미노산은 산성 측쇄를 갖는 또 다른 아미노산 (예를 들어, 아스파르트산 또는 글루탐산)으로 치환되고/거나; 소수성 또는 친수성 아미노산은 각각 또 다른 소수성 또는 친수성 아미노산으로 대체된다. 추가의 예시적인 보존적 아미노산 치환은 표 1에 제시된다.
표 1. 예시적인 보존적 아미노산 치환
용어 "아미노산 치환 세트" 또는 "치환 세트"는 참조 서열에 비해 폴리펩티드 서열에서의 아미노산 치환의 그룹을 지칭한다. 치환 세트는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 아미노산 치환을 가질 수 있다.
"기능적 단편"은 아미노-말단 및/또는 카르복시-말단 결실(들) 및/또는 내부 결실을 갖지만, 나머지 아미노산 서열은 그것이 비교되고 있는 서열 (예를 들어, 본 발명에 사용되는 전장 조작된 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 효소)에서의 상응하는 위치와 동일하고, 전장 폴리펩티드의 실질적으로 모든 활성을 보유하는 폴리펩티드를 지칭한다.
본원에 사용된 바와 같은 "결실"은 참조 폴리펩티드로부터 1개 이상의 아미노산의 제거에 의한 폴리펩티드에 대한 변형을 지칭한다. 결실은 효소적 활성을 보유하고/거나 조작된 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 효소의 개선된 특성을 보유하면서, 참조 효소를 구성하는 아미노산의 총 수의 10% 까지, 또는 아미노산의 총 수의 20%까지, 1개 이상의 아미노산, 2개 이상의 아미노산, 5개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산의 제거를 포함할 수 있다. 결실은 폴리펩티드의 내부 부분 및/또는 말단 부분에 지정될 수 있다. 다양한 실시양태에서, 결실은 연속적 절편을 포함할 수 있거나, 불연속적일 수 있다. 결실은 전형적으로 아미노산 서열에서 "-"에 의해 지시된다.
본원에 사용된 바와 같은 "삽입"은 참조 폴리펩티드로부터 1개 이상의 아미노산의 부가에 의한 폴리펩티드에 대한 변형을 지칭한다. 삽입은 폴리펩티드의 내부 부분에 있거나, 카르복시 또는 아미노 말단에 대한 것일 수 있다. 본원에 사용된 바와 같은 삽입은 관련 기술분야에 공지된 바와 같이 융합 단백질을 포함한다. 삽입은 아미노산의 인접한 절편이거나, 천연 발생 폴리펩티드에서 1개 이상의 아미노산에 의해 분리될 수 있다.
본원에 사용된 추가의 두문자어 및 약어는 하기와 같다:
실험 절차
2-에티닐-2-히드록시프로판-1,3-디일 디아세테이트 (2)의 제조
방법 A:
THF (1000 mL) 중 디아세톡시아세톤 (1) (159 g, 914.0 mmol)의 -35 ℃ 용액에 THF 중 에티닐 마그네슘 클로라이드의 0.5 M 용액 1600 mL을 온도를 -20 ℃ 미만으로 유지하면서 첨가하였다. 반응이 완결에 도달한 후, 400 mL 메틸 tert-부틸 에테르 (MTBE) 중 아세트산 (78 mL)을 온도를 -20 ℃ 미만으로 유지하면서 적가하였다. 그 후, MTBE (800 mL)를 첨가하고, 혼합물을 실온으로 가온하였다. 물 (1000 mL) 중 포화 NaCl, 이어서 물 (1050 mL) 중 포화 NH4Cl 용액을 첨가하였다. 유기 층을 분리하고, Na2SO4 상에서 건조시키고, 증발시켜 화합물 (2)를 오일 (160 g, 88%)로서 얻었다. 1H NMR (CDCl3, 500 MHz): δ 4.26 (dd, 4 H), 2.55 (s, 1H), 2.14 (s, 6H).
2-에티닐-프로판-1,2,3-트리올 (3)의 제조
방법 B:
에탄올 중 2-에티닐-2-히드록시프로판-1,3-디일 디아세테이트 (2) (70 g, 350 mmol)의 용액에 메탄올 중 나트륨 메톡실레이트의 0.5M 용액 (69.9 mL, 35.0 mmol)을 실온 (rt)에서 첨가하였다. 반응물을 rt에서 2시간 (h) 동안 교반하여 완결에 도달하였다. 용매를 증발시키고, 잔류물을 100 mL 물에 재-용해시키고, 3 x 50 mL MTBE로 추출하였다. 수성 층을 질소로 살포하여 잔류의 용매를 제거하여 핵 자기 공명 (NMR) (내부 표준물로서 말레산)에 의해 결정 시, 2-에티닐-프로판-1,2,3-트리올 (3) (108 g, 100% 수율)의 40.9% 용액을 얻었다. 1H NMR (D2O, 500 MHz): δ 3.60 (dd, 4 H), 2.85 (s, 1H).
(
R
)-2-에티닐-글리세르알데히드 (4)의 교대적 제조
방법 C1:
교반된 반응기에서, 발포방지제 204 (시그마(Sigma) A6426, 1 방울 ~ 20 μL)를 함유하는 인산나트륨 완충액 (30 mL, 100 mM, pH 7.0) 중 2-에티닐-프로판-1,2,3-트리올 (3) (1.1 g, 9.47 mmol)을 12.5 sccm에서 공기 살포하면서 30 ℃로 가온하였다. 인산나트륨 완충액 (5 mL 100 mM, pH 7.0)에 용해된 갈락토스 옥시다제 (GOase, 서열식별번호: 1) (250 mg), 서양고추냉이 퍼옥시다제* (유형 I, 5 mg) 및 소 카탈라제** (5 mg)를 반응기에 첨가하고, 이어서 CuSO4 수용액 (100 mM, 150 μL)을 첨가하였다. 반응 혼합물을 600 rpm에서 공기 살포하면서 47h 동안 교반하여 (R)-2-에티닐-글리세르알데히드 (4)를 47% 전환율 (NMR에 의해) 및 72% e.e.로 얻었다. (생성물은 단리하지 않았다). 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H).
* 서양고추냉이 퍼옥시다제: 서양고추냉이 뿌리 (아모라시아 루스티카나(Amoracia rusticana))로부터 단리된 시그마 (P8125)로부터 시판되는 서양고추냉이 유형 I로부터의 야생형 퍼옥시다제.
** 소 카탈라제: 시그마 (C1345)로부터 시판되는 소 공급원으로부터의 헴-의존성 카탈라제
방법 C2:
탈이온수 (56.2 kg)로 충전된 교반된 100 L 재킷형 반응기에서, 인산이수소나트륨 (1.212 kg, 10 몰)을 첨가하였다. pH를 25 ℃에서 10 N 수산화나트륨 용액 (852.6 g)을 사용하여 7.02로 조정하였다. 반응기를 발포방지제 204 (A6426, 10 mL), 이어서 CuSO4·5H2O (6.5 g)로 충전하였다. 갈락토스 옥시다제 (451.2 g) (서열식별번호: 10)를 첨가하고, 공기로 살포하면서 15분 동안 교반하였다. 서양고추냉이 퍼옥시다제* (200.2 g) 및 카탈라제** (502.6 g)를 첨가하고, 반응기를 물 (2.0 kg)로 세정하였다. 다음으로, 물 중 2-에티닐-프로판-1,2,3-트리올 (3) 용액 (9.48%, 30.34 kg, 24.72 mol)을 첨가하고, 이어서 추가의 부분의 발포방지제 204 (A6426, 10 mL)를 첨가하였다. 반응물을 공기로 살포하고, 밤새 교반하여 (R)-2-에티닐-글리세르알데히드 (4) 94.0 kg을 66% 전환율 (NMR에 의해) 및 84% e.e.로 얻었다. 검정 수율 60%: 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H).
* 서양고추냉이 퍼옥시다제: 서양고추냉이 뿌리 (아모라시아 루스티카나)로부터 단리된 토요보(Toyobo) (PEO-301)로부터 시판되는 정제된 서양고추냉이로부터의 야생형 퍼옥시다제.
** 소 카탈라제: 시그마 (C1345)로부터 시판되는 소 공급원으로부터의 헴-의존성 카탈라제.
상기 반응을 또한 갈락토스 옥시다제 (서열식별번호: 11)를 사용하여 수행하고, 생성물 (4)을 67% 전환율 (NMR에 의해) 및 88% e.e. 및 검정 수율 59%로 얻었다: 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H).
방법 C3:
살포기 및 유동 제어기가 구비된 100 mL 이지맥스(EasyMax) 용기에서, 물 (82 mL) 및 PIPES 칼륨 완충액 (5mL, 0.5 M)을 충전하였다. pH를 25℃에서 5 M KOH 용액을 사용하여 7.5로 조정하였다. 발포방지제 204 (200 μL), 이어서 개량된 갈락토스 옥시다제 (서열식별번호: 17, 450 mg 효소 분말) 및 구리(II) 술페이트 펜타히드레이트 (100 μL, 100 mM)를 첨가하였다. 반응 혼합물을 125 분 당 표준 입방 센티미터 (sccm)로 15분 동안 공기로 살포하였다. 소 카탈라제 (C1345, 시그마-알드리치(Sigma-Aldrich), 150 mg, 2000-5000 U/mg, 0.75 MU), 이어서 서양고추냉이 퍼옥시다제 (HRP, 토요보 PEO-301, 100 mg, 130 U/mg, 1.3 kU) 및 2-에티닐-프로판-1,2,3-트리올 (3)의 수용액 (25 중량%, 12 mL, 25.8 mmol)을 충전하였다. 반응 혼합물을 30 ℃에서 에어레이션하면서 125 sccm에서 교반하고, 이지샘플러(EasySampler)를 사용하여 20h에 걸쳐 샘플링하여 70% 전환율을 얻고, 화합물 (4) ((R)-2-에티닐-글리세르알데히드)를 58% 검정 수율 및 99% e.e.로 형성하였다. 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H). 조 반응 스트림을 후속 인산화 단계로 직접적으로 운반하였다.
방법 C4: 고정화된 갈락토스 옥시다제로의 산화
효소 고정화 절차:
누비아(Nuvia) IMAC Ni-충전된 수지 (침전된 부피를 기준으로 16 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 160 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하였다. 용기에서 개량된 갈락토스 옥시다제 (서열식별번호: 17, 2.00 g) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 5.00 mL)에 재현탁시키고, 이어서 결합 완충액 (50 mL) 및 수지를 첨가하였다. 용액을 20 ℃에서 5h 동안 회전 혼합기를 사용하여 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 160 mL) 및 칼륨 PIPES 완충액 (10 컬럼 부피, 160 mL; 50 mM, pH 7.5)으로 세척하고, 이를 반응에 직접적으로 사용하였다.
반응 절차:
살포기 및 유동 제어기가 구비된 100 mL 이지맥스 용기에서, 물 (82 mL) 및 PIPES 칼륨 완충액 (5mL, 1 M)을 충전하였다. pH를 25℃에서 5 M KOH 용액을 사용하여 7.5로 조정하였다. 발포방지제 204 (200 μL), 이어서 수지 상에 고정화된 개량된 갈락토스 옥시다제 (서열식별번호: 17, 6 mL 수지 당 750 mg 효소 분말) 및 구리(II) 술페이트 펜타히드레이트 (100 μL, 100 mM)를 첨가하였다. 반응 혼합물을 125 분 당 표준 입방 센티미터 (sccm)에서 15분 동안 공기로 살포하였다. 소 카탈라제 (C1345, 시그마-알드리치, 210 mg, 2000-5000 U/mg, 1.05 MU), 이어서 서양고추냉이 퍼옥시다제 (HRP, 토요보 PEO-301, 100 mg, 130 U/mg, 1.3 kU) 및 2-에티닐-프로판-1,2,3-트리올 (3)의 수용액 (25 중량%, 13 mL, 29.4 mmol)을 충전하였다. 반응 혼합물을 25 ℃에서 에어레이션하면서 125 sccm에서 교반하였다. 22h 후, 반응은 91% 전환율에 도달하여 200 mM (R)-2-에티닐-글리세르알데히드 (4) 용액 (100 mL, 68% 검정 수율, 97% e.e.)를 얻었다. 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H). 조 반응 스트림을 후속 인산화 단계로 직접적으로 운반하였다.
방법 C5: 아미날 (8)의 형성을 통한 알데히드의 임의적 단리
단계 1: ( S )-2-(1,3-디벤질이미다졸리딘-2-일)부트-3-인-1,2-디올의 제조
질소 버블러, 기계식 교반기 및 열전대가 구비된 100 L 재킷형 원통형 용기를 (R)-2-에티닐-글리세르알데히드 ((4), 26.0 kg, 1.85 중량% 알데히드, 3.64 mol)를 함유하는 조 옥시다제 반응 스트림으로 충전하고, N2 분위기로 불활성화시켰다. 수용액을 20 ℃로 가온하고, N,N-디메틸도데칸-1-아민 옥시드 (DDAO) (물 중 30 중량%, 798 g, 0.96 mol;), 이어서 MTBE (55.3 kg, 76 L) 및 N,N'-디벤질에탄-1,2-디아민 (1.55 kg, 6.43 mol)을 첨가하였다. 갈색 2상 혼합물을 질소 분위기 하에서 20 ℃에서 밤새 교반하였다. 17시간 후, 교반을 중지하고, 유기 상을 제거하고, 버렸다. (S)-2-(1,3-디벤질이미다졸리딘-2-일)부트-3-인-1,2-디올 (56.5 kg, 2.02 중량% 아미날, 3.39 mmol, 93% 검정 수율)의 밝은 갈색 MTBE 용액을 얻었다.
6개의 유사한 MTBE 용액을 단일 증류 및 결정화 단계로 함께 프로세싱하였다 (총 374.4 kg의 용액, 7.91 kg 아미날을 함유함).
기계식 교반기, 증류 헤드 (-20 ℃에서 응축기) 및 열전대가 구비된 50 L 재킷형 원통형 용기를 아미날 용액 (45 L)으로 충전하였다. 진공을 용기에 적용하고 (65-95 토르), 재킷을 40 ℃로 설정하였다. 용매를 35 L의 부피가 도달될 때까지 증류에 의해 제거하였다. 이 시점에서, 내부 온도는 6.1 ℃였으며, 회백색 고체가 결정화되기 시작하였다. 나머지 MTBE 용액을 35-40 L의 일정한 부피 및 0-10 ℃의 내부 온도를 유지하면서 서서히 첨가하였다. 모든 MTBE 용액이 첨가되었으면, 부피를 25 L로 감소시켰다. 증류를 중지하고, 용기를 질소로 불활성화시키고, 재킷 온도를 10 ℃로 감소시켰다. 생성된 담황색 현탁액을 이 온도에서 2시간 동안 숙성시키고, 고체를 여과에 의해 수집하였다. 필터 케이크를 차가운 (-2℃) MTBE (12.7 kg)로 세척한 후, 질소 유동 하에서 7시간 동안 건조시켰다. (S)-2-(1,3-디벤질이미다졸리딘-2-일)-부트-3-인-1,2-디올을 회백색 결정질 고체 (5.75 kg)로서 얻었다. 1H NMR (500 MHz, DMSO-d 6) δ 7.42 - 7.35 (m, 4H), 7.32 (td, J = 7.5, 1.6 Hz, 4H), 7.27 - 7.21 (m, 2H), 5.10 (t, J = 5.6 Hz, 1H), 5.03 (s, 1H), 4.28 (d, J = 13.3Hz, 1H), 4.16 (d, J = 13.3 Hz, 1H), 3.76 (s, 1H), 3.70 - 3.58 (m, 4H), 3.21 (d, J = 0.9 Hz, 1H), 2.90 - 2.80 (m, 2H), 2.60 - 2.51 (m, 2H).13C NMR (126 MHz, DMSO-d 6) δ 140.0, 140.0, 128.5, 128.3, 128.2, 128.1, 126.8, 126.8, 88.6, 86.9, 75.0, 74.0, 66.4, 60.7, 60.5, 50.4, 50.3, 39.5. HR-MS (ESI) 아미날 (M + H+) C21H25N2O2 + 계산치 337.1911; 실측치 337.1922.
단계 2: 아미날 ( 8 )로부터의 ( R )-2-에티닐-글리세르알데히드 ( 4 )의 제조
질소 버블러 및 기계식 교반기가 구비된 4 L 재킷형 원통형 용기를 TsOH·H2O (12.0 g, 63.1 mmol), 물 (60 mL), (S)-2-(1,3-디벤질이미다졸리딘-2-일)부트-3-인-1,2-디올 (110 g, 327 mmol) 및 MTBE (1700 mL)로 충전하였다. 2상 혼합물을 질소 하에서 정치하고, 재킷 온도를 15 ℃로 설정하였다. 물 (600 mL) 중 TsOH·H2O (114 g, 599.3 mmol)의 용액을 오버헤드 교반하면서 (200 rpm) 1.5 시간에 걸쳐 적가하였다. 첨가가 완결된 후, 재킷 온도를 5 ℃로 하강시키고, 생성된 슬러리를 1시간 동안 숙성시켰다. 고체를 여과에 의해 제거하고, 차가운 물 (270 mL)로 세척하였다. 2상 용액을 분리 깔대기로 옮기고, 유기 상을 제거하고, 버렸다. 수성 상을 200 sccm의 속도에서 24시간 동안 N2로 살포하면서 도웩스™ 마라톤™ A 수지 (히드록시드 형태, 11.0 g) 및 암벌리스트® 15 수지 (수소 형태, 11.0 g)로 처리하여 잔류의 MTBE를 제거하였다. 수지를 여과에 의해 제거하여 (R)-2-히드록시-2-(히드록시메틸)부트-3-이날 (774 g, 4.6 중량% 알데히드, 82% 수율)의 무색 수용액을 얻었다. 1H NMR (500 MHz, D2O) δ 5.01 (s, 1H), 3.77 (d, J = 11.7 Hz, 1H), 3.73 (d, J = 11.7 Hz, 1H), 2.92 (s, 1H). 13C NMR (126 MHz, D2O) δ 129.4, 125.4, 90.3, 81.0, 76.0, 73.9, 65.3. HRMS (ESI) 알데히드 이량체 (2M + Na+) C10H12NaO6 + 계산치 251.0526; 실측치 251.0530.
(
R
)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 교대적 제조:
방법 D1: 아세테이트 키나제: ATP-재생 시스템
교반된 반응기에서, HEPES 완충액 (66 mM, pH 7.5, 30 mL) 중 아데노신 디포스페이트 디나트륨 염 (40 mg, 0.087 mmol) 및 염화마그네슘 (38 mg, 0.400 mmol)의 용액에 (R)-2-에티닐-글리세르알데히드 (4) (1.9 mL, 물 중 210 g/L 용액, 3.51 mmol), 이어서 아세테이트 키나제 (서열식별번호: 3) (40 mg), 및 판토테네이트 키나제 (서열식별번호: 2) (120 mg)를 첨가하였다. 반응 혼합물을 25 ℃로 가온하고, HEPES 완충액 (50 mM, pH 7.5, 10 mL) 중 아세틸 포스페이트 리튬 칼륨 염 (1.3 g, 7.01 mmol)의 용액을 5M 수산화나트륨을 사용하여 7.5에서 유지된 pH로 4시간에 걸쳐 적가하였다. 반응물을 18시간 동안 교반하여 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 85% 전환율 (HPLC에 의해)로 얻었다 (생성물은 단리하지 않았다). 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
방법 D2: 피루베이트 옥시다제 ATP-재생 시스템
교반된 반응기에서, 76 mL 물 pH 7.5 중 피루브산나트륨 (3.11 g, 28 mmol) 및 인산 (0.523 mL, 7.71 mmol)의 용액을 (R)-2-에티닐-글리세르알데히드 (4) (3.8 mL, 물 중 210 g/L 용액, 7.01 mmol), 아데노신 디포스페이트 디나트륨 염 (80 mg, 0.174 mmol), 티아민 피로포스페이트 (40 mg, 0.086 mmol), 플라빈 아데닌 디뉴클레오티드 디나트륨 염 히드레이트 (64 mg, 0.077 mmol), 및 염화마그네슘 (400 μL, 물 중 1 M 용액, 0.4 mmol)으로 충전하였다. pH를 5M 수성 수산화나트륨으로 7.5로 재-조정하고, 반응 부피를 물로 80 mL로 재-조정하였다. 아세테이트 키나제 (서열식별번호: 3) (80 mg), 피루베이트 옥시다제 (서열식별번호: 4) (80 mg, 동결건조된 무세포 추출물), 판토테네이트 키나제 (서열식별번호: 2) (400 mg), 및 카탈라제 (800 μL, 황산암모늄 현탁액 CAT-101, 바이오카탈리틱스(Biocatalytics))를 첨가하였다. 반응물을 500 rpm 및 30 ℃에서 공기 살포하면서 72시간 동안 교반하여 (R)-2-에티닐-글리세르알데히드 3-포스페이트 5를 95% 전환율 (HPLC에 의해)로 얻었다 (생성물은 단리하지 않았다). 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
상기 반응을 또한 판토테네이트 키나제 (서열식별번호: 13)를 사용하여 수행하고, 생성물 5를 66% 전환율로 얻었다. (생성물은 단리하지 않았다). 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H).
방법 D3: 아세테이트 키나제: 고정화된 효소를 사용한 ATP-재생 시스템
효소 고정화 절차:
누비아™ 고정화된 금속-이온 친화도 크로마토그래피 (IMAC) 니켈-충전된 수지 (침전된 부피를 기준으로 168 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (1.6 L; 500 mM 염화나트륨, 50 mM 인산나트륨, pH 8.0)으로 세척하였다. 용기에서, 판토테네이트 키나제 (8.4 g) (서열식별번호: 12) 및 아세테이트 키나제 (2.8 g) (서열식별번호: 3)를 결합 완충액 (500 mL)에 용해시켰다. 세척된 수지를 용기에 충전하고, 용액을 20 ℃에서 4시간 동안 교반하였다. 수지를 여과하고, 먼저 결합 완충액 (1.6 L), 이어서 피페라진-N,N'-비스(2-에탄술폰산) (PIPES) 완충액 (840 mL; 50 mM, pH 6.5)으로 세척하였다. 세척된 수지를 다음 단계에 직접적으로 사용하였다.
반응 절차:
1 L 반응기에, 물 중 (R)-2-에티닐-글리세르알데히드 (4) (608.7 g, 4.6 중량%, 212 mmol)의 용액을 충전하고, 5 ℃로 냉각시켰다. 냉각된 용액에 피페라진-N,N'-비스(2-에탄술폰산) (PIPES) 완충액 (32.7 mL, 1 M, pH 6.5, 32.7 mmol), 염화마그네슘 (9.33 mL, 1 M, 9.33 mmol), 아세틸 포스페이트 디암모늄 염 (51.8 g, 265 mmol), 아데노신 디포스페이트 디나트륨 염 히드레이트 (1.17 g, 2.12 mmol), 및 물 (192 mL)을 첨가하였다. 용액을 교반하고, pH를 5 N KOH를 사용하여 6.4로 조정하였다. 반응물을 20 ℃로 가온하고, 공동-고정화된 판토테네이트 키나제 (서열식별번호: 12) 및 아세테이트 키나제 (서열식별번호: 3)를 갖는 수지 168 mL를 첨가하였다. 반응물을 6.4의 pH를 유지하는데 사용된 5 N KOH와 함께 10시간 동안 교반하여 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 92% 전환율 (HPLC에 의해) 및 91% 수율 (내부 표준물로서 테트라페닐포스포늄 클로라이드로의 31P NMR에 의해)로 얻었다 (생성물은 단리하지 않았다). 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)의 제조
방법 E:
물 중 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5) (5, 20 mL, 5.3 mmol)의 용액에, 물 중 아세트알데히드 (40 중량%, 2.02 mL, 15.9 mmol)의 용액을 실온에서 첨가하고, 이어서 데옥시리보스-포스페이트 알돌라제 (DERA) (서열식별번호: 6), 트리에탄올아민 히드로클로라이드 완충액 (1 mL, 1 M, pH 7.0) 중 25 mg 용액을 첨가하였다. 반응기를 밀봉하고, 혼합물을 30 ℃ 및 600 rpm에서 밤새 교반하여 4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)를 99% conv. 및 99% e.e., 99% d.e.로 1:1 아노머 혼합물로서 얻었다 (생성물은 단리하지 않았다). α-아노머: 1H NMR (D2O, 600 MHz) δ 5.31 (t, 1H), 4.13 (t, 1H), 3.81-3.72 (m, 2H), 2.89 (s, 1H), 2.42-2.34 (m, 1H), 1.87-1.79 (m, 1H); 13C NMR (D2O, 151 MHz) δ 97.7 (s), 81.4 (d), 79.4 (s), 78.9 (s), 71.1 (s), 67.7 (d), 39.6 (s). β-아노머: 1H NMR (D2O, 600 MHz) δ 5.40 (dd, 1H), 4.28 (t, 1H), 3.88-3.80 (m, 2H), 2.87 (s, 1H), 2.13-2.06 (m, 1H), 2.04-1.97 (m, 1H); 13C NMR (D2O, 151 MHz) δ 97.3 (s), 82.2 (d), 78.7 (s), 78.5 (s), 71.3 (s), 68.4 (d), 39.6 (s). LC-MS: (ES, m/z): C7H10O7P에 대한 계산치 (M-H): 237.0; 실측치 237.0
(2 R ,3 S ,5 R )-5-(6-아미노-2-플루오로-9H-퓨린-9-일)-2-에티닐-2-(히드록시메틸)테트라히드로푸란-3-올 모노히드레이트 (7) [대안적 명칭 4'-에티닐-2-플루오로-2'-데옥시아데노신 또는 EFdA]의 교대적 제조
방법 F1:
암모늄 ((2R,3S)-2-에티닐-3,5-디히드록시테트라히드로푸란-2-일)메틸 수소 포스페이트 (1.00 g, 3.91 mmol)를 pH 7.5 완충액 (5 mM MnCl2를 함유하는 100 mM 트리에탄올아민·HCl) 10 mL에 용해시켰다. 용액 pH를 5 N NaOH로 7.3으로 조정하였다. 용액에 2-플루오로아데닌 (0.599 g, 3.91 mmol) 및 수크로스 (2.68 g, 7.82 mmol)를 첨가하였다. 효소 용액을 포스포펜토뮤타제 (서열식별번호: 8) (100 mg), 퓨린 뉴클레오시드 포스포릴라제 (서열식별번호: 9) (50 mg), 및 수크로스 포스포릴라제 (서열식별번호: 7) (10 mg)를 pH 7.5 완충액 10 mL에 용해시킴으로써 제조하였다. 효소 용액을 시약 혼합물에 첨가하고, 생성된 현탁액을 40 ℃에서 진탕하였다. 20h 후, 현탁액을 0 ℃로 냉각시키고, 여과하고, 차가운 물로 세정하였다. 고체를 흡인 건조시켜 표제 화합물 (1.12 g, 92%)을 단일 이성질체로서 얻었다.
1H NMR: (300 MHz, DMSO-d6, ppm): δ 7.68 (br s, 2H), 7.32 (d, J = 2.0 Hz, 1H), 6.44 (t, J = 5.8 Hz, 1H), 5.52 (d, J = 5.6 Hz, 1H), 5.27 (t, J = 6.0 Hz, 1H), 4.44 (q, J = 6.4 Hz, 1H), 3.60 (q, J = 6.0 Hz, 1H), 3.53 (q, J = 6.4 Hz, 1H), 3.48 (s, 1H), 2.48-2.41 (m, 1H), 2.37-2.30 (m, 1H). 13C NMR (150.92 MHz, DMSO-d6, ppm) δ 158.5 (d, JCF = 203.5), 157.6 (d, JCF = 21.2), 150.2 (d, JCF = 20.2), 139.7 (d, JCF = 2.4), 117.4 (d, JCF = 4.0), 85.1, 82.0, 81.4, 78.7, 70.1, 64.2, 38.1. LC-MS: (ES, m/z): C12H12FN5O3에 대한 계산치 (M+Na): 316.0822; 실측치 316.0818.
이 단계에 사용된 PPM 및 PNP 효소는 각각 이. 콜라이 (에스케리키아 콜라이(Escherichia coli))로부터의 효소로부터 시작하여 돌연변이로부터 유래되었다. 이 단계에 사용된 수크로스 포스포릴라제 (SP)는 알로스카르도비아 옴니콜렌스(Alloscardovia omnicolens)로부터 유래되었으며; 다른 유기체로부터 유래된 SP는 또한 사용될 수 있다.
방법 F2:
약 5.5 내지 6.0의 pH에서의 피페라진-N,N'-비스(2-에탄술폰산) (PIPES) 완충액을 함유하는 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5) (950 mL, 157 mmol)의 수용액에 트리에탄올아민 (7.09 g, 47.5 mmol)을 첨가하였다. 용액의 pH를 수산화칼륨 (8 mL, 8M)을 사용하여 7.1 내지 7.6으로 조정하였다. 망간(II) 클로라이드 히드레이트 (0.592 g, 4.70 mmol), 이어서 수크로스 (161 g, 470 mmol)를 첨가하여, 7.5의 pH를 얻었다. 용액에 하기 효소를 첨가하였다: 데옥시리보스-포스페이트 알돌라제 (서열식별번호: 14) (461 mg), 수크로스 포스포릴라제 (서열식별번호: 7) (494 mg), 포스포펜토뮤타제 (서열식별번호: 8)(2.63 g), 및 퓨린 뉴클레오시드 포스포릴라제 (서열식별번호: 15) (659 mg). 효소가 용해되었으면, 2-플루오로아데닌 (19.80 g, 125 mmol)을 첨가하였다. 반응물을 35 ℃로 가열하고, 아세트알데히드를 첨가하였다 (이소프로필 알콜 중 40 중량%, 29.8 mL, 235 mmol). 2h 동안 반응시킨 후, 혼합물을 EFdA 결정질 생성물 (0.96 g, 2 mol%)로 시딩하였다. 35 ℃에서 26 h에 걸쳐 반응시킨 후, 슬러리를 0 ℃로 냉각시키고, 고체를 물 (40 mL ea.)로 2회 세척하면서 여과에 의해 수집하였다. 고체를 질소 스위프 하에서 건조시켰다. 수득량 43.2 g, 92 중량%, 96.2% 보정됨. 1H NMR: (300 MHz, DMSO-d6, ppm): δ 7.68 (br s, 2H), 7.32 (d, J = 2.0 Hz, 1H), 6.44 (t, J = 5.8 Hz, 1H), 5.52 (d, J = 5.6 Hz, 1H), 5.27 (t, J = 6.0 Hz, 1H), 4.44 (q, J = 6.4 Hz, 1H), 3.60 (q, J = 6.0 Hz, 1H), 3.53 (q, J = 6.4 Hz, 1H), 3.48 (s, 1H), 2.48-2.41 (m, 1H), 2.37-2.30 (m, 1H). 13C NMR (150.92 MHz, DMSO-d6, ppm) δ 158.5 (d, JCF = 203.5), 157.6 (d, JCF = 21.2), 150.2 (d, JCF = 20.2), 139.7 (d, JCF = 2.4), 117.4 (d, JCF = 4.0), 85.1, 82.0, 81.4, 78.7, 70.1, 64.2, 38.1. LC-MS: (ES, m/z): C12H12FN5O3에 대한 계산치 (M+Na): 316.0822; 실측치 316.0818.
(
S
)-2-에티닐-프로판-1,2,3-트리올 l 1-포스페이트 (9)의 교대적 제조:
방법 G1: 효소 서열식별번호: 2 및 서열식별번호: 3을 사용한 아세테이트 키나제: ATP-재생 시스템
50 mL 반응기를 물 (9.29 g, 9.46 중량%, 7.57 mmol) 중 2-에티닐-프로판-1,2,3-트리올 (3)의 용액, 칼륨 PIPES 완충액 (1.02 mL, 1 M, pH 6.5, 1.02 mmol), 염화마그네슘 (292 μL, 1 M, 0.292 mmol), 아세틸 포스페이트 디암모늄 염 (1.851 g, 89 중량%, 9.46 mmol), 아데노신 디포스페이트 디나트륨 염 히드레이트 (ADP, 42 mg, 0.076 mmol, 0.01 eq), 및 물 (28 mL)로 충전하였다. pH를 5 M KOH를 사용하여 6.4로 조정하고, 용액을 20 ℃로 가온하고, 개량된 판토테네이트 키나제 PanK 서열식별번호: 2 (264 mg) 및 아세테이트 키나제 AcK 서열식별번호: 3 (88 mg)을 첨가하였다. 반응물을 5 N KOH를 사용하여 6.4에서 유지된 pH로 16시간 동안 교반하였다. 최종 반응 내용물은 >95% e.e. 및 99% 전환율 (31P NMR에 의해)로 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9)를 제공하였다. 생성물은 단리하지 않았다. 1H NMR (D2O, 500 MHz) δ 3.89 (m, 2H), 3.72 (d, J = 11.6 Hz, 1 H), 3.65 (d, J = 11.6 Hz, 1H), 2.93 (s, 1H). 13C NMR (D2O, 126 MHz) δ 82.9 (s), 75.1 (s), 71.0 (d, J = 6.9 Hz), 67.0 (d, J = 4.5 Hz), 64.7 (s). 31P NMR (D2O, 202 MHz) δ 3.39. HRMS: (ESI, m/z): [M-1]- C5H8O6P에 대한 계산치: 195.0058; 실측치 195.0068 [M-H]-: 195.0058.
방법 G2: 효소 서열식별번호: 20 및 효소 서열식별번호: 21을 사용한 아세테이트 키나제: ATP-재생 시스템
재킷형 반응기에 수용액 2-에티닐-프로판-1,2,3-트리올 (3) (11.47 kg, 8.7 중량%, 8.61 mol) 및 물 (7.5kg), 이어서 1M BIS-TRIS 메탄 완충액 pH 6.5 (1L) 및 염화마그네슘 (41.4 g)을 충전하였다. ATP (48g, 0.086 mol, 0.01 당량) 및 디암모늄 아세틸 포스페이트 (2.021 kg, 89%, 10.33 mmol)를 첨가하고, 용액을 20 ℃까지 가온하고, 용액의 pH를 KOH (270.4 g)를 사용하여 6.8로 재-조정하였다. 그 후, 개량된 판토테네이트 키나제 서열식별번호: 20 (20.4 g) 및 개량된 아세테이트 키나제 서열식별번호: 21 (3 g)을 고체로서 충전하였다. 반응물을 20 ℃에서 16h 동안 교반하고, 그 동안 pH를 5.5로 강하시켰다. 정량적 전환율의 2-에티닐-프로판-1,2,3-트리올 (3)을 1H 및 31P NMR에 의해 판단된 바와 같이 얻었다. 이렇게 제조된 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9) 용액 (397 mM, 22.5 kg, 98% 수율)을 임의의 추가의 정제 없이 후속 산화 단계에 사용하였다. 1H NMR (D2O, 500 MHz) δ 3.89 (m, 2H), 3.72 (d, J = 11.6 Hz, 1 H), 3.65 (d, J = 11.6 Hz, 1H), 2.93 (s, 1H).
방법 G3: 절대 입체화학을 할당하고 비대칭화 인산화를 입증하기 위한 중수소화된 화합물 (3)을 갖는 효소 서열식별번호: 20 및 효소 서열식별번호: 21을 사용한 아세테이트 키나제: ATP-재생 시스템.
개량된 판토테네이트 키나제 서열식별번호: 20 (물 중 10 g/L 용액 100 μL) 및 개량된 아세테이트 키나제 서열식별번호: 21 (물 중 2g/L 용액 100 μL)을 pH 6.5에서의 물 (800 μL) 중 디암모늄 아세틸 포스페이트 (41 mg), 2-에티닐-프로판-1,1-d2-1,2,3-트리올 ((R)-3-d2, 20 mg, 170 μmol), 염화마그네슘 (물 중 1 M 용액 10 μL), ADP (물 중 100 g/L 용액 10 μL), 및 인산나트륨 완충액 (물 중 1 M 용액 10 μL)을 함유하는 용액에 첨가하였다. 반응물을 rt에서 24h 동안 인큐베이션하여 중수소화된 2-에티닐-프로판-1,2,3-트리올 1-포스페이트 유사체 (S)-9-( 3,3-d2 ) 및 (S)-9-( 1,1-d2 )를 95:5 비 및 99% 전체 수율로 얻었다. 인산화된 화합물의 비는 31P NMR에 의해 ~95:5인 것으로 결정되었으며, 이는 프로-(S) 히드록실 기에서의 2-에티닐-프로판-1,2,3-트리올 (3)의 입체선택적 인산화 (즉, 비대칭 인산화)를 확인시켜 준다. 1H NMR (D2O, 500 MHz) δ 3.89 (m, 2H), 3.72 (d, J = 11.6 Hz, 1 H), 3.65 (d, J = 11.6 Hz, 1H), 2.93 (s, 1H). 13C NMR (D2O, 126 MHz) δ 82.9 (s), 75.1 (s), 71.0 (d, J = 6.9 Hz), 67.0 (d, J = 4.5 Hz), 64.7 (s).
방법 G4: 고정화된 효소 서열식별번호: 20 및 효소 서열식별번호: 21을 사용한 아세테이트 키나제: ATP-재생 시스템
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 75 mL)를 필터 깔대기에 첨가하고, 물 (9 컬럼 부피, 3 x 225 mL) 및 결합 완충액 (1 컬럼 부피, 75mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하였다. 용기에서 판토테네이트 키나제 (서열식별번호: 20, 6.0 g) 동결건조된 분말을 결합 완충액 (200 mL)에 재현탁시키고, 세척된 수지를 첨가하였다. 용액을 회전 혼합기를 사용하여 25℃에서 6h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (6 컬럼 부피, 6 x 225 mL) 및 BIS-TRIS 완충액 (8 컬럼 부피, 600 mL; 50 mM, pH 6.2)으로 세척하였다.
반응 절차:
2-에티닐-프로판-1,2,3-트리올 (3) (574 g, 8.7 중량%, 0.430 mol) 및 물 (350 mL)의 수용액, 이어서 1M BIS-TRIS 메탄 완충액 pH 6.5 (50 mL) 및 염화마그네슘 (2.033 g, 0.01 mol)을 재킷형 반응기에 충전하였다. ATP (2.37g, 0.0043 mol, 0.01 당량) 및 디암모늄 아세틸 포스페이트 (101 g, 89%, 0.530 mmol, 1.2 eq)를 첨가하고, 용액을 20 ℃까지 가온하고, 용액의 pH를 5 M KOH를 사용하여 6.8로 재-조정하였다. 그 후, 고정화된 판토테네이트 키나제 서열식별번호: 20 (25 mL) 및 개량된 아세테이트 키나제 서열식별번호: 21 (0.15 g)을 갖는 수지를 고체로서 충전하였다. 반응물을 20 ℃에서 16h 동안 교반하고, 그 동안 pH를 5.5로 강하시켰다. 정량적 전환율의 2-에티닐-프로판-1,2,3-트리올 (3) 대 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9)를 1H 및 31P NMR에 의해 판단된 바와 같이 얻었다. 1H NMR (D2O, 500 MHz) δ 3.89 (m, 2H), 3.72 (d, J = 11.6 Hz, 1 H), 3.65 (d, J = 11.6 Hz, 1H), 2.93 (s, 1H).
(
R
)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 교대적 제조:
방법 H1
: 고정화된 갈락토스 옥시다제 서열식별번호: 16
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 10 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 100 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하고, 세척된 수지 16 g을 얻었다. 용기에서 개량된 갈락토스 옥시다제 (서열식별번호: 16, 750 mg) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 5.00 mL)에 재현탁시키고, 이어서 결합 완충액 (20 mL) 및 세척된 수지 (3.0g)를 첨가하였다. 용액을 회전 혼합기에서 20 ℃에서 5h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 100 mL) 및 BIS-TRIS 완충액 (10 컬럼 부피, 100 mL; 50 mM, pH 7.5)으로 세척하고, 이를 글리코실화 반응에 직접적으로 사용하였다.
반응 절차:
고정화된 갈락토스 옥시다제 서열식별번호: 16 (3.0 g)을 갖는 수지를 BIS-TRIS 메탄 완충액 (35 mM, 7.2로 조정된 pH) 중 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9, 5.4 mmol, 270 mM, 20 mL)의 용액에 첨가하고, 이어서 물 (30 μL, 100 mM) 중 구리 (II) 술페이트 용액, 및 물 (600 μL)에 재현탁된 서양고추냉이 퍼옥시다제 (PEO-301, 18 mg) 및 소 카탈라제 (C1345, 120 mg)를 첨가하였다. 반응을 기체 투과성 막으로 밀봉하고, 22℃에서 4일 동안 격렬하게 진탕하여 77%의 최종 전환율에 도달하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 95% e.e.로 얻었다. 효소 수지를 여과하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 용액을 글리코실화 반응에 직접적으로 사용하였다. 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
방법 H2: 고정화된 갈락토스 옥시다제 서열식별번호: 17
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 10 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 100 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하고, 세척된 수지 16g을 얻었다. 용기에서, 개량된 갈락토스 옥시다제 (서열식별번호: 16, 750 mg) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 5.00 mL)에 재현탁시키고, 이어서 결합 완충액 (20 mL) 및 세척된 수지 (3.0g)를 첨가하였다. 용액을 회전 혼합기를 사용하여 20 ℃에서 5h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 100 mL) 및 BIS-TRIS 메탄 완충액 (10 컬럼 부피, 100 mL; 50 mM, pH 7.5)으로 세척하고, 이를 반응에 직접적으로 사용하였다.
반응 절차:
고정화된 개량된 갈락토스 옥시다제 서열식별번호: 17 (3.0 g)을 갖는 수지를 BIS-TRIS 메탄 완충액 (35 mM, 7.2로 조정된 pH) 중 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9, 5.4 mmol, 270 mM, 20 mL)의 용액에 첨가하고, 이어서 물 (30 μL, 100 mM) 중 구리 (II) 술페이트 용액, 및 물 (600 μL)에 재현탁된 서양고추냉이 퍼옥시다제 (PEO-301, 18 mg) 및 소 카탈라제 (C1345, 120 mg)를 첨가하였다. 반응을 기체 투과성 막으로 밀봉하고, 22℃에서 4일 동안 격렬하게 진탕하여 77%의 최종 전환율에 도달하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 95% e.e.로 얻었다. 효소 수지를 여과하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 용액을 글리코실화 반응에 직접적으로 사용하였다. 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
방법 H3: 고정화된 갈락토스 옥시다제 서열식별번호: 18
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 3 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 30 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하고, 세척된 수지 2.4 g을 얻었다. 바이알에서 개량된 갈락토스 옥시다제 (서열식별번호: 18, 75mg) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 1.00 mL)에 재현탁시키고, 이어서 결합 완충액 (5 mL) 및 세척된 수지 (400 mg)를 첨가하였다. 용액을 회전 혼합기를 사용하여 20 ℃에서 5h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 4 mL) 및 BIS-TRIS 메탄 완충액 (10 컬럼 부피, 4 mL; 50 mM, pH 7.5)으로 세척하고, 이를 반응에 직접적으로 사용하였다.
반응 절차:
고정화된 개량된 GOase 서열식별번호: 18 (400 mg)을 BIS-TRIS 메탄 완충액 (35 mM, 7.2로 조정된 pH) 중 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 용액 ((9), 5.4 mmol, 270 mM, 1 mL)의 용액에 첨가하고, 이어서 물 (100 μL)에 재현탁된 서양고추냉이 퍼옥시다제 (PEO-301, 1 mg) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)으로부터의 카탈라제 (로슈(Roche), 동결건조물, #11650645103, 3 mg)를 첨가하였다. 반응을 기체 투과성 막으로 밀봉하고, 30℃에서 48h 동안 격렬하게 진탕하였다. 2일 후에 최종 전환율은 90% 전환율 및 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5) >99% e.e.에 도달하였다. 효소 수지를 여과하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 용액을 추가의 정제 없이 직접적으로 사용하였다. 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
방법 H4: 고정화된 갈락토스 옥시다제 서열식별번호: 19
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 3 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 30 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하고, 세척된 수지 2.4 g을 얻었다. 바이알에서 개량된 갈락토스 옥시다제 (서열식별번호: 19, 75mg) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 1.00 mL)에 재현탁시키고, 이어서 결합 완충액 (5 mL) 및 세척된 수지 (400 mg)를 첨가하였다. 용액을 회전 혼합기를 사용하여 20 ℃에서 5h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 4 mL) 및 BIS-TRIS 메탄 완충액 (10 컬럼 부피, 4 mL; 50 mM, pH 7.5)으로 세척하고, 이를 반응에 직접적으로 사용하였다.
반응 절차:
고정화된 개량된 GOase 서열식별번호: 18 (400 mg)을 BIS-TRIS 메탄 완충액 (35 mM, 7.2로 조정된 pH) 중 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 용액 (9, 5.4 mmol, 270 mM, 1 mL)의 용액에 첨가하고, 이어서 물 (100 μL)에 재현탁된 서양고추냉이 퍼옥시다제 (PEO-301, 1 mg) 및 코리네박테리움 글루타미쿰으로부터의 카탈라제 (로슈, 동결건조물, #11650645103, 3 mg)를 첨가하였다. 반응을 기체 투과성 막으로 밀봉하고, 30 ℃에서 48h 동안 격렬하게 진탕하였다. 2일 후의 최종 전환율은 100% 전환율에 도달하였으며, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 >99% e.e.로 얻었다. 효소 수지를 여과하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 용액을 추가의 정제 없이 직접적으로 사용하였다. 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
"아미노산"은 본원에서 IUPAC-IUB 생화학 명명법 위원회에 의해 권고된 그들의 통상적으로 공지된 1-문자 기호에 의해 지칭된다. 본원의 설명의 목적을 위해, 본원의 방법에 사용되는 효소에 대한 유전적으로 코딩된 아미노산에 사용되는 부호는 표 2에서 통상적이다:
표 2
본원에 기재된 EFdA를 합성하는 공정에서 및 본원에 기재된 실험 절차에서 예시된 공정 단계에서 이용된, 또는 이용될 수 있는 효소에 대한 서열식별번호는 표 3에서의 것들로 제공되지만, 이에 제한되지는 않는다.
표 3
서양고추냉이 퍼옥시다제: 서양고추냉이 뿌리 (아모라시아 루스티카나)로부터 단리된 시그마 (P8125)로부터 시판되는 서양고추냉이 유형 I로부터의 야생형 퍼옥시다제.
카탈라제: (1) 시그마 (C1345)로부터 시판되는 소 간으로부터의; 또는 (2) CAT-101, 바이오카탈리틱스; 또는 (3) 코리네박테리움 글루타미쿰 (로슈, #11650645103)으로부터의 야생형 카탈라제.
본 발명의 추가의 실시양태는 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체, 예를 들어, EFdA를 생산하기 위한 본원에 기재된 합성 공정 단계에서 하기 효소의 사용을 포함하나, 이에 제한되지는 않는다.
A. 퓨린 뉴클레오시드 포스포릴라제.
1A. 서열식별번호: 9 또는 서열식별번호: 15와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 퓨린 뉴클레오시드 포스포릴라제이며, 여기서 상기 조작된 퓨린 뉴클레오시드 포스포릴라제의 폴리펩티드 서열은 서열식별번호: 9 또는 서열식별번호: 15에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 퓨린 뉴클레오시드 포스포릴라제.
2A. 상기 조작된 퓨린 뉴클레오시드 포스포릴라제가 서열식별번호: 9 또는 서열식별번호: 15와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 1A의 조작된 퓨린 뉴클레오시드 포스포릴라제.
3A. 서열식별번호: 9 또는 서열식별번호: 15에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 퓨린 뉴클레오시드 포스포릴라제.
A4. 야생형 이. 콜라이 퓨린 뉴클레오시드 포스포릴라제에 비해 적어도 1종의 개선된 특성을 포함하는 1A 내지 3A 중 어느 하나의 조작된 퓨린 뉴클레오시드 포스포릴라제.
5A. 상기 개선된 특성이 야생형 이. 콜라이 퓨린 뉴클레오시드 포스포릴라제에 비해 기질 화합물 6.5 (그의 고리 형태로 또는 개방 쇄 알데히드 또는 히드레이트, 또는 상기 중 임의의 것의 염으로서)에 대한 개선된 활성을 포함하는 것인 4A의 조작된 퓨린 뉴클레오시드 포스포릴라제.
6A. 상기 개선된 특성이 야생형 이. 콜라이 퓨린 뉴클레오시드 포스포릴라제에 비해 EFdA (화합물 7)의 개선된 생산을 포함하는 것인 4A의 조작된 퓨린 뉴클레오시드 포스포릴라제.
7A. 상기 조작된 퓨린 뉴클레오시드 포스포릴라제가 정제된 것인 A1 내지 6A 중 어느 하나의 조작된 퓨린 뉴클레오시드 포스포릴라제.
8A. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 1A 내지 7A 중 어느 하나의 조작된 퓨린 뉴클레오시드 포스포릴라제.
B. 포스포펜토뮤타제.
1B. 서열식별번호: 8과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 포스포펜토뮤타제이며, 여기서 상기 조작된 포스포펜토뮤타제의 폴리펩티드 서열은 서열식별번호: 8에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 포스포펜토뮤타제.
2B. 상기 조작된 포스포펜토뮤타제가 서열식별번호: 8과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 1B의 조작된 포스포펜토뮤타제.
3B. 서열식별번호: 8에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 포스포펜토뮤타제.
4B. 야생형 이. 콜라이 포스포펜토뮤타제에 비해 적어도 1종의 개선된 특성을 포함하는 1B 내지 3B 중 어느 하나의 조작된 포스포펜토뮤타제.
5B. 상기 개선된 특성이 야생형 이. 콜라이 포스포펜토뮤타제에 비해 기질 화합물 6 (그의 고리 형태로 또는 개방 쇄 알데히드 또는 히드레이트, 또는 상기 중 임의의 것의 염으로서)에 대한 개선된 활성을 포함하는 것인 4B의 조작된 포스포펜토뮤타제.
6B. 상기 개선된 특성이 야생형 이. 콜라이 포스포펜토뮤타제에 비해 화합물 6.5 또는 화합물 7 (EFdA)의 개선된 생산을 포함하는 것인 4B의 조작된 포스포펜토뮤타제.
7B. 상기 조작된 포스포펜토뮤타제가 정제된 것인 1B 내지 6B 중 어느 하나의 조작된 포스포펜토뮤타제.
8B. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 1B 내지 7B 중 어느 하나의 조작된 포스포펜토뮤타제.
C. 데옥시리보스-포스페이트 알돌라제.
1C. 서열식별번호: 5에 제시된 바와 같은 슈와넬라 할리팍센시스 폴리펩티드 서열로부터의 야생형으로 구성된 데옥시리보스-포스페이트 알돌라제.
2C. 서열식별번호: 6 또는 서열식별번호: 14에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 데옥시리보스-포스페이트 알돌라제.
3C. 조작된 데옥시리보스-포스페이트 알돌라제이며, 여기서 상기 조작된 데옥시리보스-포스페이트 알돌라제는 서열식별번호: 5, 서열식별번호: 6 또는 서열식별번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 조작된 데옥시리보스-포스페이트 알돌라제.
4C. 서열식별번호: 5, 서열식별번호: 6 또는 서열식별번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 데옥시리보스-포스페이트 알돌라제이며, 여기서 상기 조작된 데옥시리보스-포스페이트 알돌라제의 폴리펩티드 서열은 서열식별번호: 5, 서열식별번호: 6 또는 서열식별번호: 14에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 데옥시리보스-포스페이트 알돌라제.
5C. 기질 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트, 그의 히드레이트 또는 상기 중 어느 하나의 염)에 대한 활성을 갖는 1C 내지 4C 중 어느 하나의 데옥시리보스-포스페이트 알돌라제.
6C. 반응 동안 기질 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트, 그의 히드레이트, 또는 상기 중 어느 하나의 염) 상의 보호기에 대한 필요 없이 화합물 6 (4-에티닐-D-2-데옥시리보스 5-포스페이트, 또는 그의 개방 쇄 알데히드 또는 히드레이트 형태, 또는 상기 중 임의의 것의 염)을 생산하는 능력을 포함하는 1C 내지 5C 중 어느 하나의 데옥시리보스-포스페이트 알돌라제.
7C. 데옥시리보스-포스페이트 알돌라제가 야생형 슈와넬라 할리팍센시스 데옥시리보스-포스페이트 알돌라제에 비해 화합물 6 (4-에티닐-D-2-데옥시리보스 5-포스페이트, 또는 그의 개방 쇄 알데히드 또는 히드레이트 형태, 또는 상기 중 임의의 것의 염)의 개선된 생산을 포함하는 개선된 특성을 갖는 것인 2C 내지 6C 중 어느 하나의 조작된 데옥시리보스-포스페이트 알돌라제.
8C. 상기 데옥시리보스-포스페이트 알돌라제가 정제된 것인 1C 내지 7C 중 어느 하나의 데옥시리보스-포스페이트 알돌라제.
9C. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 2C 내지 7C 중 어느 하나의 조작된 데옥시리보스-포스페이트 알돌라제.
D. 판토테네이트 키나제.
1D. 서열식별번호: 2, 서열식별번호: 12, 서열식별번호: 13 또는 서열식별번호: 20과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 판토테네이트 키나제이며, 여기서 상기 조작된 판토테네이트 키나제의 폴리펩티드 서열은 서열식별번호: 2, 서열식별번호: 12, 서열식별번호: 13 또는 서열식별번호: 20에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 판토테네이트 키나제.
2D. 상기 조작된 판토테네이트 키나제가 서열식별번호: 2, 서열식별번호: 12, 서열식별번호: 13 또는 서열식별번호: 20과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 1D의 조작된 판토테네이트 키나제.
3D. 서열식별번호: 2, 서열식별번호: 12, 서열식별번호: 13 또는 서열식별번호: 20에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 판토테네이트 키나제.
4D. 야생형 이. 콜라이 판토테네이트 키나제에 비해 적어도 1종의 개선된 특성을 포함하는 1D 내지 3D 중 어느 하나의 조작된 판토테네이트 키나제.
5D. 상기 개선된 특성이 야생형 이. 콜라이 판토테네이트 키나제에 비해 기질 화합물 4 ((R)-2-에티닐-글리세르알데히드 또는 그의 히드레이트 형태)에 대한 개선된 활성을 포함하는 것인 4D의 조작된 판토테네이트 키나제.
6D. 상기 개선된 특성이 야생형 판토테네이트 키나제에 비해 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트)의 개선된 생산을 포함하는 것인 5D의 조작된 판토테네이트 키나제.
7D. 상기 개선된 특성이 야생형 이. 콜라이 판토테네이트 키나제에 비해 기질 화합물 3 (2-에티닐-프로판-1,2,3-트리올)에 대한 개선된 활성을 포함하는 것인 4D의 조작된 판토테네이트 키나제.
8D. 상기 개선된 특성이 야생형 판토테네이트 키나제에 비해 화합물 9 ((S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트)의 개선된 생산을 포함하는 것인 7D의 조작된 판토테네이트 키나제.
9D. 상기 판토테네이트 키나제가 정제된 것인 1D 내지 8D 중 어느 하나의 조작된 판토테네이트 키나제.
10D. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 1D 내지 9D 중 어느 하나의 조작된 판토테네이트 키나제.
E. 갈락토스 옥시다제.
1E. 서열식별번호: 1, 10, 11, 16, 17, 18 또는 19와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 갈락토스 옥시다제이며, 여기서 상기 조작된 갈락토스 옥시다제의 폴리펩티드 서열은 서열식별번호: 1, 10, 11, 16, 17, 18 또는 19에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 갈락토스 옥시다제.
2E. 상기 조작된 갈락토스 옥시다제가 서열식별번호: 1, 10, 11, 16, 17, 18 또는 19와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 1E의 조작된 갈락토스 옥시다제.
3E. 서열식별번호: 1, 10, 11, 16, 17, 18 또는 19에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 갈락토스 옥시다제.
4E. 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 적어도 1종의 개선된 특성을 포함하는 1E 내지 3E 중 어느 하나의 조작된 갈락토스 옥시다제.
5E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 1차 알콜인 기질에 대한 개선된 활성을 포함하는 것인 4E의 조작된 갈락토스 옥시다제.
6E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 기질 화합물 3 (2-에티닐-프로판-1,2,3-트리올)에 대한 개선된 활성을 포함하는 것인 4E의 조작된 갈락토스 옥시다제.
7E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 화합물 4 ((R)-2-에티닐-글리세르알데히드 또는 그의 히드레이트 형태)의 개선된 생산을 포함하는 것인 6E의 조작된 갈락토스 옥시다제.
8E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 기질 화합물 9 ((S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트)에 대한 개선된 활성을 포함하는 것인 4E의 조작된 갈락토스 옥시다제.
9E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트 또는 그의 히드레이트 형태)의 개선된 생산을 포함하는 것인 8E의 조작된 갈락토스 옥시다제.
10E. 상기 갈락토스 옥시다제가 정제된 것인 1E 내지 9E 중 어느 하나의 조작된 갈락토스 옥시다제.
11E. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 1E 내지 10E 중 어느 하나의 조작된 갈락토스 옥시다제.
F. 아세테이트 키나제.
1F. 서열식별번호: 3 또는 서열식별번호: 21에 제시된 바와 같은 써모토가 마리티마 폴리펩티드 서열로부터의 야생형으로 구성된 아세테이트 키나제.
2F. 상기 조작된 아세테이트 키나제가 서열식별번호: 3 또는 서열식별번호: 21과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 조작된 아세테이트 키나제.
3F. 서열식별번호: 3 또는 서열식별번호: 21과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 아세테이트 키나제이며, 여기서 상기 조작된 아세테이트 키나제의 폴리펩티드 서열은 서열식별번호: 3 또는 서열식별번호: 21에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 아세테이트 키나제.
4F. 야생형 티. 마리티마 아세테이트 키나제에 비해 적어도 1종의 개선된 특성을 포함하는 2F 또는 3F의 아세테이트 키나제.
5F. 상기 개선된 특성이 야생형 써모토가 마리티마 아세테이트 키나제에 비해 기질 화합물 4 ((R)-2-에티닐-글리세르알데히드 또는 그의 히드레이트 형태)에 대한 인산화 반응에서의 ATP-보조인자 재사용에 대한 개선된 활성을 포함하는 것인 4F의 아세테이트 키나제.
6F. 상기 개선된 특성이 야생형 써모토가 마리티마 아세테이트 키나제에 비해 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트 또는 그의 히드레이트 형태 또는 상기 중 어느 하나의 염)의 개선된 생산을 포함하는 것인 5F의 아세테이트 키나제.
7F. 상기 개선된 특성이 야생형 써모토가 마리티마 아세테이트 키나제에 비해 기질 화합물 3 (2-에티닐-프로판-1,2,3-트리올)에 대한 인산화 반응에서의 ATP-보조인자 재사용에 대한 개선된 활성을 포함하는 것인 4F의 아세테이트 키나제.
8F. 상기 개선된 특성이 야생형 써모토가 마리티마 아세테이트 키나제에 비해 화합물 9 ((S)-2- 에티닐-프로판-1,2,3-트리올 1-포스페이트 또는 상기 중 어느 하나의 염)의 개선된 생산을 포함하는 것인 7F의 아세테이트 키나제.
9F. 상기 아세테이트 키나제가 정제된 것인 1F 내지 8F 중 어느 하나의 아세테이트 키나제.
10F. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 2F 내지 7F 중 어느 하나의 조작된 아세테이트 키나제.
SEQUENCE LISTING
<110> Merck Sharp & Dohme Corp.
Huffman, Mark A.
Fryszkowska, Anna
Kolev, Joshua N.
Devine, Paul N.
Campos, Kevin R.
Truppo, Matthew
Nawrat, Christopher C.
<120> ENZYMATIC SYNTHESIS OF 4'-ETHYNYL NUCLEOSIDE ANALOGS
<130> 24608-WO-PCT
<150> 62/695508
<151> 2018-07-09
<150> 62/822320
<151> 2019-03-22
<160> 21
<170> PatentIn version 3.5
<210> 1
<211> 657
<212> PRT
<213> Fusarium graminearum
<400> 1
Met Ala Ser Ala Pro Ile Gly Ser Ala Ile Pro Arg Asn Asn Trp Ala
1 5 10 15
Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Asn Lys Ala Ile
20 25 30
Asp Gly Asn Lys Asp Thr Phe Trp His Thr Phe Tyr Gly Ala Asn Gly
35 40 45
Asp Pro Lys Pro Pro His Thr Tyr Thr Ile Asp Met Lys Thr Thr Gln
50 55 60
Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn
65 70 75 80
Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Thr Asn
85 90 95
Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr
100 105 110
Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val
115 120 125
Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile
130 135 140
Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly
145 150 155 160
Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ala Ala Ala Ala
165 170 175
Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Asn
180 185 190
Asp Ala Phe Glu Gly Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp
195 200 205
Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Lys
210 215 220
His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile
225 230 235 240
Val Val Asp Glu Thr Ala Thr Gly Gly Asn Asp Ala Lys Lys Thr Ser
245 250 255
Leu Tyr Asp Ser Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln
260 265 270
Val Ala Arg Gly Tyr Gln Ser Ser Ala Thr Met Ser Asp Gly Arg Val
275 280 285
Phe Thr Ile Gly Gly Ser Phe Ser Gly Gly Arg Val Glu Lys Asn Gly
290 295 300
Glu Val Tyr Ser Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala
305 310 315 320
Lys Val Asn Pro Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser
325 330 335
Asp Asn His Ala Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln
340 345 350
Ala Gly Pro Ser Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly
355 360 365
Asp Val Lys Ser Ala Gly Lys Arg Gln Ser Asn Arg Gly Val Ala Pro
370 375 380
Asp Ala Met Cys Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys
385 390 395 400
Ile Leu Thr Phe Gly Gly Ser Pro Asp Tyr Glu Asp Ser Asp Ala Thr
405 410 415
Thr Asn Ala His Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn
420 425 430
Thr Val Phe Ala Ser Asn Gly Leu Tyr Phe Ala Arg Thr Phe His Thr
435 440 445
Ser Val Val Leu Pro Asp Gly Ser Thr Phe Ile Thr Gly Gly Gln Arg
450 455 460
Arg Gly Ile Pro Thr Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile
465 470 475 480
Tyr Val Pro Glu Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile
485 490 495
Val Arg Ala Tyr His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val
500 505 510
Phe Asn Gly Gly Gly Gly Leu Cys Gly Asp Cys Thr Thr Asn His Phe
515 520 525
Asp Ala Gln Ile Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn
530 535 540
Leu Ala Thr Arg Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Lys
545 550 555 560
Val Gly Gly Arg Ile Thr Ile Ser Thr Asp Ser Ser Ile Ser Lys Ala
565 570 575
Ser Leu Ile Arg Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln
580 585 590
Arg Arg Ile Pro Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser
595 600 605
Phe Gln Val Pro Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met
610 615 620
Leu Phe Val Met Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile
625 630 635 640
Arg Val Thr Gln Gly Gly Gly Gly Ser Trp Ser His Pro Gln Phe Glu
645 650 655
Lys
<210> 2
<211> 316
<212> PRT
<213> Escherichia coli
<400> 2
Met Ser Ile Lys Glu Gln Thr Leu Met Thr Pro Tyr Leu Gln Phe Asp
1 5 10 15
Arg Asn Gln Trp Ala Ala Leu Arg Asp Ser Val Pro Met Thr Leu Ser
20 25 30
Glu Asp Glu Ile Ala Arg Leu Lys Gly Ile Asn Glu Asp Leu Ser Leu
35 40 45
Glu Glu Val Ala Glu Ile Tyr Leu Pro Leu Ser Arg Leu Leu Asn Phe
50 55 60
Tyr Ile Ser Ser Asn Leu Arg Arg Gln Ala Val Leu Glu Gln Phe Leu
65 70 75 80
Gly Thr Asn Gly Gln Arg Ile Pro Tyr Ile Ile Ser Ile Ala Gly Ser
85 90 95
Val Ala Val Gly Lys Ser Thr Thr Ala Arg Val Leu Gln Ala Leu Leu
100 105 110
Ser Arg Trp Pro Glu His Arg Arg Val Glu Leu Ile Thr Thr Asp Gly
115 120 125
Phe Leu His Pro Asn Gln Val Leu Lys Glu Arg Gly Leu Met Lys Lys
130 135 140
Lys Gly Phe Pro Glu Ser Tyr Asp Met His Arg Leu Val Lys Phe Val
145 150 155 160
Ser Asp Leu Lys Ser Gly Val Pro Asn Val Thr Ala Pro Val Tyr Ser
165 170 175
His Leu Ile Tyr Asp Val Ile Pro Asp Gly Asp Lys Thr Val Val Gln
180 185 190
Pro Asp Ile Leu Ile Leu Glu Gly Leu Asn Val Leu Gln Ser Gly Met
195 200 205
Asp Tyr Pro His Asp Pro His His Val Phe Val Ser Asp Phe Val Asp
210 215 220
Phe Ser Ile Tyr Val Asp Ala Pro Glu Asp Leu Leu Gln Thr Trp Tyr
225 230 235 240
Ile Asn Arg Phe Leu Lys Phe Arg Glu Gly Ala Phe Thr Asp Pro Asp
245 250 255
Ser Tyr Phe His Asn Tyr Ala Lys Leu Thr Lys Glu Glu Ala Ile Lys
260 265 270
Thr Ala Met Thr Ile Trp Lys Glu Met Asn Trp Leu Asn Leu Lys Gln
275 280 285
Asn Ile Leu Pro Thr Arg Glu Arg Ala Ser Leu Ile Leu Thr Lys Ser
290 295 300
Ala Asn His Ala Val Glu Glu Val Arg Leu Arg Lys
305 310 315
<210> 3
<211> 413
<212> PRT
<213> Thermotoga maritima
<400> 3
Met Gly Ser His His His His His His Gly Ser Arg Val Leu Val Ile
1 5 10 15
Asn Ser Gly Ser Ser Ser Ile Lys Tyr Gln Leu Ile Glu Met Glu Gly
20 25 30
Glu Lys Val Leu Cys Lys Gly Ile Ala Glu Arg Ile Gly Ile Glu Gly
35 40 45
Ser Arg Leu Val His Arg Val Gly Asp Glu Lys His Val Ile Glu Arg
50 55 60
Glu Leu Pro Asp His Glu Glu Ala Leu Lys Leu Ile Leu Asn Thr Leu
65 70 75 80
Val Asp Glu Lys Leu Gly Val Ile Lys Asp Leu Lys Glu Ile Asp Ala
85 90 95
Val Gly His Arg Val Val His Gly Gly Glu Arg Phe Lys Glu Ser Val
100 105 110
Leu Val Asp Glu Glu Val Leu Lys Ala Ile Glu Glu Val Ser Pro Leu
115 120 125
Ala Pro Leu His Asn Pro Ala Asn Leu Met Gly Ile Lys Ala Ala Met
130 135 140
Lys Leu Leu Pro Gly Val Pro Asn Val Ala Val Phe Asp Thr Ala Phe
145 150 155 160
His Gln Thr Ile Pro Gln Lys Ala Tyr Leu Tyr Ala Ile Pro Tyr Glu
165 170 175
Tyr Tyr Glu Lys Tyr Lys Ile Arg Arg Tyr Gly Phe His Gly Thr Ser
180 185 190
His Arg Tyr Val Ser Lys Arg Ala Ala Glu Ile Leu Gly Lys Lys Leu
195 200 205
Glu Glu Leu Lys Ile Ile Thr Cys His Ile Gly Asn Gly Ala Ser Val
210 215 220
Ala Ala Val Lys Tyr Gly Lys Cys Val Asp Thr Ser Met Gly Phe Thr
225 230 235 240
Pro Leu Glu Gly Leu Val Met Gly Thr Arg Ser Gly Asp Leu Asp Pro
245 250 255
Ala Ile Pro Phe Phe Ile Met Glu Lys Glu Gly Ile Ser Pro Gln Glu
260 265 270
Met Tyr Asp Ile Leu Asn Lys Lys Ser Gly Val Tyr Gly Leu Ser Lys
275 280 285
Gly Phe Ser Ser Asp Met Arg Asp Ile Glu Glu Ala Ala Leu Lys Gly
290 295 300
Asp Glu Trp Cys Lys Leu Val Leu Glu Ile Tyr Asp Tyr Arg Ile Ala
305 310 315 320
Lys Tyr Ile Gly Ala Tyr Ala Ala Ala Met Asn Gly Val Asp Ala Ile
325 330 335
Val Phe Thr Ala Gly Val Gly Glu Asn Ser Pro Ile Thr Arg Glu Asp
340 345 350
Val Cys Ser Tyr Leu Glu Phe Leu Gly Val Lys Leu Asp Lys Gln Lys
355 360 365
Asn Glu Glu Thr Ile Arg Gly Lys Glu Gly Ile Ile Ser Thr Pro Asp
370 375 380
Ser Arg Val Lys Val Leu Val Val Pro Thr Asn Glu Glu Leu Met Ile
385 390 395 400
Ala Arg Asp Thr Lys Glu Ile Val Glu Lys Ile Gly Arg
405 410
<210> 4
<211> 613
<212> PRT
<213> Streptococcus thermophilus
<400> 4
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Thr Val Gly Lys Thr Lys Val Ser Thr Ala Ser
20 25 30
Leu Lys Val Leu Ala Gly Trp Gly Ile Asp Thr Ile Tyr Gly Ile Pro
35 40 45
Ser Gly Thr Leu Ala Pro Leu Met Glu Ala Leu Gly Glu Gln Glu Glu
50 55 60
Thr Asp Ile Lys Phe Leu Gln Val Lys His Glu Glu Val Gly Ala Met
65 70 75 80
Ala Ala Val Met Gln Trp Lys Phe Gly Gly Lys Leu Gly Val Cys Val
85 90 95
Gly Ser Gly Gly Pro Gly Ala Ser His Leu Ile Asn Gly Leu Tyr Asp
100 105 110
Ala Ala Met Asp Asn Thr Pro Val Leu Ala Ile Leu Gly Ser Pro Pro
115 120 125
Gln Arg Glu Leu Asn Met Asp Ala Phe Gln Glu Leu Asn Gln Asn Pro
130 135 140
Met Tyr Asp His Ile Ala Val Tyr Asn Arg Arg Val Ala Tyr Ala Glu
145 150 155 160
Gln Leu Pro Lys Leu Ile Asp Asp Ala Ile Arg Thr Ala Ile Ser Lys
165 170 175
Arg Gly Val Ala Val Leu Glu Val Pro Gly Asp Phe Gly Tyr Lys Glu
180 185 190
Ile Ala Asn Asp Ala Phe Tyr Ser Ser Gly His Ser Tyr Arg Asp Tyr
195 200 205
Val Ser Ser Ala Ile Asn Glu Val Asp Ile Asp Ala Ala Val Glu Val
210 215 220
Leu Asn Lys Ser Lys Arg Ala Val Ile Tyr Ala Gly Ile Gly Thr Met
225 230 235 240
Gly His Gly Pro Ala Val Gln Glu Leu Ser Arg Lys Ile Lys Ala Pro
245 250 255
Ile Ile Thr Thr Ala Lys Asn Phe Glu Thr Phe Asp Tyr Asp Phe Glu
260 265 270
Gly Leu Thr Gly Ser Thr Tyr Arg Val Gly Trp Lys Pro Ala Asn Glu
275 280 285
Ala Val Lys Glu Ala Asp Thr Val Leu Phe Val Gly Ser Asn Phe Pro
290 295 300
Phe Ala Glu Val Glu Gly Thr Phe Ser Asn Val Glu Asn Phe Ile Gln
305 310 315 320
Ile Asp Asn Asn Pro Thr Met Leu Gly Lys Arg His Asn Ala Asp Val
325 330 335
Ala Ile Leu Gly Asp Ala Gly Glu Ala Val Gln Met Leu Leu Glu Lys
340 345 350
Val Ala Pro Val Glu Glu Ser Ala Trp Trp Asn Ala Asn Leu Lys Asn
355 360 365
Ile Gln Asn Trp Arg Asp Tyr Met Thr Lys Leu Glu Thr Lys Glu Asn
370 375 380
Gly Pro Leu Gln Leu Tyr Gln Val Tyr Asn Ala Ile Asn Lys Tyr Ala
385 390 395 400
Asp Glu Asp Ala Ile Tyr Ser Ile Asp Val Gly Asn Thr Thr Gln Thr
405 410 415
Ser Ile Arg His Leu His Met Thr Pro Lys Asn Met Trp Arg Thr Ser
420 425 430
Pro Leu Phe Ala Ser Met Gly Ile Ala Leu Pro Gly Gly Ile Gly Ala
435 440 445
Lys Asn Val Tyr Pro Glu Arg Gln Val Phe Asn Leu Met Gly Asp Gly
450 455 460
Ala Phe Ser Met Asn Tyr Gln Asp Ile Val Thr Asn Val Arg Tyr Asn
465 470 475 480
Met Pro Val Ile Asn Val Val Phe Thr Asn Thr Glu Tyr Gly Phe Ile
485 490 495
Lys Asn Lys Tyr Glu Asp Thr Asn Thr Asn Thr Phe Gly Thr Glu Phe
500 505 510
Thr Asp Val Asp Tyr Ala Met Ile Gly Glu Ala Gln Gly Ala Val Gly
515 520 525
Phe Thr Val Ser Arg Ile Glu Asp Met Asp Gln Val Met Ala Ala Ala
530 535 540
Val Lys Ala Asn Lys Glu Gly Lys Thr Val Val Ile Asp Ala Lys Ile
545 550 555 560
Thr Lys Asp Arg Pro Ile Pro Val Glu Thr Leu Lys Leu Asp Pro Ala
565 570 575
Leu Tyr Ser Glu Glu Glu Ile Lys Ala Tyr Lys Glu Arg Tyr Glu Ala
580 585 590
Glu Glu Leu Val Pro Phe Ser Glu Phe Leu Lys Ala Glu Gly Leu Glu
595 600 605
Ser Lys Val Ala Lys
610
<210> 5
<211> 257
<212> PRT
<213> Shewanella halifaxensis
<400> 5
Met Ser Asp Leu Lys Lys Ala Ala Gln Gln Ala Ile Ser Leu Met Asp
1 5 10 15
Leu Thr Thr Leu Asn Asp Asp Asp Thr Asp Gln Lys Val Ile Glu Leu
20 25 30
Cys His Lys Ala Lys Thr Pro Ala Gly Asp Thr Ala Ala Ile Cys Ile
35 40 45
Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys Thr Leu Asn Glu Ile Gly
50 55 60
Gly Asp Asp Ile Lys Ile Ala Thr Val Thr Asn Phe Pro His Gly Asn
65 70 75 80
Asp Asp Ile Ala Ile Ala Val Leu Glu Thr Arg Ala Ala Val Ala Tyr
85 90 95
Gly Ala Asp Glu Val Asp Val Val Phe Pro Tyr Arg Ala Leu Met Glu
100 105 110
Gly Asn Glu Thr Val Gly Phe Glu Leu Val Lys Ala Cys Lys Glu Ala
115 120 125
Cys Gly Glu Asp Thr Ile Leu Lys Val Ile Ile Glu Ser Gly Val Leu
130 135 140
Ala Asp Pro Ala Leu Ile Arg Lys Ala Ser Glu Leu Ser Ile Asp Ala
145 150 155 160
Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly Lys Val Ala Val Asn Ala
165 170 175
Thr Leu Glu Ala Ala Glu Ile Met Met Thr Val Ile Ser Glu Lys Asn
180 185 190
Pro Lys Val Gly Phe Lys Pro Ala Gly Gly Val Lys Asp Ala Ala Ala
195 200 205
Ala Ala Glu Phe Leu Gly Val Ala Ala Arg Leu Leu Gly Asp Asp Trp
210 215 220
Ala Thr Pro Ala Thr Phe Arg Phe Gly Ala Ser Ser Leu Leu Thr Asn
225 230 235 240
Leu Leu His Thr Leu Glu Leu Ala Asp Ala Pro Gln Gly Ala Gln Gly
245 250 255
Tyr
<210> 6
<211> 257
<212> PRT
<213> Shewanella halifaxensis
<400> 6
Met Cys Asp Leu Lys Lys Ala Ala Gln Arg Ala Ile Ser Leu Met Asp
1 5 10 15
Leu Thr Thr Leu Asn Asp Asp Asp Thr Asp Gln Lys Val Ile Glu Leu
20 25 30
Cys His Lys Ala Lys Thr Pro Ala Gly Asp Thr Ala Ala Ile Val Ile
35 40 45
Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys Thr Leu Asn Glu Ile Gly
50 55 60
Gly Leu Asp Ile Lys Ile Val Thr Val Thr Asn Phe Pro His Gly Asn
65 70 75 80
Asp Asp Ile Ala Ile Ala Val Leu Glu Thr Arg Ala Ala Val Ala Tyr
85 90 95
Gly Ala Asp Glu Val Asp Val Val Phe Pro Tyr Arg Ala Leu Met Glu
100 105 110
Gly Asn Glu Thr Val Gly Phe Glu Leu Val Lys Ala Cys Lys Glu Ala
115 120 125
Cys Gly Glu Asp Thr Ile Leu Lys Val Ile Ile Glu Ser Gly Val Leu
130 135 140
Lys Asp Pro Ala Leu Ile Arg Lys Ala Ser Glu Ile Ser Ile Asp Ala
145 150 155 160
Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly Lys Val Ala Val Asn Ala
165 170 175
Thr Leu Glu Ala Ala Glu Ile Ile Met Thr Val Ile Ser Glu Lys Asn
180 185 190
Pro Lys Val Gly Phe Lys Pro Ala Gly Gly Ile Lys Asp Ala Ala Ala
195 200 205
Ala Ala Glu Phe Leu Gly Val Ala Ala Arg Leu Leu Gly Asp Asp Trp
210 215 220
Ala Thr Pro Ala Thr Phe Arg Phe Gly Ala Thr Asp Leu Leu Thr Asn
225 230 235 240
Leu Leu His Thr Leu Glu Leu Ala Asp Ala Pro Gln Gly Ala Gln Gly
245 250 255
Tyr
<210> 7
<211> 500
<212> PRT
<213> Alloscardovia omnicolens
<400> 7
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Leu Lys Ser Met Thr Glu Thr Leu Arg Lys His Phe Glu Gly
20 25 30
Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Val Asp His Thr Lys Val Asp Pro Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Thr Thr His Asp Ile
65 70 75 80
Met Val Asp Thr Ile Val Asn His Met Ser Trp Glu Ser Glu Gln Phe
85 90 95
Gln Asp Val Met Ala Lys Gly Glu Asp Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Ile Phe Pro Asp Gly Val Thr Glu Glu Asp Leu
115 120 125
Thr Ala Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Asn
130 135 140
Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Glu Met Gly Trp Asn Tyr Leu Leu Ser
165 170 175
Ile Leu Asp Gln Leu Ser Gln Ser His Val Ser Gln Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Lys Asn Ser Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Glu Arg Ile Lys Ala Glu Gly Glu Lys
210 215 220
Arg Gly Leu Glu Thr Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro
245 250 255
Gly Leu Leu Leu His Ala Leu Glu Phe Gly Lys Thr Asp Ala Leu Ala
260 265 270
Gln Trp Ile Asp Val Arg Pro Asn Asn Ala Val Asn Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Met Asp Arg
290 295 300
Ser Leu Ala Gly Leu Val Pro Asp Glu Glu Val Asp Ala Leu Val Glu
305 310 315 320
Ser Ile His Arg Asn Ser Lys Gly Glu Ser Gln Glu Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ala
340 345 350
Ala Leu Gly Ser Asp Asp Gln Lys Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Ser Asn Asp Met Asp Leu Leu Lys Arg Thr Asn Val Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Ala Ala Glu Val Ala Ser Glu Val Glu
405 410 415
Arg Pro Val Val Gln Ala Leu Asn Ala Leu Gly Arg Phe Arg Asn Thr
420 425 430
Leu Ser Ala Phe Asp Gly Glu Phe Ser Tyr Ser Asn Ala Asp Gly Val
435 440 445
Leu Thr Met Thr Trp Ala Asp Asp Ala Thr Arg Ala Thr Leu Thr Phe
450 455 460
Ala Pro Lys Ala Asn Ser Asn Gly Ala Ser Val Ala Arg Leu Glu Trp
465 470 475 480
Thr Asp Ala Ala Gly Glu His Ala Thr Asp Asp Leu Ile Ala Asn Pro
485 490 495
Pro Val Val Ala
500
<210> 8
<211> 407
<212> PRT
<213> Escherichia coli
<400> 8
Met Lys Arg Ala Phe Ile Met Val Leu Asp Ser Phe Gly Ile Gly Ala
1 5 10 15
Thr Glu Asp Ala Glu Arg Phe Gly Asp Val Gly Ala Asp Thr Leu Gly
20 25 30
His Ile Ala Glu Ala Cys Ala Lys Gly Glu Ala Asp Asn Gly Arg Lys
35 40 45
Gly Pro Leu Asn Leu Pro Asn Leu Thr Arg Leu Gly Leu Ala Lys Ala
50 55 60
His Glu Gly Ser Thr Gly Phe Ile Pro Ala Gly Met Asp Gly Asn Ala
65 70 75 80
Glu Val Ile Gly Ala Tyr Ala Trp Ala His Glu Met Ser Ser Gly Lys
85 90 95
Asp Ser Val Ser Gly His Trp Glu Ile Ala Gly Val Pro Val Leu Phe
100 105 110
Glu Trp Gly Tyr Phe Ser Asp His Glu Asn Ser Phe Pro Gln Glu Leu
115 120 125
Leu Asp Lys Leu Val Glu Arg Ala Asn Leu Pro Gly Tyr Leu Gly Asn
130 135 140
Cys Arg Ser Ser Gly Thr Val Ile Leu Asp Gln Leu Gly Glu Glu His
145 150 155 160
Met Lys Thr Gly Lys Pro Ile Phe Tyr Thr Ser Ala Ala Ser Val Phe
165 170 175
Gln Ile Ala Cys His Glu Glu Thr Phe Gly Leu Asp Lys Leu Tyr Glu
180 185 190
Leu Cys Glu Ile Ala Arg Glu Glu Leu Thr Asn Gly Gly Tyr Asn Ile
195 200 205
Gly Arg Val Ile Ala Arg Pro Phe Ile Gly Asp Lys Ala Gly Asn Phe
210 215 220
Gln Arg Thr Gly Asn Arg Arg Asp Leu Ala Val Glu Pro Pro Ala Pro
225 230 235 240
Thr Val Leu Gln Lys Leu Val Asp Glu Lys His Gly Gln Val Val Ser
245 250 255
Val Gly Lys Ile Ala Asp Ile Tyr Ala Asn Cys Gly Ile Thr Lys Lys
260 265 270
Val Lys Ala Thr Gly Leu Asp Ala Leu Phe Asp Ala Thr Ile Lys Glu
275 280 285
Met Lys Glu Ala Gly Asp Asn Thr Ile Val Phe Thr Asn Phe Val Asp
290 295 300
Phe Asp Ser Ser Trp Gly His Arg Arg Asp Val Ala Gly Tyr Ala Ala
305 310 315 320
Gly Leu Glu Leu Phe Asp Arg Arg Leu Pro Glu Leu Met Ser Leu Leu
325 330 335
Arg Asp Asp Asp Ile Leu Ile Leu Thr Ala Asp His Gly Cys Asp Pro
340 345 350
Thr Trp Thr Gly Thr Asp His Thr Arg Glu His Ile Pro Val Leu Val
355 360 365
Tyr Gly Pro Lys Val Lys Pro Gly Ser Leu Gly His Arg Glu Thr Phe
370 375 380
Ala Asp Ile Gly Gln Thr Leu Ala Lys Tyr Phe Gly Thr Ser Asp Met
385 390 395 400
Glu Tyr Gly Lys Ala Met Phe
405
<210> 9
<211> 239
<212> PRT
<213> Escherichia coli
<400> 9
Met Ala Thr Pro His Ile Asn Ala Glu Met Gly Asp Phe Ala Asp Val
1 5 10 15
Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr Ile Ala Glu Thr
20 25 30
Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly
35 40 45
Phe Thr Gly Thr Tyr Lys Gly Arg Lys Ile Ser Val Met Gly His Gly
50 55 60
Ala Gly Ile Pro Ser Cys Ser Ile Tyr Thr Lys Glu Leu Ile Thr Asp
65 70 75 80
Phe Gly Val Lys Lys Ile Ile Arg Val Gly Ser Cys Gly Ala Val Leu
85 90 95
Pro His Val Lys Leu Arg Asp Val Val Ile Gly Met Gly Ala Cys Thr
100 105 110
Asp Ser Lys Val Asn Arg Ile Arg Phe Lys Asp His Asp Phe Ala Ala
115 120 125
Ile Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala
130 135 140
Leu Gly Ile Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe
145 150 155 160
Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly Ile
165 170 175
Leu Gly Val Glu Met Glu Ala Ala Gly Ile Tyr Gly Val Ala Ala Glu
180 185 190
Phe Gly Ala Lys Ala Leu Thr Ile Cys Thr Val Ser Asp His Ile Arg
195 200 205
Thr His Glu Gln Thr Thr Ala Ala Glu Arg Gln Thr Thr Phe Asn Asp
210 215 220
Met Ile Lys Ile Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu
225 230 235
<210> 10
<211> 650
<212> PRT
<213> Fusarium graminearum
<400> 10
Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala
1 5 10 15
Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Asn Lys Ala Ile
20 25 30
Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly
35 40 45
Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln
50 55 60
Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn
65 70 75 80
Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn
85 90 95
Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr
100 105 110
Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val
115 120 125
Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile
130 135 140
Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly
145 150 155 160
Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala
165 170 175
Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln
180 185 190
Asp Ala Phe Glu Gly Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp
195 200 205
Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Lys
210 215 220
His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile
225 230 235 240
Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser
245 250 255
Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly
260 265 270
Tyr Gln Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly
275 280 285
Gly Ser Phe Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser
290 295 300
Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro
305 310 315 320
Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala
325 330 335
Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser
340 345 350
Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser
355 360 365
Ala Gly Lys Arg Gln Ser Asn Arg Gly Val Ala Pro Asp Ala Met Cys
370 375 380
Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe
385 390 395 400
Gly Gly Ser Pro Asp Tyr Glu Asp Ser Asp Ala Thr Thr Asn Ala His
405 410 415
Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala
420 425 430
Ser Asn Gly Leu Tyr Phe Ala Arg Thr Phe His Thr Ser Val Val Leu
435 440 445
Pro Asp Gly Ser Thr Phe Ile Thr Gly Gly Gln Gln Arg Gly Ile Pro
450 455 460
Thr Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu
465 470 475 480
Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr
485 490 495
His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly
500 505 510
Gly Gly Leu Cys Gly Asp Cys Thr Thr Asn His Phe Asp Ala Gln Ile
515 520 525
Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg
530 535 540
Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp
545 550 555 560
Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg
565 570 575
Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Pro
580 585 590
Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro
595 600 605
Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met
610 615 620
Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Arg Val Thr Gln
625 630 635 640
Gly Gln Thr Gly His His His His His His
645 650
<210> 11
<211> 650
<212> PRT
<213> Fusarium graminearum
<400> 11
Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala
1 5 10 15
Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Asn Lys Ala Ile
20 25 30
Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly
35 40 45
Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln
50 55 60
Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn
65 70 75 80
Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn
85 90 95
Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr
100 105 110
Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val
115 120 125
Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile
130 135 140
Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly
145 150 155 160
Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala
165 170 175
Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln
180 185 190
Asp Ala Phe Glu Gly Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp
195 200 205
Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly
210 215 220
His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile
225 230 235 240
Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser
245 250 255
Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly
260 265 270
Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly
275 280 285
Gly Ser Phe Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser
290 295 300
Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro
305 310 315 320
Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala
325 330 335
Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser
340 345 350
Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser
355 360 365
Ala Gly Lys Arg Gln Ser Asn Arg Gly Val Ala Pro Asp Ala Met Cys
370 375 380
Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe
385 390 395 400
Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His
405 410 415
Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala
420 425 430
Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu
435 440 445
Pro Asp Gly Ser Thr Phe Ile Thr Gly Gly Gln Gln Arg Gly Ile Pro
450 455 460
Thr Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu
465 470 475 480
Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr
485 490 495
His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly
500 505 510
Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile
515 520 525
Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg
530 535 540
Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp
545 550 555 560
Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg
565 570 575
Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Pro
580 585 590
Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro
595 600 605
Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met
610 615 620
Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln
625 630 635 640
Gly Gln Thr Gly His His His His His His
645 650
<210> 12
<211> 316
<212> PRT
<213> Escherichia coli
<400> 12
Met Ser Ile Lys Glu Gln Thr Leu Met Thr Pro Tyr Leu Gln Leu Asp
1 5 10 15
Arg Asn Gln Trp Ala Ala Leu Arg Asp Ser Asn Pro Met Thr Leu Ser
20 25 30
Glu Asp Glu Ile Ala Arg Leu Lys Gly Ile Asn Glu Asp Leu Ser Leu
35 40 45
Glu Glu Val Ala Glu Val Tyr Leu Pro Leu Ser Arg Leu Leu Asn Phe
50 55 60
Tyr Ile Ser Ser Asn Leu Arg Arg Gln Ala Val Leu Glu Gln Phe Leu
65 70 75 80
Gly Thr Asn Gly Gln Arg Ile Pro Tyr Ile Ile Ser Ile Ala Gly Ser
85 90 95
Val Ala Val Gly Lys Ser Thr Thr Ala Arg Val Leu Gln Ala Leu Leu
100 105 110
Ser Arg Trp Pro Glu His Arg Arg Val Glu Leu Ile Thr Thr Asp Gly
115 120 125
Phe Leu His Pro Asn Gln Val Leu Lys Glu Arg Gly Leu Met Lys Lys
130 135 140
Lys Gly Phe Pro Glu Ser Tyr Asp Met His Arg Leu Met Lys Phe Val
145 150 155 160
Lys Asp Leu Lys Ser Gly Val Pro Asn Val Thr Ala Pro Val Tyr Ser
165 170 175
His Leu Ile Tyr Asp Val Ile Pro Asp Gly Asp Lys Thr Val Val Gln
180 185 190
Pro Asp Ile Leu Ile Leu Glu Gly Leu Asn Val Leu Gln Ser Gly Met
195 200 205
Asp Tyr Pro His Asp Pro His His Val Phe Val Ser Asp Phe Val Asp
210 215 220
Phe Ser Ile Tyr Val Asp Ala Pro Glu Asp Leu Leu Gln Thr Trp Tyr
225 230 235 240
Ile Asn Arg Phe Leu Lys Phe Arg Glu Gly Ala Phe Thr Asp Pro Asp
245 250 255
Ser Tyr Phe His Gly Tyr Ala Lys Leu Thr Lys Glu Glu Ala Ile Lys
260 265 270
Thr Ala Met Thr Ile Trp Lys Glu Met Asn His Leu Asn Leu Lys Gln
275 280 285
Asn Ile Leu Pro Thr Arg Glu Arg Ala Ser Leu Ile Leu Thr Lys Ser
290 295 300
Ala Asn His Ile Val Glu Glu Val Arg Leu Arg Lys
305 310 315
<210> 13
<211> 325
<212> PRT
<213> Escherichia coli
<400> 13
Met His His His His His His Gly Gly Met Ser Ile Lys Glu Gln Thr
1 5 10 15
Leu Met Thr Pro Tyr Leu Gln Leu Asp Arg Asn Gln Trp Ala Ala Leu
20 25 30
Arg Asp Ser Asn Pro Met Thr Leu Ser Glu Asp Glu Ile Ala Arg Leu
35 40 45
Lys Gly Ile Asn Glu Asp Leu Ser Leu Glu Glu Val Ala Glu Val Tyr
50 55 60
Leu Pro Leu Ser Arg Leu Leu Asn Phe Tyr Ile Ser Ser Asn Leu Arg
65 70 75 80
Arg Gln Ala Val Leu Glu Gln Phe Leu Gly Thr Asn Gly Gln Arg Ile
85 90 95
Pro Tyr Ile Ile Ser Ile Ala Gly Ser Val Ala Val Gly Lys Ser Thr
100 105 110
Thr Ala Arg Val Leu Gln Ala Leu Leu Ser Arg Trp Pro Glu His Arg
115 120 125
Arg Val Glu His Ile Thr Thr Asp Gly Phe Leu His Pro Asn Gln Val
130 135 140
Leu Lys Glu Arg Gly Leu Met Gly Lys Lys Gly Phe Pro Glu Ser Tyr
145 150 155 160
Asp Met His Arg Leu Met Lys Phe Val Lys Asp Leu Lys Ser Gly Val
165 170 175
Pro Asn Val Thr Ala Pro Val Tyr Ser His Leu Ile Tyr Asp Val Ile
180 185 190
Pro Asp Gly Asp Lys Thr Val Val Gln Pro Asp Ile Leu Ile Leu Glu
195 200 205
Gly Leu Asn Val Leu Gln Ser Gly Met Asp Tyr Pro His Asp Pro His
210 215 220
His Val Phe Val Ser Asp Phe Val Asp Phe Ser Ile Tyr Val Asp Ala
225 230 235 240
Pro Glu Asp Leu Leu Gln Thr Trp Tyr Ile Asn Arg Phe Leu Lys Phe
245 250 255
Arg Glu Gly Ala Phe Thr Asp Pro Asp Ser Tyr Phe His Gly Tyr Ala
260 265 270
Lys Leu Thr Lys Glu Glu Ala Ile Lys Thr Ala Met Thr Ile Trp Lys
275 280 285
Glu Met Asn His Leu Asn Leu Lys Gln Asn Ile Leu Pro Thr Arg Glu
290 295 300
Arg Ala Ser Leu Ile Leu Thr Lys Ser Ala Asn His Ile Val Glu Glu
305 310 315 320
Val Arg Leu Arg Lys
325
<210> 14
<211> 263
<212> PRT
<213> Shewanella halifaxensis
<400> 14
Met His His His His His His Cys Asp Leu Lys Lys Ala Ala Gln Arg
1 5 10 15
Ala Ile Ser Leu Met Asp Leu Thr Thr Leu Asn Asp Asp Asp Thr Asp
20 25 30
Gln Lys Val Ile Glu Leu Cys His Lys Ala Lys Thr Pro Ala Gly Asp
35 40 45
Thr Ala Ala Ile Val Ile Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys
50 55 60
Thr Leu Asn Glu Ile Gly Gly Leu Asp Ile Lys Ile Val Thr Val Thr
65 70 75 80
Asn Phe Pro His Gly Asn Asp Asp Ile Ala Ile Ala Val Leu Glu Thr
85 90 95
Arg Ala Ala Val Ala Tyr Gly Ala Asp Glu Val Asp Val Val Phe Pro
100 105 110
Tyr Arg Ala Leu Met Glu Gly Asn Glu Thr Val Gly Phe Glu Leu Val
115 120 125
Lys Ala Cys Lys Glu Ala Cys Gly Glu Asp Thr Ile Leu Lys Val Ile
130 135 140
Ile Glu Ser Gly Val Leu Lys Asp Pro Ala Leu Ile Arg Lys Ala Ser
145 150 155 160
Glu Ile Ser Ile Asp Ala Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly
165 170 175
Lys Val Ala Val Asn Ala Thr Leu Glu Ala Ala Glu Ile Ile Met Thr
180 185 190
Val Ile Ser Glu Lys Asn Pro Lys Val Gly Phe Lys Pro Ala Gly Gly
195 200 205
Ile Lys Asp Ala Ala Ala Ala Ala Glu Phe Leu Gly Val Ala Ala Arg
210 215 220
Leu Leu Gly Asp Asp Trp Ala Thr Pro Ala Thr Phe Arg Phe Gly Ala
225 230 235 240
Thr Asp Leu Leu Thr Asn Leu Leu His Thr Leu Glu Leu Ala Asp Ala
245 250 255
Pro Gln Gly Ala Gln Gly Tyr
260
<210> 15
<211> 239
<212> PRT
<213> Escherichia coli
<400> 15
Met Ala Thr Pro His Ile Asn Ala Glu Met Gly Asp Phe Ala Asp Val
1 5 10 15
Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr Ile Ala Glu Thr
20 25 30
Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly
35 40 45
Phe Thr Gly Thr Tyr Lys Gly Arg Lys Ile Ser Val Met Gly His Gly
50 55 60
Met Gly Ile Pro Ser Cys Ser Ile Tyr Thr Lys Glu Leu Ile Thr Asp
65 70 75 80
Phe Gly Val Lys Lys Ile Ile Arg Val Gly Ser Cys Gly Ala Val Leu
85 90 95
Pro His Val Lys Leu Arg Asp Val Val Ile Gly Met Gly Ala Cys Thr
100 105 110
Asp Ser Lys Val Asn Arg Ile Arg Phe Lys Asp His Asp Phe Ala Ala
115 120 125
Ile Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala
130 135 140
Leu Gly Ile Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe
145 150 155 160
Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly Ile
165 170 175
Leu Gly Val Glu Met Glu Ala Ala Gly Ile Tyr Gly Val Ala Ala Glu
180 185 190
Phe Gly Ala Lys Ala Leu Thr Ile Cys Thr Val Ser Asp His Ile Arg
195 200 205
Thr His Glu Gln Thr Thr Ala Ala Glu Arg Gln Thr Thr Phe Asn Asp
210 215 220
Met Ile Lys Ile Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu
225 230 235
<210> 16
<211> 650
<212> PRT
<213> Fusarium graminearum
<400> 16
Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala
1 5 10 15
Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Asn Lys Ala Ile
20 25 30
Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly
35 40 45
Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln
50 55 60
Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn
65 70 75 80
Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn
85 90 95
Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr
100 105 110
Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val
115 120 125
Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile
130 135 140
Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly
145 150 155 160
Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala
165 170 175
Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln
180 185 190
Asp Ala Phe Glu Pro Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp
195 200 205
Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly
210 215 220
His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile
225 230 235 240
Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser
245 250 255
Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly
260 265 270
Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly
275 280 285
Gly Ser Tyr Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser
290 295 300
Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro
305 310 315 320
Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala
325 330 335
Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser
340 345 350
Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser
355 360 365
Ala Gly Lys Arg Gln Ser Asp Arg Gly Val Ala Pro Asp Ala Met Cys
370 375 380
Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe
385 390 395 400
Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His
405 410 415
Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala
420 425 430
Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu
435 440 445
Pro Asp Gly Ser Val Phe Ile Thr Gly Gly Gln Gln Arg Gly Val Pro
450 455 460
Leu Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu
465 470 475 480
Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr
485 490 495
His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly
500 505 510
Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile
515 520 525
Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg
530 535 540
Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp
545 550 555 560
Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg
565 570 575
Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Gly
580 585 590
Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro
595 600 605
Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met
610 615 620
Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln
625 630 635 640
Gly Gln Thr Gly His His His His His His
645 650
<210> 17
<211> 650
<212> PRT
<213> Fusarium graminearum
<400> 17
Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala
1 5 10 15
Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Ile Lys Ala Ile
20 25 30
Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly
35 40 45
Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln
50 55 60
Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn
65 70 75 80
Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn
85 90 95
Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr
100 105 110
Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val
115 120 125
Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile
130 135 140
Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly
145 150 155 160
Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala
165 170 175
Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln
180 185 190
Asp Ala Phe Glu Asp Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp
195 200 205
Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly
210 215 220
His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile
225 230 235 240
Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser
245 250 255
Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly
260 265 270
Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly
275 280 285
Gly Ser Tyr Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser
290 295 300
Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro
305 310 315 320
Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala
325 330 335
Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser
340 345 350
Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser
355 360 365
Ala Gly Lys Arg Gln Ser Asp Arg Gly Val Ala Pro Asp Ala Met Cys
370 375 380
Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe
385 390 395 400
Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His
405 410 415
Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala
420 425 430
Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu
435 440 445
Pro Asp Gly Ser Val Phe Ile Thr Gly Gly Gln Gln Arg Gly Val Pro
450 455 460
Leu Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu
465 470 475 480
Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr
485 490 495
His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly
500 505 510
Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile
515 520 525
Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg
530 535 540
Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp
545 550 555 560
Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg
565 570 575
Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Gly
580 585 590
Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro
595 600 605
Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met
610 615 620
Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln
625 630 635 640
Gly Gln Thr Gly His His His His His His
645 650
<210> 18
<211> 650
<212> PRT
<213> Fusarium graminearum
<400> 18
Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala
1 5 10 15
Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Ile Lys Ala Ile
20 25 30
Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly
35 40 45
Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln
50 55 60
Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn
65 70 75 80
Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn
85 90 95
Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr
100 105 110
Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val
115 120 125
Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile
130 135 140
Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly
145 150 155 160
Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala
165 170 175
Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln
180 185 190
Asp Ala Phe Glu Asp Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp
195 200 205
Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly
210 215 220
His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile
225 230 235 240
Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser
245 250 255
Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly
260 265 270
Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly
275 280 285
Gly Ser Tyr Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser
290 295 300
Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro
305 310 315 320
Met Leu Thr Ala Asp Lys Arg Gly Leu Tyr Arg Ser Asp Asn His Ala
325 330 335
Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser
340 345 350
Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser
355 360 365
Ala Gly Lys Arg Gln Ser Asp Arg Gly Val Ala Pro Asp Ala Met Cys
370 375 380
Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe
385 390 395 400
Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His
405 410 415
Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala
420 425 430
Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu
435 440 445
Pro Asp Gly Ser Val Phe Ile Thr Gly Gly Gln Gln Arg Gly Val Pro
450 455 460
Leu Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu
465 470 475 480
Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr
485 490 495
His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly
500 505 510
Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile
515 520 525
Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg
530 535 540
Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp
545 550 555 560
Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg
565 570 575
Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Gly
580 585 590
Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro
595 600 605
Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met
610 615 620
Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln
625 630 635 640
Gly Gln Thr Gly His His His His His His
645 650
<210> 19
<211> 650
<212> PRT
<213> Fusarium graminearum
<400> 19
Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala
1 5 10 15
Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Ile Lys Ala Ile
20 25 30
Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly
35 40 45
Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln
50 55 60
Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn
65 70 75 80
Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn
85 90 95
Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr
100 105 110
Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val
115 120 125
Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile
130 135 140
Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly
145 150 155 160
Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala
165 170 175
Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln
180 185 190
Asp Ala Phe Arg Asp Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp
195 200 205
Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly
210 215 220
His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile
225 230 235 240
Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser
245 250 255
Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly
260 265 270
Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly
275 280 285
Gly Ser Tyr Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser
290 295 300
Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro
305 310 315 320
Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala
325 330 335
Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser
340 345 350
Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser
355 360 365
Ala Gly Lys Arg Gln Ser Asp Arg Gly Val Ala Pro Asp Ala Met Cys
370 375 380
Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe
385 390 395 400
Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His
405 410 415
Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala
420 425 430
Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu
435 440 445
Pro Asp Gly Ser Val Phe Ile Thr Gly Gly Gln Gln Arg Gly Val Pro
450 455 460
Leu Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu
465 470 475 480
Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr
485 490 495
His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly
500 505 510
Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile
515 520 525
Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg
530 535 540
Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp
545 550 555 560
Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg
565 570 575
Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Gly
580 585 590
Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro
595 600 605
Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met
610 615 620
Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln
625 630 635 640
Gly Gln Thr Gly His His His His His His
645 650
<210> 20
<211> 326
<212> PRT
<213> Escherichia coli
<400> 20
Met His His His His His His Gly Gly Ser Gly Ser Ile Lys Glu Gln
1 5 10 15
Thr Leu Met Thr Pro Tyr Leu Gln Leu Asp Arg Asn Gln Trp Ala Ala
20 25 30
Leu Arg Asp Ser Asn Pro Met Thr Leu Ser Glu Asp Glu Ile Ala Arg
35 40 45
Leu Lys Gly Ile Asn Glu Asp Leu Ser Leu Glu Glu Val Ala Glu Val
50 55 60
Tyr Leu Pro Leu Ser Arg Leu Leu Asn Phe Tyr Ile Ser Ser Asn Leu
65 70 75 80
Arg Arg Gln Ala Gln Leu Glu Gln Phe Leu Gly Thr Asn Gly Gln Arg
85 90 95
Ile Pro Tyr Ile Ile Ser Ile Ala Gly Ser Val Ala Val Gly Lys Ser
100 105 110
Thr Phe Ala Arg Val Leu Gln Ala Leu Leu Ser Arg Trp Pro Glu His
115 120 125
Arg Arg Val Glu His Ile Thr Thr Asp Gly Phe Leu His Pro Asn Gln
130 135 140
Val Leu Lys Glu Arg Gly Leu Met Gly Lys Lys Gly Phe Pro Glu Ser
145 150 155 160
Tyr Asp Met His Arg Leu Met Lys Phe Val Lys Asp Leu Lys Ser Gly
165 170 175
Val Pro Asn Val Thr Ala Pro Val Tyr Ser His Leu Ile Tyr Asp Val
180 185 190
Ile Pro Asp Gly Asp Lys Thr Val Val Gln Pro Asp Ile Leu Ile Leu
195 200 205
Glu Gly Leu Asn Val Leu Gln Ser Gly Met Asp Tyr Pro His Asp Pro
210 215 220
His His Val Phe Val Ser Asp Phe Val Asp Phe Ser Ile Tyr Val Asp
225 230 235 240
Ala Pro Glu Asp Leu Leu Gln Thr Trp Tyr Ile Asn Arg Phe Leu Lys
245 250 255
Phe Arg Glu Gly Ala Phe Thr Asp Pro Asp Ser Tyr Phe His Gly Tyr
260 265 270
Ala Lys Leu Thr Lys Glu Glu Ala Ile Lys Thr Ala Met Thr Ile Trp
275 280 285
Lys Glu Met Asn His Val Asn Leu Lys Gln Asn Ile Leu Pro Thr Arg
290 295 300
Glu Arg Ala Ser Leu Ile Leu Thr Lys Ser Ala Asn His Ile Val Glu
305 310 315 320
Glu Val Arg Leu Arg Lys
325
<210> 21
<211> 413
<212> PRT
<213> Thermotoga maritima
<400> 21
Met Gly Ser His His His His His His Gly Ser Arg Val Leu Asn Ile
1 5 10 15
Asn Ser Gly Ser Ser Ser Ile Lys Tyr Gln Leu Ile Glu Met Glu Gly
20 25 30
Glu Lys Val Leu Cys Lys Gly Ile Ala Glu Arg Ile Gly Ile Glu Gly
35 40 45
Ser Arg Leu Val His Arg Val Gly Asp Glu Lys His Val Ile Glu Arg
50 55 60
Glu Leu Pro Asp His Glu Glu Ala Leu Lys Leu Ile Leu Asn Thr Leu
65 70 75 80
Val Asp Glu Lys Leu Gly Val Ile Lys Asp Leu Lys Glu Ile Asp Ala
85 90 95
Val Gly His Arg Val Val His Gly Gly Glu Arg Phe Lys Glu Ser Val
100 105 110
Leu Val Asp Glu Glu Val Leu Lys Ala Ile Glu Glu Val Ser Pro Leu
115 120 125
Ala Pro Leu His Asn Pro Ala Asn Leu Met Gly Ile Lys Ala Ala Met
130 135 140
Lys Leu Leu Pro Gly Val Pro Asn Val Gln Val Phe Asp Thr Ala Phe
145 150 155 160
His Gln Thr Ile Pro Gln Lys Ala Tyr Leu Tyr Ala Ile Pro Tyr Glu
165 170 175
Tyr Tyr Glu Lys Tyr Lys Ile Arg Arg Tyr Gly Phe His Gly Ile Ser
180 185 190
His Arg Tyr Val Ser Lys Arg Ala Ala Glu Ile Leu Gly Lys Lys Leu
195 200 205
Glu Glu Leu Lys Ile Ile Thr Cys His Ile Gly Asn Gly Ala Ser Val
210 215 220
Ala Ala Val Lys Tyr Gly Lys Cys Val Asp Thr Ser Met Gly Phe Thr
225 230 235 240
Pro Leu Glu Gly Leu Val Met Gly Thr Arg Ser Gly Asp Leu Asp Pro
245 250 255
Ala Ile Pro Phe Phe Ile Met Glu Lys Glu Gly Ile Ser Pro Gln Glu
260 265 270
Met Tyr Asp Ile Leu Asn Lys Lys Ser Gly Val Tyr Gly Leu Ser Lys
275 280 285
Gly Phe Ser Ser Asp Met Arg Asp Asn Leu Glu Ala Ala Leu Lys Gly
290 295 300
Asp Glu Trp Cys Lys Leu Val Leu Glu Ile Tyr Asp Tyr Arg Ile Ala
305 310 315 320
Lys Tyr Ile Gly Ala Tyr Ala Ala Ala Met Asn Gly Val Asp Ala Ile
325 330 335
Val Phe Thr Ala Gly Val Gly Glu Asn Ser Pro Ile Thr Arg Glu Asp
340 345 350
Val Cys Lys Tyr Leu Glu Phe Leu Gly Val Lys Leu Asp Lys Gln Lys
355 360 365
Asn Glu Glu Thr Ile Arg Gly Lys Glu Gly Ile Ile Ser Thr Pro Asp
370 375 380
Ser Arg Val Lys Val Leu Val Val Pro Thr Asn Glu Glu Leu Met Ile
385 390 395 400
Ala Arg Asp Thr Lys Glu Ile Val Glu Lys Ile Gly Arg
405 410
Claims (37)
- 제4항에 있어서, 반응 용액으로부터 무기 포스페이트 부산물을 제거하는 것을 추가로 포함하는 방법.
- 제5항에 있어서, (a) 수크로스 포스포릴라제 및 수크로스를 반응 혼합물에 첨가하거나 또는 (b) 칼슘, 마그네슘 또는 망간을 반응 혼합물에 첨가함으로써 반응 용액으로부터 무기 포스페이트 부산물을 제거하는 것을 포함하는 방법.
- 제4항 내지 제6항 중 어느 한 항에 있어서, 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체를 단리하는 것을 추가로 포함하는 방법.
- 제10항에 있어서, 반응이 밀봉된 용기에서 수행되는 것인 방법.
- 제12항에 있어서, ATP가 (a) 아세틸 포스페이트 및 아세테이트 키나제, 또는 (b) 피루베이트, 포스페이트 및 산소의 존재 하에서 피루베이트 옥시다제, 카탈라제 및 아세테이트 키나제 또는 (c) 이들의 조합을 이용하여 계내에서 재생되는 것인 방법.
- 제13항에 있어서, (a) 판토테네이트 키나제가 고정화되거나 또는 (b) 판토테네이트 키나제 및 아세테이트 키나제가 고정화되는 것인 방법.
- 제15항에 있어서, 갈락토스 옥시다제가 고정화되는 것인 방법.
- 제17항에 있어서, 반응 혼합물로부터 무기 포스페이트 부산물을 제거하는 것을 추가로 포함하는 방법.
- 제18항에 있어서, (a) 수크로스 포스포릴라제 및 수크로스를 반응 혼합물에 첨가하거나 또는 (b) 칼슘, 마그네슘, 또는 망간을 반응 혼합물에 첨가함으로써 반응 혼합물로부터 무기 포스페이트 부산물을 제거하는 것을 포함하는 방법.
- 제17항 내지 제19항 중 어느 한 항에 있어서, 4'-에티닐 2'-데옥시 뉴클레오시드를 단리하는 것을 추가로 포함하는 방법.
- 제25항에 있어서, ATP가 (a) 아세틸 포스페이트 및 아세테이트 키나제, 또는 (b) 피루베이트, 포스페이트 및 산소의 존재 하에서 피루베이트 옥시다제, 카탈라제 및 아세테이트 키나제 또는 (c) 이들의 조합을 이용하여 계내에서 재생되는 것인 방법.
- 제26항에 있어서, (a) 판토테네이트 키나제가 고정화되거나 또는 (b) 판토테네이트 키나제 및 아세테이트 키나제가 고정화되는 것인 방법.
- 제28항에 있어서, 갈락토스 옥시다제가 고정화되는 것인 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862695508P | 2018-07-09 | 2018-07-09 | |
US62/695,508 | 2018-07-09 | ||
US201962822320P | 2019-03-22 | 2019-03-22 | |
US62/822,320 | 2019-03-22 | ||
PCT/US2019/040316 WO2020014041A1 (en) | 2018-07-09 | 2019-07-02 | Enzymatic synthesis of 4'-ethynyl nucleoside analogs |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210030399A true KR20210030399A (ko) | 2021-03-17 |
Family
ID=69143135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217003533A KR20210030399A (ko) | 2018-07-09 | 2019-07-02 | 4'-에티닐 뉴클레오시드 유사체의 효소적 합성 |
Country Status (10)
Country | Link |
---|---|
US (2) | US12037623B2 (ko) |
EP (1) | EP3820473A4 (ko) |
JP (3) | JP2021530479A (ko) |
KR (1) | KR20210030399A (ko) |
CN (1) | CN112996511B (ko) |
AU (1) | AU2019300832A1 (ko) |
BR (1) | BR112021000202B1 (ko) |
CA (1) | CA3105823C (ko) |
MX (1) | MX2021000278A (ko) |
WO (1) | WO2020014041A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022191612A1 (ko) | 2021-03-08 | 2022-09-15 | 주식회사 엘지에너지솔루션 | 전지셀 및 이를 제조하는 전지셀 제조 장치 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG11202107145SA (en) | 2019-01-25 | 2021-08-30 | Univ Brown | Compositions and methods for treating, preventing or reversing age-associated inflammation and disorders |
JP2022538229A (ja) * | 2019-07-02 | 2022-09-01 | コデクシス, インコーポレイテッド | 操作された酢酸キナーゼバリアント酵素 |
CN110527704B (zh) * | 2019-10-31 | 2020-03-13 | 烟台华康荣赞生物科技有限公司 | 一种合成乳-n-二糖的方法 |
IL305928A (en) * | 2021-04-02 | 2023-11-01 | Codexis Inc | Transgenic enzymes of acetate kinase variant |
CN116855471B (zh) * | 2023-09-04 | 2023-11-28 | 江苏申基生物科技有限公司 | 一种嘌呤核苷磷酸化酶突变体及其应用 |
CN117143942A (zh) * | 2023-10-30 | 2023-12-01 | 泰兴合全药业有限公司 | 3’-氨基-2’,3’-双脱氧鸟苷5’-三磷酸的合成方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2207504T3 (es) * | 1999-05-12 | 2004-06-01 | Yamasa Corporation | Nucleosidos 4'-c-etinilpurina. |
CA2382462A1 (en) | 1999-08-20 | 2001-03-01 | Roche Diagnostics Gmbh | Enzymatic synthesis of deoxyribonucleosides |
EP1178051B1 (en) | 2000-02-10 | 2008-05-28 | Mitsui Chemicals, Inc. | Process for selectively producing 1-phosphorylated sugar derivative anomer and process for producing nucleoside |
JP4058663B2 (ja) * | 2000-09-22 | 2008-03-12 | 有機合成薬品工業株式会社 | リボース1−リン酸類及びヌクレオシド化合物の製造方法 |
JP4058667B2 (ja) | 2001-08-31 | 2008-03-12 | 有機合成薬品工業株式会社 | 2’−デオキシヌクレオシド化合物の製造方法 |
JP2003250570A (ja) | 2002-03-04 | 2003-09-09 | Yuki Gosei Kogyo Co Ltd | 2’−デオキシリボヌクレオシド化合物の製造方法及びこの中間体の製造方法、並びにこれらに使用する2−デオキシリボース5−リン酸アルドラーゼ遺伝子 |
CA2502109C (en) | 2004-03-24 | 2010-02-23 | Yamasa Corporation | 4'-c-substituted-2-haloadenosine derivative |
JP5120949B2 (ja) * | 2008-07-28 | 2013-01-16 | 独立行政法人産業技術総合研究所 | 白色蛍光体の製造方法 |
CN105879047A (zh) | 2008-12-16 | 2016-08-24 | 建新公司 | 寡糖-蛋白缀合物 |
CN107746834A (zh) | 2013-03-27 | 2018-03-02 | 辉瑞爱尔兰制药公司 | 用于制备普瑞巴林的方法和中间体 |
WO2015143712A1 (en) * | 2014-03-28 | 2015-10-01 | Merck Sharp & Dohme Corp. | 4'-substituted nucleoside reverse transcriptase inhibitors |
CA3103819A1 (en) * | 2018-07-09 | 2020-01-16 | Codexis, Inc. | Engineered pantothenate kinase variant enzymes |
AU2019300837A1 (en) | 2018-07-09 | 2021-01-07 | Codexis, Inc. | Engineered galactose oxidase variant enzymes |
KR20210031933A (ko) | 2018-07-09 | 2021-03-23 | 코덱시스, 인코포레이티드 | 조작된 포스포펜토뮤타제 변이체 효소 |
CA3103721A1 (en) * | 2018-07-09 | 2020-01-16 | Codexis, Inc. | Engineered deoxyribose-phosphate aldolases |
KR20210031926A (ko) * | 2018-07-09 | 2021-03-23 | 코덱시스, 인코포레이티드 | 조작된 퓨린 뉴클레오사이드 포스포릴라제 변이체 효소 |
-
2019
- 2019-07-02 CN CN201980058723.8A patent/CN112996511B/zh active Active
- 2019-07-02 EP EP19833923.6A patent/EP3820473A4/en active Pending
- 2019-07-02 JP JP2021500463A patent/JP2021530479A/ja active Pending
- 2019-07-02 AU AU2019300832A patent/AU2019300832A1/en active Pending
- 2019-07-02 MX MX2021000278A patent/MX2021000278A/es unknown
- 2019-07-02 BR BR112021000202-2A patent/BR112021000202B1/pt active IP Right Grant
- 2019-07-02 WO PCT/US2019/040316 patent/WO2020014041A1/en unknown
- 2019-07-02 KR KR1020217003533A patent/KR20210030399A/ko not_active Application Discontinuation
- 2019-07-02 CA CA3105823A patent/CA3105823C/en active Active
- 2019-07-02 US US17/257,792 patent/US12037623B2/en active Active
-
2022
- 2022-10-25 JP JP2022170820A patent/JP7482188B2/ja active Active
-
2023
- 2023-06-29 JP JP2023107449A patent/JP2023123750A/ja active Pending
-
2024
- 2024-05-28 US US18/675,302 patent/US20240301460A1/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022191612A1 (ko) | 2021-03-08 | 2022-09-15 | 주식회사 엘지에너지솔루션 | 전지셀 및 이를 제조하는 전지셀 제조 장치 |
Also Published As
Publication number | Publication date |
---|---|
US20240301460A1 (en) | 2024-09-12 |
US12037623B2 (en) | 2024-07-16 |
JP2023123750A (ja) | 2023-09-05 |
CN112996511B (zh) | 2024-08-09 |
JP2021530479A (ja) | 2021-11-11 |
CA3105823C (en) | 2023-07-25 |
US20220228184A1 (en) | 2022-07-21 |
AU2019300832A1 (en) | 2021-02-04 |
WO2020014041A1 (en) | 2020-01-16 |
CN112996511A (zh) | 2021-06-18 |
MX2021000278A (es) | 2021-03-31 |
BR112021000202A2 (pt) | 2021-08-10 |
BR112021000202A8 (pt) | 2022-12-27 |
CA3105823A1 (en) | 2020-01-16 |
EP3820473A1 (en) | 2021-05-19 |
JP7482188B2 (ja) | 2024-05-13 |
JP2023012498A (ja) | 2023-01-25 |
EP3820473A4 (en) | 2022-05-11 |
BR112021000202B1 (pt) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210030399A (ko) | 4'-에티닐 뉴클레오시드 유사체의 효소적 합성 | |
US8728789B2 (en) | DNA fragment encoding a polyphosphate-driven nucleoside 5′-diphosphate kinase polypeptide | |
KR20160030876A (ko) | 약제학적 활성 성분들로써 뉴클레오시드 유사체들의 생물촉매적 생산 | |
CN114075585A (zh) | 一种β-烟酰胺单核苷酸的制备方法 | |
CN106701723B (zh) | D-果糖-6-磷酸醛缩酶a突变体、重组表达载体、基因工程菌及其应用和反应产物 | |
JPWO2006085535A1 (ja) | テトラヒドロビオプテリン生合成酵素を用いたビオプテリン類の製造方法 | |
AU2018344883B2 (en) | Cellular transport system for transferring a sulfonic acid construct carrying a cargo into the cytoplasm of a cell | |
RU2816846C2 (ru) | Ферментативный синтез 4’-этинилнуклеозидных аналогов | |
JP7510573B2 (ja) | 抗ウイルス性ヌクレオシドの合成 | |
US20240140920A1 (en) | Synthesis of uridine | |
CN116744938A (zh) | 抗病毒核苷的合成 | |
JP6286036B2 (ja) | 人工補因子の合成のためのs−アデノシルメチオニン(sam)シンターゼ変異体 | |
US20230174992A1 (en) | Reductase enzymes and processes for making and using reductase enzymes | |
EP4153189A1 (en) | Synthesis of fluorinated nucleotides | |
WO2022212230A1 (en) | Synthesis of fluorinated cyclic dinucleotides | |
WO2024129235A1 (en) | Enzymatic synthesis of ntp and nqp | |
CN118726510A (zh) | 一管法酶促合成加帽mRNA的方法 | |
CN116555378A (zh) | 制备核糖核苷或其衍生物的方法、生物酶制剂及其应用 | |
KR20060095772A (ko) | α-1-인산화-2-데옥시-2-플루오로아라비노시드 및2’-데옥시-2’-플루오로-β-D-아라비노뉴클레오시드의제조법 | |
KR20040031866A (ko) | 데옥시당의 중간체인티디피-4-케토-6-데옥시-디-글루코즈의 생합성 방법, 이를위한 재조합 효소들, 재조합 벡터들 및 형질전환체들 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |