CZ2003996A3 - Nové molekuly agrekanázy - Google Patents
Nové molekuly agrekanázy Download PDFInfo
- Publication number
- CZ2003996A3 CZ2003996A3 CZ2003996A CZ2003996A CZ2003996A3 CZ 2003996 A3 CZ2003996 A3 CZ 2003996A3 CZ 2003996 A CZ2003996 A CZ 2003996A CZ 2003996 A CZ2003996 A CZ 2003996A CZ 2003996 A3 CZ2003996 A3 CZ 2003996A3
- Authority
- CZ
- Czechia
- Prior art keywords
- aggrecanase
- seq
- ser
- ala
- gly
- Prior art date
Links
- 108010003059 aggrecanase Proteins 0.000 title claims abstract description 155
- 238000000034 method Methods 0.000 claims abstract description 46
- 239000002773 nucleotide Substances 0.000 claims abstract description 45
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 45
- 102000016284 Aggrecans Human genes 0.000 claims abstract description 37
- 108010067219 Aggrecans Proteins 0.000 claims abstract description 37
- 239000003112 inhibitor Substances 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims abstract description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 48
- 239000012634 fragment Substances 0.000 claims description 34
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 27
- 229920001184 polypeptide Polymers 0.000 claims description 23
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 23
- 108020004414 DNA Proteins 0.000 claims description 21
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 20
- 230000000694 effects Effects 0.000 claims description 20
- 238000003776 cleavage reaction Methods 0.000 claims description 12
- 230000007017 scission Effects 0.000 claims description 12
- 239000000203 mixture Substances 0.000 claims description 11
- 239000001963 growth medium Substances 0.000 claims description 9
- 230000002797 proteolythic effect Effects 0.000 claims description 9
- 238000012258 culturing Methods 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 5
- 108020004705 Codon Proteins 0.000 claims description 4
- 241000124008 Mammalia Species 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 3
- 102000053602 DNA Human genes 0.000 claims 9
- 150000001875 compounds Chemical class 0.000 claims 1
- 238000009510 drug design Methods 0.000 claims 1
- 230000017854 proteolysis Effects 0.000 claims 1
- 102000004190 Enzymes Human genes 0.000 abstract description 11
- 108090000790 Enzymes Proteins 0.000 abstract description 11
- 230000015556 catabolic process Effects 0.000 abstract description 10
- 238000006731 degradation reaction Methods 0.000 abstract description 10
- 108090000623 proteins and genes Proteins 0.000 description 60
- 102000004169 proteins and genes Human genes 0.000 description 50
- 235000018102 proteins Nutrition 0.000 description 47
- 210000004027 cell Anatomy 0.000 description 42
- 239000002299 complementary DNA Substances 0.000 description 22
- 238000009396 hybridization Methods 0.000 description 20
- 235000001014 amino acid Nutrition 0.000 description 18
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 16
- 235000011180 diphosphates Nutrition 0.000 description 16
- 101100408682 Caenorhabditis elegans pmt-2 gene Proteins 0.000 description 13
- 229940024606 amino acid Drugs 0.000 description 13
- 150000001413 amino acids Chemical class 0.000 description 13
- 239000003298 DNA probe Substances 0.000 description 12
- 230000001580 bacterial effect Effects 0.000 description 12
- 239000000243 solution Substances 0.000 description 12
- 108020003215 DNA Probes Proteins 0.000 description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 11
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 11
- 201000010099 disease Diseases 0.000 description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 108010022394 Threonine synthase Proteins 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 102000004419 dihydrofolate reductase Human genes 0.000 description 9
- 201000008482 osteoarthritis Diseases 0.000 description 9
- 230000013595 glycosylation Effects 0.000 description 8
- 238000006206 glycosylation reaction Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 238000010561 standard procedure Methods 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 229960000723 ampicillin Drugs 0.000 description 6
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 6
- 210000000845 cartilage Anatomy 0.000 description 6
- 210000004962 mammalian cell Anatomy 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 210000001550 testis Anatomy 0.000 description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 5
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 5
- 210000001188 articular cartilage Anatomy 0.000 description 5
- 238000000211 autoradiogram Methods 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 235000018417 cysteine Nutrition 0.000 description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 229960000485 methotrexate Drugs 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 210000002784 stomach Anatomy 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 108091005664 ADAMTS4 Proteins 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- 239000000020 Nitrocellulose Substances 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 101100393821 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GSP2 gene Proteins 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 150000001540 azides Chemical class 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 239000000356 contaminant Substances 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 229960004452 methionine Drugs 0.000 description 4
- 229920001220 nitrocellulos Polymers 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 229920006298 saran Polymers 0.000 description 4
- 235000020183 skimmed milk Nutrition 0.000 description 4
- 230000004572 zinc-binding Effects 0.000 description 4
- 102100027400 A disintegrin and metalloproteinase with thrombospondin motifs 4 Human genes 0.000 description 3
- 229940123879 Aggrecanase inhibitor Drugs 0.000 description 3
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 3
- AUIJUTGLPVHIRT-FXQIFTODSA-N Arg-Ser-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N AUIJUTGLPVHIRT-FXQIFTODSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 102100022887 GTP-binding nuclear protein Ran Human genes 0.000 description 3
- 101000774835 Heteractis crispa PI-stichotoxin-Hcr2o Proteins 0.000 description 3
- 101000620756 Homo sapiens GTP-binding nuclear protein Ran Proteins 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 3
- 108020005091 Replication Origin Proteins 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000012197 amplification kit Methods 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000003636 conditioned culture medium Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000012894 fetal calf serum Substances 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000003349 osteoarthritic effect Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 239000006152 selective media Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- ANGAOPNEPIDLPO-XVYDVKMFSA-N Ala-His-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N ANGAOPNEPIDLPO-XVYDVKMFSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 2
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 2
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 2
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 2
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 2
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 2
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- RGTVXXNMOGHRAY-WDSKDSINSA-N Cys-Arg Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RGTVXXNMOGHRAY-WDSKDSINSA-N 0.000 description 2
- LKHMGNHQULEPFY-ACZMJKKPSA-N Cys-Ser-Glu Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O LKHMGNHQULEPFY-ACZMJKKPSA-N 0.000 description 2
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241001131785 Escherichia coli HB101 Species 0.000 description 2
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 2
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- FLQAKQOBSPFGKG-CIUDSAMLSA-N Glu-Cys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLQAKQOBSPFGKG-CIUDSAMLSA-N 0.000 description 2
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 2
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 2
- BIRKKBCSAIHDDF-WDSKDSINSA-N Gly-Glu-Cys Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BIRKKBCSAIHDDF-WDSKDSINSA-N 0.000 description 2
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 2
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 2
- ALPXXNRQBMRCPZ-MEYUZBJRSA-N His-Thr-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ALPXXNRQBMRCPZ-MEYUZBJRSA-N 0.000 description 2
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 2
- WTOAPTKSZJJWKK-HTFCKZLJSA-N Ile-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WTOAPTKSZJJWKK-HTFCKZLJSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- SVJRVFPSHPGWFF-DCAQKATOSA-N Lys-Cys-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVJRVFPSHPGWFF-DCAQKATOSA-N 0.000 description 2
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 2
- HONVOXINDBETTI-KKUMJFAQSA-N Lys-Tyr-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CC=C(O)C=C1 HONVOXINDBETTI-KKUMJFAQSA-N 0.000 description 2
- 108010006035 Metalloproteases Proteins 0.000 description 2
- 102000005741 Metalloproteases Human genes 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- NSTPXGARCQOSAU-VIFPVBQESA-N N-formyl-L-phenylalanine Chemical compound O=CN[C@H](C(=O)O)CC1=CC=CC=C1 NSTPXGARCQOSAU-VIFPVBQESA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 238000009004 PCR Kit Methods 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 2
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 2
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 2
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- SYCFMSYTIFXWAJ-DCAQKATOSA-N Ser-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N SYCFMSYTIFXWAJ-DCAQKATOSA-N 0.000 description 2
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 2
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 2
- 102000002938 Thrombospondin Human genes 0.000 description 2
- 108060008245 Thrombospondin Proteins 0.000 description 2
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 2
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 210000002744 extracellular matrix Anatomy 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 229960002897 heparin Drugs 0.000 description 2
- 229920000669 heparin Polymers 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 210000001179 synovial fluid Anatomy 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- 102100032295 A disintegrin and metalloproteinase with thrombospondin motifs 10 Human genes 0.000 description 1
- 108091005668 ADAMTS10 Proteins 0.000 description 1
- 102000051403 ADAMTS4 Human genes 0.000 description 1
- 108091005663 ADAMTS5 Proteins 0.000 description 1
- 102000051389 ADAMTS5 Human genes 0.000 description 1
- 108091005667 ADAMTS7 Proteins 0.000 description 1
- 102000051352 ADAMTS7 Human genes 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 1
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 1
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 1
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- JNLDTVRGXMSYJC-UVBJJODRSA-N Ala-Pro-Trp Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JNLDTVRGXMSYJC-UVBJJODRSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 1
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- 102100040410 Alpha-methylacyl-CoA racemase Human genes 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- KGSJCPBERYUXCN-BPNCWPANSA-N Arg-Ala-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KGSJCPBERYUXCN-BPNCWPANSA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 1
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 1
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 1
- NAARDJBSSPUGCF-FXQIFTODSA-N Arg-Cys-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N NAARDJBSSPUGCF-FXQIFTODSA-N 0.000 description 1
- DGFGDPVSDQPANQ-XGEHTFHBSA-N Arg-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)O DGFGDPVSDQPANQ-XGEHTFHBSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- PZVMBNFTBWQWQL-DCAQKATOSA-N Arg-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PZVMBNFTBWQWQL-DCAQKATOSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 1
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 1
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- YJRORCOAFUZVKA-FXQIFTODSA-N Asn-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N YJRORCOAFUZVKA-FXQIFTODSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- XLHLPYFMXGOASD-CIUDSAMLSA-N Asn-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLHLPYFMXGOASD-CIUDSAMLSA-N 0.000 description 1
- AITGTTNYKAWKDR-CIUDSAMLSA-N Asn-His-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O AITGTTNYKAWKDR-CIUDSAMLSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- KNOGLZBISUBTFW-QRTARXTBSA-N Asp-Trp-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O KNOGLZBISUBTFW-QRTARXTBSA-N 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 208000000094 Chronic Pain Diseases 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- HAYVTMHUNMMXCV-IMJSIDKUSA-N Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CS HAYVTMHUNMMXCV-IMJSIDKUSA-N 0.000 description 1
- TULNGKSILXCZQT-IMJSIDKUSA-N Cys-Asp Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O TULNGKSILXCZQT-IMJSIDKUSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 1
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 1
- FIADUEYFRSCCIK-CIUDSAMLSA-N Cys-Glu-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIADUEYFRSCCIK-CIUDSAMLSA-N 0.000 description 1
- UYYZZJXUVIZTMH-AVGNSLFASA-N Cys-Glu-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UYYZZJXUVIZTMH-AVGNSLFASA-N 0.000 description 1
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- SBDVXRYCOIEYNV-YUMQZZPRSA-N Cys-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N SBDVXRYCOIEYNV-YUMQZZPRSA-N 0.000 description 1
- MRVSLWQRNWEROS-SVSWQMSJSA-N Cys-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CS)N MRVSLWQRNWEROS-SVSWQMSJSA-N 0.000 description 1
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 1
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 1
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 1
- BCFXQBXXDSEHRS-FXQIFTODSA-N Cys-Ser-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BCFXQBXXDSEHRS-FXQIFTODSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 1
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 1
- LLUXQOVDMQZMPJ-KKUMJFAQSA-N Cys-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CS)CC1=CC=C(O)C=C1 LLUXQOVDMQZMPJ-KKUMJFAQSA-N 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 101800001224 Disintegrin Proteins 0.000 description 1
- 101800000620 Disintegrin-like Proteins 0.000 description 1
- 241000710188 Encephalomyocarditis virus Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 1
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 1
- UENPHLAAKDPZQY-XKBZYTNZSA-N Glu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O UENPHLAAKDPZQY-XKBZYTNZSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 1
- QLNKFGTZOBVMCS-JBACZVJFSA-N Glu-Tyr-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QLNKFGTZOBVMCS-JBACZVJFSA-N 0.000 description 1
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 1
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 1
- VLPMGIJPAWENQB-SRVKXCTJSA-N His-Cys-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O VLPMGIJPAWENQB-SRVKXCTJSA-N 0.000 description 1
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 1
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 1
- XVZJRZQIHJMUBG-TUBUOCAGSA-N His-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CN=CN1)N XVZJRZQIHJMUBG-TUBUOCAGSA-N 0.000 description 1
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 1
- YKUAGFAXQRYUQW-KKUMJFAQSA-N His-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O YKUAGFAXQRYUQW-KKUMJFAQSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 1
- 101000891254 Homo sapiens Alpha-methylacyl-CoA racemase Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 208000012659 Joint disease Diseases 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- BCUVPZLLSRMPJL-XIRDDKMYSA-N Leu-Trp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N BCUVPZLLSRMPJL-XIRDDKMYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 1
- XFANQCRHTMOEAP-WDSOQIARSA-N Lys-Pro-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XFANQCRHTMOEAP-WDSOQIARSA-N 0.000 description 1
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- CNUPMMXDISGXMU-CIUDSAMLSA-N Met-Cys-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O CNUPMMXDISGXMU-CIUDSAMLSA-N 0.000 description 1
- XGIQKEAKUSPCBU-SRVKXCTJSA-N Met-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCSC)N XGIQKEAKUSPCBU-SRVKXCTJSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- YDUGVDGFKNXFPL-IXOXFDKPSA-N Phe-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YDUGVDGFKNXFPL-IXOXFDKPSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- GAMLAXHLYGLQBJ-UFYCRDLUSA-N Phe-Val-Tyr Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC1=CC=C(C=C1)O)C(C)C)CC1=CC=CC=C1 GAMLAXHLYGLQBJ-UFYCRDLUSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 1
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 1
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 1
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 1
- MDAWMJUZHBQTBO-XGEHTFHBSA-N Pro-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1)O MDAWMJUZHBQTBO-XGEHTFHBSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000016611 Proteoglycans Human genes 0.000 description 1
- 108010067787 Proteoglycans Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 101710094523 Replication enhancer Proteins 0.000 description 1
- 241000219061 Rheum Species 0.000 description 1
- 101001099106 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CAAX prenyl protease 2 Proteins 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 1
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 1
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- HJAXVYLCKDPPDF-SRVKXCTJSA-N Ser-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N HJAXVYLCKDPPDF-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- LUMXICQAOKVQOB-YWIQKCBGSA-N Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O LUMXICQAOKVQOB-YWIQKCBGSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- ODXKUIGEPAGKKV-KATARQTJSA-N Thr-Leu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O ODXKUIGEPAGKKV-KATARQTJSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 1
- OHDXOXIZXSFCDN-RCWTZXSCSA-N Thr-Met-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OHDXOXIZXSFCDN-RCWTZXSCSA-N 0.000 description 1
- KDGBLMDAPJTQIW-RHYQMDGZSA-N Thr-Met-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N)O KDGBLMDAPJTQIW-RHYQMDGZSA-N 0.000 description 1
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 208000026062 Tissue disease Diseases 0.000 description 1
- BSSJIVIFAJKLEK-XIRDDKMYSA-N Trp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BSSJIVIFAJKLEK-XIRDDKMYSA-N 0.000 description 1
- HXMJXDNSFVNSEH-IHPCNDPISA-N Trp-Cys-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXMJXDNSFVNSEH-IHPCNDPISA-N 0.000 description 1
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 1
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 1
- RRXPAFGTFQIEMD-IVJVFBROSA-N Trp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RRXPAFGTFQIEMD-IVJVFBROSA-N 0.000 description 1
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 1
- YBRHKUNWEYBZGT-WLTAIBSBSA-N Trp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-WLTAIBSBSA-N 0.000 description 1
- DYIXEGROAOVQPK-VFAJRCTISA-N Trp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DYIXEGROAOVQPK-VFAJRCTISA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- KYPMKDGKAYQCHO-RYUDHWBXSA-N Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 1
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 1
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- WHNSHJJNWNSTSU-BZSNNMDCSA-N Val-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 WHNSHJJNWNSTSU-BZSNNMDCSA-N 0.000 description 1
- 101000745889 Xenopus laevis Cytochrome P450 26A1 Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 230000002917 arthritic effect Effects 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000008355 cartilage degradation Effects 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 102000035122 glycosylated proteins Human genes 0.000 description 1
- 108091005608 glycosylated proteins Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010081985 glycyl-cystinyl-aspartic acid Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000001466 metabolic labeling Methods 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- YSGSDAIMSCVPHG-UHFFFAOYSA-N valyl-methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)C(C)C YSGSDAIMSCVPHG-UHFFFAOYSA-N 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
- C12N9/6421—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/02—Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/08—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
- A61P19/10—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Physical Education & Sports Medicine (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Chemical & Material Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Rheumatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Compounds Of Unknown Constitution (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Description
NOVE MOLEKULY AGREKANAZY
Oblast techniky
Předkládaný vynález se týká nukleotidových sekvencí kódujících nové molekuly agrekanázy, proteinů agrekanázy a způsobů jejich výroby. Vynález se dále týká přípravy inhibitorů a také protilátek k enzymům agrekanázám. Tyto inhibitory a protilátky mohou být užitečné pro léčbu různých onemocnění sdružených s agrekanázou, včetně osteoartritidy.
Dosavadní stav techniky
Agrekan je hlavní extracelulární složka artikulární chrupavky. Jde o proteoglykan zodpovědný za to, že vznikne chrupavka vybavená mechanickými vlastnostmi stlačitelností a pružností. Ztráta agrekanu se podílí na degradaci artikulární (kloubní) chrupavky při artritických onemocněních. Osteoartritida je vysilující onemocnění, které postihuje přinejmenším 30 miliónů Američanů (Maclean et al., J Rheumatol., 25: 2213-8, 1998). Osteoartritida může závažně snižovat kvalitu života kvůli degradaci artikulární chrupavky a výsledné chronické bolesti. Časnou a důležitou charakteristikou osteoartritického procesu je ztráta agrekanu z extracelulární matrix (Brandt, KD. a Mankin HJ., Pathogenesis of Osteoarthritis, v Textbook of Rheumatology, WB Saunders Company, Philadelphia, PA, ss. 1355-1373., 1993). Velká část agrekanu, obsahující cukry, je proto ztracena z extracelulární matrix, což má za následek deficit biomechanických vlastností chrupavky.
• · · • · · • · ► · · >· ·· ··
Předpokládá se, že proteolytická aktivita nazývaná agrekanázová aktivita je zodpovědná za štěpeni agrekanu a proto má úlohu v degradaci chrupavky sdružené s osteoartritidou a zánětlivým onemocněním kloubů. Byl prováděn výzkum pro rozpoznání enzymu zodpovědného za degradaci agrekanu v humánní osteoartritické chrupavce. Dvě místa enzymatického štěpení byla identifikována v interglobulární doméně agrekanu. Bylo pozorováno, že jedno místo (Asn341-Phe342) bylo štěpeno několika známými metaloproteázami (Flannery, CR et al., J Biol Chem, 267: 100814, 1992, Fosang, AJ et al., Biochemical J., 304: 347-351, 1994). Fragment agrekanu zjištěný v humánní synoviální tekutině a vytvořený štěpením agrekanu chrupavky indukovaným IL-1 je štěpen ve vazbě Glu373-Ala374 (Sandy, JD, et al., J Clin Invest, 69: 1512-1516, 1992, Lohmander LS, et al., Arthritis Rheum, 36: 1214-1222, 1993, Sandy JD et al., J Biol Chem., 266: 8683-8685., 1991), ukazuje na to, že žádný ze známých enzymů není zodpovědný za štěpení agrekanu in vivo.
Nedávno byly identifikovány dva enzymy, agrekanáza-1 (ADAMTS 4) a agrekanáza-2 (ADAMTS-11), v rodině s motivem trombospodinu typu 1 disintegrinu podobných proteinů a metaloproteáz Disintegrin-like and Metalloprotease with Thrombospondin type 1 motif (ADAM-TS), které jsou syntetizovány chrupavkou stimulovanou IL-1 a štěpí agrekan v příslušném místě (Tortorella MD, et al., Science, 284: 16646, 1999, Abbaszade, I, et al., J Biol Chem, 274: 23443-23450, 1999). Je možné, že tyto enzymy mohou být syntetizovány osteoartritickou humánní artikulární chrupavkou. Předpokládá se také, že existují další příbuzné enzymy v rodině ADAM-TS, které jsou schopné štěpení agrekanu ve vazbě Glu373-Ala374, a mohou přispět ke štěpení agrekanu při osteoartritidě.
• · · · • · · · • · · · • · • · • · ···· ····
Podstata vynálezu
Předkládaný vynález se týká identifikace molekul agrekanázových proteinů schopných štěpit agrekan, nukleotidových sekvencí, který kódují agrekanázové enzymy a způsoby výroby agrekanáz. Má se za to, že tyto enzymy jsou charakterizovány zejména tím, že mají agrekanázovou proteolytickou aktivitu. Vynález dále zahrnuje přípravky obsahující tyto enzymy, a také protilátky k těmto enzymům. Kromě toho vynález zahrnuje způsoby přípravy inhibitorů agrekanázy, které blokují enzymovou proteolytickou aktivitu. Tyto inhibitory a protilátky mohou být použity v různých testech a terapiích pro léčení chorobných stavů charakterizovaných degradací artikulární chrupavky.
Nukleotidová sekvence agrekanázové molekuly podle předkládaného vynálezu je uvedena v sekv. id. č. 3. V dalším provedení je nukleotidová sekvence agrekanázové molekuly podle předkládaného vynálezu uvedena v sekv. id. č. 1 od nukleotidu č. 1 do č. 3766. V dalším provedení nukleotidová sekvence podle vynálezu obsahuje nukleotid č. 1086 (TCG) až č. 3396 (CGC) ze sekv. id. č. 1. Vynález dále zahrnuje ekvivalentní sekvence s degenerovanými kodony k sekvencím uvedeným v sekv. id. č. 1, a také jejich fragmenty, které projevují agrekanázovou aktivitu.
Aminokyselinová sekvence izolované agrekanázové molekuly podle vynálezu obsahuje sekvenci uvedenou v sekv. id. č. 4. Aminokyselinová sekvence izolované agrekanázové molekuly zahrnuje sekvenci uvedenou v sekv. id. č. 2. Vynález dále zahrnuje fragmenty aminokyselinové sekvence, které kódují molekuly projevující agrekanázovou aktivitu.
Humánní agrekanázový protein nebo jeho fragment mohou být • · • · ···· připraveny kultivací buněk transformovaných DNA sekvencí ze sekv. id. č. 3 nebo sekv. id. č. 1 obsahující nukleotidy č. 1 až č. 3766 ze sekv. id. č. 1 nebo obsahující nukleotidy č. 1086 až č. 3396 sekv. id. č. 1 a získáním a purifikací z kultivačního média proteinu charakterizovaného aminokyselinovou sekvencí uvedenou v sekv. id. č. 4 nebo sekv. id. č. 2, v daném pořadí, v podstatě bez dalších proteinových látek, se kterými je společně produkován. Pro produkci v savčích buňkách DNA sekvence dále obsahuje DNA sekvenci kódující vhodný propeptid 5' spojený ve shodném čtecím rámci s nukleotidovou sekvencí kódující agrekanázový enzym.
Vynález zahrnuje způsoby pro získání další agrekanázových molekul, DNA sekvencí získaných tímto způsobem a proteinu jimi kódovaného. Způsob izolace kompletní sekvence zahrnuje použití agrekanázové sekvence uvedené v sekv. id. č. 3 nebo sekv. id. č. 1 od nukleotid č. 1086 do č. 3396 pro navrhování sond pro screening s použitím standardních postupů odborníkovi známých.
Očekává se, že jiné druhy mají DNA sekvence homologní s humánním agrekanázovým enzymem. Vynález tedy zahrnuje způsoby získání DNA sekvencí kódujících další agrekanázové molekuly, DNA sekvence získané těmito způsoby a protein kódovaný těmito DNA sekvencemi. Tento způsob vyžaduje použití nukleotidové sekvence podle vynálezu nebo její části pro navržení sondy ke screeningu knihoven na odpovídající gen z jiných druhů nebo kódujících sekvencí nebo jejich fragmentů s použitím standardních technik. Předkládaný vynález tedy může zahrnovat DNA sekvence z jiných druhů, které jsou homologní s humánním agrekanázovým proteinem a mohou být získány s použitím humánní sekvence. Předkládaný vynález může také zahrnovat funkční fragmenty agrekanázového proteinu a DNA sekvence kódující takové funkční fragmenty, a také funkční fragmenty dalších příbuzných proteinů. Schopnost funkce • · · ·· ·· ·· • · · • · · • · ···· ···· až č,
1086 až č. 3396 ze sekv. agrekanázového proteinu takového fragmentu je určitelná testováním proteinu v biologických testech popsaných pro testy agrekanázových proteinů.
Agrekanázové proteiny podle předkládaného vynálezu mohou být připraveny kultivací buněk transformovaných DNA sekvencí ze sekv. id. č. 3 nebo sekv. id. č. 1 obsahující nukleotid č.
3766 ze sekv. id. č. 1 nebo obsahující nukleotid č.
id. č. 1 a získání a purifikace z kultivačního média. V jednom provedení protein obsahuje aminokyselinovou sekvenci ze sekv. id. č. 4 nebo aminokyseliny č. 1 až č. 770 ze sekv. id. č. 2. Purifikovaný exprimovaný protein je v podstatě bez dalších proteinových látek, se kterými je společně vytvářen, a také bez dalších kontaminujících složek. Předpokládá se, že získaný purifikovaný protein projevuje proteolytickou agrekanázovou aktivitu štěpením agrekanu. Proteiny podle vynálezu mohou být tedy dále charakterizovány schopností demonstrovat agrekanovou proteolytickou aktivitu v testu, kterým se určuje přítomnost molekul degradujících agrekan. Tyto testy nebo jejich příprava je odborníkům plně známa. Takové testy mohou zahrnovat kontakt agrekanového substrátu s agrekanázovou molekulou a sledování vzniku fragmentů agrekanu (viz například Hughes et al., Biochem J, 305: 799-804, 1995, Mercuri et al., J. Bio Chem.,
274: 32387-32395, 1999).
V dalším provedení vynález zahrnuje způsoby přípravy inhibitorů agrekanázy a inhibitory takto vytvořené. Tyto inhibitory zabraňují štěpení agrekanu. Způsob mohou vyžadovat stanovení vazebných míst na základě na trojrozměrné struktury agrekanázy a agrekanu a přípravu molekuly reaktivní s vazebným místem. Kandidátské molekuly jsou testovány na inhibiční aktivitu. Odborníkům jsou známy další standardní způsoby přípravy inhibitorů agrekanázové molekuly. Testování • · · · · • · ·· ·· • · · • « ···· ·· ·· inhibitorů zahrnuje kontakt směsi agrekanu a inhibitoru s agrekanázovou molekulou, pak následuje měřením agrekanázové inhibice, například detekcí a měřením fragmentů agrekanu vytvořených štěpením v místě citlivém na agrekanázu.
Další aspekt vynálezu proto poskytuje farmaceutické přípravky obsahující terapeuticky účinné množství inhibitorů agrekanázy ve farmaceuticky přijatelném vehikulu.
Degradace agrekanu v chrupavce zprostředkovaná agrekanázou je zapojena do osteoartritidy a dalších zánětlivých nemocí. Tyto přípravky podle vynálezu mohou být tedy použity v léčbě nemocí charakterizovaných degradací agrekanu a/nebo up-regulací agrekanázy. Přípravky mohou být použity v léčbě těchto chorobných stavů nebo v jejich prevenci.
Vynález zahrnuje způsoby léčení pacientů trpících chorobnými stavy charakterizovanými degradací agrekanu nebo prevence takových chorobných stavů. Tyto způsoby podle vynálezu zahrnují podávání pacientovi, který tuto léčbu potřebuje, účinného množství přípravku obsahujícího inhibitor agrekanázy, který inhibuje proteolytickou aktivitu agrekanázových enzymů.
Ještě dalším aspektem vynálezu jsou DNA sekvence kódující agrekanázový protein (expresi agrekanázového proteinu). Tyto sekvence zahrnují sekvence nukleotidů ve směru 5' ke 3' znázorněné v sekv. id. č. 1 obsahující nukleotid č. 1 až č. 3766 nebo obsahující nukleotid č. 1086 až č. 3396 ze sekv. id. č. 1 nebo sekv. id. č. 3 a DNA sekvence, které jsou díky degeneraci genetického kódu totožné s DNA sekvencí ze sekv. id. č. 1 a sekv. id. č. 3 a kódují agrekanázový protein. Dále jsou v předkládaném vynálezu zahrnuty DNA sekvence, které hybridizují za stringentních podmínek s DNA sekvencí ze sekv. id. č. 1 a sekv. id. č. 3 a kódují protein mající schopnost štěpit agrekan. Výhodné DNA sekvence zahrnují ty, který • · · ·
• · ···· ···« hybridizují za stringentních podmínek (viz T. Maniatis et al., Molecular Cloning (A Laboratory Manual), Cold Spring Harbor Laboratory, 1982, strany 387 až 389). Všeobecně je výhodné, že takové DNA sekvence kódují polypeptid, který je alespoň přibližně z 80 % homologní a výhodněji alespoň přibližně z 90 % homologní se sekvencí uvedenou v sekv. id. č. 3 nebo sekv. id. č. 1 obsahující nukleotid č. 1 až č. 3766 nebo obsahující nukleotid č. 1086 až č. 3396 sekv. id. č. 1. Konečně, v předkládaném vynálezu jsou také zahrnuty alelické nebo jiné variace sekvencí ze sekv. id. č. 1 nebo sekv. id. č. 3, ať už takové změny nukleotidů mají za následek změny peptidové sekvence nebo ne, ale kde peptidová sekvence má stále agrekanázovou aktivitu. Předkládaný vynález také zahrnuje fragmenty DNA sekvence ukázané v sekv. id. č. 1, které kódují polypeptid, který si zachovává aktivitu agrekanázy.
DNA sekvence podle předkládaného vynálezu jsou použitelné například jako sondy pro detekci mRNA kódující agrekanázu v dané buněčné populaci. Předkládaný vynález tedy zahrnuje způsoby detekce nebo diagnózy genetických chorobných stavů týkajících se agrekanázy nebo chorobných stavů týkajících se buněčné, orgánové nebo tkáňové poruchy, ve které je agrekanáza nepravidelně transkribována nebo exprimována. DNA sekvence mohou také být použitelné pro přípravu vektorů pro aplikace genové terapie, jak popsáno níže.
Další aspekt vynálezu zahrnuje vektory obsahující DNA sekvenci, jak byla popsána výše, v operativním spojení s příslušnou kontrolní sekvencí exprese. Tyto vektory mohou být použity v novém způsobu přípravy agrekanázového proteinu podle vynálezu, ve kterém buněčná linie transformovaná DNA sekvencí kódující agrekanázový protein v operativním spojení s příslušnou kontrolní sekvencí exprese, je pěstována ve • · ·«··
vhodném kultivačním médiu a z něj je získán a purifikován agrekanázový protein. Tento postup může používat velký počet známých buněk, jak prokaryotických tak eukaryotických, jako hostitelské buňky pro expresi polypeptidu. Vektory mohou být použity v aplikacích genové terapie. Při takovém použití mohou být vektory transfekovány do buněk pacienta ex vivo a buňky mohou být znovu zavedena pacientovi. Alternativně, vektory mohou být zavedeny pacientovi in vivo prostřednictvím cílené transfekce.
Ještě dalším aspektem vynálezu jsou agrekanázové proteiny nebo polypeptidy. Takové polypeptidy jsou charakterizovány jako mající aminokyselinovou sekvenci zahrnující sekvenci ukázanou v sekv. id. č. 2 nebo 4, varianty aminokyselinové sekvence ze sekv. id. č. 2 nebo 4, včetně přirozeně se vyskytujících alelických variant a dalších variant, ve kterých si protein podrží schopnost štěpit agrekan, což je vlastnost charakteristická pro agrekanázové molekuly. Výhodné polypeptidy zahrnují polypeptid, který je alespoň přibližně z 80 % homologní a výhodněji alespoň přibližně z 90 % homologní s aminokyselinovou sekvencí ukázanou v sekv. id. č. 2 nebo 4. Konečně, v předkládaném vynálezu jsou také zahrnuty alelické nebo další variace sekvencí ze sekv. id. č. 2 nebo 4, ať už jsou takové změny aminokyselin indukované mutagenezí, chemickou alterací nebo alterací DNA sekvence použité pro přípravu polypeptidu, přičemž peptidová sekvence má stále agrekanázovou aktivitu. Předkládaný vynález také zahrnuje fragmenty aminokyselinové sekvence ze sekv. id. č. 2 nebo 4, který si podrží aktivitu agrekanázového proteinu.
Purifikované proteiny podle předkládaného vynálezu mohou být použity pro tvorbu protilátek, buď monoklonálních nebo polyklonálních, proti agrekanáze a/nebo dalším proteinům souvisejících s agrekanázou, s použitím metod, které jsou
* · · ·
známy v oboru tvorby protilátek. Předkládaný vynález tedy také zahrnuje protilátky proti agrekanáze nebo dalším příbuzným proteinům. Protilátky mohou být použitelné pro detekci a/nebo purifikaci agrekanázy nebo příbuzných proteinů nebo pro inhibici nebo prevenci účinků agrekanázy. Agrekanáza podle vynálezu nebo její části může být použita pro přípravu protilátek, které se specificky vážou k agrekanáze.
Podrobný popis vynálezu
Humánní agrekanáza podle předkládaného vynálezu zahrnuje nukleotidovou sekvenci uvedenou v sekv. id. č. 3. V dalším provedení humánní agrekanáza podle předkládaného vynálezu obsahuje nukleotidy č. 1 až č. 3766 nebo nukleotidy č. 1086 až č. 3396 ze sekv. id. č. 1. Sekvence humánního agrekanázového proteinu zahrnuje aminokyselinovou sekvenci uvedenou v sekv. id. č. 4. V dalším provedení sekvence humánního agrekanázového proteinu zahrnuje aminokyseliny č. 1 až č. 770 uvedené v sekv. id. č. 2. Další sekvence agrekanázy podle předkládaného vynálezu mohou být získány s použitím sekvencí ze sekv. id. č. 3 nebo sekv. id. č. 1 obsahující nukleotidy č. 1086 až č. 3396 pro navržení sond pro screening na kompletní sekvenci s použitím standardních technik.
Agrekanázové proteiny podle předkládaného vynálezu zahrnují polypeptidy obsahující aminokyselinovou sekvenci ze sekv. id. č. 2 nebo sekv. id. č. 4 a mající schopnost štěpit agrekan.
Agrekanázové proteiny získané z kultivačního média jsou purifikovány izolací od dalších proteinových látek, se kterými jsou společně vytvářeny a od dalších přítomných kontaminujících složek. Izolované a purifikované proteiny mohou být charakterizovány schopností štěpit agrekanový ·· ♦·♦· id.
č.
tak se substrát. Agrekanázové proteiny poskytované v tomto textu také zahrnují faktory kódované sekvencemi podobnými těm ze sekv. č. 3 nebo sekvenci ze sekv. id. č. 1 obsahující nukleotid 1 až č. 3766 nebo obsahující nukleotid č. 1086 až č. 3396 ze sekv. id. č. 1, ale ve kterých jsou modifikace nebo delece přirozeně se vyskytující (např. alelické změny v nukleotidové sekvenci, které mohou mít za následek aminokyselinové změny v polypeptidu) nebo uváženě geneticky upravené. Například syntetické polypeptidy mohou zcela nebo částečně duplikovat kontinuální sekvence aminokyselinových zbytků ze sekv. id. č. 2 nebo sekv. id. č. 4. Tyto sekvence, na základě sdílení primární, sekundární nebo terciální struktury a konformačních charakteristik s agrekanázovými molekulami, mohou mít s nimi společné biologické vlastnosti. Například je známo, že jsou možné četné substituce konzervativních aminokyselin bez významné modifikace struktury a konformace proteinu, a zachovávají rovněž biologické vlastnosti. Například připouští, že substituce konzervativních aminokyselin mohou být vytvářeny mezi aminokyselinami s bazickými postranními řetězci, jako je například lysin (Lys nebo K) , arginin (Arg nebo R) a histidin (His nebo H) , aminokyselinami s kyselými postranními řetězci, jako je například kyselina asparagová (Asp nebo D) a kyselina glutamová (Glu nebo E), aminokyselinami s polárními postranními řetězci bez náboje, jako je například asparagin (Asn nebo N) , glutamin (Gin nebo Q) , serin (Ser nebo S) , threonin (Thr nebo T) a tyrosin (Tyr nebo Y) a aminokyselinami s nepolárními postranními řetězci, jako, je například alanin (Ala nebo A), glycin (Gly nebo G) , valin (Val nebo V) , leucin (Leu nebo 1) , izoleucin (Ile nebo I), prolin (Pro nebo P), fenylalanin (Phe nebo F) , methionin (Met nebo M) , tryptofan (Trp nebo W) a cystein (Cys nebo C) . Tyto modifikace a delece nativní agrekanázy mohou tedy být použity jako biologicky aktivní náhražky přirozeně se ·· tt ·· 99 9 · • 9 ••99 9«·* vyskytující agrekanázy a při přípravě inhibitorů dalších polypeptidů v terapeutických způsobech. Může být tedy snadno určeno, zda daná varianta agrekanázy si podrží biologickou aktivitu agrekanázy podrobením jak agrekanázy, tak varianty agrekanázy, a také jejích inhibitorů, testům popsaných v příkladech.
Další specifické mutace sekvencí agrekanázových proteinů popisovaných v tomto textu zahrnují modifikace glykosylačních míst. Tyto modifikace mohou zahrnovat 0- nebo N-glykosylační místa. Například nepřítomnost glykosylace nebo pouze parciální glykosylace je důsledkem aminokyselinové substituce nebo delece v rozpoznávacích místech glykosylace spojených s asparaginem. Rozpoznávací místa s asparaginem zahrnují tripeptidové specificky rozpoznávány příslušnými buněčnými glykosylačními enzymy. Tyto tripeptidové sekvence jsou buď asparagin-Xthreonin nebo asparagin-X-serin, kde X je obvykle kterákoliv aminokyselina. Velký počet substitucí nebo delecí aminokyselin v jedné nebo obou první nebo třetí polohy aminokyselin glykosylačního rozpoznávacího aminokyseliny ve druhé poloze) glykosylace spojená sekvence, které jsou místa má za (a/nebo následek delece to, že neproběhne glykosylace v modifikované tripeptidové sekvenci. Kromě toho, bakteriální exprese proteinu příbuzného s agrekanázou má také za následek tvorbu neglykosylovaného proteinu, dokonce i když jsou glykosylační místa nemodifikována.
Předkládaný vynález také zahrnuje nové DNA sekvence, které nejsou asociovány s jinými DNA sekvencemi kódujícími jiné proteiny, a které kódují expresi agrekanázových proteinů. Tyto DNA sekvence zahrnují sekvence ukázané v sekv. id. č. 1 nebo 3 ve směru 5' k 3' a ty sekvence, které s nimi hybridizují v hybridizačních stringentních podmínkách promývání (například ·· ·· »· • ♦ »··· ···· • ····
0,1 x SSC, 0,1% SDS v 65 °C, viz T. Maniatis et al., Molecular Cloning (A Laboratory Manual), Cold Spring Harbor Laboratory, 1982, strany 387 až 389) a kódují protein mající agrekanázovou proteolytickou aktivitu. Tyto DNA sekvence také zahrnují sekvence, které obsahují DNA sekvenci ze sekv. id. č. 1 a ty, které s nimi hybridizují za stringentních podmínek hybridizace a kódují protein, který si podrží další aktivity popsané pro agrekanázu.
Podobně, DNA sekvence, které kódují agrekanázové proteiny kódované sekvencemi ze sekv. id. č. 1 obsahující nukleotid č. 1 až č. 3766 nebo obsahující nukleotid č. 1086 až č. 3396
č. 1 nebo sekvencí ze sekv. proteiny, které zahrnují ze sekv. id agrekanázové sekvenci ze sekv. v sekvenci kodonů id. č. 3 nebo aminokyselinovou liší id. č. 2 nebo 4, ale které se díky degenerací genetického kódu nebo alelickými variacemi (přirozeně se vyskytující změny bází v populaci živočišného druhu, které mohou nebo nemusí mít za následek změnu aminokyselin) , také kódují nové faktory popisované v tomto textu. Variace DNA sekvencí ze sekv. id. č. 3 nebo sekv. id. č. 1 obsahující nukleotid č. 1 až č. 3766 nebo obsahující nukleotid č. 1086 až č. 3396 ze sekv. id. č. 1, které jsou způsobené bodovými mutacemi nebo indukované modifikacemi (včetně inzerce, delece a substituce) pro zesílení aktivity, poločasu nebo produkce kódovaných polypeptidů jsou také zahrnuty ve vynálezu.
Další aspekt předkládaného vynálezu poskytuje nový způsob výroby agrekanázových proteinů. Způsob podle předkládaného vynálezu zahrnuje kultivaci vhodné buněčné linie, která byla transformována DNA sekvencí kódující agrekanázový protein podle vynálezu, pod kontrolou známých regulačních sekvencí. Transformované hostitelské buňky jsou pěstovány a agrekanázové proteiny jsou získávány a purifikovány z kultivačního média.
·· ♦···
Purifikované proteiny jsou v podstatě bez dalších proteinů, se kterými jsou společně vytvářeny, a také bez dalších kontaminujících složek.
Vhodné buňky nebo buněčné linie mohou být savčí buňky, jako například buňky vaječníků čínského křečka (CHO). V oboru je známo, jak provádět selekci vhodných savčích hostitelských buněk a způsobů transformace, kultivace, amplifikace, screeningu, výroby produktů a purifikace. (viz např. Gething a Sambrook, Nátuře, 293: 620-625, 1981 nebo alternativně, Kaufman et al., Mol. Cell. Biol, 5 (7): 1750-1759, 1985 nebo Howley et al., patent Spojených Států č. 4 419 446). Další vhodná savčí buněčná linie, která je popsána v doprovodných příkladech, je opičí buněčná linie COS-1. Mohou také být vhodné savčí buňky CV-1.
Vhodní hostitelé mohou také být bakteriální buňky. Například v biotechnologických oborech jsou jako hostitelské buňky známy různé kmeny E. coli (např. HB101, MC1061). Tímto způsobem mohou také být použity různé kmeny B. Subtilis, Pseudomonas, další mikroorganizmy apod. Pro expresi proteinu v bakteriálních buňkách obecně není nezbytná DNA kódující propeptid agrekanázy.
Odborníkům je známo, že pro expresi polypeptidů podle předkládaného vynálezu mohou být také vhodné různé kmeny kvasinek jakožto hostitelské buňky. Dále, kde je to třeba, mohou být ve způsobu podle předkládaného vynálezu použity jako hostitelské buňky také hmyzí buňky, (viz např. Miller et al., Genetic Engineering, 8: 277-298, Plenům Press, 1986, a odkazy uváděné v tomto textu).
Další aspekt předkládaného vynálezu poskytuje vektory pro použití ve způsobech exprese těchto nových agrekanázových polypeptidů. Výhodně vektory obsahují kompletní nové DNA sekvence popsané výše, které kódují nové faktory podle ·· ···· ·· ·* vynálezu. Dále, vektory obsahují vhodné expresní kontrolní sekvence umožňující expresi agrekanázových proteinových sekvencí. Alternativně, vektory zahrnující modifikované sekvence, jak bylo popsáno výše, jsou také provedením předkládaného vynálezu. Dále, sekvence ze sekv. id. č. 3 nebo sekv. id. č. 1 nebo další sekvence kódující agrekanázové proteiny mohou být manipulována tak, aby exprimovaly složené agrekanázové molekuly. Předkládaný vynález tedy zahrnuje chimérické DNA molekuly kódující obsahující fragment ze sekv. id. č. obsahující nukleotid č. 1 až č,
č. 1086 až č. 3396 ze sekv. id. č. 1 čtecím rámci s DNA sekvencí kódující agrekanázový protein 3 nebo sekv. id. č. 1 3766 nebo obsahující nukleotid spojený ve správném další agrekanázový polypeptid.
Vektory mohou být použity ve způsobu transformace buněčných linií a obsahují vybrané regulační sekvence v operativním spojení s DNA kódující sekvence podle vynálezu, které jsou schopné řídit replikaci a expresi ve vybraných hostitelských buňkách. Regulační sekvence pro takové vektory jsou odborníkům známy a mohou být vybrány v závislosti na hostitelských buňkách. Taková selekce je rutinní a netvoří část předkládaného vynálezu.
Je známo, že různé chorobné stavy, jako je například osteoartritida, jsou charakterizovány degradací agrekanu. Agrekanázový protein podle předkládaného vynálezu, který štěpí agrekan, může být tudíž použitelný pro přípravu inhibitorů agrekanázy. Vynález proto poskytuje přípravky inhibitor agrekanázy. Inhibitory mohou být s použitím agrekanázy ve screeningových testech používajících směs agrekanového substrátu s inhibitorem, a pak následuje expozice agrekanu. Přípravky mohou být použity v léčbě osteoartritidy a dalších chorobných stavů, kdy se projevuje obsahuj ící připraveny
* · t · • * • · · ·· degradace agrekanu.
Vynález dále zahrnuje protilátky, které mohou být použity k detekci agrekanázy a mohou také být použity k inhibici proteolytické aktivity agrekanázy.
Terapeutické způsoby podle vynálezu zahrnují podávání přípravků s inhibitorem agrekanázy topicky, systémově nebo lokálně jako implantát nebo aplikační zařízení. Schéma dávkování je určeno ošetřujícím lékařem s přihlédnutím k různým faktorům, které modifikují účinek agrekanázového proteinu, jako je místo patologie, závažnost onemocnění, pacientův věk, pohlaví a výživa, závažnost zánětu, čas podávání a další klinické faktory. Obecně, systémové podávání nebo podávání v injekci bude započato v dávce, která je minimálně účinná a dávka bude zvyšována po předem zvolené časové období, dokud není pozorován pozitivní účinek. Pak se bude dávka postupně zvyšovat s omezením takových postupných zvýšení na takovou hladinu, která vyvolá odpovídající zvýšení účinku, přičemž se vezme do úvahy každý nepříznivý účinek, který se může objevit. Přidání dalších známých faktorů do konečného přípravku může také ovlivnit dávku.
Postup může být monitorován periodickým hodnocením průběhu onemocnění. Postup může být monitorován například rentgenovým vyšetřením, MRI nebo dalšími zobrazovacími způsoby, analýzou synoviální tekutiny a/nebo klinickým vyšetřením.
Následující příklady objasní praxi předkládaného vynálezu izolací a charakterizací humánní agrekanázy a dalších agrekanáze příbuzných proteinů, získání humánních proteinů a expresí proteinů pomocí rekombinantních technik.
·· 9· • * · « • ♦ • · • · ······«· ·* *· ···· • * · · · . - · · · » r · t t • · · · · * ···· ·< 99
Příklady provedení vynálezu
Příklad 1
Izolace DNA
Potenciální noví příslušníci rodiny agrekanázy byli identifikováni s použitím přístupu screeningu databází. Agrekanáza-1 (Science, 284: 1664-1666, 1999) má alespoň šest katalytická doména, kyseliny (E). také rozhodující domén: signální, propeptidová, disintegrinová, doména tsp a c-koncová doména. Katalytická doména obsahuje úsek s motivem pro vazbu zinku, TAAHELGHVKF a MET otáčku, které jsou zodpovědné za proteázovou aktivitu. Substituce v zinkovém vazebném úseku ve velkém počtu poloh stále umožňují proteázovou aktivitu, ale musí být přítomné zbytky histidinu (H) a glutamové
Trombospondinová doména Agrekanázy-1 je doména pro rozpoznávání a štěpení substrátu. Jsou to právě tyto dvě domény, které určují příslušnost nového příslušníka k rodině agrekanázy, podle názoru původců vynálezu. Proteinová sekvence dedukovaná z DNA sekvence Agrekanázy-1 byla použita k dotazu v GeneBank EST zaměřeném na humánní EST s použitím TBLASTN. Výsledné sekvence byly výchozí bod v úsilí identifikovat kompletní sekvenci pro potenciální příslušníky rodiny. Nukleotidová sekvence agrekanázy podle předkládaného vynálezu je složena z jednoho EST (AA588434), který obsahuje homologii v průběhu katalytické domény a zinkového vazebného motivu Agrekanázy-1 (ADAMTS4).
Tato sekvence humánní agrekanázy byla izolována z cDNA knihovny konstruované v plazmidovém vektoru pED6-dpc2 užitím dT-primeru. CDNA byla získána z RNA humánních varlat zakoupené • · · · · · od firmy Clontech. Sonda pro izolaci agrekanázy podle předkládaného vynálezu byla vytvořena ze sekvence získané z hledání v databázích. Sekvence sondy byla takováto:
5'-GGTCAAATCGCGTCAGTGTAAATACGGG-3' .
DNA sonda byla radioaktivně značena 32P a použita ke screeningu cDNA knihovny (s dT-primerem) z humánních varlat ve vysoce stringentních podmínkách pro hybridizaci/promytí, aby se rozpoznaly klony obsahující humánní kandidátskou sekvenci
č. 8.
Padesát tisíc transformant z knihovny bylo naneseno na misky v denzitě přibližně 5000 transformant na misku na 10 misek. Otisky transformovaných kolonií na nitrocelulózové membráně byly hybridizovány s DNA sondou značenou 32P ve standardním hybridizačním pufru (1 x Blotto (25 x Blotto = 5% odtučněné sušené mléko, 0,02% azid v dH2O) + 1% NP-40 + 6 x SSC +0,05% pyrofosforečnan) ve vysoce stringentních podmínkách (65 °C po dobu 2 hodin za třepání) . Po 2 hodinách hybridizace byl hybridizační roztok obsahující radioaktivně značenou DNA sondu odstraněn a filtry byly promyty ve vysoce stringentních podmínkách (3 x SSC, 0,05% pyrofosforečnan po dobu 5 minut při teplotě místnosti, následoval roztok 2,2 x SSC, 0,05% pyrofosforečnan po dobu 15 minut při teplotě místnosti, následoval roztok 2,2 x SSC, 0,05% pyrofosforečnan po dobu 1 až 2 minut v 65 °C) . Filtry byly zabaleny ve fólii Saran Wrap a exponovány proti rentgenovému filmu přes noc. Autoradiogramy byly vyvolány a pozitivně hybridizující transformanty s různou intenzitou signálu byly identifikovány. Tyto pozitivní klony byly vybrány, pěstovány po dobu 12 hodin v selektivním médiu (L-živné médium plus 100 gg/ml ampicilin) a naneseny na misky v nízké denzitě (přibližně 100 kolonií na destička). Nitrocelulózové repliky kolonií byly hybridizovány se sondou značenou 32P ve standardním hybridizačním pufru ( (1 x Blotto (25 x Blotto = 5% odtučněné sušené mléko, 0,02% azid v dH2O) + 1% NP-40 + 6 x SSC +0,05% pyrofosforečnan) ve vysoce stringentních podmínkách (65 °C po dobu 2 hodin). Po 2 hodinách hybridizace byl hybridizační roztok obsahující radioaktivně značenou DNA sondu odstraněn a filtry byly promyty ve vysoce stringentních podmínkách (3 x SSC, 0,05% pyrofosforečnan po dobu 5 minut při teplotě místnosti, následoval roztok 2,2 x SSC, 0,05% pyrofosforečnan po dobu 15 minut při teplotě místnosti, následoval roztok 2,2 x SSC, 0,05% pyrofosforečnan po dobu 1 až 2 minut v 65 °C) . Filtry byly zabaleny ve fólii Saran Wrap a exponovány proti rentgenovému filmu přes noc. Autoradiogramy byly vyvolány a pozitivně hybridizující transformanty byly identifikovány. Byly vytvořeny bakteriální zásobní roztoky purifikovaných hybridizačně pozitivních klonů a byla izolována plazmidová DNA. Byla určena sekvence cDNA inzertu a je uvedena v sekv. id. č. 1 od nukleotid č. 1086 (TCG) do č. 3396 (CGC) . Tato sekvence byla uložena v American Type Culture Collection 10801 University Blvd. Manassas, VA 20110-2209, USA, jako PTA-2284. Inzert cDNA obsahoval sekvence DNA sondy použité v hybridizaci. Sekvence s 5'-primerem a 3'-primerem této izolované sekvence pak byly extrahovány s použitím RACE protokolu. Plně určená sekvence je uvedena v sekv. id. č. 1 od nukleotidu č. 1 do č. 3766.
Získaná humánní kandidátská sekvence č. 8 byla porovnána s několika EST ve veřejné databázi. Kandidát Č. 8 vykazuje homologii s ADAMTS 7 a 6. Agrekanáza podle předkládaného vynálezu obsahuje motiv s vazebným úsekem pro zinek, MET otáčku a motiv tsp typu-1, nicméně postrádá signální a propeptidový úsek a C-koncové oddělovací („spacer) úseky. Je to díky těmto kritériím, že kandidát č. 8 je považován za nového příslušníka rodiny agrekanáz.
Agrekanázová sekvence podle vynálezu může být použita pro design sond pro další screening kompletních klonů obsahujících izolovanou sekvenci.
Konce 5P (signální a propeptidový) a 3P (C-koncové spacerové úseky) kompletní verze EST8 byly určeny pomocí metody RACE PCR s použitím soupravy Clontech Marathon cDNA Amplification Kit. Jako substráty pro RACE reakce byla použita cDNA varlat a žaludku ze zdrojů Marathon. 5P RACE primery použité v reakcích byly:
GSP1 - AGTCTAGAAAGCTGGTGATGTAGTCACGGC a
GSP2 - TAGATGCATATGTCATAGCGTGTGATGAGCACTGC (obsahuje místo Nsil).
Souprava Advantage-2 PCR Kit od firmy Clontech byla použita k sestavení „sdružených RACE reakcí („nested RACE) podle instrukcí v uživatelské příručce pro Marathon cDNA Amplification Kit, množství použitých GSP primerů bylo 0,2 pmol/μΐ každého PCR primeru/μΐ reakční směsi. GSP1 primer byl použit pro první kolo PCR a GSP2 primer byl použit pro sdružené reakce. Produkty ze sdružených RACE reakcí byly štěpeny s Nsil (na GSP2 primeru) a Notl (na AP2 primeru poskytovaném v soupravě od firmy Clontech a použitém ve sdružené reakci RACE PCR) a ligovány do CS2+ vektoru štěpeného s Nsil a Notl. Ligované produkty byly transformovány do buněk ElectroMAX DH10B od firmy Life Technologies.
Klonované RACE produkty byly naneseny na misky v nízké denzitě (přibližně 300 kolonií na misce). Nitrocelulózové otisky transformovaných kolonií byly hybridizovány s DNA sondou značenou 32P ve standardním hybridizačním pufru (lx Blotto (25 x Blotto =5% odtučněné sušené mléko, 0,02% azid), 1% NP-40, 6 x SSC, 0,05% pyrofosforečnan) ve vysoce stringentních podmínkách (65 °C po dobu 2 hodin za
třepání). Sekvence na 5P konci kandidátské 8-1 byla použita jako DNA sonda:
CTCGAGTCTGGGAAGCACCGTTAACATCC.
Po 2 hodinách byl hybridizační roztok (hybridizační pufr obsahující 1 x 106 cpm DNA sondy značené 32P) odstraněn a filtry byly promyty ve vysoce stringentních podmínkách (3 x SSC, 0,05% pyrofosforečnan po dobu 5 minut při stání při teplotě místnosti, následoval roztok 2,2 x SSC, 0,05% pyrofosforečnan po dobu 15 minut třepání při teplotě místnosti, následoval roztok 2,2 x SSC, 0,05% pyrofosforečnan po dobu 1 až 2 minut za třepání v 65 °C) . Filtry byly pokryty fólií Saran Wrap a exponovány proti rentgenovému filmu přes noc. Autoradiogramy byly vyvolány a pozitivně hybridizující transformanty s různou intenzitou signálu byly identifikovány. Tyto pozitivní klony byly vybrány, a pak pěstovány po dobu 12 hodin v selektivním médiu (L-živné médium, plus 100 gg/ml ampicilin). Plazmidová DNA byla připravena a poslána na analýzu DNA sekvence. Druhé kolo hybridizací bylo prováděno s použitím sondy, která byla vytvořena pro sekvenci dále k 5P než kandidátská 8-1. Sekvence DNA sondy byla vydedukovaná z produktů 5P RACE. Sekvence druhé sondy byla následující:
GAAGGCGATCTCATAGCTCTCCAGACT.
Klonované RACE produkty byly znovu naneseny na misky a byl následován stejný hybridizační protokol, kromě použití sondy více 5P. Iniciační Met byl dedukován z kanonické sekvence pocházející z 5P RACE produktů tvořených jak z cDNA varlat tak cDNA žaludku. Byly použity 3P RACE primery,
GSP1-GCTCTAGACTGGTCTGAGTGCACCCCCAGCT a
GSP2- GTCCTTTGCAAGAGCGCAGACCAC.
Souprava Advantage GC-2 PCR Kit od firmy Clontech byla použita pro přípravu sdružených RACE reakcí. Reakce byly
připraveny podle instrukcí v uživatelské příručce pro soupravu Marathon cDNA Amplifícation Kit, s výjimkou toho, že použité množství „roztátých GC bylo 5 μΐ na 50 μΐ reakce, množství použitých GSP primerů bylo 0,2 pmol/μΐ každého PCR primeru/μΐ reakční směsi. Pro první kolo PCR byl použit GSP1 primer a pro sdružené reakce byl použit GSP2 primer. Produkty ze sdružených RACE reakcí byly ligovány do pT-Adv vektoru s použitím soupravy AdvanTAge PCR Cloning Kit, podle instrukcí výrobce. Ligované produkty byly transformovány do buněk ElectroMAX DH10B od firmy Life Technologies. Klonované RACE produkty byly naneseny na misky v nízké denzitě (přibližně 300 kolonií na misku). Nitrocelulózové otisky transformovaných kolonií byly hybridizovány s DNA sondou značenou 32P ve standardním hybridizačním pufru (1 x Blotto (25 x Blotto = 5% odtučněné sušené mléko, 0,02% azid), 1% NP-40, 6 x SSC, 0,05% pyrofosforečnan) ve vysoce stringentních podmínkách (65 °C po dobu 2 hodin za třepání). Sekvence na 3P konci kandidátské sekvence 8-1 byla použita jako DNA sonda:
GCACTGTGCAGAGCACTCACCCCA.
Po 2 hodinách byl hybridizační roztok (hybridizační pufr obsahující lxlO6 cpm DNA sondy značené 32P) odstraněn a filtry byly promyty ve vysoce stringentních podmínkách (3 x SSC, 0,05% pyrofosforečnan při stání po dobu 5 minut při teplotě místnosti, následoval roztok 2,2 x SSC, 0,05% pyrofosforečnan po dobu 15 minut za třepání při teplotě místnosti, následoval roztok 2,2 x SSC, 0,05% pyrofosforečnan po dobu 1 až 2 minut za třepání v 65 °C) . Filtry byly přikryty fólií Saran Wrap a exponovány proti rentgenovému filmu přes noc. Autoradiogramy byly vyvolány a byly identifikovány pozitivně hybridizující transformanty s různou intenzitou signálu. Pozitivní klony byly vybrány, a pak pěstovány po dobu 12 hodin v selektivním médiu (L-živné médium plus 100 pg/ml ampicilin). Plazmidová DNA ·· ·· 9 ·· 999999 • · · 99 9 9 ·· ·
9 9 9 9 9 9 byla připravena a poslána na analýzu DNA sekvence. Stop kodon byl vydedukován z kanonické sekvence derivované z 3P RACE produktů tvořených jak z cDNA varlat tak cDNA žaludku.
S výjimkou úseku od páru bází 1332 až 1517 (pro tento popis pár bází č. 1 je A iniciačního kodonu Met (ATG), byla potvrzena kompletní sekvence EST8. Prohledávání veřejně přístupných databází odhalilo parciální sekvenci pro EST8, nazývanou ADAMTS10. Původci použili sekvenci z tohoto parciálního klonu pro konstrukci sousedícího úseku jejich EST8 (pár bází 1332 až 1517) se syntetickými oligonukleotidy.
Kompletní sekvence pro EST8 (sekv. id. č. 3) byla kanonická sekvence pocházející z hybridizačně pozitivní kandidátské sekvence 8-1, veřejně dostupné sekvence reprezentující EST8 a PCR produktů z cDNA varlat a žaludku firmy Clontech. Konečný EST8 expresní konstrukt byl sestaven ze 4 EST8 specifických fragmentů. 5P část EST8, od páru bází 1 až 1342 byla amplifikována PCR z poolu cDNA žaludku a varlat a je nazývána fragment 1. Byly použity následující primery:
5P PCR primerAAATGGGCGAATTCCCACCATGGCTCCCGCCTGCCAGATCCTCCG (obsahuj e spojovací sekvenci s 8 páry bází (AAATGGGC), klonovací místo EcoRI (GAATTC) a Kozákovu sekvenci (CCACC) v protisměru od iniciáčního Met) a 3P PCR primer CCGAGTCTAGAAAGCTGGTGATGTAG (obsahuje místo Xbal (TCTAGA)). Tento PCR produkt byl štěpen s EcoRI a Xbal s použitím standardních podmínek štěpení.
Další část genu, fragment 2, byl konstruován s použitím syntetických oligonukieotidů. Syntetický fragment se rozprostíral od místa Xbal k místu BsrFI a reprezentuje páry bází 1333 až 1517 z EST8. Syntetické oligonukleotidy se
skládaly z následující sekvence: horní vlákno se skládá z
CTAGACTCGGGCCTGGGGCTCTGCCTGAACAACCGACCCCCCAGACAGGACT
TTGTGTACCCGACAGTGGCACCGGGCCAAGCCTACGATGCAGATGAGCAATG
CCGCTTTCAGCATGGAGTCAAATCGCGTCAGTGTAAATACGGGGAGGTCTGC
AGCGAGCTGTGGTGTCTGAGCAAGAGCAA, spodní vlákno se skládá z
CCGGTTGCTCTTGCTCAGACACCACAGCTCGCTGCAGACCTCCCCGTATTTAC
ACTGACGCGATTTGACTCCATGCTGAAAGCGGCATTGCTCATCTGCATCGTAG
GCTTGGCCCGGTGCCACTGTCGGGTACACAAAGTCCTGTCTGGGGGGTCGGTT
GTTCAGGCAGAGCCCCAGGCCCGAGT.
Další část EST8, fragment 3, byl BsrFI až Sphl fragment štěpený z kandidátské sekvence 8-1. Byl reprezentován od páru bází 1518 do 2783 z kompletní verze EST8. 3P část EST8, nazývaná fragment 4 (páry bází 2663 až 3314) , byla amplifikována PCR. Byly použity následující primery:
5P-GGGTTGTAGGGAACTGGTCGCTCTG (lokalizovány ve fragment 3, v protisměru místa Sphl) a 3P-AAATGGGCCTCGAGCCCTAGTGGCCCTGGCAGGTTTTGC (obsahuje spojovací sekvenci o 8 párech bází (AAATGGGC) a místo Xhol (CTCGAG) po směru od stop kodonu (TAG)).
Tento PCR produkt byl štěpen Sphl a Xhol s použitím standardních podmínek štěpení. Kompletní verze EST8 byla konstruována ligací těchto 4 popsaných fragmentů, 5P fragment 1 (EcoRI/Xbal), vnitřní fragment 2 (Xbal/BsrFI), vnitřní fragment 3 (BsrFI/Sphl) a 3P fragment 4 (SphI/Xhol) do Cos expresního vektoru pED6-dpc2 (štěpen EcoRI a Xhol). Konečný konstrukt měl mutaci v klonovacím místě Xhol, které bylo zničeno v ligací. To neovlivnilo EST8 kódující sekvenci a bylo ponecháno v konstruktu.
·· ··· ·
Přiklad 2
Exprese agrekanázy
Aby bylo možné tvořit proteiny příbuzné agrekanáze myšího původu, humánního původu nebo původu od další savců, byla kódující DNA přenesena do vhodného expresního vektoru a ten byl zaveden do savčích buněk nebo dalších výhodných eukaryotických nebo prokaryotických hostitelů včetně hmyzích hostitelských tkáňových kultivačních systémů obvyklými technikami genetického inženýrství. Předpokládá se, že expresní systém pro biologicky účinnou rekombinantní humánní agrekanázu jsou trvale transformované savčí buňky, hmyzí buňky, kvasinky nebo bakterie.
Odborník je schopen konstruovat savčí expresní vektory použitím sekvence ze sekv. id. č. 3 nebo sekvence ze sekv. id. č. 1 obsahující nukleotid č. 1 až č. 3766 nebo obsahující nukleotid č. 1086 až č. 3396 ze sekv. id. č. 1 nebo další DNA sekvence kódující proteiny příbuzné agrekanáze nebo další modifikované sekvence a známé vektory, jako je například pCD (Okayama et al., Mol. Cell Biol, 2: 161-170, 1982), pJL3, pJL4 (Gough et al., EMBO J., 4: 645-653, 1985) a pMT2 CXM.
Savčí expresní vektor pMT2 CXM je derivát p91023(b) (Wong et al., Science 228: 810-815, 1985) lišící se od druhého uvedeného v tom, že obsahuje gen rezistence na ampicilin v místě genu rezistence na tetracyklin a dále obsahuje místo Xhol pro inzerci cDNA klonů. Funkční prvky pMT2 CXM. byly popsány (Kaufman, R. J, 1985, Proč. Nati. Acad. Sci. USA, 82: 689-693) a zahrnují adenovirové VA geny, SV40 replikační počátek včetně enhanceru o velikosti 72 bp, adenovirový hlavní • · ··· ·
• · · · ·· ·· pozdní promotor včetně 5' sestřihového místa a většinu adenovirové tripartitiní vedoucí sekvence přítomné na adenovirové pozdní mRNA, 3' sestřihové akceptorové místo, DHFR inzert, SV40 místo časné polyadenylace (SV40) a pBR322 sekvence potřebné pro pomnožení v E. coli.
Plazmid pMT2 CXM je získán EcoRI štěpením z pMT2-VWF, který byl uložen v American Type Culture Collection (ATCC), Rockville, MD (USA) pod přístupovým číslem ATCC 67122. Štěpení EcoRI vystřihne cDNA inzert přítomný v pMT2-VWF, poskytující pMT2 v lineární formě, který může být ligován a použit ke transformaci E. coli HB 101 nebo DH-5 pro získání ampicilinové rezistence. Plazmidová pMT2 DNA může být připravena obvyklými metodami. Pak je pMT2 CXM konstruován s využitím postupu mutageneze „loopout/in (Morinaga, et al., Biotechnology 84: 636, 1984) . Tímto postupme se odstraní báze 1075 až 1145 relativně k místu HindlII blízko SV40 replikačního počátku a enhancerových sekvencí pMT2. Kromě toho se vloží následující sekvence
5' PO-CATGGGCAGCTCGAG-3' v místě nukleotidu 1145. Tato sekvence obsahuje rozpoznávací místo pro restrikční endonukleázu Xhol. Derivát pMT2CXM, nazývaný pMT23, obsahuje místa rozpoznávání pro restrikční endonukleázy Pstl, EcoRI, Sáli a Xhol. Plazmid pMT2 CXM a pMT23 DNA mohou být připraveny obvyklými metodami. ΡΕΜΟ2β1 pocházející pMT21 může také být vhodný v praxi vynálezu. pMT21 je derivován z pMT2, který je derivován z pMT2-VWF. Jak bylo popsáno výše, štěpení EcoRI odstraní cDNA inzert přítomný v pMT-VWF, za vzniku pMT2 v lineární formě, která může být ligována a použita ke transformaci E. Coli HB 101 nebo DH-5 pro získání ampicilinové rezistence. Plazmidová pMT2 DNA může být připravena obvyklými metodami.
·· ··»· ·9 · ·· • · · · ·· · · • · · · • · · · · • · · ·
ΡΜΤ21 je derivován z pMT2 pomocí následujících dvou modifikací. Jako první je odstraněn úsek o velikosti 76 bp z 5' netranslatované oblasti DHFR cDNA zahrnující úsek 19 G zbytků z G/C úseku („tailing) pro cDNA klonování. Při tomto postupu je vloženo Xhol místo za zisku následující sekvence ihned v protisměru od DHFR:
5'- CTGCAGGCGAGCCTGAATTCCTCGAGCCATCATG-3'
Pstl EcoRI Xhol
Za druhé, unikátní Clal místo je zavedeno štěpením s EcoRV a Xbal, ošetřením s Klenowovým fragmentem DNA polymerázy I a ligací k Clal spojovací sekvenci (CATCGATG). Toto odstraní segment o velikosti 250 bp z úseku RNA (VAI) asociovaného adenoviru, ale neinterferuje s expresí nebo funkcí VAI RNA genu. pMT21 je štěpen s EcoRI a Xhol a použit pro derivaci vektoru pEMC2B 1.
Část EMCV vedoucí sekvence byla získána z pMT2-ECATl (S. K. Jung, et al., J. Virol, 63: 1651-1660, 1989) štěpením s EcoRI a Pstl, což mělo za následek fragment o velikosti 2752 bp. Tento fragment byl štěpen s Taql za vzniku EcoRI-Taql fragmentu o velikosti 508 bp, který byl purifikován elektroforézou na agarózovém gelu s nízkou teplotou tání. Adaptér o velikosti 68 bp a jeho komplementární vlákno byly syntetizovány s přečnívajícím koncem 5' Taql a přečnívajícím koncem 3' Xhol, které mají následující sekvenci:
5'-CGAGGTTAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTT
Taql
GAAAAACACGATTGC-3'
Xhol »* *·*·
Tato sekvence odpovídá vedoucí sekvenci EMC viru od nukleotidu 7 63 do 827. Mění také ATG v poloze 10 ve vedoucí sekvenci EMC viru na ATT a je následována Xhol místem. Trojitá ligace fragmentu pMT21 EcoRI-16hoI, fragmentu EcoRI-Taql EMC viru a oligonukleotidového adaptéru o velikosti 68 bp Taql16hol adaptéru měla za následek vektor ρΕΜ02β1.
Tento vektor obsahuje SV40 replikační počátek a enhancer, adenovirový hlavní pozdní promotor, cDNA kopii většiny adenovirové tripartitní vedoucí sekvence, malou hybridní intervenující sekvenci, SV40 polyadenylační signál a adenovirový gen VAI, markéry DHFR a β-laktamázu a EMC sekvenci, v patřičném vztahu pro řízení vysoké hladiny exprese požadované cDNA v savčích buňkách.
Konstrukce vektorů může zahrnovat modifikaci DNA sekvencí příbuzných agrekanáze. Například cDNA agrekanázy může být modifikována odstraněním nekódujících nukleotidů na 5' a 3' koncích kódujícího úseku. Odstraněné nekódující nukleotidy mohou nebo nemusí být nahrazeny dalšími sekvencemi, u kterých je znám jejich přínos pro expresi. Tyto vektory jsou transformovány do vhodných hostitelských buněk pro expresi proteinů příbuzných agrekanáze. Dále, sekvence ze sekv. id. č. 3 nebo sekv. id. č. 1 obsahující nukleotid č. 1 až č. 37 66 nebo obsahující nukleotid č. 1086 až č. 3396 ze sekv. id. č. 1 nebo dalších sekvencí kódujících proteiny příbuzné agrekanáze mohou být manipulovány tak, aby exprimovaly zralý protein příbuzný agrekanáze odstraněním propeptidových sekvencí kódujících agrekanázu a jejich nahrazením sekvencemi kódujícími kompletní propeptidy jiných agrekanázových proteinů.
Odborník může manipulovat sekvence ze sekv. id. č. 3 nebo sekv. id. č. 1 eliminací nebo nahrazením savčích regulačních sekvencí ohraničujících kódující sekvenci bakteriálními •9 999* >9 r · · · · • «9 9 9999 9
9 99 9999
9999 9999 9«* 9999 99 «9 sekvencemi za vzniku bakteriálních vektorů pro intracelulární nebo extracelulární expresi bakteriálními buňkami. Například kódující sekvence mohou být dále manipulovány (např. ligovány k dalším známým linkerům nebo modifikovány delecí nekódujících sekvencí nebo změnami nukleotidů dalšími známými technikami). Modifikované sekvence kódující proteiny příbuzné agrekanáze mohou pak být vloženy do známého bakteriálního vektoru s použitím postupů, jako jsou například popsány v práci autorů T. Taniguchi et al., Proč. Nati Acad. Sci. USA, 77: 5230-5233, 1980. Tento příkladný bakteriální vektor může pak být transformován do bakteriálních hostitelských buněk a jimi může být exprimován protein příbuzný agrekanáze. Pro strategii produkce extracelulární exprese proteinů příbuzných agrekanáze v bakteriálních buňkách, viz např. evropskou patentovou přihlášku EPA 177 343.
Podobné manipulace mohou být prováděny pro konstrukci hmyzího vektoru (viz např. postupy popsané v publikované evropské patentové přihlášce 155 476) pro expresi v hmyzích buňkách. Může také být zkonstruován kvasinkový vektor používající kvasinkové regulační sekvence pro intracelulární nebo extracelulární expresi faktorů podle předkládaného vynálezu kvasinkami. (Viz např. postupy popsané v publikované PCT přihlášce W086/00639 a evropské patentové přihlášce EPA 123 289).
Způsob přípravy vysokých hladin proteinů příbuzných agrekanáze podle vynálezu v savčích, bakteriálních, kvasinkových nebo hmyzích hostitelských buněčných systémech může zahrnovat konstrukci buněk obsahujících mnohonásobné kopie heterologního genu příbuzného agrekanáze. Heterologní gen je spojen s amplifikovatelným markérem, např. genem dihydrofolátreduktázy (DHFR), díky kterému mohou být buňky obsahující zvýšený počet kopií genu selektovány pro propagaci
ve zvyšující se koncentraci metotrexátu (MTX) podle postupů autorů Kaufman a Sharp, J. Mol. Biol, 159: 601-629, 1982. Tento přístup může být používán s velkým počtem různých buněčných typů.
Například plazmid obsahující DNA sekvenci proteinu příbuzného agrekanáze podle vynálezu v operativním spojení s dalšími plazmidovými sekvencemi umožňujícími jeho expresi a DHFR expresní plazmid pAdA26SV (A) 3 (Kaufman a Sharp, Mol. Cell. Biol, 2: 1304, 1982) mohou být společně zavedeny do DHFR-deficitních CHO buněk, DUKX-BII, různými metodami včetně koprecipitace fosforečnanem vápenatým a transfekce, elektroporace nebo fúzí protoplastů. Transformanty exprimující DHFR jsou selektovány růstem v alfa médiu s dialyzovaným fetálním telecím sérem a následně selektovány pro amplifikaci růstem ve zvyšujících se koncentracích MTX (např. postupně v 0,02, 0,2, 1,0 a 5μΜ MTX) (jak bylo popsáno v práci Kaufman et al., Mol Cell Biol., 5: 1750, 1983). Transformanty jsou klonovány a exprese biologicky aktivní agrekanázy je monitorována testy popsanými výše. Exprese agrekanázového proteinu by se měla zvyšovat se stoupajícími hladinami MTX rezistence. Agrekanázové polypeptidy jsou charakterizovány s použitím standardních technik v oboru známých, jako je například pulsové značení [35S]-methioninem nebo cysteinem a elektroforéza v polyakrylamidovém gelu. Podobné postupy mohou být sledovány za vzniku dalších proteinů příbuzných agrekanáze.
V jednom příkladu agrekanázový gen podle předkládaného vynálezu uvedený v sekv. id. č. 3 je klonován do expresního vektoru pED6 (Kaufman et al., Nucleic Acid Res. 19: 448854490, 1991) . Buňky COS a CHO DUKX Bil jsou přechodně transfekovány agrekanázovou sekvencí podle vynálezu (+/- kotransfekce PÁCE v samostatném pED6 plazmidu) lipofekcí
(LF2000, Invitrogen). Dvojité transfekce jsou prováděny pro každý požadovaný gen: (a) první pro sklízení kondicionovaných médií pro test aktivity a (b) druhá pro metabolické značení 35S-methioninem/cysteinem.
První den jsou média změněna na média DME(COS) nebo alfa(CHO) + 1% fetální telecí sérum inaktivované teplem +/- 100 gg/ml heparinu do jamek (a), které budou sklízeny pro test aktivity. Po 48 hodinách (den 4) jsou kondicionovaná média sklízena pro test aktivity.
Třetí den byla média ve dvojitých jamkách (b) změněna na médium MEM (bez methioninu/bez cysteinu) + 1% fetální telecí sérum inaktivované teplem + 100 μρ/ml heparinu + 100 μθί/ιη1 35S-methioninu/cysteinu (Redivue Pro mix, Amersham) . Po 6 hodinách inkubace ve 37 °C byla kondicionovaná média sklízena a byla prováděny gely SDS-PAGE v redukčních podmínkách. Proteiny byly vizualizovány autoradiogramy.
Příklad 3
Biologická aktivita exprimované agrekanázy
Pro měření biologické aktivity exprimovaných proteinů příbuzných agrekanáze získaných v příkladu 2 výše, byly proteiny získány z tkáňové kultury a purifikovány izolací proteinů příbuzných agrekanáze od dalších proteinových látek, se kterými jsou společně vytvářeny, a také od dalších kontaminujících složek. Purifikovaný protein může být testován v souladu s testy popsanými výše. Purifikace je prováděna s použitím standardních technik odborníkům známých.
Analýza proteinů je prováděna s použitím standardních technik, jako je například elektroforéza v SDS-PAGE polyakrylamidovém gelu (Laemmli, Nátuře 227: 680, 1970), obarvením stříbrem (Oakley, et al. Anal. Biochem. 105: 361, 1980) a imunobloty (Towbin, et al. Proč. Nati. Acad. Sci. USA 76: 4350, 1979).
Předcházející popisy uvedly detailně výhodná provedení předkládaného vynálezu. Lze očekávat, že odborníky napadnou po zvážení tohoto popisu četné modifikace a změny v praxi vynálezu. Avšak tyto modifikace a variace jsou zahrnuty ve vynálezu definovaném v připojených patentových nárocích.
SEZNAM SEKVENCÍ <210> 1 <211> 3766 <212> DNA <213> neznámý <400> 1 gcggccgctg aafctctaggg aggccccggg aaggcccaga gagggaggcc caggtgcagg cccaacacta ctccaccaac cgaagccccc tgaacagggg aggcggcact gtgggggctg gacaogtggc ctctatggct cccgcctgcc tgggcctcat gttcgaggtc acgcacgcct tggagagcta tgagatcgcc ttccccaccc tctegccaec tcctccccgg aggcagcgcc tcttctacaa agtggcctcg cccagcaccc gtctactggc agggcacgtc tccgtggagt gggcggcccg gccccactgc ctctacgctg atgtggccat cagcacctgt ggaggcctgc acctgattga gcccctgcac ggfcgggccca cacatgtggt gtacaagcgt tcctctctgc tgagagatga gaaaccgtgg aaagggcggc ctgccaggcc cctggggaat gaaacagagc gccgagageg etacgtggag accctggtgg ggcgccggga tgtggagcag tatgtcctgg aggactcgag tctgggaagc accgttaaca aggaccagcc cactctggag atcacccacc agtggcagaa atccatcgtg aaccacagcg tggctaacca tgacacagca gtgctcatca aaccctgcgg cacactaggc ctggccccgg gcagcgtcaa tgaggacatt ggcctggcca acacattcgg catgaaccat gacggcgtgg cagccaagct catggctgcc cacattacca gcagccgtga ctacatcacc agctttctag cggcccccca gacaggactt tgtgtacccg gatgagcaat gccgctttca gcatggagtc gcagcgagct gtggtgtctg agcaagagca ccgagggcac gctgtgccag acgcacacca gtgtcccctt tgggtcgcgc ccagagggtg ggggcgactg cagccggacc tgtggcggcg gccccaggcc aaccatcggg ggcaagtact gcaacacgga tgactgfcccc cctggctccc ttgacagcat ccctttccgt gggaaattct tgaaggcctg ctcgctcacg tgcctagcgg cagccgtggt ggacgggaca ccctgccgtc aatgcaagca cgtgggctgc gaccgagtcc gagtgtgtgg cggtgacggc agtgcctgcg cacctggggc cgggtacgag gatgtcgtct tccaggatcfc gaacctctct ctcagtcact tgctggaggg gctgcccggg accccccagc ttcaactgcg acaggggcca gaccaggtcc catctctcat cgtcatggtg cfcggcccgga atgcccccat cgcccgtgac tcgctgcccc agtgctcggc ócagtgtgca ggcggtagcc cgcggcgcag gctccaaaga agaagaaacc 60 gagcaggcga gggaaggatc cgtacagggg 120 aaaaggagcc oggtgatgct gcgaaggctg 180 ccggcagccg gggctgggga gagacatgtg 240 agatcctccg ctgggccctc gccctggggc 300 tccggtctca agatgagttc ctgtccagtc 360 gcgtggacca caacggggca ctgcfcggcct 420 gcggcacggg ggccacagcc gagtcccgcc 480 acttcctgct gaacctgacc cgcagctccc 540 actggacacg ggagggcctg gcctggcaga 600 gtcacctgca gggccaggcc agcagctccc 660 acggcctgat cgtggcagac gággaagagt 720 agggttctcg gagcccggag gaaagtggac 780 gtcaccccca cctggacaca gcctgtggag 840 catggfcggcfc gcggaccttg aagccaccgc 900 gtggccagcc aggcctgaag cgatcggtca 960 tggctgacaa gatgatggtg gcctatcacg 1020 ccatcatgaa cattgttgcc aaacttttcc 1080 tcctcgtaac tcgcctcatc ctgotcacgg 1140 atgccgggaa gtccctggaG agcttctgta 1200 gccatggcaa tgccattcca gagaacggtg 1260 cacgctatga catctgcatc tacaagaaca 1320 tgggcggaat gtgtgagcgc gagagaagct 1380 cagcgttcac catfcgcccac gagatcgggc 1440 gaaacagctg tggggcccgt ggtcaggacc 1500 tgaagaccaa cccattcgtg tggtcatcct 1560 actcagggac tggggctctg cctgaacaaa 1620 acagtggcae cgggccaagc ctacgatgca 1680 aaatcgcgtc agtgtaaata cgggaggtct 1740 accggtgcat caccaacagc atcccggccg 1800 tcgacaaggg gtggtgctac aaacgggtct 1860 tggacggagc ctgggggccg tggactccat 1920 gcgtgtcctč ttctagccgt cactgcgaca 1980 gtctgggtga gagaaggcgg caccgctcct 2040 aggacttcag agaagtgcag tgttctgaat 2100 acaagtggaa aacgtaccgg ggagggggcg 2160 aaggcttcaa cttcfcacacg gagagggcgg 2220 cagacácggt ggacatttgc gtcagtggcg 2280 tgggctccga cctgcgggag gacaagtgcc 2340 agaccatcga gggcgtcttc agcccagcct 2400 ggattcccaa aggctccgtG cacatcttca 2460 tggccctgaa gggagaccag gagtccctgc 2520 cccaccgtct gcctctagct gggaccacct 2580 agagcctcga agccctggga ccgattaatg 2640 ccgagctgcc tgccctccgc taccgcttca 2700 cctactcctg gcactatgcg ccctggacca 2760 aggtgcaggc ggtggagtgc cgcaaccagc 2820 • · · · tggacagctc agcgcgcctg gcagccgcag ctgccgcgga tggaggcctg gcacccccag.
accgcgccac gctgcaactt ctgcacagtg aggcgtcgca agtgcgacag cctactgecc gctgcaaaac gtctccgccg ggagggaagg tggggggatg cgcggtcgcc caacacggag ctgcgatgca ggagaaggcg ccacggcccc ctgcgggccg gctgcccccg gcgccgctgc cggcgtcggg cgagtgcacg cccaaccccc cctggtgcte ctgccagggc ccagfcccfcgc gtgagacgga gagaggggct ccccactact ccttgccctc ggcgtgcgca ctggacgaca acttgccctc ggcctccgcc gcgcactgct cccccggccc cagcggcagc gaggccctgc gggggcggcc aaatbtcagb cactaggggg agcgggccgg gccggaagtt ggctatccac gcagtgccea cagactgggt gccgctcggc gegcatgccc cggagtgggc accgcgtggt cacccgccgc gctgggtggc gctcggtgcg ggccgcccac ctgaagagtg tctgcagccg cgcgcggcac ccagaggggg atttattggg ctgcccgggc cagcaagctg tgtagggaac cgtgtgccag gcagccgcgc ggccctcgac cctttgcaag caagccaccg tggcgagtgg ctgcaccagc cacgcagcaa caaggatgtg agcctacttc ccggagccac ccccgggggg aacccctgca ggccgc cccaaaaggc tggtcgctct cgccgcgtct ccacctgtac tggtctgagt agcgcagacc gccaccatgc ggtgagtgct cacacgggcc tgtgaggcca aacaaggtcg cgccagatgt agctggcggg gcgggaactg gggccctggc
2880
2940
3000
3060
3120
3180
3240
3300
3360
3420
3480
3540
3600
3660
3720
3766 <210> 2 <211> 770 <212> PRT <213> neznámý <220>
<221> varianta <222> (1) ... (770) <223> Xaa = kterákoliv aminokyselina
| Ser | Ser | Leu | Gly | Ser | Thr | Val | Asn | Ile | Leu | Val | Thr Arg | Leu | Ile | Leu | |
| 1 | .. 5 | 10 | 15 | ||||||||||||
| Leu | Thr | Glu | Asp | Gin | Pro | Thr | Leu | Glu | Ile | Thr | His His | Ala | Gly Lys | ||
| 20 | 25 | 30 | |||||||||||||
| Ser | Leu | Asp | Ser | Phe | Cys | Lys | Trp | Gin | Lys | Ser | Ile | Val | Asn | His | Ser |
| 35 | 40 | 45 | |||||||||||||
| Gly | His | Gly | Asn | Ala | Ile | Pro | Glu | Asn | Gly Val | Ala | Asn | His | Asp | Thr | |
| 50 | 55 | 60 | |||||||||||||
| Ala Val | Leu | Ile | Thr | Arg Tyr Asp | Ile | Cys | Ile | Tyr | Lys | Asn | Lys | Pro | |||
| 65 | 70 | 75 | .80 ·. | ||||||||||||
| Cys | eiy | Thr | Leu | Gly Leu Ala | Pro | Val | Gly Gly Met | Cys | Glu | Arg | Glu | ||||
| 85 | 90 | 95 | |||||||||||||
| Arg | Ser | Cys | Ser | Val | Asn Glu | Asp | Ile | Gly | Leu | Ala | Thr | Ala | Phe | Thr | |
| 100 | 105 | 110 | |||||||||||||
| Ile | Ala | His | Glu | Ile | Gly His | Thr | Phe· | Gly | Met | Asn | His | Asp | Gly Val | ||
| 115 | 120 | 125 | |||||||||||||
| Gly | Asn | Ser | Cys | Gly | Ala | Arg | Gly | Gin | Asp | Pro | Ala | Lys | Leu | Met | Ala |
| 130 | 135 | 140 | |||||||||||||
| Ala | His | Ile | Thr | Met | Lys | Thr | Asn | Pro | Phe | Val | Trp | Ser | Ser | Cys | Ser |
| 145 | 150 | 155 | 160 | ||||||||||||
| Arg Asp | Tyr | Ile | Thr | Ser | Phe | Leu | Asp | Ser | Gly | Pro | Gly Ala | Leu | Pro | ||
| 165 | 170 | 175 | |||||||||||||
| Glu | Gin | Pro | Ala | Pro | Gin | Thr | Gly | Leu | Cys | Val | Pro | Asp | Ser | Gly | Thr |
| 180 | 185 | 190 | |||||||||||||
| Gly | Pro | Ser | Leu | Arg | Cys | Arg | Xaa | Ala | Met | Pro' | Leu | Ser | Ala | Trp | Ser |
| 195 | 200 | 205 | |||||||||||||
| Gin | Ile | Ala | Ser | Val | Xaa | Ile | Arg | Glu | Val | Cys | Ser | Glu | Leu | Trp | Cys |
| 210 | 215 | 220 | |||||||||||||
| Leu | Ser | Lys | Ser | Asn | Arg | Cys | Ile | Thr | Asn | Ser | Ile | Pro | Ala | Ala | Glu |
| 225 | 230 | 235 | 240 | ||||||||||||
| Gly | Thr | Leu | Cys | Gin | Thr | His | Thr | Ile | Asp | Lys | Gly | Trp | Cys | Tyr | Lys |
| 245 | 250 | 255 | |||||||||||||
| Arg | Val | Cys | Val | Pro | Phe | Gly | Ser | Arg | Pro | Glu | Gly | Val | Asp | Gly | Ala |
| 260 | 265 | 270 | |||||||||||||
| Trp | Gly | Pro | Trp | Thr | Pro | Trp | Gly | Asp | Cys | Ser | Arg | Thr | Cys | Gly | Gly |
| 275 | 280 | 285 | |||||||||||||
| Gly | Val | Ser | Ser | Ser | Ser | Arg | His | Cys | Asp | Ser | Pro | Arg | Pro | Thr | Ile |
| Gly Gly Lys Tyr | Cys | Leu Gly Glu Arg Arg | Arg His | Arg | Ser Cys Asn |
| 305 | 310 | 315 | 320 | ||
| Thr Asp Asp Cys | Pro 32S | Pro Gly Ser Gin Asp 330 | Phe Arg | Glu | Val Gin Cys 335 |
| Ser Glu Phe Asp 340 | Ser | Ile Pro Phe Arg Gly 345 | Lys Phe | Tyr | Lys Trp Lys 350 |
| Thr Tyr Arg Gly Gly Gly Val Lys Ala Cys 355 350 | Ser Leu | Thr 365 | Cys Leu Ala | ||
| Glu Gly Phe Asn 370 | Phe | Tyr Thr Glu Arg Ala 375 | Ala Ala 380 | Val | Val Asp Gly |
| Thr Pro Cys Arg 385 | Pro | Asp Thr Val Asp Ile 390 | Cys Val 395 | Ser | Gly Glu Cys 400 |
| Lys His Val Gly | Cys 405 | Asp Arg Val Leu Gly 410 | Ser Asp | Leu | Arg Glu Asp 415 |
| Lys Cys Arg Val 420 | cys | Gly Gly Asp Gly Ser 425 | Ala Cys | Glu | Thr Ile Glu 430 |
| Gly Val Phe Ser 435 | Pro | Ala Ser Pro Gly Ala 440 | Gly Tyr | Glu 445 | Asp Val Val |
| Trp Ile Pro Lys 450 | ely | Ser Val His Ile Phe 455 | Ile Gin 460 | Asp | Leu Asn Leu |
| Ser Leu Ser His 465 | Leu | Ala Leu Lys Gly Asp 470 | Gin Glu 475. | Ser | Leu Leu Leu 480 |
| Glu Gly Leu Pro | Gly 485 | Thr Pro Gin Pro His 490 | Arg Leu | Pro | Leu Ala Gly 495 |
| Thr Thr Phe Gin 500 | Leu | Arg Gin Gly Pro Asp 505 | Gin Val | Gin | Ser Leu Glu 510 |
| Ala Leu Gly Pro 515 | Ile | Asn Ala Ser Leu Ile 520 | Val Met | Val 525 | Leu Ala Arg |
| Thr Glu Leu Pro 530 | Ala | Leu Arg Tyr Arg Phe 535 | Asn Ala 540 | Pro | Ile Ala Arg |
| Asp Ser Leu Pro 545' | Pro | Tyr Ser Trp His Tyr 550 | Ala Pro 555 | Trp | Thr Lys Cys 560 |
| •Ser Ala Gin Cys | Ala 565 | Gly Gly Ser Gin Val 570 | Gin Ala | Val | Glu Cys Arg 575. |
| Asn Gin Leu Asp 580 | Ser | Ser Ala Val Ala Pro 585 | His Tyr | Cys | Ser Ala.His 590 |
| Ser Lys Leu Pro 595 | Lys | Arg Gin Arg Ala Cys 600 | Asn Thr | Glu 605 | Pro cys Pro |
| Pro Asp Trp Val 610 | Val | Gly Asn Trp Ser Leu 615 | Cys Ser 620 | Arg | Ser Cys Asp |
| Ala Gly Val Arg 625 | Ser | Arg Ser Val Val Cys 630 | Gin Arg Arg Val Ser Ala 635 640 | ||
| Ala Glu Glu Lys | Ala 645 | Leu Asp Asp Ser Ala 650 | Cys Pro | Gin | Pro Arg Pro 655 |
| Pro Val Leu Glu Ala ‘660 | Cys His Gly Pro Thr 665 | Cys Pro | Pro | Glu Trp Ala 670 | |
| Ala Leu Asp Trp 675 | Ser | Glu Cys Thr Pro Ser 680 | Cys Gly | Pro 685 | Gly Leu Arg |
| His Arg Val Val 690 | Leu | Cys Lys Ser Ala Asp 695 | His Arg 700 | Ala | Thr Leu Pro |
| Pro Ala His Cys 705 | Ser | Pro Ala Ala Lys Pro 710 | Pro Ala 715 | Thr | Met Arg Cys 720 |
| Asn Leu Arg Arg Cys 725 | Pro Pro Ala Arg Trp 730 | Val Ala | Gly | Glu Trp Gly 735 | |
| Glu Cys Ser Ala 740 | Gin | Cys Gly Val Gly Gin 745 | Arg Gin | Arg | Ser Val Arg 750 |
| Cys Thr Ser His 755 | Thr | Gly Gin Ala Ser His 760 | Glu Cys | Thr 765 | Glu Ala Leu |
Arg Pro 770 <210> 3 <211> 3377 <212> DNA <213> neznámý <220>
<223> neznámý <400> 3 gaattcccac catggctccc gcctgccaga tcctccgctg ggccctcgcc ctggggctgg 60 gcctcafcgtt cgaggtcacg cacgccttcc ggtctcaaga tgagttcctg tccagtctgg 120 agagctatga gatcgccttc cccacccgcg tggaccacaa cggggcactg ctggccttct 180 cgccacctcc tccccggagg cagcgccgcg gcaegggggc cacagccgag tcccgcctct 240 tctacaaagt ggcctcgccc ageacccact tcctgctgaa cctgacccgc agetcecgtc 300 tactggcagg gcacgtctcc gtggagtact ggacacggga gggcctggcc tggcagagag 360 cggcccggcc ccactgcctc tacgctggtc acctgcaggg ccaggccagc agctcccatg 420 tggccatcag cacctgtgga ggcotgcacg gcctgatcgt ggcagaegag gaagagtacc 480 tgattgagcc cctgcacggt gggcccaagg gttctcggag cccggaggaa agtggaccac 540 atgtggtgta caagcgttcc tctctgegtc acccccacct ggacacagcc tgtggagtga' 600 gagatgagaa accgtggaaa gggcggccat ggtggctgcg gaccttgaag ccaccgcctg 660· ccaggcccct ggggaatgaa acagagogtg gccagccagg cctgaágcga tcggtcagcc 720 gagagcgcta cgtggagacc ctggtggtgg ctgacaagat gatggtggcc tatcacgggc 780 gccgggatgt ggagcagtat gtcctggcca tcatgaacat tgttgccaaa cttttccagg 840 actcgagtct gggaagcacc gttaacatcc tcgtaactcg cctcatcctg ctcacggagg 900 accagcccac tctggagatc acccaccatg ccgggaagtc cctggacagc ttctgtaagfc 960 ggcagaaatc catcgtgaac cacagcggtc afcggcaatgc cattccagag.aaeggtgtgg 1020 ctaaccatga cacagcagtg ctcatcacac gctatgácat cfcgcatctac aagaacaaac 1080 cctgcggcac actaggcctg gccccggtgg gcggaatgtg tgagcgcgag agaagctgca 1140 gcgtcaatga ggacattggc otggccaoag cgttcaccat tgccóacgag atcgggcaca 1200 cattcggcat gaacoatgac ggcgtgggaa acagctgtgg ggcccgtggt caggácccag 1260 ccaagctcat ggctgcccac attaccatgá agaccaaccc gttcgfcgtgg tčatactgca 1320 gccgtgácta catcaccagc ttfcctagacťcgggcčtggg gctctgcctg aacaaccgac 1380 cccccagáca ggactttgtg tacccgacag-tggcaccggg ccaagcctac gatgcagatg 1440 agcaatgccg ctt.tcagqat ggagtcaaat cgcgtcagtg taaatacggg gaggtctgca 1500 gcgagctgtg gtgtctgagc aagagcaacc•ggtgcatcac caacagcatc ccggccgccg 1560 agggcacgct gtgccagacg cacaccatcg'· acaaggggtg gtgctacaaa cgggtctgtg 1620 tcccctttgg gtcgcgccca gagggtgtgg acggagcctg ggggccgtgg actccatggg 1680 gcgactgcag ccggacctgt ggcggcggcg tgtectcttc tagccgtcac tgcgacagcc 1740 ccaggccaac catcgggggc aagtactgtď tgggtgagag aaggcggcac -cgctcctgca 1800 acacggatga ctgtcccčct ggctcccaggacttcagaga agtgcagtgt tctgaatttg 1860 acagcatccc tttccgtggg aaattctaca agtggaaaac gtaccgggga gggggcgtga 1920 aggcctgctc gctcacgtgc ctagcggaag gcttcaactt ctacacggag agggcggcag 198Q ccgtggtgga cgggacaccc tgccgtccag acacggtgga catttgcgtc agtggcgaat 2040 gcaagcacgt gggctgcgac cgagtcctgg gctccgacct gcgggaggac aagtgccgag 2100 tgtgtggcgg tgacggcagt gcctgcgaga ccatcgaggg cgtcttcagc ccagcctcac 2160 ctggggccgg gtacgaggat gtcgtctgga ttcccaaagg ctccgtccac atcttcatcc 2220 aggatcfcgaa cctctctctc agtcacttgg ccctgaaggg agaccaggag tccctgctgc 2280 tggaggggct gcccgggacc ccccagcccc accgtctgcc fcctagctggg accacctttc 2340 aacfcgcgaca ggggccagac caggtccaga gcctcgaagc cctgggaccg attaatgcat 2400 ctcfccatcgt catggtgctg gcccggaccg agctgcctgc cctccgctac cgcttcaatg 2460 cccccatcgc ccgtgactcg ctgcccccct actcctggca ctatgcgccc tggaccaagt 2520 gctcggccca gtgtgcaggc ggtagccagg tgcaggcggt ggagtgccgc aaccagctgg 2580 acagctccgc ggtcgccccc cactactgca gtgcccacag eaagctgccc aaaaggcagc 2640 gcgcctgcaa cacggagcct tgccctccag actgggttgt agggaačtgg tcgctctgca 2700 gccgcagctg cgatgcaggc gtgcgcagcc gctcggtcgt gtgccagcgc cgcgtctctg 2760 ccgcggagga gaaggcgctg gacgacagcg catgcccgca gccgcgccca cctgtactgg 2820 aggcctgcca cggccccact tgccctccgg agtgggcggc cctcgactgg tctgagtgca 2880 cccccagttg cgggccgggc ctccgccacc gcgtggtcct ttgcaagagc gcagaccacc 2940 gcgccacgct gcccccggcg cactgctcac ccgccgccaa gccaccggcc aecatgcgct 3000 gcaacttgcg ccgctgcccc ccggcccgct gggtggctgg cgagtggggt gagtgctctg 3060 cacagtgegg cgtcgggcag cggcagcgct cggtgcgctg caccagccac acgggccagg 3120 cgtcgcacga gtgcacggag gccctgcggc cgcccaccac gcagcagtgt gaggccaagt 3180 gcgacagccc aacccccggg gacggccctg aagagtgcaa ggatgtgaac aaggtcgcct 3240 actgccccct ggtgctcaaa tttcagttct gcagccgagc ctacttccgc cagatgtgct 3300 gcaaaacctg ccagggccac tagggtcgag gcccattfcaa gccgaattct gcagatatcc 3350 atcacactgg cggccgc ’ 3377 <210> 4 <211> 1104 <212> PRT <213> neznámý • ·« · · · · · · • · · · · · · · ···« ···· ··· ···· ·· ·· <400> 4
| Met Ala Pro | Ala Cys Gin Ile Leu Arg Trp Ala | Leu Ala Leu Gly | Leu |
| 1 | 5 10 | 15 | |
| Gly Leu Met | Phe Glu Val Thr His Ala Phe Arg | Ser Gin Asp Glu | Phe |
| 20 ’ 25 | 30 | ||
| Leu Ser Ser | Leu Glu Ser Tyr Glu Ile Ala Phe | Pro Thr Arg Val | Asp |
| 35 | 40 | 45 | |
| His Asn Gly | Ala Leu Leu Ala Phe Ser Pro Pro | Pro Pro Arg Arg | Gin |
| 50 | 55 | 60 | |
| Arg Arg Gly | Thr Gly Ala Thr Ala Glu Ser Árg | Leu Phe Tyr Lys | Val |
| 65 | 70 75 | 80 | |
| Ala Ser Pro | Ser Thr His Phe Leu Leu Asn Leu | Thr Arg Ser Ser | Arg |
| 85 90 | 95 | ||
| Leu Leu Ala | Gly His Val Ser Val Glu Tyr Trp | Thr Arg Glu Gly | Leu |
| 100 105 | 110 | ||
| Ala Trp Gin | Arg Ala Ala Arg Pro His Cys Leu | Tyr Ala Gly His | Leu |
| 115 | 120 | 125 | |
| Gin Gly Gin Ala Ser Ser Ser His Val Ala Ile | Ser Thr Cys Gly | Gly | |
| 130 | 135 | 140 | |
| Leu His Gly Leu Ile Val Ala Asp Glu Glu Glu | Tyr Leu Ile Glu | Pro | |
| 145 | 150 155 | 160 | |
| Leu His Gly Gly Pro Lys Gly Ser Arg Ser Pro | Glu Glu Ser Gly | Pro | |
| 165 170 | 175 | ||
| His Val Val | Tyr Lys Arg Ser Ser Leu Arg His | Pro His Leu Asp | Thr |
| 180 185 | 190 | ||
| Ala Cys Gly | Val Arg Asp Glu Lys Pro Trp Lys | Gly Arg Pro Tip | Tip |
| 195 | 200 | 205 | |
| Leu Arg Thr | Leu Lys Pro Pro Pro Ala Arg Pro | Leu Gly Asn Glu | Thr |
| 210 | 215 | 220 | |
| Glu Arg Gly | Gin Pro Gly Leu Lys Arg Ser Val | Ser Arg Glu Arg | Tyr |
| 225 | 230 235 | 240 | |
| Val Glu Thr | Leu Val Val.Ala Asp Lys Met Met | Val Ala Tyr His | Gly |
| 245 250 | 255 | ||
| Arg Arg Asp | Val Glu Gin Tyr Val Leu Ala Ile | Met Asn Ile Val | Ala |
| 260 265 | 270 | ||
| Lys Leu Phe | Gin Asp Ser Ser Leu Gly Ser Thr | Val Asn Ile Leu | Val |
| . 275 | 280 | 285 | |
| Thr Arg Leu | Ile Leu Leu Thr Glu Asp Gin Pro | Thr Leu Glu Ile | Thr |
| 290 | ’ 295 | 300 | |
| His His Ala | Gly Lys Ser Leu Asp Ser Phe Cys | Lys Tip Gin Lys | Ser |
| 305 | 310 .315 | 320 | |
| Ile Val Asn | His Ser Gly His Gly Asn Ala tle | Pro Glu Asn Gly Val | |
| 325 330 | 335 | ||
| Ala Asn His | Asp Thr Ala Val Leu Ile Thr Arg | Tyr Asp Ile Cys | ile |
| 340 345 | 350 | ||
| Tyr Lys Asn | Lys Pro Cys Gly Thr Leu Gly Leu | Ala Pro Val Gly Gly | |
| 355 | 360 | 365 | |
| Met Cys Glu | Arg Glu Arg Ser Cys Ser Val Asn | Glu Asp Ile Gly | Leu |
| 370 | 375 | 380 | |
| Ala Thr Ala | Phe Thr Ile Ala His Glu Ile Gly | His Thr Phe Gly | Met |
| 385 | 390 395 | 400 | |
| Asn His Asp | Gly Val Gly Asn Ser Cys Gly Ala Arg Gly Gin Asp | Pro | |
| 405 410 | 415 | ||
| Ala Lys Leu | Met Ala Ala His Ile Thr Met Lys | Thr Asn Pro Phe | Val |
| 420 425 | 430 | ||
| Trp Ser Ser | Cys Ser Arg Asp Tyr Ile Thr Ser | Phe Leu Asp Ser | Gly |
| 435 | 440 | 445 | |
| Leu Gly Leu | Cys Leu Asn Asn Arg Pro Pro Arg | Gin Asp Phe Val | Tyr |
| 450 | 455 | 460 | |
| Pro Thr Val | Ala Pro Gly Gin Ala Tys- Asp Ala | Asp Glu Gin Cys | Arg |
| 465 | 470 475 | 480 |
·· ·· · ·· ·· • · · * ♦ ♦ · · · • · · · · • · · · · · · • · · · · ···· ···· ··· ···· ··
| Phe Gin Kis Gly Val Lys | Ser Arg Gin Cys Lys Tyr Gly Glu Val | Cys | ||
| 485 | 490 | 495 | ||
| Ser Glu | Leu Trp Cys Leu 500 | Ser Lys Ser Asn Arg Cys Ile 505 | Thr Asn 510 | Ser |
| Ile Pro | Ala Ala Glu Gly 515 | Thr Leu Cys Gin Thr His Thr 520 525 | Ile Asp | Lys |
| Gly Trp 530 | Cys Tyr Lys Arg | Val Cys Val Pro Phe Gly Ser 535 540 | Arg Pro | Glu |
| Gly Val 545 | Asp Gly Ala Trp 550 | Gly Pro Trp Thr Pro Trp Gly 555 | Asp Cys | Ser 560 |
| Arg Thr | Cys Gly Gly Gly 565 | Val Ser Ser Ser Ser Arg His • 570 | Cys Asp 575 | Ser |
| Pro Arg | Pro Thr Ile Gly Gly Lys Tyr Cys Leu Gly Glu 580 585 | Arg Arg 590 | Arg | |
| His Arg | Ser Cys Asn Thr 595 | Asp Asp Cys Pro Pro Gly Ser 600 605 | Gin Asp | Phe |
| Arg Glu 6X0 | Val Gin Cys Ser | Glu Phe Asp Ser Ile Pro Phe 615 620 | Arg Gly | Lys |
| Phe Tyr 625 | Lys Trp Lys Thr 630 | Tyr Arg Gly Gly Gly Val Lys 635 | Ala Cys | Ser 640 |
| Leu Thr | Cys Leu Ala Glu 645 . | Gly Phe Asn Phe Tyr Thr Glu Arg Ala 650 655 | Ala | |
| Ala Val | Val Asp Gly Thr 660 | Pro Cys Arg Pro Asp Thr Val 665 | Asp Ile 670 | cys |
| Val Ser | Gly Glu Cys Lys 675 | His Val Gly Cys Asp Arg Val 680 685 | Leu Gly | Ser |
| Asp Leu 690 | Arg Glu Asp Lys | Cys Arg Val Cys Gly Gly Asp 695 700 | Gly Ser | Ala |
| Cys Glu 705 | Thr Ile Glu Gly Val Phe Ser Pro Ala Ser Pro 710 715 | Gly Ala Gly 720 | ||
| Tyr Glu | Asp Val Val Trp 725 | Ile Pro Lys Gly Ser Val His 730 | Ile Phe 735 | Ile |
| Gin Asp | Leu Asn Leu Ser 740 | Leu Ser His Leu Ala Leu Lys 745 | Gly Asp 750 | Gin |
| Glu Ser | Leu Leu Leu Glu 755 | Gly Leu Pro Gly Thr Pro Gin 760 765 | Pro His | Arg |
| Leu Pro 770 | Leu Ala Gly Thr | Thr Phe Gin Leu Arg Gin Gly 775 · 780 | Pro Asp | Gin |
| Val Gin 785 | Ser Leu Glu Ala 790 | Leu' Gly Pro Ile Asn Ala Ser 795 | Leu Ile | .Val 800 |
| Met Val | Leu Ala Arg Thr 805 | Glu Leu Pro Ala Leu Arg Tyr Arg Phe 810 815 | Asn | |
| Ala Pro | Ile Ala Arg Asp 820 | Ser Leu Pro Pro Tyr Ser Trp 825 | His Tyr 830 | Ala |
| Pro Trp | Thr Lys Cys Ser 835 | Ala Gin Cys Ala Gly Gly Ser 840 845 | Gin Val | Gin |
| Ala Val 850 | Glu Cys Arg Asn | Gin Leu Asp Ser Ser Ala Val 855 860 | Ala Pro | His |
| Tyr Cys 865 | Ser Ala His Ser 870 | lys Leu Pro Lys Arg Gin Arg 875 | Ala Cys | Asn 880 |
| Thr Glu | Pro Cys Pro Pro 885 | Asp Trp Val Val Gly Asn Trp 890 | Ser Leu 895 | Cys |
| Ser Arg | Ser Cys Asp Ala 900 | Gly Val Arg Ser Arg Ser Val 905 | Val Cys 910 | Gin |
| Arg Arg | Val Ser Ala Ala 915 | Glu Glu Lys Ala Leu Asp Asp 920. 925 | Ser Ala | cys |
| Pro Gin 930 | Pro Arg Pro Pro | Val Leu Glu Ala Cys His Gly 935 940 | Pro Thr | Cys |
| Pro Pro 945 | Glu Trp Ala Ala 950 | Leu Asp Trp Ser Glu Cys Thr . 955 | Pro Ser | Cys 960 |
| Gly Pro | Gly Leu Αχσ His 965 | Arg Val Val Leu Cys Lys Ser 970 | Ala Asp 975 | His |
| Arg Ala | Thr Leu Pro Pro 980 | Ala His Cys Ser Pro Ala Ala 985 | Lys Pro 990 | Pro |
| Ala Thr | Met Arg Cys Asn 995 | Leu Arg Arg Cys Pro Pro Ala 1000 1005 | Arg Trp | Val |
| Ala Gly | Glu Trp Gly Glu | Cys Ser Ala Gin Cys Gly Val Gly Gin | Arg |
• 4
4444
1010 1015 1020
| Gin Arg Ser | Val | Arg Cys Thr Ser | His | Thr | Gly | Gin· Ala Ser His Glu |
| 1025 | 1030 | 1035 1040 | ||||
| Cys Thr Glu | Ala | Leu Arg Pro Pro | Thr | Thr | Gin | Gin Cys Glu Ala Lys |
| 1045 | 1050 | 1055 | ||||
| Cys Asp Ser | Pro | Thr Pro Gly Asp | Gly | Pro | Glu | Glu Cys Lys Asp Val |
| 1060 | 1065 | 1070 | ||||
| Asn Lys Val | Ala Tyr Cys Pro Leu | Val | Leu | Lys | Phe Gin Phe Cys Ser | |
| 1075 | 1080 | 1085 | ||||
| Arg Ala Tyr Phe Arg Gin Met Cys Cys Lys | Thr | Cys Gin Gly His Xaa | ||||
| 1090 | 1095 | 1100 |
Claims (20)
1. Izolovaná DNA molekula obsahující DNA sekvenci uvedenou v sekv. id. č. 3.
2. Izolovaná DNA molekula obsahující DNA sekvenci uvedenou v sekv. id. č. 1 od nukleotidu č. 1086 do č. 3396.
3. Izolovaná DNA molekula obsahující DNA sekvenci vybranou ze skupiny, kterou tvoří
a) sekvence ze sekv. id. č. 3,
b) sekvence ze sekv. id. č. 1 obsahující nukleotid č. 1086 až č. 3396 přirozeně se vyskytujících humánních alelických sekvencí a ekvivalentní degenerované kodony ze sekvencí z bodů
a) a b) .
4. Vektor obsahující DNA molekulu podle nároku 1 v operativním spojení s příslušnou kontrolní sekvencí její exprese.
5. Vektor obsahující DNA molekulu podle nároku 2 v operativním spojení s příslušnou kontrolní sekvencí její exprese.
6. Hostitelská buňka transformovaná DNA sekvencí podle nároku 1.
7. Hostitelská buňka transformovaná DNA sekvencí podle nároku 2.
8. Způsob přípravy purifikovaného humánního agrekanázového proteinu vyznačující se tím, že obsahuje kroky:
(a) kultivace hostitelské buňky transformované DNA molekulou podle nároku 1 a (b) získání a purifikace agrekanázového proteinu z kultivačního média.
9. Způsob přípravy purifikovaného humánního agrekanázového proteinu vyznačující se tím, že obsahuje kroky:
(a) kultivace hostitelské buňky transformované DNA molekulou podle nároku 2 a (b) získání a purifikace agrekanázového proteinu z kultivačního média.
10. Purifikovaný agrekanázový polypeptid obsahující aminokyselinovou sekvenci ze sekv. id. č. 4.
11. Purifikovaný agrekanázový polypeptid obsahující aminokyselinovou sekvenci uvedenou v sekv. id. č. 2.
12. Purifikovaný agrekanázový polypeptid vytvořený kroky (a) kultivace buňky transformované DNA molekulou podle nároku 1 a (b) získání a purifikace polypeptidu obsahujícího aminokyselinovou sekvenci uvedenou v sekv. id. č. 4 z kultivačního média.
·· ···» • · · • · · • · · · ·· ··
13. Purifikovaný agrekanázový polypeptid vytvořený kroky (a) kultivace buňky transformované DNA molekulou podle nároku 2 a (b) získání a purifikace polypeptidů obsahujícího aminokyselinovou sekvenci uvedenou v sekv. id. č. 2 z kultivačního média.
14. Protilátka, která se váže k purifikovanému agrekanázovému proteinu podle nároku 10.
15. Způsob výroby inhibitorů agrekanázy vyznačující se tím, že obsahuje použití agrekanázového proteinu uvedeného v sekv. id. č. 4 nebo jeho fragmentu.
16. Způsob výroby inhibitorů agrekanázy vyznačující se tím, že obsahuje použití agrekanázového proteinu uvedeného v sekv. id. č. 2 nebo jeho fragmentu.
17. Způsob podle nároku 15 nebo 16 vyznačuj ící se tím, že způsob obsahuje trojrozměrnou strukturní analýzu.
18. Způsob podle nároku 15 nebo 16 vyznačuj ící se tím, že způsob obsahuje počítačem podporovaný návrh léku.
·· 99 9 99 99 ····
9 9 9 9 99 9 9 · 9 9
9 9 9 9 9 9 9
9 99 9 9999 9
9 9 · · 9999
9999 9999 999 9999 99 99
19. Přípravek pro inhibici proteolytické aktivity agrekanázy vyznačující se tím, že obsahuje peptidovou molekulu, která se váže k agrekanáze inhibující proteolytickou degradaci agrekanu.
20. Způsob inhibice štěpení agrekanu u savce vyznačující se tím, že obsahuje podávání účinného množství sloučeniny, která inhibuje agrekanázovou aktivitu, savci.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US24231700P | 2000-10-20 | 2000-10-20 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CZ2003996A3 true CZ2003996A3 (cs) | 2004-04-14 |
Family
ID=22914296
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CZ2003996A CZ2003996A3 (cs) | 2000-10-20 | 2001-10-17 | Nové molekuly agrekanázy |
Country Status (13)
| Country | Link |
|---|---|
| EP (1) | EP1326967A2 (cs) |
| JP (2) | JP2004512043A (cs) |
| AU (1) | AU2002245758A1 (cs) |
| BR (1) | BR0114719A (cs) |
| CA (1) | CA2426463A1 (cs) |
| CZ (1) | CZ2003996A3 (cs) |
| MX (1) | MXPA03003425A (cs) |
| NO (1) | NO20031649L (cs) |
| NZ (1) | NZ525368A (cs) |
| PL (1) | PL362008A1 (cs) |
| SK (1) | SK4632003A3 (cs) |
| WO (1) | WO2002034895A2 (cs) |
| ZA (1) | ZA200303865B (cs) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11261260B2 (en) | 2017-06-02 | 2022-03-01 | Merck Patent Gmbh | ADAMTS binding immunoglobulins |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6391610B1 (en) * | 1999-08-06 | 2002-05-21 | The Cleveland Clinic Foundation | Nucleic acids encoding zinc metalloproteases |
| AU7717800A (en) * | 1999-09-27 | 2001-04-30 | Curagen Corporation | Novel polynucleotides encoding proteins containing thrombospondin type 1 repeats |
-
2001
- 2001-10-17 CA CA002426463A patent/CA2426463A1/en not_active Abandoned
- 2001-10-17 MX MXPA03003425A patent/MXPA03003425A/es active IP Right Grant
- 2001-10-17 AU AU2002245758A patent/AU2002245758A1/en not_active Abandoned
- 2001-10-17 EP EP01988767A patent/EP1326967A2/en not_active Ceased
- 2001-10-17 NZ NZ525368A patent/NZ525368A/xx unknown
- 2001-10-17 PL PL36200801A patent/PL362008A1/xx unknown
- 2001-10-17 CZ CZ2003996A patent/CZ2003996A3/cs unknown
- 2001-10-17 SK SK463-2003A patent/SK4632003A3/sk not_active Application Discontinuation
- 2001-10-17 BR BR0114719-6A patent/BR0114719A/pt not_active IP Right Cessation
- 2001-10-17 WO PCT/US2001/032596 patent/WO2002034895A2/en not_active Ceased
- 2001-10-17 JP JP2002537866A patent/JP2004512043A/ja not_active Withdrawn
-
2003
- 2003-04-10 NO NO20031649A patent/NO20031649L/no not_active Application Discontinuation
- 2003-05-19 ZA ZA200303865A patent/ZA200303865B/en unknown
-
2008
- 2008-05-07 JP JP2008121344A patent/JP2008301813A/ja not_active Withdrawn
Also Published As
| Publication number | Publication date |
|---|---|
| WO2002034895A2 (en) | 2002-05-02 |
| AU2002245758A1 (en) | 2002-05-06 |
| BR0114719A (pt) | 2004-01-27 |
| PL362008A1 (en) | 2004-10-18 |
| JP2004512043A (ja) | 2004-04-22 |
| CA2426463A1 (en) | 2002-05-02 |
| NO20031649L (no) | 2003-06-11 |
| ZA200303865B (en) | 2004-08-19 |
| EP1326967A2 (en) | 2003-07-16 |
| NZ525368A (en) | 2006-03-31 |
| SK4632003A3 (en) | 2004-05-04 |
| MXPA03003425A (es) | 2004-05-04 |
| WO2002034895A3 (en) | 2002-10-10 |
| NO20031649D0 (no) | 2003-04-10 |
| JP2008301813A (ja) | 2008-12-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU2009201274A1 (en) | Aggrecanase molecules | |
| CA2296766C (en) | Aggrecan degrading metallo proteases | |
| AU2003207795A1 (en) | Aggrecanase molecules | |
| AU2009200041A1 (en) | Truncated aggrecanase molecules | |
| US6689599B1 (en) | Aggrecanase molecules | |
| CZ2003996A3 (cs) | Nové molekuly agrekanázy | |
| US20020151702A1 (en) | Aggrecanase molecules | |
| WO2002042439A2 (en) | Aggrecanase adamts9 | |
| US20030148306A1 (en) | Aggrecanase molecules | |
| AU2007211873A1 (en) | Novel aggrecanase molecules | |
| US20030105313A1 (en) | Aggrecanase molecules | |
| US7125701B2 (en) | Aggrecanase molecules | |
| AU2002312623A1 (en) | Aggrecanase molecules | |
| ZA200400929B (en) | Aggrecanase molecules | |
| US20030228676A1 (en) | Aggrecanase molecules |