ITGE20130040A1 - Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marino - Google Patents
Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marinoInfo
- Publication number
- ITGE20130040A1 ITGE20130040A1 IT000040A ITGE20130040A ITGE20130040A1 IT GE20130040 A1 ITGE20130040 A1 IT GE20130040A1 IT 000040 A IT000040 A IT 000040A IT GE20130040 A ITGE20130040 A IT GE20130040A IT GE20130040 A1 ITGE20130040 A1 IT GE20130040A1
- Authority
- IT
- Italy
- Prior art keywords
- gly
- pro
- asp
- ala
- enzyme
- Prior art date
Links
- 108010035532 Collagen Proteins 0.000 title claims description 89
- 102000008186 Collagen Human genes 0.000 title claims description 88
- 238000000034 method Methods 0.000 title claims description 74
- 229920001436 collagen Polymers 0.000 title claims description 72
- 238000004519 manufacturing process Methods 0.000 title claims description 23
- 102000004079 Prolyl Hydroxylases Human genes 0.000 claims description 98
- 108010043005 Prolyl Hydroxylases Proteins 0.000 claims description 98
- 108090000623 proteins and genes Proteins 0.000 claims description 65
- 241000243142 Porifera Species 0.000 claims description 52
- 239000013598 vector Substances 0.000 claims description 47
- 230000014509 gene expression Effects 0.000 claims description 45
- 102000004190 Enzymes Human genes 0.000 claims description 44
- 108090000790 Enzymes Proteins 0.000 claims description 44
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 43
- 239000002773 nucleotide Substances 0.000 claims description 36
- 125000003729 nucleotide group Chemical group 0.000 claims description 36
- 108010050808 Procollagen Proteins 0.000 claims description 35
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims description 33
- 239000013604 expression vector Substances 0.000 claims description 33
- 241000235058 Komagataella pastoris Species 0.000 claims description 31
- 102000004169 proteins and genes Human genes 0.000 claims description 30
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 28
- 210000004027 cell Anatomy 0.000 claims description 21
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 20
- 230000009466 transformation Effects 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 230000000694 effects Effects 0.000 claims description 17
- 229920001184 polypeptide Polymers 0.000 claims description 16
- 210000005253 yeast cell Anatomy 0.000 claims description 16
- 230000006698 induction Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 14
- 239000002609 medium Substances 0.000 claims description 13
- 230000004048 modification Effects 0.000 claims description 13
- 238000012986 modification Methods 0.000 claims description 13
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 11
- 239000001963 growth medium Substances 0.000 claims description 10
- 230000033444 hydroxylation Effects 0.000 claims description 10
- 238000005805 hydroxylation reaction Methods 0.000 claims description 10
- 238000011426 transformation method Methods 0.000 claims description 9
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 claims description 8
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 8
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 8
- 238000002360 preparation method Methods 0.000 claims description 8
- 238000010367 cloning Methods 0.000 claims description 7
- 230000002255 enzymatic effect Effects 0.000 claims description 7
- SBKVPJHMSUXZTA-MEJXFZFPSA-N (2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(1H-indol-3-yl)propanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylsulfanylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 SBKVPJHMSUXZTA-MEJXFZFPSA-N 0.000 claims description 6
- 108010038049 Mating Factor Proteins 0.000 claims description 6
- 239000000725 suspension Substances 0.000 claims description 6
- 235000010323 ascorbic acid Nutrition 0.000 claims description 4
- 229960005070 ascorbic acid Drugs 0.000 claims description 4
- 239000011668 ascorbic acid Substances 0.000 claims description 4
- 238000003756 stirring Methods 0.000 claims description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 2
- 102000008109 Mixed Function Oxygenases Human genes 0.000 claims description 2
- 108010074633 Mixed Function Oxygenases Proteins 0.000 claims description 2
- 240000004061 Merremia emarginata Species 0.000 claims 11
- 150000007523 nucleic acids Chemical group 0.000 claims 4
- 210000003527 eukaryotic cell Anatomy 0.000 claims 2
- 108020004707 nucleic acids Proteins 0.000 claims 2
- 102000039446 nucleic acids Human genes 0.000 claims 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 230000001413 cellular effect Effects 0.000 claims 1
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 description 40
- 108020003519 protein disulfide isomerase Proteins 0.000 description 40
- 241000972619 Chondrosia reniformis Species 0.000 description 35
- 108010029020 prolylglycine Proteins 0.000 description 31
- 108010064235 lysylglycine Proteins 0.000 description 28
- 238000006243 chemical reaction Methods 0.000 description 26
- 241001122767 Theaceae Species 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 21
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 21
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 21
- 241000282326 Felis catus Species 0.000 description 16
- 108010047857 aspartylglycine Proteins 0.000 description 16
- 229930189065 blasticidin Natural products 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 15
- 239000002299 complementary DNA Substances 0.000 description 15
- 229930024421 Adenine Natural products 0.000 description 14
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 14
- 229960000643 adenine Drugs 0.000 description 14
- 239000000047 product Substances 0.000 description 14
- 108010061238 threonyl-glycine Proteins 0.000 description 13
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 12
- 108010076504 Protein Sorting Signals Proteins 0.000 description 10
- 108010050848 glycylleucine Proteins 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 230000003321 amplification Effects 0.000 description 9
- 230000000692 anti-sense effect Effects 0.000 description 9
- 238000003199 nucleic acid amplification method Methods 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 241000588724 Escherichia coli Species 0.000 description 8
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 8
- 108010079364 N-glycylalanine Proteins 0.000 description 8
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 108010051242 phenylalanylserine Proteins 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 6
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 6
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 6
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 6
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 6
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- 108010084455 Zeocin Proteins 0.000 description 6
- 230000003115 biocidal effect Effects 0.000 description 6
- JFCQEDHGNNZCLN-UHFFFAOYSA-N glutaric acid Chemical compound OC(=O)CCCC(O)=O JFCQEDHGNNZCLN-UHFFFAOYSA-N 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 6
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 6
- 230000004481 post-translational protein modification Effects 0.000 description 6
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 6
- 238000003753 real-time PCR Methods 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 5
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 5
- ORGPJDKNYMVLFL-UHFFFAOYSA-N Coumalic acid Chemical compound OC(=O)C=1C=CC(=O)OC=1 ORGPJDKNYMVLFL-UHFFFAOYSA-N 0.000 description 5
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 5
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 5
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 5
- 108010047495 alanylglycine Proteins 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 238000004925 denaturation Methods 0.000 description 5
- 230000036425 denaturation Effects 0.000 description 5
- 239000003112 inhibitor Substances 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 231100000331 toxic Toxicity 0.000 description 5
- 230000002588 toxic effect Effects 0.000 description 5
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 4
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 4
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 4
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 4
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 4
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 4
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 4
- 241000972624 Chondrosia Species 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 4
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 4
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 4
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 4
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 4
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 4
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 4
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 4
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 4
- 108010047562 NGR peptide Proteins 0.000 description 4
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 4
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 4
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 4
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 4
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 4
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 4
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 4
- 108010066875 alanyl-prolyl-tryptophyl-cysteine Proteins 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 239000012620 biological material Substances 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000006114 decarboxylation reaction Methods 0.000 description 4
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 4
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 3
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 3
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 3
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 3
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 3
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 3
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 3
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 3
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 3
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 3
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 3
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 3
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 238000010222 PCR analysis Methods 0.000 description 3
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 3
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 3
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 3
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 3
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 3
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 3
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 3
- 108010077465 Tropocollagen Proteins 0.000 description 3
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 3
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 108060002894 fibrillar collagen Proteins 0.000 description 3
- 102000013373 fibrillar collagen Human genes 0.000 description 3
- 235000019253 formic acid Nutrition 0.000 description 3
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 238000007169 ligase reaction Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- -1 0.1 M glyein Substances 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 101150096273 ADE2 gene Proteins 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 2
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- CFGHCPUPFHWMCM-FDARSICLSA-N Arg-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N CFGHCPUPFHWMCM-FDARSICLSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 2
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 2
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 2
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 2
- ZTRJUKDEALVRMW-SRVKXCTJSA-N Asn-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZTRJUKDEALVRMW-SRVKXCTJSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 2
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 2
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 2
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 2
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 2
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 2
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- RRUWMFBLFLUZSI-LPEHRKFASA-N Asp-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N RRUWMFBLFLUZSI-LPEHRKFASA-N 0.000 description 2
- LIQNMKIBMPEOOP-IHRRRGAJSA-N Asp-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)O)N LIQNMKIBMPEOOP-IHRRRGAJSA-N 0.000 description 2
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- DKQCWCQRAMAFLN-UBHSHLNASA-N Asp-Trp-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O DKQCWCQRAMAFLN-UBHSHLNASA-N 0.000 description 2
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 2
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- LWYKPOCGGTYAIH-FXQIFTODSA-N Cys-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LWYKPOCGGTYAIH-FXQIFTODSA-N 0.000 description 2
- JEKIARHEWURQRJ-BZSNNMDCSA-N Cys-Phe-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CS)N JEKIARHEWURQRJ-BZSNNMDCSA-N 0.000 description 2
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 2
- TXGDWPBLUFQODU-XGEHTFHBSA-N Cys-Pro-Thr Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O TXGDWPBLUFQODU-XGEHTFHBSA-N 0.000 description 2
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 2
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 2
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 2
- 241001200922 Gagata Species 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 2
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 2
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 2
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 2
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 2
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 2
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 2
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 2
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 2
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 2
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 2
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 2
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 2
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 2
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 2
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 2
- OXIWIYOJVNOKOV-SRVKXCTJSA-N Met-Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCNC(N)=N OXIWIYOJVNOKOV-SRVKXCTJSA-N 0.000 description 2
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 2
- 101100494726 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pep-4 gene Proteins 0.000 description 2
- 230000004989 O-glycosylation Effects 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 2
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 2
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 2
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 2
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 2
- OZAPWFHRPINHND-GUBZILKMSA-N Pro-Cys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O OZAPWFHRPINHND-GUBZILKMSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 2
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 2
- UCTIUWKCVNGEFH-OBJOEFQTSA-N Pro-Val-Gly-Pro Chemical compound N([C@@H](C(C)C)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 UCTIUWKCVNGEFH-OBJOEFQTSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 2
- DBIDZNUXSLXVRG-FXQIFTODSA-N Ser-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N DBIDZNUXSLXVRG-FXQIFTODSA-N 0.000 description 2
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 2
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 2
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 2
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 2
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 2
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 2
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 2
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 2
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- RQLNEFOBQAVGSY-WDSOQIARSA-N Trp-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQLNEFOBQAVGSY-WDSOQIARSA-N 0.000 description 2
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 2
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 2
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 2
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 2
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 2
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 2
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 2
- CLEGSEJVGBYZBJ-MEYUZBJRSA-N Tyr-Thr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CLEGSEJVGBYZBJ-MEYUZBJRSA-N 0.000 description 2
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- CWOSXNKDOACNJN-BZSNNMDCSA-N Val-Arg-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N CWOSXNKDOACNJN-BZSNNMDCSA-N 0.000 description 2
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 2
- PFMAFMPJJSHNDW-ZKWXMUAHSA-N Val-Cys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PFMAFMPJJSHNDW-ZKWXMUAHSA-N 0.000 description 2
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 2
- 239000003708 ampul Substances 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000037319 collagen production Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 239000003480 eluent Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 210000002744 extracellular matrix Anatomy 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000005040 ion trap Methods 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 229910052697 platinum Inorganic materials 0.000 description 2
- 108010029843 preprocollagen Proteins 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 229930000044 secondary metabolite Natural products 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- CUVSTAMIHSSVKL-UWVGGRQHSA-N (4s)-4-[(2-aminoacetyl)amino]-5-[[(2s)-6-amino-1-(carboxymethylamino)-1-oxohexan-2-yl]amino]-5-oxopentanoic acid Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN CUVSTAMIHSSVKL-UWVGGRQHSA-N 0.000 description 1
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000844498 Agatea Species 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- RUQBGIMJQUWXPP-CYDGBPFRSA-N Ala-Leu-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O RUQBGIMJQUWXPP-CYDGBPFRSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- RGDKRCPIFODMHK-HJWJTTGWSA-N Ala-Leu-Leu-His Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RGDKRCPIFODMHK-HJWJTTGWSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- FOQFHANLUJDQEE-GUBZILKMSA-N Arg-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(=O)O FOQFHANLUJDQEE-GUBZILKMSA-N 0.000 description 1
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- XFJKRRCWLTZIQA-XIRDDKMYSA-N Asn-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N XFJKRRCWLTZIQA-XIRDDKMYSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- UOUHBHOBGDCQPQ-IHPCNDPISA-N Asn-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)N)N UOUHBHOBGDCQPQ-IHPCNDPISA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 1
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 1
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 1
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- 241000484222 Auricorona queenslandica Species 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 102000016938 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 241001546778 Cerapanorpa reni Species 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical group [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 102000004266 Collagen Type IV Human genes 0.000 description 1
- 108010042086 Collagen Type IV Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- WVJHEDOLHPZLRV-CIUDSAMLSA-N Cys-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N WVJHEDOLHPZLRV-CIUDSAMLSA-N 0.000 description 1
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 1
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 1
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- GULGDABMYTYMJZ-STQMWFEESA-N Gly-Trp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O GULGDABMYTYMJZ-STQMWFEESA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- QSLKWWDKIXMWJV-SRVKXCTJSA-N His-Cys-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N QSLKWWDKIXMWJV-SRVKXCTJSA-N 0.000 description 1
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- KHUFDBQXGLEIHC-BZSNNMDCSA-N His-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 KHUFDBQXGLEIHC-BZSNNMDCSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 1
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- JWBXCSQZLLIOCI-GUBZILKMSA-N Ile-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C JWBXCSQZLLIOCI-GUBZILKMSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 1
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- HODVZHLJUUWPKY-STECZYCISA-N Ile-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=C(O)C=C1 HODVZHLJUUWPKY-STECZYCISA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- XOEDPXDZJHBQIX-ULQDDVLXSA-N Leu-Val-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOEDPXDZJHBQIX-ULQDDVLXSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 1
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- MVQGZYIOMXAFQG-GUBZILKMSA-N Met-Ala-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MVQGZYIOMXAFQG-GUBZILKMSA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- PJWDQHNOJIBMRY-JYJNAYRXSA-N Met-Arg-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PJWDQHNOJIBMRY-JYJNAYRXSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 1
- HGCNKOLVKRAVHD-RYUDHWBXSA-N Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-RYUDHWBXSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- OZILORBBPKKGRI-RYUDHWBXSA-N Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 OZILORBBPKKGRI-RYUDHWBXSA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 1
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 1
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- JLDZQPPLTJTJLE-IHPCNDPISA-N Phe-Trp-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JLDZQPPLTJTJLE-IHPCNDPISA-N 0.000 description 1
- IEHDJWSAXBGJIP-RYUDHWBXSA-N Phe-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 IEHDJWSAXBGJIP-RYUDHWBXSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 1
- 108010064622 Procollagen N-Endopeptidase Proteins 0.000 description 1
- 102000015339 Procollagen N-endopeptidase Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 238000011530 RNeasy Mini Kit Methods 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 101710141795 Ribonuclease inhibitor Proteins 0.000 description 1
- 229940122208 Ribonuclease inhibitor Drugs 0.000 description 1
- 102100037968 Ribonuclease inhibitor Human genes 0.000 description 1
- 229920005683 SIBR Polymers 0.000 description 1
- 235000012377 Salvia columbariae var. columbariae Nutrition 0.000 description 1
- 240000005481 Salvia hispanica Species 0.000 description 1
- 235000001498 Salvia hispanica Nutrition 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- CUTPSEKWUPZFLV-WISUUJSJSA-N Thr-Cys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(O)=O CUTPSEKWUPZFLV-WISUUJSJSA-N 0.000 description 1
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- KHTIUAKJRUIEMA-HOUAVDHOSA-N Thr-Trp-Asp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 KHTIUAKJRUIEMA-HOUAVDHOSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- WQYPAGQDXAJNED-AAEUAGOBSA-N Trp-Cys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N WQYPAGQDXAJNED-AAEUAGOBSA-N 0.000 description 1
- FNOQJVHFVLVMOS-AAEUAGOBSA-N Trp-Gly-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N FNOQJVHFVLVMOS-AAEUAGOBSA-N 0.000 description 1
- MKDXQPMIQPTTAW-SIXJUCDHSA-N Trp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N MKDXQPMIQPTTAW-SIXJUCDHSA-N 0.000 description 1
- WKQNLTQSCYXKQK-VFAJRCTISA-N Trp-Lys-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WKQNLTQSCYXKQK-VFAJRCTISA-N 0.000 description 1
- CYLQUSBOSWCHTO-BPUTZDHNSA-N Trp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N CYLQUSBOSWCHTO-BPUTZDHNSA-N 0.000 description 1
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- HNERGSKJJZQGEA-JYJNAYRXSA-N Tyr-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HNERGSKJJZQGEA-JYJNAYRXSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- ULUXAIYMVXLDQP-PMVMPFDFSA-N Tyr-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC4=CC=C(C=C4)O)N ULUXAIYMVXLDQP-PMVMPFDFSA-N 0.000 description 1
- AXKADNRGSUKLKI-WIRXVTQYSA-N Tyr-Trp-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 AXKADNRGSUKLKI-WIRXVTQYSA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 1
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 1
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- LMVWCLDJNSBOEA-FKBYEOEOSA-N Val-Tyr-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N LMVWCLDJNSBOEA-FKBYEOEOSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000219995 Wisteria Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 230000002009 allergenic effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 235000014167 chia Nutrition 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- OKKJLVBELUTLKV-MICDWDOJSA-N deuteriomethanol Chemical compound [2H]CO OKKJLVBELUTLKV-MICDWDOJSA-N 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 230000001279 glycosylating effect Effects 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000003228 microsomal effect Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229940126701 oral medication Drugs 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005895 oxidative decarboxylation reaction Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Toxicology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Tropical Medicine & Parasitology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Description
"Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marino"
TESTO DELLA DESCRIZIONE
La presente invenzione ha per oggetto un metodo per la produzione di proteine collageniche derivanti da spugna di mare e un organismo capace di produrre dette proteine.
Il collagene à ̈ una proteina della matrice extracellulare presente in tutti gli animali, dai più semplici all'uomo, che negli ultimi due decenni ha assunto un rilevante interesse commerciale.
La domanda di brevetto US 2010/0260823, ad esempio, descrive preparazioni farmaceutiche contenenti collagene marino trattato ed ottenuto da spugne, preferibilmente da Chondrosia.reniformis.
In natura il suo processo di biosintesi, messo in atto da cellule specializzate, prevede diversi passaggi che iniziano con la trascrizione del, o dei, geni che ne codificano la struttura primaria e proseguono con l'intervento di enzimi che la modicano sino a farle assumere la conformazione attiva, matura.
In particolare il collagene nasce come pre-procollagene, prodotto che possiede rispetto al collagene, due pro-peptidi, uno all'N-terminale ed uno C-terminale, che hanno struttura globulare.
La catena di pre-procollagene subisce la rimozione del peptide segnale, 1'idrossilazione di specifici residui di prolina e lisina ad idrossiprolina ed idrossilisina. Tre di queste catene si avvolgono a formare una tripla elica, stabilizzata da legami idrogeno tra amminoacidi idrossilati, dando origine al pro-collagene.
I passi successivi prevedono la glicosilazione dell'elica, la secrezione all'esterno della cellula e l'azione di alcune procollagene peptidasi che rimuovono i pro-peptidi all' N-terminale ed al C-terminale, trasformando il pro-collagene in tropocollagene .
Il tropocollagene à ̈ quindi l'unità strutturale del collagene, ed à ̈ una proteina formata da tre catene peptidiche con andamento sinistrorso che si associano a formare una tripla elica destrorsa.
Le tre catene nel tropocollagene sono tenute insieme da legami idrogeno, legami che sono possibili grazie alla presenza di glicine e alle modifiche post-traduzionali di lisina e prolina.
Le principali modifiche del procollagene, nel processo di maturazione del collagene, consistono quindi nell' idrossilazione delle proline (uno degli amminoacidi caratterizzanti questa tipologia di proteine) e nella glicosilazione (aggiunta di zuccheri) : queste modifiche vengono effettuate da specifici enzimi presenti nella cellula produttrice di collagene.
La prolil-4-idrossilasi (P4H) à ̈ un enzima chiave, necessario per ottenere collagene da procollagene e, nei mammiferi, à ̈ un tetramero con subunità α2β2.
Le subunità alfa contengono i siti catalitici coinvolti nell'idrossilazione dei residui di prolina.
Le subunità beta sono identiche alla proteina disolfuro isomerasi (PDI) e nel caso specifico svolgono una funzione strutturale nel mantenere funzionale la subunità alfa.
E' noto l'utilizzo di sistemi ricombinanti per la produzione in organismi ospiti, quali funghi e batteri, di collagene umano.
L'espressione di geni esogeni codificanti per collagene in sistemi ricombinanti risulta, tuttavia difficoltosa dato che, per ottenere la formazione di una proteina funzionante, Ã ̈ necessario un complesso sistema di gestione delle necessarie modificazioni post-traduzionali .
L'interesse verso sorgenti di collagene alternative a quelle tradizionali, bovine o suine, Ã ̈ cresciuto negli ultimi anni, anche a seguito dei problemi di biosicurezza emersi con l'impiego di bioderivati da mammiferi.
Con il termine di "proteine collageniche marine derivanti da spugna" si intendono proteine con struttura collagenica prodotte da poriferi, ossia precursori del collagene (procollagene), collagene, frammenti di questi o simili.
Il collagene marino ad oggi à ̈ ottenuto solo da estrazione dall'organismo sorgente, ossia dalle spugne, con notevoli difficoltà di purificazione per la frequente co-presenza di altri componenti tossici e con rilevante impatto ambientale in quanto la spugna sottoposta al processo di estrazione non proviene da allevamento ma dall'ambiente naturale.
La domanda di brevetto US 2003/0032601 descrive un metodo di estrazione di collagene da spugne.
E' noto che queste proteine ottenute da spugne presentano alcune peculiarità rispetto a quelle dei mammiferi, in particolare il collagene di spugna C. reniformis risulta essere particolarmente utile in campo cosmetico e farmacologico, in particolare per la costituzione di capsule di rivestimento per l'assunzione orale di farmaci.
Tuttavia la co-presenza nell'animale di origine di notevoli quantità di composti tossici rende difficoltoso, lungo e costoso il metodo di estrazione di questa miscela di proteine dalla biomassa di provenienza.
Scopo della presente invenzione à ̈ quello di:
produrre collagene, in particolare proteine collageniche, derivanti da spugna di mare, in modo rapido e poco costoso,
- ottenere elevate quantità di collagene senza un impatto negativo sull'ambiente (come invece accade per i metodi di produzione tradizionali che prevedono il prelievo di spugne dall'ambiente),
- ovviare ai problemi di estrazione evidenziati dall'arte nota e consentire, quindi, di avere un composto sostanzialmente puro, privo di altri componenti, anche tossici, normalmente presenti nell'organismo produttore.
Oggetto della presente invenzione à ̈ quindi un metodo per la produzione di proteine collageniche ricombinanti di spugna di mare il quale metodo prevede la trasformazione di un organismo ospite prescelto con vettori di espressione che consentono di :
- aggiungere l'informazione genetica codificante per almeno un enzima coinvolto nella modifica della struttura primaria della proteina per permetterne una sua corretta organizzazione,
- aggiungere l'informazione genetica codificante per la struttura primaria della o delle proteine.
Il metodo di produzione prevede quindi l'introduzione e l'espressione all'interno di un organismo ospite di almeno una sequenza nucleotidica codificante per una catena peptidica di collagene marino e di almeno una sequenza nucleotidica codificante per un enzima o per almeno una sua subunità , il quale enzima à ̈ coinvolto nelle modifiche post-traduzionali del processo di formazione del collagene marino.
Il metodo prevede quindi, sfruttando la tecnologia ricombinante, l'espressione all'interno di un organismo ospite di almeno un gene coinvolto nel processo di produzione di collagene marino di spugna.
Secondo il metodo oggetto della presente invenzione detto organismo ospite à ̈ costituito da cellule eucariotiche di lievito trasformate con vettori di espressione: la trasformazione, con vettori di espressione ricombinanti contenenti le sequenze codificanti per almeno un enzima coinvolto nell'attività prolil-idrossilasica, permette di ottenerne ceppi in grado di esprimere tale polipeptide funzionale nel reticolo endoplasmatico della cellula del sistema ospite.
Questa cellula base potrà poi essere trasformata con uno o più specifici geni codificanti per proteine collageniche di spugna.
Vantaggiosamente per avere un'adeguata produzione di collagene ricombinante à ̈ necessario selezionare cellule che abbiamo più copie integrate di geni del collagene nel proprio genoma.
Il metodo oggetto della presente invenzione consente quindi di ottenere elevate quantità di collagene e/o precursori del collagene marino di spugna all'interno di un organismo ospite che, in assenza del processo di trasformazione, non sarebbe in grado di produrre detta molecola o i suoi precursori .
Questo consente di facilitare il processo di purificazione del collagene e/o dei suoi precursori.
Vantaggiosamente, secondo la presente invenzione come organismo ospite à ̈ stato scelto un lievito (eucariote unicellulare), il quale, rispetto ad un batterio (pur essendo più semplice da utilizzare), permette di sfruttare un preesistente apparato enzimatico in grado di glicosilare, essendo comunque necessaria l'introduzione degli enzimi coinvolti nel processo di idrossilazione per consentire al lievito di produrre collagene e/o procollagene con la corretta struttura a tripla elica.
Oggetto della presente invenzione à ̈ quindi anche un sistema eucariotico per l'espressione in forma ricombinante di proteine collageniche derivanti da spugna di mare in cui le cellule esprimono, come mRNA e proteina, uno o più geni che codificano per il collagene e per uno o più enzimi necessari per le modificazioni post-traduzionali dei collageni medesimi .
Secondo l'invenzione il ceppo di lievito à ̈ stato trasformato con i geni di entrambe le subunità alfa e beta dell'enzima prolil-4-idrossilasi di spugna di mare.
In particolare la spugna appartiene alla specie C . reniformis.
Il ceppo di lievito à ̈ anche stato trasformato con specifico gene codificante per il procollagene non fibrillare di spugna C.reniformis ossia il gene ColCH.
L'organismo ospite trasformato, utilizzato per produrre proteine collageniche ricombinanti secondo la presente invenzione, Ã ̈ un ceppo di lievito Pichia pastoris .
In particolare, come descritto di seguito, sono stati utilizzati ceppi di P. pastoris del kit PichiaPinkâ„¢ Expression System, ma à ̈ possibile utilizzare qualsiasi ceppo di lievito aventi caratteristiche simili sul quale à ̈ possibile applicare la tecnologia ricombinante.
Il ceppo di P. pastoris del kit PichiaPinkâ„¢ Expression System à ̈ difettivo del gene relativo alla sintesi dell'adenina.
Le caratteristiche del kit e del ceppo sono contenute nel suo manuale di utilizzo (Pichia Expression Kit Catalog no. K1710-01, Manual part no.
25-0043).
Il ceppo non à ̈ tossico né pericoloso per l'uomo e l'ambiente.
Detto ceppo di lievito Pichia pastoris, trasformato come sopra descritto, identificato con il riferimento "Pichia pastoris ColCH4" Ã ̈ stato depositato presso la Collezione dei Lieviti Industriali DBVPG (Industriai Yeasts Collection DBVPG) , con sede in Borgo 20 Giugno 74 06121 Perugia Italia, in data 05/04/13 con numero 34P, secondo le diposizioni del Trattato di Budapest.
Vantaggiosamente il ceppo di lievito à ̈ stato trasformato, tramite tecnologia ricombinante, con un gene codificante per un collagene marino analogo al collagene di tipo IV dei vertebrati, pertanto il metodo e l'organismo oggetto della presente invenzione à ̈ anche in grado di produrre collageni di struttura complessa similari ai collageni di tipo IV degli organismi superiori.
Le cellule di lievito trasformate sono poi messe in coltura per consentire l'espressione delle proteine ricombinanti e l'estrazione/purificazione del bioprodotto ricombinante (collagene marino).
Oggetto della presente invenzione à ̈ anche un metodo di trasformazione tramite tecnologia ricombinante di un ceppo di lievito per l'espressione all'interno delle cellule di detto ceppo di almeno una sequenza nucleotidica codificante per una catena polipeptidica primaria di collagene marino, cosiddetto procollagene, e di almeno una sequenza nucleotidica codificante per una proteina enzimatica o di almeno una sua subunità coinvolta nelle modifiche di detta catena nel processo di formazione del collagene marino.
Il metodo oggetto della presente invenzione consente di trasformare il ceppo di Pichia pastoris con tre differenti vettori ciascuno comprendente una specifica sequenza di DNA.
Il metodo consente quindi di introdurre nel genoma di Pichia pastoris tre differenti sequenze nucleotidiche codificanti ciascuna per una proteina coinvolta nella formazione del collagene marino.
Secondo l'invenzione detto metodo comprende i seguenti passi:
identificazione delle sequenze nucleotidiche codificanti per le catene alfa e beta dell'enzima coinvolto nelle modifiche post-traduzionali del collagene,
- preparazione ed utilizzo di almeno un vettore di espressione per l'introduzione di dette sequenze all 'interno delle cellule,
selezione degli organismi trasformati contenenti dette sequenze integrate nel proprio genoma .
Detto metodo di trasformazione del lievito per la produzione di proteine ricombinati di spugna di mare C. reniformis à ̈ possibile grazie all'identificazione dell'enzima prolil-4 -idrossilasi di spugna di mare, isolata dall'animale.
Il metodo prevede la co-trasformazione del ceppo di lievito con i due vettori comprendenti uno la sequenza codificante per le subunità alfa e l'altro la sequenza codificante per la subunità beta dell'enzima prolil-4-idrossilasi, seguita dalla trasformazione con il vettore di espressione comprendente la sequenza codificante per 11 procollagene non fibrillare.
Ovviamente à ̈ possibile prevedere l'uso di un solo vettore comprendente le sequenze codificanti per entrambe le subunità .
Preferibilmente tra detti due passi à ̈ previsto un passo di selezione dei ceppi di lievito con elevata attività prolil-idrossilasica.
Oggetto della presente invenzione à ̈ anche almeno un vettore di espressione per la trasformazione di un organismo ospite tramite tecnologia ricombinante.
Detti vettori comprendono le sequenze codificanti per la struttura peptidica del collagene marino e/o per i geni degli enzimi coinvolti nel processo di trasformazione di dette catene peptidiche .
Secondo l'invenzione sono stati realizzati vettori di espressione che presentano sequenze codificanti per peptidi segnale ottimali posizionate a monte delle regioni codificanti le proteine di interesse.
Preferibilmente secondo l'invenzione sono stati sviluppati vettori di espressione comprendenti:
cDNA codificante (SEQ ID NO: 1) per la subunità alfa della prolil-4-idrossilasi (vettori pPinkHC\α o pPinkLC\α),
cDNA codificante (SEQ ID NO: 3) per la subunità beta della prolil-4-idrossilasi (vettore apPIC6B\PDI)
cDNA codificante (SEQ ID NO: 5) per il collagene non fibrillare di C. reniformis (pPICZB\colCH).
In particolare, in una forma esecutiva della presente invenzione, nel vettore di espressione con la sequenza di DNA codificante per la subunità beta dell'enzima prolil-4-idrossilasi il sito di clonaggio à ̈ preceduto dalla regione codificante per l'Alfa Mating factor (AM) di S. cerevisiae.
E' possibile prevedere l'uso di altri fattori di secrezione oltre a quello sopra indicato.
Secondo la presente invenzione sono stati caratterizzati gli enzimi responsabili della idrossilazione delle catene peptidiche nel processo di biosintesi del collagene nella spugna e le loro sequenze geniche e con esse à ̈ stato trasformato un lievito, in particolare à ̈ stato caratterizzato l'enzima prolil-4-idrossilasi (subunità alfa e beta) di C.reniformis.
Detto enzima appartiene alla categoria delle prolil-idrossilasi di tipo II.
I polipeptidi che costituiscono le subunità alfa e beta dell'enzima prolil-4-idrossilasi della spugna di mare C. reniformis e la loro rispettiva sequenza amminoacidica non sono noti allo stato dell'arte.
In particolare oggetto dell'invenzione sono le sequenze nucleotidiche ed amminoacidiche che codificano le subunità alfa e beta dell'enzima prolil 4-idrossilasi (rispettivamente (SEQ ID NO: 1,2,3 e 4).
I geni (SEQ ID N0:1 e SEQ ID NO:3) codificanti per l'enzima avente attività idrossilasica nel
procedimento di produzione di collagene marino di C.reniformis sono stati isolati dall'organismo e identitificati tramite il procedimento tecnico (PCR) descritto con maggiori dettagli di seguito.
Il metodo e l'organismo trasformato tramite vettori oggetto della presente invenzione consentono quindi la produzione su larga scala di proteine della matrice extracellulare derivanti da spugne, le quali proteine, in particolare il collagene ed i suoi derivati, potranno essere utilizzate nel settore biomedico, farmaceutico e cosmetico.
Il collagene marino à ̈ un biomateriale che può essere utilizzato in alternativa o in combinazione con il collagene di mammifero.
Il metodo di ottenimento per via ricombinante presenta numerosi vantaggi:
- consente una produzione su larga scala senza impatto sull'ambiente in quanto non utilizza animali che vivono in natura (Ã ̈ noto infatti che le spugne sono animali non facilmente allevabili, pertanto i metodi tradizionali per la produzione di collagene sfruttano animali non di allevamento con notevole impatto ambientale),
elimina il problema della co-presenza di metaboliti secondari nei preparati naturali (i metodi tradizionali di base che prevedono l'estrazione di collagene da spugne non separano con sufficiente efficacia i metaboliti secondari e questo inconveniente può conferire all'estratto notevole tossicità . Questo complica il processo di estrazione obbligando a costosi e lunghi processi di purificazione del materiale estratto),
consente di ottenere biomateriale estratto pulito (ossia privo di sostanze tossiche ed estranee al collagene ed ai suoi derivati), ben caratterizzato ed omogeneo,
annulla il rischio di avere contaminanti tossici o sostanze allergeniche, grazie alla produzione di collagene marino in lievito (comunemente presenti nelle matrici naturali e/o nel collagene suino o bovino).
Queste ed altre caratteristiche e vantaggi della presente invenzione risulteranno più chiaramente dalla seguente descrizione di alcuni esempi esecutivi illustrati nei disegni allegati in cui:
la fig.1 illustra la strategia di cotrasformazione del ceppo di lievito difettivo per il gene relativo alla sintesi dell'adenina, con i tre vettori, contenenti rispettivamente 1) il gene codificante la sub-unità a di P4H e il gene Ade+, 2) il gene relativo alla sintesi della PDI, con il marcatore per la resistenza alla blasticidina, e 3) il gene codificante per il collagene non fibrillare con marcatore per la resistenza alla zeocina. I ceppi co-trasformati vengono facilmente selezionati in piastre prive di adenina e con l'antibiotico blasticidina e zeocina;
la fig.2 illustra schematicamente i tre vettori di espressione ed il relativo marcatore di selezione;
le fig.3a e 3b illustrano la mappa dei vettori pPinkLC e pPinkHC.
la fig.4 illustra la mappa del vettore apPIC6; la fig.5 illustra la mappa del vettore pPICZA; la fig.6 illustra l'attività della P4H ricombinante nei diversi ceppi di P. pastoris analizzata mediante la quantificazione della<14>C02prodotta dalla decarbossilazione del 2-oxo [l-<14>C] glutarato; come controllo à ̈ stato utilizzato il ceppo αβΙΗ incubato per 30 minuti in ghiaccio con un inibitore specifico della P4H, l'acido cumalico;
la fig.7 illustra la comparazione dell'attività della P4H ricombinante nei due ceppi di P. pastoris High copy e Low copy analizzata mediante la quantificazione della<14>C02prodotta dalla decarbossilazione del 2-oxo [l-<14>C] glutarato; come controllo à ̈ stato utilizzato il ceppo αβΙΗ incubato per 30 minuti in ghiaccio con un inibitore specifico della P4H, l'acido cumalico;
la fig.8 illustra la valutazione dell'espressione della P4H ricombinante nel tempo sul ceppo αβ2L.; l'espressione della P4H à ̈ stata analizzata mediante la quantificazione dell'attività enzimatica (<14>C02prodotta dalla decarbossilazione del 2-oxo [l-<14>C] glutarato) ; come controllo à ̈ stato utilizzato il ceppo αβ1Η incubato per 30 minuti in ghiaccio con un inibitore specifico della P4H, l'acido cumalico;
la fig.9 illustra l'analisi quantitativa relativa al numero di copie di geni inseriti stabilmente nel genoma dei diversi ceppi di lievito trasformati ;
la fig. 10 illustra l'espressione degli mRNA relativi ai tre geni inseriti nei ceppi di P. pastoris P4H, PDI e ColCH valutati mediante PCR quantitativa. I livelli di espressione dei messaggeri sono stati analizzati nei lieviti 24 ore dopo l'induzione. T0 rappresenta il campione controllo costituito dal ceppo ColCH4 estratto immediatamente dopo 1'indùzione;
la fig.ll illustra l'analisi mediante SDS-Page seguita da colorazione di Coomassie del (a) e del terreno di coltura concentrato e dializzato contro acqua (b) di ceppi di P. pastoris indotti con metanolo.
a) 50 Î1⁄4g di proteine derivate da totale del ceppo αβ2L> (A) e del ceppo ColCH4 (B) dopo induzione con metanolo per 60 ore.
b) 30 Î1⁄4g di proteine presenti nel terreno di coltura concentrato e dializzato del ceppo ColCH4 che non à ̈ stato indotto (C) o che à ̈ stato indotto per 60 ore con metanolo (D); 15 Î1⁄4g di proteine presenti nel terreno di coltura concentrato e dializzato del ceppo αβ2L (F) e ColCH4 (E) indotti per 60 ore con metanolo;
la fig.12 illustra l'identificazione tramite spettro MS<2>del peptide triptico GAVGPGGKPGPR (doppio caricato m/z 525.5).
Secondo la presente invenzione il metodo per la produzione di proteine collageniche ricombinanti derivanti dalla spugna di mare C. reniformis, in particolare di pro-collagene idrossilato, prevede l'utilizzo di un organismo ospite costituito da un ceppo di lievito geneticamente modificato.
Il metodo di ottenimento di detto organismo atto alla produzione di proteine di spugna di mare ricombinanti prevede la co-trasformazione di ceppi di lievito con tre differenti vettori di espressione comprendenti rispettivamente:
la sequenza codificante per la subunità a dell'enzima prolil-4-idrossilasi (P4H),
la sequenza codificante della subunità β dell'enzima prolil-4-idrossilasi (Proteina Disolfuro Isomerasi, PDI),
- la sequenza codificante per un collagene di tipo non fibrillare.
Il ceppo di lievito utilizzato à ̈ il ceppo di Pichia pastoris.
Preferibilmente il metodo di ottenimento prevede la trasformazione del ceppo con i vettori con le sequenze codificanti per l'enzima coinvolto nella modifica post-traduzionale della proteina collagenica e la successiva trasformazione di detto ceppo (contenente i geni per codificanti per le subunità alfa e beta dell'enzima prolil-4-idrossilasi) con uno o più geni codificanti per proteine collageniche di spugna di mare.
Secondo l'invenzione il ceppo trasformato tramite specifico vettore di espressione, come descritto con maggiore dettaglio di seguito, contiene il gene codificante per il procollagene di spugna C. reniformis ColCH.
La sequenza nucleotidica del gene (ColCH) codificante per il pro-collagene non fibrillare e la sequenza amminoacidica della proteina di procollagene non fibrillare à ̈ accessibile in GenBank con numero DQ874470.
Il gene ColCH codificante per la proteina di pro-collagene non fibrillare ha una sequenza nucleotidica secondo la SEQ ID NO: 5.
La proteina ColCH ha una sequenza amminoacidica secondo la SEQ ID NO:6.
Oggetto della presente invenzione sono la sequenza codificante per la subunità a dell'enzima prolil-4-idrossilasi (P4H) e la sequenza codificante per la subunità β del detto enzima (Proteina Disolfuro Isomerasi, PDI), non ancora note allo stato dell'arte. Dette sequenze sono state isolate, identificate, inserite in vettori plasmidici e clonate in ceppi di E. coli.
Il gene codificante per la subunità alfa della proteina enzimatica prolil-4-idrossilasi (P4H) presenta una sequenza nucleotidica corrispondente alla sequenza SEQ ID NO: 1.
La subunità alfa della proteina prolil-4 -idrossilasi (P4H) presenta una sequenza amminoacidica corrispondente alla sequenza SEQ ID NO: 2.
Il gene codificante per la proteina Disolfuro Isomerasi (PDI) (subunità beta dell'enzima Prolil 4 -idrossilasi) presenta una sequenza nucleotidica corrispondente alla sequenza SEQ ID NO: 3.
La proteina Disolfuro Isomerasi (PDI) presenta una sequenza amminoacidica corrispondente alla sequenza SEQ ID NO: 4.
Come illustrato in figura 1 per la realizzazione dei ceppi di P. pastoris in grado di esprimere e quindi produrre proteine ricombinanti, Ã ̈ stato utilizzato il kit commerciale PichiaPinkâ„¢ Expression System (Life Technology), in cui ceppi denominati Pichia Pink â„¢ sono difettivi per il gene relativo alla sintesi dell'adenina (ade2); i vettori presenti nel kit (pPinkHC o pPinkLC) contengono il gene ADE2, che permette al lievito trasformato di crescere su terreno privo di adenina.
Questo ceppo commerciale à ̈ adatto all'espressione di un singolo polipeptide ricombinante per volta.
La presente invenzione prevede una modificazione del metodo di trasformazione del lievito e ha permesso l'integrazione di tre differenti sequenze codificanti, inserite in tre vettori differenti, e la loro co-espressione in un unico sistema.
I vettori presenti nel kit (pPinkHC o pPinkLC) e che contengono il gene ADE2 sono stati utilizzati per contenere la sequenza codificante per la subunità a dell'enzima prolil-4-idrossilasi (P4H).
Per la sequenza codificante la subunità β (Proteina Disolfuro Isomerasi, PDI) à ̈ stato utilizzato un vettore di espressione contenente il marcatore per la resistenza alla blasticidina.
Per la sequenza codificante il pro-collagene di C. reniformis à ̈ stato utilizzato un vettore pPICZ contenente geni che conferiscono la resistenza all'antibiotico zeocina.
CDNA Vettore di Vettore di
Tipo di espressione usato espressione
selezione ricombinante ottenuto
P4H pPink pPink\a Ade+ PDI apPIC6 B apPIC6 B\PDI Resistenza blasticidina COLLIeh pPICZ pPICZ\Colch Resistenza zeocina
Dopo la trasformazione, i ceppi in cui si erano integrate le tre sequenze codificanti sono stati facilmente selezionati in piastre prive di adenina, con i suddetti antibiotici.
Poiché l'enzima ricombinante prolil-4 idrossilasi deve svolgere la propria attività enzimatica all'interno della cellula di lievito, ossia à ̈ necessario che nella cellula di lievito ricombinante siano presenti entrambe le sequenze codificanti per le subunità alfa e beta dell'enzima, la sequenza codificante per la subunità alfa dell'enzima prolil-4-idrossilasi (P4H) e per il collagene (ColCH) sono state inserite nei vettori di espressione provviste dei loro peptidi segnali, mentre nella sequenza codificante per la subunità beta dell'enzima (PDI) il peptide segnale proprio à ̈ stato sostituito con quello di S. cerevisiae AlfaMating factor (AM), scegliendo la versione del vettore pPIC6 in cui il MCS (multi cloning site, sito di multi clonaggio) , à ̈ preceduto dalla sequenza codificante per questo peptide segnale (apPIC).
Identificazione e clonaggio delle sequenze codificanti per la subunità alfa e beta della prolil-4-idrossilasi di C. reniformis.
Le sequenze codificanti complete per la subunità alfa e beta dell'enzima prolil-4-idrossilasi (P4H e PDI) di C. reniformis sono state identificate mediante approccio PCR.
In entrambi i casi sono state identificate zone altamente conservate delle regioni codificanti della P4H e della PDI della specie A. queenslandica ; all'interno di esse sono stati disegnati quindi un set di oligonucleotidi da impiegare come primers senso in reazioni di PCR in cui, come antisenso.
veniva impiegato un oligonucleotide dalla sequenza (5'-GTACTAGTCGACGCGTGGCC -3'), in grado di appaiarsi in modo specifico all'estremità 3' di sequenze di cDNA opportunamente retrotrascritte con un oligo-dT-adapter (5'-GGCCACGCGTCGACTAGTACTTTTTTTTTTTTTTTTT-3 ') come innesco .
Una volta identificata amplificata e sequenziata una prima regione all'estremo 3' del cDNA della due sequenze, con il sistema GeneRacerâ„¢ (Life Technology) Ã ̈ stato possibile amplificare e sequenziare la regione mancante in 5'.
Una volta completata l'intera sequenza nucleotidica del cDNA, à ̈ stata fatta un'ultima reazione di amplificazione ad alta fedeltà , impiegando una coppia di primers collocati nelle regioni più esterne del cDNA e 1 Î1⁄4l di prodotto di amplificazione à ̈ stato inserito, mediante una reazione ligasica, nel plasmide pCR*II e clonato in ceppi di E. coli.
Le sequenze sino ad oggi non note allo stato dell'arte dei cDNA della P4H e della PDI di C. reniformis ottenute sono state analizzate utilizzando l'algoritmo BLAST nel "National Centre for Biotechnology Information" (http://blast.ncbi.nlm.nih.gov/Blast .cgi).
Le sequenze amminoacidiche dedotte sono state analizzate usando "SignalP 3.9 server" (http://www.cbs.dtu.dk/services/SignalP/) , per identificare il sito di taglio dell'eventuale peptide segnale .
In relazione alla sequenza amminoacidica dedotta di P4H, l'analisi con Signal P 3.9 Server rivela la probabile presenza di un peptide segnale in posizione 1-28 con sito di taglio tra Gly 27 e Glu 28. La presenza di un dominio Pfam P4Ha_N (subunità a della P4H, regione N-terminale) tra l'aa 32 e l'aa 163 indica che la proteina à ̈ un membro della superfamiglia delle prolil-4-idrossilasi, mentre tra i residui 332 e 517 c'à ̈ un P4Hc (dominio omologo della sub-unità a della prolil-4-idrossilasi) al cui interno à ̈ presente un dominio 20G-Fell_0xy (residui 412-517), che si trova nei membri della superfamiglia delle ferro-diossigenasi 2-ossoglutarato (20G)-dipendenti, così come il C-terminale della sub-unità a della P4H , che à ̈ una regione coinvolta nell'attività catalitica. Inoltre à ̈ presente un potenziale sito di N-glicosilazione in posizione 157 (Asp) all'interno dei tetra-amminoacido 157-160, mentre non à ̈ presente alcun sito di O-glicosilazione. Infine tra i residui 302 e 304 à ̈ presente la triade His-His-Lys che lega il gruppo carbossilico al C5 del 2-ossoglutarato .
Il prodotto putativo della traduzione di P4Hach ha un peso molecolare stimato di 61,9 kDa ed un punto isolelettrico di 6,31.
In relazione alla sequenza amminoacidica dedotta della PDI, l'analisi con Signal P 3.9 Server rivela la probabile presenza di un peptide segnale in posizione 1-16 con un sito di taglio tra Gly 16 e Ala 17. Le analisi con BLAST e Smart della sequenza del polipeptide mostrano la presenza di quattro differenti domini TRX (avvolgimento tioredossinatipo): 1) PDIa, motivo TRX redox attivo all'N-terminale tra l'aa 30 e il 127; 2) PDIb, motivo TRXslmile redox inattivo tra aa 135 e aa 230; 3) PDIb', motivo TRX-simile redox inattivo tra aa 242 e aa 345, 4) PDIa_PDIa'C con una regione TRX redox attiva al C-terminale in posizione 366-466. Non sono presenti siti di N- e O-glicosilazioni. In ciascuno dei due domini TRX con attività redox (PDIa e PDIa_PDIa'C) à ̈ presente il motivo -Cys-Gly-His-Cys-, che rappresentano due siti catalitici che agiscono indipendentemente per l'attività della PDI.
Il prodotto putativo della traduzione della PDI ha un peso molecolare stimato di 58,8 kDa ed un punto isoelettrico di 4,34.
Preparazione dei vettori di espressione Preparazione del vettore di espressione comprendente la sequenza codificante per la subunità alfa dell'enzima prolil 4-idrossilasi (P4H): pPinkHC\α e di pPinkLC\α
Il cDNA codificante per la sub-unità a della prolil-4-idrossilasi di C. reniformis, esteso dalla sequenza consenso per l'inizio della traduzione fino al codone di stop, e fiancheggiato dal sito per EcoRI in 5' e per KpnI in 3', à ̈ stato amplificato mediante PCR e inserito con reazione ligasica all'interno dell'MCS nel vettore pPinkHC (high copy) o pPinkLC (low copy) (Fig.3b e 3a) (Life Technologyâ„¢), preventivamente linearizzati con EcoRI e con Kpnl, generando così, rispettivamente, pPinkH/α e pPinkL/a.
Nello specifico, al fine di introdurre immediatamente prima del codone codificante per la metionina iniziale la sequenza consenso di lievito, relativa all'inizio della traduzione (sequenza di Kozac, gaaacg), Ã ̈ stata eseguita un'amplificazione in PCR in due step.
Una prima amplificazione à ̈ stata effettuata impiegando la coppia di primers FwalfaRO come senso e RewalfaT come antisenso:
• nome: FwalfaRO
sequenza : 5'-gaaacgatgcagttggtattagggatgagt-3' posizione:1-24
SEQ ID NO: 7.
• nome: RewalfaT
sequenza: 5'-cgcaaagtggtatgacaatga-3' posizione: 1642-1663
SEQ ID NO: 8
• nome: FwalfaRl
sequenza: 5'-aattGAATTCgaaacgatgcagttggtatt-3' posizione: 1 - 14
SEQ ID NO: 9
• nome: RewalfaRl
sequenza: 5'-aattGGTACCcgcaaagtggtatgacaatg-3' posizione: 1642-1662
SEQ ID NO: 10
(doppia sottolineatura utilizzata per identificare la sequenza di Kozac, in maiuscolo sono stati indicati i siti di restrizione mentre la sottolineatura singola indica le triplette di inizio e fine dell'ORF)
L'amplificazione à ̈ avvenuta secondo le condizioni sotto riportate:
Conc . Reagenti (Î1⁄4l)
finale High Fidelity PCR Buffer lOx 2.5 lx dNTP mix 10 mM 0.5 0.2 mM MgS0450mM 1 2 mM FwalfaRO 10 Î1⁄4Îœ 0.5 0.2 Î1⁄4Îœ RewalfaTIO Î1⁄4Îœ 0.5 0.2 Î1⁄4Îœ Plasmide pCR<^>II /P4H (40 ng/Î1⁄4Î ) 1.6
1
preparato in sez. 6.5.1. ng/Î1⁄4Î Platinum Taq High Fidelity (Life 1.0 0.1 Technologyâ„¢) unità H20 sterile 18.9 Volume Totale 25
Il profilo termico prevede 2 minuti di denaturazione iniziale a 94°C, seguiti dalla ripetizione per 20 cicli di 30 secondi a 94°C, 30 secondi a 60°C, 1,5 minuti a 68°C; una volta terminati i cicli, 7 minuti a 68°C.
L'amplificato ottenuto dalla reazione à ̈ stato poi diluito 1:100 e amplificato con le stesse modalità , impiegando la coppia di primers FwalfaRl come senso e RewRl come antisenso. In tal caso il profilo termico à ̈ stato: 2 minuti di denaturazione iniziale a 94°C, seguiti dalla ripetizione per 28 cicli di 30 secondi a 95°C, 30 secondi a 62°C, 1,5 minuti a 68°C; quindi, una volta terminati i cicli, 10 minuti a 68°C.
Otto reazioni di amplificazione identiche sono state riunite e purificate con il kit commerciale High Pure PCR Product Purification Kit (Roche) secondo le indicazioni del prodotto.
Amplificato purificato e vettori pPink HC o pPink LC sono stati quindi digeriti con EcoRI e Kpnl ed in fine à ̈ allestita la seguente reazione ligasica:
Reagenti Volume
Ligase buffer 5x 2 Î1⁄4Î
H20 sterile 1.9 /il
Plasmide digerito e
4 /il
purificato 4.9 ng/Î1⁄4Î
Inserto digerito e
1.6 /il
purificato 12 ng/Î1⁄4l
T4 DNA ligase (5U//il) 0.5 /il
Volume finale 10 /il
La reazione à ̈ stata effettuata per 18 ore a 16°C.
I Î1⁄4Î di prodotto della reazione ligasica à ̈ stato clonato in batteri One shot TOPIO chimicamente competenti (Life technologies). Identificate le colonie positive mediante analisi con PCR, i vettori ricombinanti pPinkHC/α e pPinkLC/a sono stati estratti da 200 mi di sospensione di E. coli trasformati, mediante impiego del kit Nucleobond Xtra midi (Macherey-Nagel) e successivamente linearizzati con l'enzima di restrizione Spel (Bcul).
Preparazione del vettore di espressione comprendente la sequenza codificante per la subunità beta dell'enzima prolil-4-idrossilasi (proteina disolfuro Isomerasi PDI):αpPIC6B/PDI
Il cDNA codificante per la subunità β della prolil-4-idrossilasi (PDI) di C. reniformis, esteso dal codone codificante per il primo amminoacido (Ala i7), dopo il sito di taglio del peptide segnale, fino al codone di stop, e fiancheggiato dai siti per Pmll in 5' e per NotI in 3', à ̈ stato amplificato mediante PCR con FwPDIr come primer senso e RewPDIr come primer antisenso:
• nome: FwPDIr
sequenza: 5'-aattCACGTGgcagacgatatccctgaaga-3' posizione: 49 - 69
SEQ ID NO: 11
• nome: RewPDIr
sequenza: aattGCGGCCGCctaaagttcaatcttttt-3' posizione: 1579-1597
SEQ ID NO: 12
(in maiuscolo sono evidenziati i siti di restrizione ed à ̈ stata sottolineata la tripletta di STOP) .
Il cDNA à ̈ stato quindi inserito con reazione ligasica all'interno dell'MCS nel vettore αpPIC6B (Life Technologyâ„¢) (Figura 4), preventivamente linearizzati con Piali e con Noti, generando così il costrutto apPIC6B/PDI.
La reazione di amplificazione à ̈ stata eseguita nelle condizioni sotto riportate:
Conc. Reagenti (Î1⁄4Î )
finale High Fidelity POR Buffer lOx 2.5 lx dNTP mix 10 mM 0.5 0.2 mM MgS0450mM 1 2 mM FwPDIr 10 Î1⁄4Îœ 0.5 0.2 Î1⁄4Îœ FwPDIr 10 /zM 0.5 0.2 Î1⁄4Îœ Plasmide pCR<^>II /PDI (50 ng/Î1⁄4Î )
1 2 ng/Î1⁄4Î preparato in sez. 6.5.1.
Platinum Tag High Fidelity (Life
0.1 1.0 unità Technology™)
H20 sterile 18.9
Volume Totale 25
Il profilo termico prevede: 2 minuti di denaturazione iniziale a 94°C, seguiti dalla ripetizione per 30 cicli di 30 secondi a 94°C, 30 secondi a 58°C, 2 minuti a 68°C; quindi, una volta terminati i cicli, 7 minuti a 68°C.
Otto reazioni di amplificazione identiche sono state riunite e purificate con il kit commerciale High Pure PCR Produci Purification Kit (Roche) secondo le indicazioni del prodotto.
Amplificato purificato e vettore PIC6aB, sono stati quindi digeriti prima con Pmll per 2 ore a 37°C.
Al termine della reazione à ̈ stata allestita la seconda digestione con NotI.
Inserto e vettore sono stati impiegati per la seguente reazione ligasica:
Reagenti Volume Ligase buffer 5x 2 Î1⁄4l
H20 sterile 1.5 Î1⁄4l Plasmide digerito e
4 Î1⁄4l purificato 5.1 ng/Î1⁄4Î
Inserto digerito e
2 Î1⁄4l purificato 21.25 ng/Î1⁄4l
T4 DNA ligase (5U/Î1⁄4l) 0.5 Î1⁄4l Volume finale 10 Î1⁄4l
La reazione à ̈ stata effettuata per 18 ore a 16°C.
1 Î1⁄4l di reazione ligasica così preparata, à ̈ stata usata per trasformare il ceppo di E. coli TOP10 chimicamente competente, secondo procedure standard con la differenza che l'antibiotico impiegato à ̈ stato in tal caso la blasticidina, usata 100 Î1⁄4g/ml, e che il terreno di coltura utilizzato à ̈ stato LB medium con una concentrazione NaCl dimezzata. Dopo aver identificato le colonie positive mediante analisi con PCR, il vettore ricombinante apPIC6B/PDI à ̈ stato estratto da 200 mi di sospensione di E. coli trasformati, mediante il kit Nucleobond Xtra midi (Macherey-Nagel) e linearizzato con l'enzima Spel (BcuI), secondo lo schema sottostante:
Reagenti Volume
Buffer 10 X 25 Î1⁄4l
Sac I lOu/Î1⁄4Ι (Thermo
60 Î1⁄4Î Scientific)
Vettore <xpPIC6B/PDI 2,3
26 Î1⁄4l
mg/mi
H20 sterile 139 Î1⁄4l Volume finale 250 Î1⁄4l
Preparazione_ del vettore di espressione comprendente la sequenza codificante per procollagene non_ fibrillare di_ C.reniformis: pPICZB\ColCH
Il cDNA codificante per il procollagene non fibrillare di C. reniformis (accessibile su GenBank DQ874470 e mostrato in SEQ ID NO: 5) esteso dalla sequenza consenso per l'inizio della traduzione fino al codone di stop e fiancheggiato dai siti per Pmll in 5' e per Noti in 3', à ̈ stato amplificato mediante PCR, quindi inserito con reazione ligasica all'interno dell'MCS nel vettore pPICZA (Life Technologyâ„¢) (Figura 5), preventivamente linearizzato con PmlI e con NotI generando così il costrutto pPICZA/ColCH.
Anche in questo caso, al fine di introdurre immediatamente prima del codone codificante per la metionina iniziale la sequenza consenso di lievito, relativa all'inizio della traduzione (sequenza di Kozac, gaaacg) , Ã ̈ stata eseguita un'amplificazione in PCR in due fasi.
Una prima amplificazione à ̈ stata effettuata impiegando la coppia di primers FwColRO come senso e RewColRT come antisenso:
• nome: FwColRO
sequenza : 3'-GAAACGatggagaagaccagttctaaagtg-5' posizione: 1 - 24
SEQ ID NO: 13
• nome: FwColR
sequenza: 3'-AATTCACGTGGAAACGatggagaagaccag -5' posizione: 1 - 14
SEQ ID NO: 14
• nome: RewColR
sequenza: 5'-AATT GCGGCCGC ttactttgtgcacactgc-3' posizione: 2275-2292
SEQ ID NO: 15
(in maiuscolo e sottolineato à ̈ indicata la sequenza di Kozac, in maiuscolo con doppia sottolineatura i siti di restrizione, in minuscolo e sottolineato le triplette di inizio e fine dell'ORF), secondo le condizioni sotto riportate:
Conc . Reagenti (Î1⁄4l)
finale High Fidelity PCR Buffer lOx 2.5 lx dNTP mix 10 mM 0.5 0.2 mM MgS0450mM 1 2 mM FwColRO 10 Î1⁄4Îœ 0.5 0.2 Î1⁄4Îœ RewColR 10 Î1⁄4Îœ 0.5 0.2 Î1⁄4Îœ Plasmide pCR<^>II /ColCH (40
1 1.6 ng/Î1⁄4Î ng/Î1⁄4Î )
Platinimi Taq High Fidelity
0.1 1.0 unità (Life Technology™)
H20 sterile 18.9 Volume Totale 25
Il profilo termico prevede 2 minuti di denaturazione iniziale a 94°C, seguiti dalla ripetizione per 15 cicli di 30 secondi a 94°C, 30 secondi a 63.7°C, 2,5 minuti a 68°C; una volta terminati i cicli, 7 minuti a 68°C.
1 Î1⁄4l di prodotto di PCR ottenuto dalla reazione à ̈ stato amplificato con le stesse modalità , impiegando la coppia di primers FwColRl come senso e RewColR come antisenso. In tal caso il profilo termico à ̈ stato: 2 minuti di denaturazione iniziale a 94°C, seguiti dalla ripetizione per 28 cicli di 30 secondi a 95°C, 30 secondi a 62°C, 2,5 minuti a 68°C; quindi, una volta terminati i cicli, 10 minuti a 68°C.
Otto reazioni identiche di questa amplificazione sono state riunite e purificate con il kit commerciale High Pure PCR Product Purification Kit (Roche) secondo le indicazioni del prodotto. Amplificato, purificato e vettore PICZA, sono stati quindi digeriti prima con PmlI e poi con NotI.
A termine à ̈ stata allestita la seguente reazione ligasica:
Reagenti Volume Ligase buffer 5x 2 Î1⁄4l
H20 sterile 1 Î1⁄4l Plasmide digerito e
6.5 Î1⁄4l purificato 2.71 ng/Î1⁄4l
Inserto digerito e
1 Î1⁄4l purificato 20 ng/Î1⁄4l
T4 DNA ligase (250U/Î1⁄41) 0.5 /il Volume finale 10 Î1⁄4l
La reazione à ̈ stata effettuata per 18 ore a 16 °C.
1 Î1⁄4l di reazione ligasica così preparata, à ̈ stata usata per trasformare il ceppo di E. coli TOP10 chimicamente competente, secondo la procedura standard, con la differenza che l'antibiotico impiegato à ̈ stato in tal caso la zeocina, usata 100 Î1⁄4g/ml, e che il terreno di coltura utilizzato à ̈ stato LB medium con una concentrazione di NaCl dimezzata rispetto allo standard.
Dopo aver identificato le colonie positive mediante analisi con PCR, il vettore ricombinante pPICZA/ColCH Ã ̈ stato estratto da 200 mi di sospensione di E. Coli trasformati, mediante il kit Nucleobond Xtra midi (Macherey-Nagel) e linearizzato con l'enzima Pmel.
Trasformazione e selezione dei ceppi di P. pastoris con attività proli-idrossilasica
I quattro differenti ceppi di P. pastoris presenti nel kit PichiaPinkâ„¢ Expression System (Life Technologyâ„¢), con i genotipi sotto indicati, sono stati resi chimicamente competenti utilizzando in kit EasyCompâ„¢ (Life Technologyâ„¢), secondo le indicazioni del prodotto.
Genotipo
Ceppo Pichia Pink â„¢
predominante 5
1 (wild type) ade2
2 ade2, pep4 3 ade2,prbl
4 ade2, pep4, prbl
10
I 4 ceppi resi competenti, sono stati quindi cotrasformati, con le modalità riportate nel kit PichiaPink™ Expression System (Life Technology™), con 5 pg pPinkHC/α o di pPinkLC/a linearizzati e con 5 pg di apPIC6B/PDI linearizzato.
In questo caso specifico, poiché il marcatore per la selezione del vettore αpPIC6B/PDI era la resistenza ad un antibiotico, dopo lo shock termico, le cellule sono state incubate per 2 ore a 30°C in presenza di YPD, per permettere l'espressione del gene che conferisce tale resistenza.
Solo dopo questo tempo, le cellule sono state piastrate su piastre selettive PAD/agar senza adenina con blasticidina 0,3 mg/mi, generando così gli 8 differenti ceppi sotto riportati, esprimenti contemporaneamente la subunità a della prolil-4-idrossilasi e la proteina disolfuro isomerasi (PDI), preceduta dall'Alfa Mating factor di S. cerevisiae. Un controllo negativo à ̈ stato realizzato trasformando il ceppo Pichia pinkl di P. pastoris con 5 pg pPinkHC vuoto e 5 pg di apPIC6B vuoto.
Ceppo Polipeptide
Nome VETTORE SELEZIONE trasformato espresso
Plchia pinK adenina/ αβΙΗ pPinkHCa/apPIC6BPDI P4H<a>/amI’DI<b>
1 blasticidina Pichla pinK adenina/ αβ2Η pPinkHCa/apPIC6BPDI P4H/amPDI
2 blasticidina Plchia pinK adenina/ αβ3Η pPinkHCa/apPIC6BPDI P4H/amPDI
3 blasticidina Plchia pinK adenina/ αβ4Η pPinkHCa/apPIC6BPDI P4H/amPDl
4 blasticidina Pichla pinK adenina/ αβΠΠι pPinkLCa/apPIC6BPDI P4H/amPDI
1 blasticidina Pichla pinK adenina/ αβ2Ι· pPinkLCa/apPIC6BPDI P4H/amPDI
2 blasticidina Plchia pinK adenina/ αβ3Ι<pPinkLCa/ocpPIC6BPDI P4H/amPDI
3 blasticidina Pi chia pinK adenina/ αβ4Ι<pPinkLCa<'>apPIC6BPDI P4H/amPDI
4 blasticidina Pichia pinK adenina\ negativo pPinkHC/apPIC6BI niente
1 blasticidina<a>subunità a della prolil-4-idrossilasl di C. reni fonai 8
<b>subunità β della prolil-4 -idrossilasi di C. renifonais (PDI) il cui peptide segnale à ̈ stato sostituito con quello di S. cerevisiae Alpha mating (AM) .
L'avvenuta inserzione dei costrutti di espressione nel genoma di P. pastoris à ̈ stata verificata su almeno 5 colonie positive di ciascun tipo di ceppo, mediante PCR tradizionale con la procedura riportata sul manuale del kit PichiaPinkâ„¢ Expression System (pag. 70) (Life Technologyâ„¢) .
Al posto dei primers universali forniti dal kit tuttavia sono stati usati un set di primers specifici per questa specifica applicazione.
I primers universali, infatti, sono progettati per appaiarsi alle regioni fiancheggianti il sito di clonaggio che nei due vettori à ̈ identico: i due geni eventualmente integrati nel genoma del lievito, quindi competerebbero per la stessa coppia di primers .
Per ovviare a questo problema si sono usate coppie di oligonucleotidi in cui il primer senso appaiasse con una regione del vettore e l'antisenso con una regione dell'inserto che à ̈ quindi genespecifico.
Anche i primers senso pur essendo complementari al vettore differiscono tra P4H e PDI, poiché il vettore usato per la PDI ha il sito di clonaggio preceduto dalla regione codificante per l'Alfa Mating factotor (AM) di S. cerevisiae ed à ̈ proprio in questa regione che si à ̈ scelto di far appaiare il primer senso per verificare 1'avvenuta integrazione del costrutto apPIC6B\PDI nel genoma di lievito.
Le sequenze di primers impiegati per la verifica mediante PCR dell'avvenuta integrazione dei costrutti ricombinanti nel genoma di lievito sono i seguenti:
FwOxi: 5'-GACTGGTTCCAATTGACAAGC-3' SEQ ID NO: 16 RewP4H: 5'-CCAAAGCCACAGCAGACATA-3' SEQ ID NO: 17 FwAM: 5'-CTATTGCCAGCATTGCTGC-3' SEQ ID NO: 18 RewPDI: 5'TCACAATGTCCTCTGCTTGC-3' SEQ ID NO: 19 Coltivazione dei ceppi di P. pastoris e induzione_ dell'espressione_ delle_ proteine ricombinanti
Le cellule di lievito sono state messe in coltura.
L'espressione delle proteine ricombinanti à ̈ stata effettuata in sospensioni di cellule di lievito cresciute prima in terreno minimo con glicerolo 1% (BMGY, pH 6.0) e poi trasferite in terreno minimo con metanolo (BMMY, pH 6.0) al fine di avviare 1'induzione dell'espressione.
Durante l'espressione, fatta avvenire a 28°C in agitazione a 250 rpm, ogni 12 ore sono stati aggiunti metanolo allo 0,5 % ed acido ascorbico alla concentrazione finale di 80 Î1⁄4g/ml.
La temperatura può essere compresa tra 20 e 30°C.
Analisi delle proteine ricombinati prodotte La produzione delle proteine ricombinanti à ̈ stata valutata mediante analisi dell'attività dell'enzima P4H nei lisati cellulari di lievito.
Dapprima nei quattro ceppi αβΗΙ, αβΗ2, αβΗ3 e αβΗ4.
Le cellule, dopo 60 ore di induzione in terreno BMMY, sono state recuperate centrifugando per 10 minuti a 1.500 x g, a temperatura ambiente, lavate una volta con terreno BMMY e risospese nel seguente tampone: NaCl 0,1 M, glieina 0,1 M, Triton X-100 0,05%, ditiotreitolo (DTT) 10 Î1⁄4Îœ, Tris-HCl 10 mM pH 7.8, cocktail di inibitori delle proteasi diluito 1:100 (P8465 Sigma-Aldrich Corp., St. Louis, MO, USA), il tutto precedentemente raffreddato in ghiaccio.
Le cellule sono state utilizzando un omogenizzatore di Potter e l'avvenuta lisi cellulare à ̈ stata monitorata al microscopio ottico (Olympus CKX41).
In seguito il liso à ̈ stato centrifugato a 15.000 x g per 15 minuti, a 4°C, al fine di ottenere la sola frazione citosolica e microsomiale, il sopranatante à ̈ stato recuperato e mantenuto in ghiaccio fino al successivo dosaggio dell'attività della P4H mediante il metodo descritto da Kivirikko e Myllyla, basato sull' idrossilazione accoppiata alla decarbossilazione del 2-osso [1-<14>C]glutarato, con alcune modificazioni.
Utilizzando 0,5 Î1⁄4Ci di 2-osso [l-<14>C]glutarato à ̈ stata fatta avvenire la reazione in una particolare ampolla costituita da due camere comunicanti ed ermeticamente sigillate: l'ampolla consente la cattura della C02sviluppata durante il dosaggio dell'attività della P4H in lisato di P. pastoris.
In una delle due camere à ̈ stata inserita la miscela di reazione descritta da Kivirikko contenente FeS0450 mM, Tris-HCl 50mM pH 7.8, DTT 0,1 mM, acido ascorbico 2 mM, peptide substrato dell'enzima (Pro-Pro-Gly) io 30 mM, BSA 2 mg/ml e catalasi 600 U, mentre nell'altra camera sono stati posti 200 Î1⁄4l di una soluzione di NaOH 2 M in grado di catturare la<14>C02gassosa prodotta dalla reazione enzimatica della prolil-idrossilasi attiva.
Al fine di poter eliminare dalla quantificazione l'attività dell'α-chetoglutarato deidrogenasi, un enzima mitocondriale che tramite la decarbossilazione ossidativa dello stesso substrato 2-osso [l-<14>C]glutarato porta anch'esso alla formazione di<14>C02(e di succinato), la reazione à ̈ stata fatta avvenire anche in presenza di un inibitore specifico della P4H , l'acido cumalico, in grado di bloccare selettivamente l'enzima ricombinante. Il lisato di cellule di lievito, contenente per ogni reazione 120 Î1⁄4g di proteine, à ̈ stato pre-incubato in ghiaccio per 30 minuti in presenza di acido cumalico 8 mM e successivamente sono stati introdotti i substrati della reazione enzimatica con i relativi coenzimi.
La miscela à ̈ stata quindi incubata a 37°C per 30 minuti.
La radioattività della<14>C02gassosa catturata dalla trappola liquida di NaOH à ̈ stata dunque quantificata utilizzando uno scintillatore liquido Beckman.
Al termine della suddetta prova si à ̈ osservato che il ceppo 2 risultava quello con l'attività enzimatica maggiore, come raffigurato in figura 6.
Una volta stabilito quale ceppo presentava una maggiore attività prolil-idrossilasica si à ̈ proceduto a valutare se vi era una differente espressione dell'enzima tra i ceppi trasformati con il vettore pPinkHC\a o pPinnkLC\a (come illustrato in figura 7), nonché il tempo ottimale di induzione del ceppo che determinava una maggiore espressione dell'enzima, (come illustrato in figura 8).
Trasformazione del ceppo «82L con il vettore pPICZa/ColCH
Il ceppo di P. pastoris αβ2L à ̈ stato reso chimicamente competente utilizzando in kit EasyCompâ„¢ (Life Technologyâ„¢), secondo le indicazioni del prodotto.
Il ceppo competente à ̈ stato, quindi, trasformato, con le modalità riportate nel kit PichiaPinkâ„¢ Expression System (Life Technologyâ„¢), con 10 Î1⁄4g pPICZA\ColCH linearizzato.
Poiché il marcatore per la selezione del vettore pPICZA\ColCH era la resistenza a un antibiotico, dopo lo shock termico, le cellule sono state incubate per 2 ore a 30°C in presenza di YPD, per permettere l'espressione del gene che conferisce tale resistenza.
Solo dopo questo tempo, le cellule sono state piastrate su piastre selettive PAD/agar senza adenina con blasticidina 0,3 mg/ml e zeocina 0,1 mg\ml.
L'avvenuta inserzione del costrutto di espressione nel genoma di P. pastoris à ̈ stata verificata su almeno otto colonie positive, mediante PCR tradizionale con la procedura riportata sul manuale del kit PichiaPinkâ„¢ Expression System (pag.70) (Life Technologyâ„¢), utilizzando però, come primers per la reazione di PCR, la coppia di oligonucleotidi, FwCs: 5'-AATTCACGTGGAAACGATGGAG-3' (SEQ ID NO: 20), come senso, e RewCs : 5'-TCCTTTCGCACCTAATCCTG-3 ' (SEQ ID NO: 21) come antisenso .
In questo caso, il primo oligonucleotide riconosce la regione di fusione del vettore con l'inserto, mentre il secondo, una regione dell'inserto .
Al fine di selezionare, inoltre, i ceppi potenzialmente più efficienti, mediante PCR quantitativa à ̈ stata fatta un'analisi per valutare il numero di copie di geni inseriti nei differenti ceppi positivi (Figura 9).
Il DNA genomico à ̈ stato estratto dai differenti ceppi con le modalità riportate a pag. 70 del manuale d'uso del kit kit PichiaPinkâ„¢ Expression System (pag.70), diluito 20 volte ed amplificato in un volume finale di 20 Î1⁄4Î , secondo lo schema sottostante :
Composizione Î1⁄4l Conc. finale H20 nuclease-free sterile 5.2
10 /xM miscela di primers
800 nM senso e antisenso
2X master mix iQ SIBR<®>Green
10∞ 1 x
(Bio-Rad) o
cDNA o controllo negativo 4
Volume finale 20
Il profilo termico adottato à ̈ stato: 3 min 95°C, (15 sec 95°C, 30 sec 60°C, lettura fluorescenza) 45 x, melting curve da 58°C a 95°C, lettura ogni 0.5°C. Ogni reazione à ̈ stata allestita in triplicato.
Per tutte le prove di PCR quantitativa à ̈ stato utilizzato il termociclatore Cromo 4 (MJ Research; UK) interfacciato al software DNA Engine Opticon 3 Real-Time Detection System Software (versione 3.03 ).
Per tali analisi à ̈ stato utilizzato il Gene Expression Analysis per iCycler iQ Reai Time Detection System (Bio-Rad) .
Il gene della β-actina à ̈ stato utilizzato per la normalizzazione dei campioni. La quantità di DNA à ̈ stata espressa relativamente al campione con i quantitativi più bassi.
Coltivazione dei ceppi ColCH e induzione dell'espressione del collagene ricombinante
Le cellule di lievito derivate dalla colonia positiva 4 (ceppo ColCH4) sono state messe in coltura .
L'espressione delle proteine ricombinanti à ̈ stata effettuata in sospensioni di cellule di lievito cresciute prima in terreno minimo con glicerolo 1% (BMGY, pH 6.0) e poi trasferite in terreno minimo con metanolo (BMMY, pH 6.0) al fine di avviare l'induzione dell'espressione.
Durante l'espressione, fatta avvenire a 28°C in agitazione a 250 rpm, ogni 12 ore sono stati aggiunti metanolo allo 0,5 % ed acido ascorbico alla concentrazione finale di 80 pg/ml.
• Quantificazione dei trascritti mediante qPCR I livelli di mRNA relativi ai tre geni inseriti nel ceppo ColCH4 indotto con metanolo, come sopra riportato, sono stati misurati mediante PCR quantitativa.
L'RNA totale à ̈ stato estratto da 5x10<7>cellule di lievito a 0 e a 24 ore dall'inizio dell'induzione con il kit RNeasy Mini Kit (Qiagen).
Le cellule di lievito sono state lisate mediante distruzione meccanica con 600 Î1⁄4Î di biglie di vetro di 0,45-0,55 mm di diametro pre-lavate con acido nitrico.
Le cellule sono state agitate vigorosamente utilizzando un Tissue lyser (Qiagen) a 30 Hz per 8 minuti con biglie aggiunte secondo un rapporto in volume rispetto al di 1:1.
In seguito il lisato à ̈ stato centrifugato a 10000 x g per 2 minuti a 4°C.
Dal sopranatante ottenuto si à ̈ proceduto all'estrazione dell'RNA totale, secondo le indicazioni del prodotto, includendo anche la fase di digestione con DNase I (27 Kunità ).
1 Î1⁄4g di RNA totale à ̈ stato retrotrascritto in un volume finale di 20 Î1⁄4l, nell'appropriato tampone contenente 2,5 Î1⁄4Îœ di random examers, 0,5 mM dNTP mix, 5 mM DTT, 40 unità di inibitore delle ribonucleasi RNAseOUT (Life Technologyâ„¢) e 15 unità di Super ScriptIIIâ„¢ (Life Technologyâ„¢).
La reazione à ̈ stata condotta per 10 minuti a 25°C, quindi 50 minuti a 50°C.
Per rimuovere l'RNA complementare al cDNA sono state aggiunte 2 unità di E. coli RNase H (Life Technologyâ„¢) e la miscela incubata per 20 minuti a 37°C.
Il cDNA ottenuto à ̈ stato poi diluito 1:5 e impiegato per la reazione di PCR quantitativa effettuata con le stesse modalità sopra riportate nel capitolo relativo alla trasformazione del ceppo aβ2L con il vettore pPICZa/ColCH.
L'analisi dei livelli di mRNA della P4H, della PDI e del collagene a 24 ore dall'induzione con metanolo del ceppo ColCH4 effettuato mediante PCR quantitativa indica che tutti i 3 geni risultano 100.000 volte più espressi rispetto al tempo zero di induzione. (Figura 10).
• Valutazione produzione collagene ricombinante nel ceppo ColCH4
Le cellule e terreno di coltura del ceppo ColCH4 dopo 60 ore di induzione in terreno BMMY sono stati recuperati.
Le cellule sono state centrifugate per 10 minuti a 1500 x g, a temperatura ambiente, lavate una volta con terreno BMMY e risospese in un tampone contenente 5% glicerolo, EDTA 1 mM, fosfato di sodio 50 mM, pH 7,4, cocktail di inibitori delle proteasi diluito 1:100 (P8465 Sigma-Aldrich Corp., St. Louis, MO, USA) .
Le cellule sono state U sate agitando vigorosamente utilizzando un tissue lyser (Qiagen) a 30 Hz per 8 minuti con biglie di vetro (0,5 mm aggiunte secondo un rapporto in volume rispetto al di 1:1. In seguito il à ̈ stato centrifugato a 10.000 x g per 30 minuti a 4° C, il sopranatante à ̈ stato quindi recuperato .
Il terreno di coltura à ̈ stato centrifugato 20 minuti, a 20.000 x g, a 4°C,concentrato dieci volte in Amicon (Millipore) dal taglio molecolare 50.000 Da e dializzato contro acqua distillata, ossia sottoposto ad una procedura per separare il contenuto proteico presente nel terreno di coltura, trasferendolo da qui all'acqua distillata.
Lisato cellulare e terreno di coltura concentrato e dializzato sono stati analizzati mediante (SDS-Page Sodium Dodecyl Sulphate - PolyAcrylamide Gel Electrophoresis, ossia elettroforesi su gel di poliacrilammide in presenza di sodio dodecil solfato per l'analisi di estratti proteici) rivelato tramite colorazione di Coomassie (Figura 11).
La banda corrispondente al peso teorico atteso del collagene à ̈ stata estratta da gel di acrilamide e digerita secondo la metodica descritta da Shervenko et al.
Dopo la digestione, i peptidi triptici ottenuti per estrazione diretta dal gel, sono stati portati a secco con evaporatore centrifugo (Speed Vac) e successivamente ripresi in un volume noto dell' eluente A (H20/Acido formico (FOA) 0,1%) utilizzato per la separazione cromatografica e separati usando un cromatografo liquido ad alte prestazioni (Agilent 1100) a micro flussi (40Î1⁄4l/min ), iniettando circa 3⁄4 del volume totale del campione in colonna.
È stata utilizzata una colonna analitica RP Zorbax Cie (150 x 1 mm ID) "particle size" 5Î1⁄4m.
Come fasi eluenti sono state utilizzate:
A: H20 EOA 0.1% e
B: CH3CN FOA 0.05%;
Il gradiente di eluizione prevedeva:
- andamento in condizioni isocratiche al 90% di A 10% di B per 5 minuti,
- gradiente lineare fino al 95% di B 5% di A in 65 minuti,
- quindi 10 minuti isocratico al 95% di B 5% di A.
Tramite accoppiamento diretto, l'eluato proveniente dall'HPLC Ã ̈ stato introdotto in uno spettrometro di massa equipaggiato con una sorgente elettrospray a geometria ortogonale e analizzatore a trappola ionica (Agilent 1100 series LC/MSD ion trap XCT instrument), in questo modo, i peptidi eluiti durante la corsa cromatografica sono stati direttamente analizzati permettendo di ottenere i singoli valori di m/z corrispondenti (spettri MS).
Nel caso dei segnali più intensi à ̈ stato possibile ottenere spettri di frammentazione riferiti principalmente agli ioni doppio caricati (spettri MS<2>).
La raccolta degli spettri MS e MS/MS ha permesso la ricerca su database (Mascot-Matrixscience).
Tutte le analisi MS e MS/MS sono state condotte in modalità ioni positivi e confermate mediante sequenza manuale de-novo.
A titolo esplicativo in figura 12 viene riportato lo spettro di frammentazione MS<2>del peptide doppio caricato a m/z 525.5, la cui sequenza GAVGPGGKPGPR corrisponde alla sequenza nucleotidica attesa ggtgctgttggaccaggtggtaaaccaggaccacgg per il procollagene marino.
Il metodo per la produzione di proteine collageniche ricombinati derivanti da spugna di mare e un lievito capace di produrre dette proteine consente di avere un biomateriale molto raffinato, di facilitare e rendere meno costosa la realizzazione di composti collagenici ben caratterizzati ed omogenei, rispetto agli estratti ottenuti da spugne con i metodi tradizionali.
Inoltre l'utilizzo di un ceppo trasformato di P. pastoris annulla il rischio di avere contaminanti tossici per l'uomo e per l'ambiente, comunemente presenti nelle matrici naturali.
Deposito di materiale biologico
Il microorganismo Pichia pastoris identificato con il riferimento Pichia pastoris ColCH4, modificato e selezionato come sopra descritto, Ã ̈ stato depositato presso la Collezione dei Lieviti Industriali DBVPG (Industriai Yeasts Collection DBVPG), Borgo 20 Giugno 74 06121 Perugia Italia in data 05/04/13 con numero 34P, secondo le diposizioni del Trattato di Budapest.
Allegato sequenze
P4HchPDichCOLchol igo .txt
SEQUENCE LISTING
<110> università Degli studi di Genova
<120> Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marino
(method for production of marine collagen and organism capable of produci ng said marine collagen)
<130> 1
<160> 21
<170> Patentin versi on 3.5
<210> 1
<211> 1804
<212> DNA
<213> Chondrosia reniformi s
<220>
<221> CDS
<222> (17) ..(1618)
<400> 1
tcgacatatc cgggtt atg cag ttg gta tta gag atg agt tct act act ttg 52
Met Gin Leu vai Leu Gly Met ser Ser Thr Thr Leu
1 5 10
ttg ctg ctg tgt agt tta gga gtg gtt att cca tct ctt gtc tgt gga 100 Leu Leu Leu Cys Ser Leu Gly Val Val Ile Pro Ser Leu Val Cys Gly
15 20 25
gaa atg ttt aca gcc ctt tta cat atg gaa gga ctg gta gag tta gaa 148 Giu Met Phe Thr Ala Leu Leu His Met Giu Gly Leu Val Giu Leu Giu
30 35 40
gaa caa tta gtg caa cac età aaa tee tat ata agg aaa gag gag gaa 196 Giu Gin Leu vai Gin His Leu Lys Ser Tyr Ile Arg Lys Giu Giu Giu
45 50 55 60
ega tta gga gaa ctt aag aag ttt tta get tea gca gag aat get caa 244 Arg Leu Gly Giu Leu Lys Lys Phe Leu Ala Ser Ala Giu Asn Ala Gin
65 70 75
agt ttg cca aga aat gaa cca aga gag cac ctc tac cac ccg acc aat 292 Ser Leu Pro Arg Asn Giu Pro Arg Giu His Leu Tyr His Pro Thr Asn
80 85 90
gcc ttg get gtc att atg cgg tat cac agt gga tgg gac caa aaa ctg 340 Ala Leu Ala Val ile Met Arg Tyr His Ser Gly Trp Asp Gin Lys Leu
95 100 105
tea gaa tat gtc tac cag gat aac tct cat gat ctt atg tct get gtg 388 Ser Giu Tyr Val Tyr Gin Asp Asn Ser His Asp Leu Met Ser Ala Val
110 115 120
get ttg gag aag tat ege ttt cct tea aag gag gac tac tct ggt gca 436 Ala Leu Giu Lys Tyr Arg Phe Pro Ser Lys Giu Asp Tyr Ser Gly Ala
125 130 135 140
gti act get atc att ega ctg caa gac gca tac aag att agt ccc aga 484 va Thr Ala ile ile Arg Leu Gin Asp Ala Tyr Lys Ile Ser Pro Arg
145 150 155
aac ctg aca cag tct att ttg ggg gag agg cag gcc att aaa gtg aca 532 P4HchPDichcOLcholigo.txt
Asn Leu Thr Gin ser ile Leu Gly Giu Arg Gin Ala ile Lys Val Thr
160 165 170
acc aga att tgc ttt gaa ata ggt aga gag gcc tat tat età gag aac 580 Thr Arg ile Cys Phe Giu ile Gly Arg Giu Ala Tyr Tyr Leu Giu Asn
175 180 185
tat tgg cac act aaa gag tgg atg ttg gag tgt ctg agg aaa atg gat 628 Tyr Trp His Thr Lys Giu Trp Met Leu Giu Cys Leu Arg Lys Met Asp
190 195 200
gag gag aat gat tat gaa gat gtc agc età cca gaa att tat gac ttt 676 Giu Giu Asn Asp Tyr Giu Asp Val Ser Leu Pro Giu Ile Tyr Asp Phe
205 210 215 220
ctg gca ttt tet gaa tac aaa gtt ggt aac ctg ege aaa gca atg caa 724 Leu Ala Phe ser Giu Tyr Lys Val Gly Asn Leu Arg Lys Ala Met Gin
225 230 235
tat acg aag gac att ttg caa agt gac ccc act cat gaa agg gcc ttg 772 Tyr Thr Lys Asp ile Leu Gin ser Asp Pro Thr His Giu Arg Ala Leu
240 245 250
aga aat tta aat ttt ttt teg gaa caa atg aaa gaa gat cct gaa gca 820 Arg Asn Leu Asn Phe Phe Ser Giu Gin Met Lys Giu Asp Pro Giu Ala
255 260 265
ttt aac aga gta gtt aca gag cag aca agg aat gta tat cct gaa acg 868 Phe Asn Arg Val Val Thr Giu Gin Thr Arg Asn Val Tyr Pro Giu Thr
270 275 280
tta ggc tat gag gag ctg tgt aga gaa gca aag cca att cca aag gag 916 Leu Gly Tyr Giu Giu Leu Cys Arg Giu Ala Lys Pro Ile Pro Lys Giu
285 290 295 300
aac cat cac aag atg gtc tgc ttc tat ttc aca cat aag aac aat cct 964 Asn His His Lys Met Val Cys Phe Tyr Phe Thr His Lys Asn Asn Pro
305 310 315
cgt ctt att ctc ege cca att aaa gtq gaa gta get cac tta aaa cca 1012 Arg Leu Ile Leu Arg Pro Ile Lys Val Giu Val Ala His Leu Lys Pro
320 325 330
aga att tgg atc ttc aaa aag ttt ctt tet gaa aca gaa atg get cgt 1060 Arg Ile Trp Ile Phe Lys Lys Phe Leu Ser Giu Thr Giu Met Ala Arg
335 340 345
ctg agg gaa ctg get gta ccc aaa età aaa ega gca act get aga aat 1108 Leu Arg Giu Leu Ala Val Pro Lys Leu Lys Arg Ala Thr Ala Arg Asn
350 355 360
tgg aaa acg gqa gaa ttt gaa ccg get gat tat agg att agt aag agt 1156 Trp Lys Thr Gly Giu Phe Giu Pro Ala Asp Tyr Arg Ile Ser Lys Ser
365 370 375 380
ggt tgg ctc agt gaa gat gat gac gaa tet act gat att gta cac cgg 1204 Gly Trp Leu Ser Giu Asp Asp Asp Giu Ser Thr Asp ile Val His Arg
385 390 395
ata aat aat agg att gac gat tee aca ggt ctc tee atg gca aca gca 1252 ile Asn Asn Arg ile Asp Asp ser Thr Gly Leu Ser Met Ala Thr Ala
400 405 410
gag gac età caa gta gtq aat tac gaa ata ggt gqa cat tat gaa ccg 1300 Giu Asp Leu Gin Val Val Asn Tyr Gly ile Gly Gly His Tyr Giu Pro
415 420 425
cat tat gat ttt gca aga aag aat gaa gat gcc ttc tea agg ttg ggg 1348 P4HchPDichC0Lcholigo.txt
His Tyr Asp Phe Ala Arg Lys Asn Giu Asp Ala Phe Ser Arg Leu Gly
430 435 440
tgg gqt aat agg ata tct act età ctt att tat atg agc aat gta acg 1396 Trp Gly Asn Arg ile Ser Thr Leu Leu Ile Tyr Met Ser Asn Val Thr
445 450 455 460
ctg gga gqt gcc acg gtq ttt act gaa tct gqa gqc aga att ata cct 1444 Leu Gly Gly Ala Thr Val Phe Thr Giu Ser Gly Gly Arg ile ile Pro
465 470 475
tac aat gqt gat gca gtq tac tgg tgg aat ctg aag cgt tea gqt gag 1492 Tyr Asn Gly Asp Ala vai Tyr Trp Trp Asn Leu Lys Arg Ser Gly Giu
480 485 490
gqt gat atg aga aca aga cat gca gcc tgt cca gtq età gta gqa acc 1540 Gly Asp Met Arg Thr Arg His Ala Ala cys Pro vai Leu Val Gly Thr
495 500 505
aaa tgg gtc tgt aac aag tgg att cac gag get gqg cag gaa ttt aga 1588 Lys Trp Val Cys Asn Lys Trp ile His Giu Ala Gly Gin Giu Phe Arg
510 515 520
aga cca tgt teg tta aat aaa aac cag taa tgacattttg gtgacctttc 1638 Arg Pro Cys ser Leu Asn Lys Asn Gin
525 530
aaaatctttc aaatttcact gtcattgtca taccactttg egatatattt atettaattt 1698 gataacaaat ttaattttat gcataacttt attttaggta tgtattcatg tgaatgtcat 1758 gtgattttca tgtggttgtt gtggttgata gaaaaaaaaa aaaaaa 1804
<210> 2
<211> 533
<212> PRT
<213> Chondrosia reniformis
<400> 2
Met Gin Leu Val Leu Gly Met Ser Ser Thr Thr Leu Leu Leu Leu Cys 1 5 10 15
Ser Leu Gly Val Val ile Pro Ser Leu Val Cys Gly Giu Met Phe Thr
20 25 30
Ala Leu Leu His Met Giu Gly Leu vai Giu Leu Giu Giu Gin Leu Val
35 40 45
Gin His Leu Lys Ser Tyr Ile Arg Lys Giu Giu Giu Arg Leu Gly Giu
50 55 60
Leu Lys Lys Phe Leu Ala ser Ala Giu Asn Ala Gin Ser Leu Pro Arg
65 70 75 80
Asn Giu Pro Arg Giu His Leu Tyr His Pro Thr Asn Ala Leu Ala Val
85 90 95
Ile Met Arg Tyr His Ser Gly Trp Asp Gin Lys Leu Ser Giu Tyr Val
100 105 110
p4HchPDichcoLcholigo . txt
Tyr Gin Asp Asn ser His Asp Leu Met Ser Ala Val Ala Leu Giu Lys 115 120 125
Tyr Arg Phe Pro ser Lys Giu Asp Tyr ser Gly Ala vai Thr Ala ile 130 135 140
ile Arg Leu Gin Asp Ala Tyr Lys ile Ser Pro Arg Asn Leu Thr Gin 145 150 155 160
Ser ile Leu Gly Giu Arg Gin Ala ile Lys Val Thr Thr Arg ile cys
165 170 175
Phe Giu ile Gly Arg Giu Ala Tyr Tyr Leu Giu Asn Tyr Trp His Thr 180 185 190
Lys Giu Trp Met Leu Giu Cys Leu Arg Lys Met Asp Giu Giu Asn Asp 195 200 205
Tyr Giu Asp Val Ser Leu Pro Giu ile Tyr Asp Phe Leu Ala Phe Ser 210 215 220
Giu Tyr Lys Val Gly Asn Leu Arg Lys Ala Met Gin Tyr Thr Lys Asp 225 230 235 240
ile Leu Gin Ser Asp Pro Thr His Giu Arg Ala Leu Arg Asn Leu Asn
245 250 255
Phe Phe Ser Giu Gin Met Lys Giu Asp Pro Giu Ala Phe Asn Arg Val 260 265 270
Val Thr Giu Gin Thr Arg Asn Val Tyr Pro Giu Thr Leu Gly Tyr Giu 275 280 285
Giu Leu cys Arg Giu Ala Lys Pro ile Pro Lys Giu Asn His His Lys 290 295 300
Met vai Cys Phe Tyr Phe Thr His Lys Asn Asn Pro Arg Leu ile Leu 305 310 315 320
Arg Pro ile Lys Val Giu Val Ala His Leu Lys Pro Arg ile Trp ile
325 330 335
Phe Lys Lys Phe Leu Ser Giu Thr Giu Met Ala Arg Leu Arg Giu Leu 340 345 350
Ala vai Pro Lys Leu Lys Arg Ala Thr Ala Arg Asn Trp Lys Thr Gly 355 360 365
Giu Phe Giu Pro Ala Asp Tyr Arg Ile Ser Lys Ser Gly Trp Leu Ser 370 375 380
P4HchPDichCOLcholigo . txt
Gi u Asp Asp Asp Giu Ser Thr Asp ile vai His Arg ile Asn Asn Arg
385 390 395 400
ile Asp Asp Ser Thr Gly Leu ser Met Ala Thr Ala Gi u Asp Leu Gin
405 410 415
vai Val Asn Tyr Gly ile Gly Gly His Tyr Giu Pro Hi s Tyr Asp Phe
420 425 430
Ala Arg Lys Asn Gi u Asp Ala Phe Ser Arg Leu Gly Trp Gly Asn Arg
435 440 445
ile Ser Thr Leu Leu ile Tyr Met Ser Asn Val Thr Leu Gly Gly Ala
450 455 460
Thr Val Phe Thr Gi u Ser Gly Gly Arg Ile Ile Pro Tyr Asn Gly Asp
465 470 475 480
Ala Val Tyr Trp Trp Asn Leu Lys Arg Ser Gly Giu Gly Asp Met Arg
485 490 495
Thr Arg Hi s Ala Ala Cys Pro Val Leu vai Gly Thr Lys Trp Val cys
500 505 510
Asn Lys Trp ile Hi s Gi u Ala Gly Gi n Giu Phe Arg Arg Pro Cys Ser
515 520 525
Leu Asn Lys Asn Gin
530
<210> 3
<211> 1814
<212> DNA
<213> Chondrosia reni formi s
<220>
<221> CDS
<222> (64) . . (1644)
<400> 3
ttgtacaact ccagtaagcc acagtctgct agactatctc ttcagagcca gtggtgatca 60
gaa atg tta aaa gga atc att ttc tct ata ttg gcc att età att ctt 108 Met Leu Lys Gly ile ile Phe Ser ile Leu Ala ile Leu Ile Leu 1 5 10 15
gga gca gac gat atc cct gaa gaa gat gga gtg tta gtg teg aca tea 156 Gly Ala Asp Asp ile Pro Giu Giu Asp Gly vai Leu Val Ser Thr ser
20 25 30
gac aac ttt aag caa gca gta ggg agt ata gac aac ata ctc gta gaa 204 Asp Asn Phe Lys Gin Ala Val G ly Ser Ile Asp Asn Ile Leu Val Giu
35 40 45
ttt tat gca ccg tgg tgc ggt cat tgc aaa get ctg gcg cca aat tat 252 Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala Pro Asn Tyr
P4HchPDichC0Lcholigo.txt
50 55 60
gcg aaa gca gca gaa ttg ttg cag aag gaa gga tct gaa atc cgt ctc 300 Ala Lys Ala Ala Giu Leu Leu Gin Lys Giu Gly Ser Giu ile Arg Leu
65 70 75
gct aaa gtg gat gca aca att cac tcg gat ctg gca cag aag ttt gga 348 Ala Lys Val Asp Ala Thr Ile His Ser Asp Leu Ala Gin Lys Phe Gly
80 85 90 95
gtg aga ggt tac ccc acc atc aag ttc ttc aga gga gaa gac aat gtg 396 Val Arg Gly Tyr Pro Thr ile Lys Phe Phe Arg Gly Giu Asp Asn vai
100 105 110
gtg gac tat tea gct ggc agg caa gca gag gac att gtg aac tgg tta 444 vai Asp Tyr ser Ala Gly Arg Gin Ala Giu Asp ile Val Asn Trp Leu
115 120 125
aag aag aag act ggc ccc cct gcc act gac ctg acc aca gct gaa cag 492 Lys Lys Lys Thr Gly Pro Pro Ala Thr Asp Leu Thr Thr Ala Giu Gin
130 135 140
gcc aag gag ttc tct gag agt gca gag gct gtg gtg gtt gga ttc ttt 540 Ala Lys Giu Phe Ser Giu Ser Ala Giu Ala Val Val vai Gly Phe Phe
145 150 155
gaa tct gct gaa tea gag gag gcc aag gcg tac ata gca gca gtt acc 588 Giu Ser Ala Giu Ser Giu Giu Ala Lys Ala Tyr Ile Ala Ala Val Thr
160 165 170 175
aag ctt gag gac atg ccg gct ggg att gtc acc aat aag gag gtt gcc 636 Lys Leu Giu Asp Met Pro Ala Gly Ile Val Thr Asn Lys Giu vai Ala
180 185 190
gaa tea ctt gga gcc act gtt agc agt att gta atg ttt caa aag ttt 684 Giu Ser Leu Gly Ala Thr Val Ser Ser Ile Val Met Phe Gin Lys Phe
195 200 205
gac gat gga aag gtg gtt tac agt ggg gag tac aac ggt gta gac ata 732 Asp Asp Gly Lys vai vai Tyr Ser Gly Giu Tyr Asn Gly Val Asp ile
210 215 220
ctg tee ttt gtg aat gct gaa cgg ctc cca ttg ttc att gaa ttt aat 780 Leu Ser Phe Val Asn Ala Giu Arg Leu Pro Leu Phe Ile Giu Phe Asn
225 230 235
gat aag act gct aac agt atc ttc agc ggc agc atc aag gtg cac ttt 828 Asp Lys Thr Ala Asn Ser Ile Phe Ser Gly Ser ile Lys Val His Phe
240 245 250 255
ctt gtc ttc tat tea gat gac tcg gat gaa gca gcc agc att tea gag 876 Leu Val Phe Tyr Ser Asp Asp Ser Asp Giu Ala Ala Ser Ile Ser Giu
260 265 270
gct gtc act gct gta gcc aaa gaa ttt aga ggc aga ata atc ttt gtt 924 Ala Val Thr Ala vai Ala Lys Giu Phe Arg Gly Arg ile ile Phe Val
275 280 285
agg gtt aat aca gat gtg gag aat aac aac aga att gtt gag ttt ttc 972 Arg Val Asn Thr Asp Val Giu Asn Asn Asn Arg Ile Val Giu Phe Phe
290 295 300
aat ctt aag gag gac gat ttc cct tgt gga cgg ctg att cag ctg gac 1020 Asn Leu Lys Giu Asp Asp Phe Pro Cys Gly Arg Leu Ile Gin Leu Asp
305 310 315
gat gac atg aga aaa ttt agg ccc gac ttt gat tea ctc aat gaa gaa 1068 Asp Asp Met Arg Lys Phe Arg Pro Asp Phe Asp Ser Leu Asn Giu Giu
P4HchPDichcoLcholigo.txt
320 325 330 335
aat att agg act ttc tta acc aac ttt ttt gat ggt aaa ctg aag cca 1116 Asn ile Arg Thr Phe Leu Thr Asn Phe Phe Asp Gly Lys Leu Lys Pro
340 345 350
cat ctc agc tct gaa gat atc ccc gaa gat tgg gat gcc aaa cca gtc 1164 His Leu Ser Ser Giu Asp ile Pro Giu Asp Trp Asp Ala Lys Pro Val
355 360 365
aag att ctt gtc gga cgt aac ttt tgg gat gtt atc aag agt ggg aaa 1212 Lys ile Leu Val Gly Arg Asn Phe Trp Asp Val Ile Lys Ser Gly Lys
370 375 380
gat gtc ttt gtt gag ttt tat gcc ccc tgg tgt ggt cac tgc aag gcc 1260 Asp vai Phe vai Giu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala
385 390 395
ctg gct ccc act tgg gat gag ctt gga gag aag ttt gtc gac agc gac 1308 Leu Ala Pro Thr Trp Asp Giu Leu Gly Giu Lys Phe vai Asp Ser Asp
400 405 410 415
gtc att att gca aaa ata gac tcg aca gcc aac gag att gat ggt att 1356 Val ile Ile Ala Lys ile Asp Ser Thr Ala Asn Giu ile Asp Gly ile
420 425 430
aag att gaa ggt ttt cca act età aaa tat ttc aag agt gat gat cca 1404 Lys Ile Giu Gly Phe Pro Thr Leu Lys Tyr Phe Lys Ser Asp Asp Pro
435 440 445
gag tct cca att gac ttc atg ggc ggc agg aca ctt gac gac ctt gtc 1452 Giu Ser Pro ile Asp Phe Met Gly Gly Arg Thr Leu Asp Asp Leu Val
450 455 460
aag ttt gta gag tee aaa ggg act gat ege ggt gtc aag gag ccg tee 1500 Lys Phe Val Giu Ser Lys Gly Thr Asp Arg Gly vai Lys Giu Pro Ser
465 470 475
gaa gac ctc gga gat gaa ttc ttt gac agc ctt gaa gat gaa gat ttt 1548 Giu Asp Leu Gly Asp Giu Phe Phe Asp Ser Leu Giu Asp Giu Asp Phe
480 485 490 495
gaa gat gaa gat tat gaa gat gaa gat gaa gat gaa gga atg gat gag 1596 Giu Asp Giu Asp Tyr Giu Asp Giu Asp Giu Asp Giu Gly Met Asp Giu
500 505 510
cag gag gat gta gga gag cct gct aaa gat aaa aag att gaa ctt tag 1644 Gin Giu Asp Val Gly Giu Pro Ala Lys Asp Lys Lys ile Giu Leu
515 520 525
gtgttaattg atagaaaata ttttactcct tatcaaatta atcaaattta ggagagcatg 1704 taagcttttg cacaatgatt cagttctgaa tttaatttac tctgttatgt atggttttgc 1764 ttttccatcg acaatatatt taatgatttt gtcgaaaaaa aaaaaaaaaa 1814
<210> 4
<211> 526
<212> PRT
<213> Chondrosia reniformis
<400> 4
Met Leu Lys Gly ile ile Phe Ser ile Leu Ala ile Leu ile Leu Gly 1 5 10 15
P4HchPDlchCOLchol igo . txt
Ala Asp Asp ile Pro Gi u Giu Asp Gly vai Leu vai Ser Thr ser Asp 20 25 30
Asn Phe Lys Gin Ala Val Gly Ser ile Asp Asn Ile Leu Val Giu Phe 35 40 45
Tyr Ala Pro Trp cys Gly His Cys Lys Ala Leu Ala Pro Asn Tyr Ala 50 55 60
Lys Ala Ala Gi u Leu Leu Gin Lys Giu Gly Ser Giu ile Arg Leu Ala 65 70 75 80 Lys Val Asp Ala Thr ile His Ser Asp Leu Ala Gi n Lys Phe Gly vai
85 90 95
Arg Gly Tyr Pro Thr ile Lys Phe Phe Arg Gly Giu Asp Asn Val Val 100 105 110
Asp Tyr Ser Ala Gly Arg Gin Ala Giu Asp Ile vai Asn Trp Leu Lys 115 120 125
Lys Lys Thr Gly Pro Pro Ala Thr Asp Leu Thr Thr Ala Gi u Gi n Ala 130 135 140
Lys Gi u Phe Ser Giu Ser Ala Giu Ala vai vai Val Gly Phe Phe Gi u 145 150 155 160 Ser Ala Giu Ser Gi u Gi u Ala Lys Ala Tyr Il e Ala Ala Val Thr Lys
165 170 175
Leu Giu Asp Met Pro Ala Gly Ile vai Thr Asn Lys Gi u Val Ala Giu 180 185 190
Ser Leu Gly Ala Thr Val ser Ser ile vai Met Phe Gi n Lys Phe Asp 195 200 205
Asp Gly Lys Val Val Tyr ser Gly Gi u Tyr Asn Gly Val Asp ile Leu 210 215 220
Ser Phe vai Asn Ala Giu Arg Leu Pro Leu Phe ile Gi u Phe Asn Asp 225 230 235 240 Lys Thr Ala Asn Ser ile Phe Ser Gly Ser Ile Lys vai Hi s Phe Leu
245 250 255
Val Phe Tyr Ser Asp Asp ser Asp Gi u Ala Ala Ser Ile Ser Giu Ala 260 265 270
vai Thr Ala Val Ala Lys Giu Phe Arg Gly Arg ile il e Phe Val Arg 275 280 285
P4HchPDichC0Lchol i go . txt
Val Asn Thr Asp Val Giu Asn Asn Asn Arg ile vai Gi u Phe Phe Asn 290 295 300
Leu Lys Gi u Asp Asp Phe Pro Cys Gly Arg Leu ile Gi n Leu Asp Asp 505 310 315 320
Asp Met Arg Lys Phe Arg Pro Asp Phe Asp Ser Leu Asn Gi u Giu Asn
325 330 335
ile Arg Thr Phe Leu Thr Asn Phe Phe Asp Gly Lys Leu Lys Pro Hi s 340 345 350
Leu Ser Ser Giu Asp Ile Pro Gi u Asp Trp Asp Ala Lys Pro Val Lys 355 360 365
ile Leu Val Gly Arg Asn Phe Trp Asp Val Ile Lys Ser Gly Lys Asp 370 375 380
Val Phe Val Gi u Phe Tyr Ala Pro Trp Cys Gly Hi s Cys Lys Ala Leu 385 390 395 400
Ala Pro Thr Trp Asp Gi u Leu Gly Gi u Lys Phe vai Asp Ser Asp Val
405 410 415
Il e ile Ala Lys Ile Asp Ser Thr Ala Asn Gi u Ile Asp Gly Ile Lys 420 425 430
Ile Gi u Gly Phe Pro Thr Leu Lys Tyr Phe Lys Ser Asp Asp Pro Giu 435 440 445
Ser Pro Ile Asp Phe Met Gly Gly Arg Thr Leu Asp Asp Leu Val Lys 450 455 460
Phe Val Gi u ser Lys Gly Thr Asp Arg Gly vai Lys Gi u Pro Ser Giu 465 470 475 480
Asp Leu Gly Asp Gi u Phe Phe Asp Ser Leu Giu Asp Gi u Asp Phe Giu
485 490 495
Asp Giù Asp Tyr Giu Asp Giu Asp Giu Asp Gi ù Gly Met Asp Giu Gi n 500 505 510
Giu Asp Val Gly Gi u Pro Ala Lys Asp Lys Lys Ile Gi u Leu
515 520 525
<210> 5
<211> 2488
<212> DNA
<213> Chondrosia reni formi s
<220>
<221> CDS
P4HchPDichCQLchol igo .txt
<222> (61).. (2295)
<300>
<308> ABI79457
<309> 2011-01-19
<313> (61).. (2295)
<400> 5
gcttcctcct aagggtcatt gtgtggtttg actggataaa cagcaagcaa ctttagaagg 60 atg gag aag acc agt tct aaa gtg gct ctg atg aca gtc ctt gta gtt 108 Met Giu Lys Thr Ser Ser Lys vai Ala Leu Met Thr Val Leu Val vai 1 5 10 15
ata aca gga gct ctt atc att gaa gga aca tee atc acc aga ggc tct 156 Ile Thr Gly Ala Leu Ile Ile Giu Gly Thr Ser Ile Thr Arg Gly Ser
20 25 30
act cat gtc aat cgt ggc ttg agg aaa agg cag aca agt gaa gac aac 204 Thr His Val Asn Arg Gly Leu Arg Lys Arg Gin Thr ser Giu Asp Asn
35 40 45
tgt gaa gca gtc aaa gtq gga tta cca aga gat gga aga gag ggt 252 Cys Giu Ala Val Lys Val Glly Leu Pro Gly Arg Asp Gly Arg G<'>lu Glv
50 55 60
cca cct ggt cca cct ggt cct gca gga agg gat ggc agg gat gct gtc 300 Pro Pro Gly Pro Pro Gly Pro Ala Gly Arg Asp Gly Arg Asp Ala Val
65 70 75 80
tgc tct aac cag aca aca gga tta ggt gcg aaa gga gat aga ggt cca 348 Cys Ser Asn Gin Thr Thr Gly Leu Gly Ala Lys Gly Asp Arg Gly Pro
85 90 95 cca t acc cct ggt ttc cca gì gaa gtt gga cgt cct it ccc cca 396 Pro y Thr Pro Gly Phe Pro G Giu Val Gly Arg Pro G y Pro Pro
100 105 110
ggg gca gat ggt ata cct ggt ccc caa ggg gaa agg ggt gct gtt gga 444 Gly Ala Asp Gly Ile Pro Gly Pro Gin Gly Giu Arg Gly Ala Val Gly
115 120 125
cca ggt ggt aaa cca gga cca cgg gga gag gta ggc act cct gjggt gcg 492 Pro Gly Gly Lys Pro Gly Pro Arq GTS J GIU Gly Thr Pro<;>iv a
130 135 140
gat ggt gca gat ggt gct act ggt gct act ggt gtc caa ggg cca gat 540 Asp Gly Ala Asp Gly Ala Thr Gly Ala Thr Gly Val Gin Gly Pro Asp
145 150 155 160
ggt gct aag gga gag aag ggt gca tea ggt aca gca gga età aag 588 Gly Ala Lys Gly Giu Lys Gly Ala Ser Gly Thr Ala Gly Leu Lys
165 170 175 3
gag aag ggt gat act tgc att cct gac agt aat agt acc età ggc atg 636 Giu Lys Gly Asp Thr cys Ile Pro Asp Ser Asn Ser Thr Leu Gly Met
180 185 190
cct ggt acc cca ggg gca ggt ggt tct aaa ggt cag aaa t gaa tea 684 Pro Gly Thr Pro Gly Ala Gly Gly Ser Lys Gly Gin Lys y Giu Ser
195 200 205
ggt ata gta gga cca aag gga gag aga ggt gag ata ggt act cct ggt 732 Gly ile Val Gly Pro Lys Gly Giu Arg Gly Giu ile Gly Thr Pro Gly
210 215 220
cat cct ggg ttt aga ggt gca gat ggt gaa ccg gga cat aaa ggt gta 780 His Pro Gly Phe Arg Gly Ala Asp Gly Giu Pro Gly His Lys Gly Val
P4HchPDichCOLcholigo.txt
225 230 235 240
cca ggc aga gca gga gca cag gga gat aga ggt gat cct ggt gat gat 828 Pro Gly Arg Ala Gly Ala Gin Gly Asp Arg Gly Asp Pro Gly Asp Asp
245 250 255
ggt ctt act ggt ttt cct ggt gct cca ggg gcg gat ggt gct cca gga 876 Gly Leu Thr Gly Phe Pro Gly Ala Pro Gly Ala Asp Gly Ala Pro Gly
260 265 270
caa aaa ggt gaa età gca gta gga cca caa gga act cca ggt ctt 924 Gin Lys Gly Giu Leu Ala Val Gly Pro Gin Gly Thr Pro Gly Leu
275 280 285
tct ggc cct tct ggt ccc aca gag cca cct ggt cct aag gga gta aga 972 Ser Gly Pro Ser Gly Pro Thr Gly Pro Pro Gly Pro Lys Gly Val Arg
290 295 300
ggt gca cca ggc agc tea gga gca aag gga gat gca ggt aat cct ggt 1020 Gly Ala Pro Gly Ser Ser Gly Ala Lys Gly Asp Ala Gly Asn Pro Gly
305 310 315 320
gat gat gga cct gta ggt cct cag ggt gtt cca ggg gtg gat ggt tct 1068 Asp Asp Gly Pro Val Gly Pro Gin Gly Val Pro Gly Val Asp Gly Ser
325 330 335
ccg gga cag aaa ggt gaa aca ggt aga gta gga cca cgg gga cac gat 1116 Pro Gly Gin Lys Gly Giu Thr Gly Arg vai Gly Pro Arg Gly HiS Asp
340 345 350
c atc aat ggc act cct ggt gag gat ggt gct act ggt ttc cca ggg 1164 Gly Ile Asn Gly Thr Pro Gly Giu Asp Gly Ala Thr Gly Phe Pro Gly
355 360 365
cca gat ggt gct aag gga gag aag ggt aca tea ggt aca gca gga età 1212 Pro Asp Gly Ala Lys Gly Giu Lys Gly Thr Ser Gly Thr Ala Gly Leu
370 375 380
aag gga gag aag ggt gat act tgc att cct gac agt aat agt acc età 1260 Lys Gly Giu Lys Gly Asp Thr Cys ile Pro Asp Ser Asn Ser Thr Leu
385 390 395 400
ggc atg cct ggt acc cca ggg gca ggt tgg tct aaa ggt cag aaa ggt 1308 Gly Met Pro Gly Thr Pro Gly Ala Gly Trp ser Lys Gly Gin Lys Gly
405 410 415
gaa tea ggt ata gta gga cca aag gga gag aaa ggt gag ata ggt act 1356 Giu Ser Gly ile Val Gly Pro Lys Gly Giu Lys Gly Giu ile Gly Thr
420 425 430
cct ggt cct cct ggg ttt aga ggt gca gat ggt gaa ccg gga cag aga 1404 Pro Gly Pro Pro Gly Phe Arg d y Ala Asp Gly Giu Pro Gly Gin Arg
435 440 445
ggt gaa cca ggc aga gca gga gca cag gga gaa aga ggt gct cct ggt 1452 Gly Giu Pro Gly Arg Ala Gly Ala Gin Gly Giu Arg Gly Ala Pro Gly
450 455 460
aat aat ggt cgt gat ggt ttt cct ggt gat cca ggg gcg gat ggt gct 1500 Asn Asn Gly Arg Asp Gly Phe Pro Gly Asp Pro Gly Ala Asp Gly Ala
465 470 475 480
cca gga caa aaa ggt gaa età ggt gca ata gga cat ccg gga ttt tea 1548 Pro d y Gin Lys Gly Giu Leu Gly Ala ile Gly His Pro Gly Phe Ser
485 490 495
ggt cct tct ggc cct tct ggt ccc aca ggg cca cct ggt cct aag gga 1596 Gly Pro Ser Gly Pro Ser Gly Pro Thr Gly Pro Pro Gly Pro Lys Gly
p4HchPDichcoLcholigo.txt
500 505 510
gta aga ggt gca caa ggc aga cca gga gat aga ggc tct cca ggt gat 1644 vai Arg Gly Ala Gin Gly Arg Pro Gly Asp Arg Gly Ser Pro Gly Asp
515 520 525
gtt ggt ccc ata ggt gct cct ggt cct cct ggg gcg gat ggt gtt ccg 1692 vai Gly Pro ile Gly Ala Pro Gly Pro Pro Gly Ala Asp Gly Val Pro
530 535 540
gga ctg aca ggt gta caa ggc aga gat gga cca aag gga gag agt gcc 1740 Gly Leu Thr Gly Val Gin Gly Arg Asp Gly Pro Lys Gly Giu Ser Ala
545 550 555 560
tct agt gga gct gtt tat gtc agg tgg gga agg act aca tgt cca agt 1788 ser ser Gly Ala Val Tyr Val Arg Trp Gly Arg Thr Thr cys Pro Ser
565 570 575
gga gct gat gtt gtg tat tea gga aga gca gcg ggt gct aaa tat gac 1836 Gly Ala Asp Val vai Tyr ser Gly Arg Ala Ala Gly Ala Lys Tyr Asp
580 585 590
cat agc ggt ggt acc agt gac cac cat tgt ctt ccc aac aat cct caa 1884 His Ser Gly Gly Thr ser Asp His His Cys Leu Pro Asn Asn Pro Gin
595 600 605
tac età tct gag gat gat act aac gca ttg gga gca caa ctg tat gga 1932 Tyr Leu ser Giu Asp Asp Thr Asn Ala Leu Gly Ala Gin Leu Tyr Gly
610 615 620
gta gag tat gag att aga gac aga agt tea cca tac aat agt età gat 1980 vai Giu Tyr Giu Ile Arg Asp Arg Ser Ser Pro Tyr Asn Ser Leu Asp
625 630 635 640
caa tea gac atg cct tgt gtg gtc tgt aat gcc aat ggt aga tea cag 2028 Gin Ser Asp Met Pro Cys Val Val Cys Asn Ala Asn Gly Arg Ser Gin
645 650 655
ctg età atg gtt cca gct cgt tac acc tgc ccc act ggg tgg agt agg 2076 Leu Leu Met Val Pro Ala Arg Tyr Thr cys Pro Thr Gly Trp ser Arg
660 665 670
gag tac tat gga tac atg atg tct gag ggt aaa gcc aaa aat ege gaa 2124 Giu Tyr Tyr Gly Tyr Met Met Ser Giu Gly Lys Ala Lys Asn Arg Giu
675 680 685
gqa aga aag aca aca att tgc atg gat ttc tea gct gaa gca gtt cca 2172 Gly Arg Lys Thr Thr ile Cys Met Asp Phe Ser Ala Giu Ala Val Pro
690 695 700
gga agc gga gca aac acc aat cct tct cca ggt att atg atg agg gcc 2220 Gly Ser Gly Ala Asn Thr Asn Pro Ser Pro Gly Ile Met Met Arg Ala
705 710 715 720
aac tgc aac gga età gca tgt cct cct tat cag teg aac aca ccg ctg 2268 Asn Cys Asn Gly Leu Ala Cys Pro Pro Tyr Gin Ser Asn Thr Pro Leu
725 730 735
aca tgt gca gtg tgc aca aag taa acc agaataccac aagatatttg 2315 Thr cys Ala Val Cys Thr Lys Thr
740
gctcaacctg tettattagt cacaaactca agacataatc acacactagg ctaaacagtt 2375 ctacaaatat actcatgata acaatgaaca atcactttag ttgtttggtt ttatatattt 2435 acaaagatta cccataaaaa tgatttgtat tgataattcg ttgattccaa cca 2488 P4HchPDichCOLchol i go . txt
<210> 6
<211> 743
<212> PRT
<213> Chondrosia reniformi s
<400> 6
Met Glu Lys Thr Ser Ser Lys Val Ala Leu Met Thr Val Leu Val Val 1 5 10 15
ile Thr Gly Ala Leu Ile Ile Glu Gly Thr Ser Ile Thr Arg Gly Ser 20 25 30
Thr His vai Asn Arg Gly Leu Arg Lys Arg Gi n Thr Ser Glu Asp Asn 35 40 45
Cys Gl u Ala vai Lys Val Gly Leu Pro Gly Arg Asp Gly Arg Glu Gly 50 55 60
Pro Pro Gly Pro Pro Gly Pro Ala Gly Arg Asp Gly Arg Asp Ala vai 65 70 75 80
Cys Ser Asn Gin Thr Thr Gly Leu Gly Ala Lys Gly Asp Arg Gly Pro 85 90 95
Pro Gly Thr Pro Gly Phe Pro Gly Glu Val Gly Arg Pro Gly Pro Pro 100 105 110
Gly Ala Asp Gly Ile Pro Gly Pro Gin Gly Glu Arg Gly Ala Val Gly 115 120 125
Pro Gly Gly Lys Pro Gly Pro Arg Gly Glu Val Gly Thr Pro Gly Ala 130 135 140
Asp Gly Ala Asp Gly Ala Thr Gly Ala Thr Gly vai Gi n Gly Pro Asp 145 150 155 160
Gly Ala Lys Gly Glu Lys Gly Ala Ser Gly Thr Ala Gly Leu Lys Gly
165 170 175
Gl u Lys Gly Asp Thr cys ile Pro Asp Ser Asn Ser Thr Leu Gly Met 180 185 190
Pro Gly Thr Pro Gly Ala Gly Gly Ser Lys Gly Gi n Lys Gly Gl u Ser 195 200 205
Gly Ile Val Gly Pro Lys Gly Gl u Arg Gly Glu ile Gly Thr Pro Gly 210 215 220
Hi s Pro Gly Phe Arg Gly Ala Asp Gly Gl u Pro Gly Hi s Lys Gly Val 225 230 235 240 p4HchPDichcoLcho1 i go . txt
Pro Gly Arg Ala Gly Ala Gi n Gly Asp Arg Gly Asp Pro Gly Asp Asp
245 250 255
Gly Leu Thr Gly Phe Pro Gly Ala Pro Gly Ala Asp Gly Ala Pro Gly 260 265 270
Gi n Lys Gly Giu Leu Gly Ala Val Gly Pro Gin Gly Thr Pro Gly Leu 275 280 285
ser Gly Pro Ser Gly Pro Thr Gly Pro Pro Gly Pro Lys Gly Val Arg 290 295 300
Gly Ala Pro Gly Ser Ser Gly Ala Lys Gly Asp Ala Gly Asn Pro Gly 305 310 315 320
Asp Asp Gly Pro Val Gly Pro Gin Gly Val Pro Gly Val Asp Gly ser
325 330 335
Pro Gly Gi n Lys Gly Gi u Thr Gly Arg Val Gly Pro Arg Gly His Asp 340 345 350
Gly Il e Asn Gly Thr Pro Gly Gi u Asp Gly Ala Thr Gly Phe Pro Gly 355 360 365
Pro Asp Gly Ala Lys Gly Gi u Lys Gly Thr Ser Gly Thr Ala Gly Leu 370 375 380
Lys Gly Giu Lys Gly Asp Thr Cys ile Pro Asp Ser Asn Ser Thr Leu 385 390 395 400
Gly Met Pro Gly Thr Pro Gly Ala Gly Trp Ser Lys Gly Gi n Lys Gly
405 410 415
Gi u Ser Gly Ile Val Gly Pro Lys Gly Gi u Lys Gly Giu Ile Gly Thr 420 425 430
Pro Gly Pro Pro Gly Phe Arg Gly Ala Asp Gly Gi u Pro Gly Gin Arg 435 440 445
Gly Giu Pro Gly Arg Ala Gly Ala Gi n Gly Gi u Arg Gly Ala Pro Gly 450 455 460
Asn Asn Gly Arg Asp Gly Phe Pro Gly Asp Pro Gly Ala Asp Gly Ala 465 470 475 480
Pro Gly Gin Lys Gly Giu Leu Gly Ala ile Gly Hi s Pro Gly Phe ser
485 490 495
Gly Pro Ser Gly Pro Ser Gly Pro Thr Gly Pro Pro Gly Pro Lys Gly 500 505 510
P4HchPDichCOLcho1 i go . txt
Val Arg Gly Ala Gin Gly Arg Pro Gly Asp Arg Gly Ser Pro Gly Asp 515 520 525
Val Gly Pro ile Gly Ala Pro Gly Pro Pro Gly Ala Asp Gly Val Pro 530 535 540
Gly Leu Thr Gly Val Gi n Gly Arg Asp Gly Pro Lys Gly Gi u Ser Ala 545 550 555 560 Ser Ser Gly Ala Val Tyr Val Arg Trp Gly Arg Thr Thr Cys Pro Ser
565 570 575
Gly Ala Asp Val Val Tyr Ser Gly Arg Ala Ala Gly Ala Lys Tyr Asp 580 585 590
Hi s Ser Gly Gly Thr ser Asp Hi s Hi s Cys Leu Pro Asn Asn Pro Gin 595 600 605
Tyr Leu Ser Giu Asp Asp Thr Asn Ala Leu Gly Ala Gi n Leu Tyr Gly 610 615 620
Val Giu Tyr Gi u Ile Arg Asp Arg Ser Ser Pro Tyr Asn Ser Leu Asp 625 630 635 640 Gi n ser Asp Met Pro Cys Val Val Cys Asn Ala Asn Gly Arg ser Gin
645 650 655
Leu Leu Met Val Pro Ala Arg Tyr Thr Cys Pro Thr Gly Trp Ser Arg 660 665 670
Giu Tyr Tyr Gly Tyr Met Met Ser Giu Gly Lys Ala Lys Asn Arg Gi u 675 680 685
Gly Arg Lys Thr Thr ile Cys Met Asp Phe Ser Ala Giu Ala Val Pro 690 695 700
Gly Ser Gly Ala Asn Thr Asn Pro Ser Pro Gly Ile Met Met Arg Ala 705 710 715 720 Asn Cys Asn Gly Leu Ala Cys Pro Pro Tyr Gin ser Asn Thr Pro Leu
725 730 735
Thr Cys Ala Val Cys Thr Lys
740
<210> 7
<211> 30
<212> DNA
<213> chondrosia reni formi s
<220>
<221> primer_bi nd
P4HchPDichCQLcholigo txt
<222> (1)..(30)
<400> 7
gaaacgatgc agttggtatt agggatgagt 30
<210> 8
<211> 21
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1)..(21)
<400> 8
cgcaaagtgg tatgacaatg a 21
<210> 9
<211> 30
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1) ..(30)
<400> 9
aattgaattc gaaacgatgc agttggtatt 30
<210> 10
<211> 30
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1) ..(30)
<400> 10
aattggtacc cgcaaagtgg tatgacaatg 30
<210> 11
<211> 30
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1)..(30)
<400> 11
aattcacgtg gcagacgata tccctgaaga 30
<210> 12
<211> 30
<212> DNA
<213> Chondrosia reniformis
P4HchPDichCOLcho1igo.txt
<220>
<221> primer_bind
<222> (1) ..(30)
<400> 12
aattgcggcc gcctaaagtt caatcttttt 30
<210> 13
<211> 30
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> CD â– â– (30)
<400> 13
gaaacgatgg agaagaccag ttctaaagtg 30
<210> 14
<211> 30
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1) ..(30)
<400> 14
aattcacgtg gaaacgatgg agaagaccag 30
<210> 15
<211> 30
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1) ..(30)
<400> 15
aattgcggcc gcttactttg tgcacactgc 30
<210> 16
<211> 21
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1)..(21)
<400> 16
gactggttcc aattgacaag c 21
<210> 17
<211> 20
<212> DNA
<213> Chondrosia reniformis
P4HchPDichcoLcholigo.txt
<220>
<221> primer_bind
<222> (1)..(20)
<400> 17
ccaaagccac agcagacata 20
<210> 18
<211> 19
<212> DNA
<21B> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1)..(19)
<400> 18
ctattgccag cattgctgc 19
<210> 19
<211> 20
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1) ..(20)
<400> 19
tcacaatgtc ctctgcttgc 20
<210> 20
<211> 22
<212> DNA
<21B> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1) . . (22)
<400> 20
aattcacgtg gaaacgatgg ag 22
<210> 21
<211> 20
<212> DNA
<213> Chondrosia reniformis
<220>
<221> primer_bind
<222> (1)..(20)
<400> 21
tcctttcgca cctaatcctg 20
Claims (32)
- RIVENDICAZIONI 1. Metodo per la produzione di proteine collageniche ricombinanti di spugna di mare caratterizzato dal fatto che prevede l'introduzione e l'espressione all'interno di un organismo ospite di almeno una sequenza nucleotidica codificante per una catena polipeptidica primaria di collagene marino, cosiddetto procollagene, e di almeno una sequenza nucleotidica codificante per una proteina enzimatica o di almeno una sua subunità coinvolta nelle modifiche di detta catena nel processo di formazione del collagene marino.
- 2. Metodo secondo la rivendicazione 1 caratterizzato dal fatto che detto organismo ospite à ̈ costituito da cellule eucariotiche di lievito e 1'introduzione di sequenze nucleotidiche nel suo genoma avviene con almeno un vettore di espressione comprendente una sequenza nucleotidica codificante per almeno un enzima, o per almeno una sua subunità , coinvolto nella idrossilazione della catena polipeptidica di procollagene marino.
- 3. Metodo secondo la rivendicazione 2 caratterizzato dal fatto che all'interno dell'organismo ospite ricombinante à ̈ introdotta ed espressa la sequenza nucleotidica codificante per la subunità alfa dell'enzima prolil-4-idrossilasi (P4H) di spugna di mare e la sequenza nucleotidica codificante per la subunità beta dell'enzima prolil-4-idrossilasi di spugna di mare (PDI).
- 4. Metodo secondo la rivendicazione 1 o 2 caratterizzato dal fatto che all'interno dell'organismo ospite ricombinante à ̈ introdotta ed espressa, con almeno un vettore di espressione, la sequenza nucleotldica codificante per il procollagene non fibrillare di spugna C.reniformis.
- 5. Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che detto organismo ospite à ̈ costituito da cellule eucariotiche di lievito trasformate, con vettori di espressione, con le sequenze nucleotidiche codificanti per le subunità alfa e beta dell'enzima prolil-4-idrossilasi di spugna C.reniformis e con almeno la sequenza nucleotidica codificante per il procollagene non fibrillare di spugna C.reniformis.
- 6. Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che detto organismo ospite à ̈ costituito da cellule eucariotiche di lievito Pichia pastoris.
- 7 . Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che detto organismo ospite à ̈ costituito da cellule eucariotiche del ceppo di lievito Pichia pastoris depositato con numero 34P in data 05/04/13 presso la Collezione dei lieviti Industriali DBVPG avente riferimento "Pichia pastoris ColCH4".
- 8. Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che il vettore di espressione comprende la sequenza nucleotidica mostrata in SEQ ID NO: 1 codificante per la subunità alfa dell'enzima prolil-4-idrossilasi di spugna di mare.
- 9. Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che il vettore di espressione comprende la sequenza nucleotidica mostrata in SEQ ID NO: 3 codificante per la subunità beta dell'enzima prolil-4-idrossilasi di spugna di mare.
- 10. Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che il vettore di espressione comprende la sequenza nucleotidica mostrata in SEQ ID NO: 5 codificante per il procollagene non fibrillare di spugna C .reniformis.
- 11 . Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che l'espressione delle proteine ricombinanti à ̈ effettuata in sospensioni di cellule di lievito cresciute prima in terreno minimo con glicerolo 1% e poi trasferite in terreno minimo (BMMY, pH 6.0) con metanolo in modo tale da avviare l'induzione dell'espressione, essendo prevista, durante l'espressione, l'aggiunta di metanolo ed acido ascorbico, sotto agitazione ad una temperatura compresa tra 20 e 30°C.
- 12. Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che prevede il passo di selezionare le cellule eucariotiche di lievito, trasformate con almeno un vettore di espressione, che hanno più copie integrate di sequenze nucleotidiche codificanti il procollagene non fibrillare di spugna.
- 13. Metodo secondo una o più delle precedenti rivendicazioni caratterizzato dal fatto che prevede il passo di isolare detta o dette proteine collageniche ricombinanti di spugna di mare dall' organismo ospite trasformato tramite la preparazione di un cellulare e terreno di coltura concentrato e dializzato.
- 14. Metodo di trasformazione tramite tecnologia ricombinante di un ceppo di lievito per l'espressione all'interno delle cellule di detto ceppo di almeno una sequenza nucleotidica codificante per una catena polipeptidica primaria di collagene marino, cosiddetto procollagene, e di almeno una sequenza nucleotidica codificante per una proteina enzimatica o di almeno una sua subunità coinvolta nelle modifiche di detta catena nel processo di formazione del collagene marino caratterizzato dal fatto che detto metodo comprende i seguenti passi: - identificazione delle sequenze nucleotidiche codificanti le subunità alfa e beta dell'enzima con attività prolil-idrossilasica coinvolte nelle modifiche di detta catena, - preparazione ed utilizzo di almeno un vettore di espressione per l'introduzione di dette sequenze all'interno delle cellule, selezione degli organismi trasformati contenenti dette sequenze integrate nel proprio genoma.
- 15. Metodo di trasformazione secondo la rivendicazione 14 caratterizzato dal fatto che prevede un passo di co-trasformazione con un primo vettore di espressione comprendente la sequenza nucleotidica codificante per la subunità alfa dell'enzima prolil-4-idrossilasi (P4H) e un secondo vettore di espressione comprendente la sequenza nucleotidica codificante per la subunità beta dell'enzima prolil-4-idrossllasi (PDI) di spugna C. reniformis .
- 16. Metodo di trasformazione secondo la rivendicazione 15 caratterizzato dal fatto che detto primo vettore contiene la sequenza nucleotidica mostrata in SEQ ID N0:1 e detto secondo vettore contiene la sequenza nucleotidica mostrata in SEQ ID NO:3.
- 17. Metodo di trasformazione secondo la rivendicazione 14, 15 o 16 caratterizzato dal fatto che prevede un passo di trasformazione con vettore di espressione comprendente la sequenza nucleotidica codificante per il procollagene non fibrillare di spugna C.reniformis.
- 18. Metodo di trasformazione secondo una o più delle precedenti rivendicazioni da 14 a 17 caratterizzato dal fatto che il passo di cotrasformazione con i vettori con le sequenze per le subunità alfa e beta dell'enzima prolil-4-idrossilasi precede il passo di trasformazione con il vettore con la sequenza nucleotidica codificante per il procollagene non fibrillare di spugna, essendo tra detti due passi interposto un passo di selezione dei ceppi di lievito con elevata attività prolilidrossilasica.
- 19. Metodo di trasformazione secondo una o più delle precedenti rivendicazioni da 14 a 18 caratterizzato dal fatto che prevede la trasformazione di un ceppo di lievito del genere Pichia pastoris.
- 20. Metodo di trasformazione secondo una o più delle precedenti rivendicazioni da 14 a 19 caratterizzato dal fatto che il vettore di espressione comprendente la sequenza per la subunità beta dell'enzima prolil-4-idrossilasi (PDI) ha il sito di clonaggio preceduto dalla regione codificante per l'Alfa Mating Factor (AM) di S. cerevisiae.
- 21. Metodo di trasformazione secondo una o più delle precedenti rivendicazioni da 14 a 20 caratterizzato dal fatto che à ̈ previsto un unico vettore di espressione comprendente la sequenza nucleotidica codificante per la subunità alfa dell'enzima prolil-4-idrossilasi (P4H) e la sequenza nucleotidica codificante per la subunità beta dell'enzima prolil-4-idrossilasi (PDI) di spugna C. reniformis .
- 22. Vettore di espressione per la trasformazione di un organismo ospite per la produzione tramite tecnologia ricombinate di proteine collageniche di spugna di mare caratterizzato dal fatto che comprende la sequenza di acido nucleico di SEQ ID NO: 1 codificante per la subunità alfa dell'enzima prolil-4-idrossilasi (P4H) di spugna C. reniformis il quale enzima, avente attività prolil-idrossilasica, à ̈ coinvolto nelle modifiche catena polipeptidica primaria di collagene marino, cosiddetto procollagene, e nel processo di formazione del collagene marino.
- 23. Vettore di espressione per la trasformazione di un organismo ospite per la produzione tramite tecnologia ricombinate di proteine collageniche di spugna di mare caratterizzato dal fatto che comprende la sequenza di acido nucleico di SEQ ID NO: 3 codificante per la subunità beta dell'enzima prolil4-idrossilasi (PDI) di spugna C. reniformis il quale enzima, avente attività prolil-idrossilasica, à ̈ coinvolto nelle modifiche catena polipeptidica primaria di collagene marino, cosiddetto procollagene, e nel processo di formazione del collagene marino.
- 24. Vettore di espressione secondo la rivendicazione 22 e 23 caratterizzato dal fatto che comprende entrambe le sequenze nucleodiche mostrate in SED ID NO: l e SED ID NO: 3
- 25. Vettore di espressione secondo la rivendicazione 23 caratterizzato dal fatto che il sito di clonaggio à ̈ preceduto dalla regione codificante per l'Alfa Mating factor (AM) di S. cerevisiae .
- 26. Ceppo di lievito ricombinante per la produzione di proteine collageniche di spugna di mare caratterizzato dal fatto che esprime al suo interno almeno una sequenza nucleotidica codificante per una catena polipeptidica primaria di collagene marino, cosiddetto procollagene, e di almeno una sequenza nucleotidica codificante per una proteina enzimatica o di almeno una sua subunità coinvolta nelle modifiche di detta catena nel processo di formazione del collagene marino.
- 27. Ceppo di lievito secondo la rivendicazione 26 caratterizzato dal fatto che appartiene alla specie Pichia pastoris.
- 28. Ceppo di lievito secondo la rivendicazione 26 o 27 caratterizzato dal fatto che detto ceppo esprime le sequenze nucleotidiche codificanti per le subunità alfa e beta dell'enzima prolil-4-idrossilasi di spugna C.reniformis, il quale enzima, avente attività prolil-idrossilasica, à ̈ coinvolto nelle modifiche catena polipeptidica primaria di collagene marino, cosiddetto procollagene, e nel processo di formazione del collagene marino, e almeno la sequenza nucleotidica codificante per il procollagene non fibrillare di spugna C.reniformis
- 29. Ceppo di lievito Pichia pastoris caratterizzato dal fatto che à ̈ il ceppo depositato con numero 34P in data 05/04/13 presso la Collezione dei lieviti Industriali DBVPG avente riferimento "Pichia pastoris ColCH4".
- 30. Acido nucleico isolato comprendente la sequenza nucleotidica mostrata in SEQ ID NO:1 e codificante per la subunità alfa dell'enzima prolil-4-idrossilasi (P4H) coinvolto nella idrossilazione della catena polipeptidica di procollagene marino.
- 31. Acido nucleico isolato comprendente la sequenza nucleotidica mostrata in SEQ ID NO:3 e codificante per la subunità beta dell'enzima prolil-4-idrossilasi (PDI) coinvolto nella idrossilazione della catena polipeptidica di procollagene marino.
- 32. Enzima prolil-4-idrossilasi coinvolto nella idrossilazione della catena polipeptidica di procollagene marino le cui subunità alfa e beta presentano una sequenza amminoacidica come mostrato rispettivamente in SEQ ID NO:2 e SEQ ID NO:4, essendo detta subunità alfa caratterizzata da un peso molecolare di 61.9 e da un punto isoelettrico di 6.31 ed essendo detta subunità beta caratterizzata da un peso molecolare di 58.8 e da un punto isoelettrico di 4.34.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT000040A ITGE20130040A1 (it) | 2013-04-18 | 2013-04-18 | Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marino |
PCT/EP2014/057966 WO2014170460A2 (en) | 2013-04-18 | 2014-04-17 | Method for the production of collagen proteins derived from marine sponges and an organism able to produce said proteins |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT000040A ITGE20130040A1 (it) | 2013-04-18 | 2013-04-18 | Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marino |
Publications (1)
Publication Number | Publication Date |
---|---|
ITGE20130040A1 true ITGE20130040A1 (it) | 2014-10-19 |
Family
ID=48628770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
IT000040A ITGE20130040A1 (it) | 2013-04-18 | 2013-04-18 | Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marino |
Country Status (2)
Country | Link |
---|---|
IT (1) | ITGE20130040A1 (it) |
WO (1) | WO2014170460A2 (it) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106119322B (zh) | 2016-07-22 | 2019-10-15 | 江苏江山聚源生物技术有限公司 | 一种提高重组人源胶原蛋白生产水平的发酵工艺 |
CA3008850A1 (en) * | 2017-06-29 | 2018-12-29 | Modern Meadow, Inc. | Yeast strains and methods for producing collagen |
RU2658428C9 (ru) * | 2017-10-03 | 2018-10-03 | Общество с ограниченной ответственностью "Медсервис" | Средство для лечения состояний человеческого организма, связанных с уменьшением уровня экспрессии гена Р4НА1 и/или уменьшением количества белка пролил 4-гидроксилазы альфа 1 на основе генно-терапевтических субстанций с геном Р4НА1, способ получения и использования |
CN111334512B (zh) * | 2019-12-06 | 2023-10-13 | 肽源(广州)生物科技有限公司 | 含羟脯氨酸与羟赖氨酸的重组类人胶原蛋白及其生产方法 |
CN117126754A (zh) * | 2022-05-19 | 2023-11-28 | 华北制药集团新药研究开发有限责任公司 | 重组i型胶原蛋白毕赤酵母工程菌及其构建方法与应用 |
CN116333096B (zh) * | 2023-03-12 | 2023-10-24 | 百世美生物技术(浙江)有限公司 | 重组人三型胶原蛋白、注射剂及医学美容产品中的应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030032601A1 (en) * | 2000-03-03 | 2003-02-13 | Jorg Kreuter | Method for isolating sponge collagen and producing nanoparticulate collagen, and the use thereof |
EP1787995A1 (en) * | 2005-11-17 | 2007-05-23 | Technische Universität München | Recombinant mussel byssus protein |
-
2013
- 2013-04-18 IT IT000040A patent/ITGE20130040A1/it unknown
-
2014
- 2014-04-17 WO PCT/EP2014/057966 patent/WO2014170460A2/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030032601A1 (en) * | 2000-03-03 | 2003-02-13 | Jorg Kreuter | Method for isolating sponge collagen and producing nanoparticulate collagen, and the use thereof |
EP1787995A1 (en) * | 2005-11-17 | 2007-05-23 | Technische Universität München | Recombinant mussel byssus protein |
Non-Patent Citations (2)
Title |
---|
DATABASE EMBL [Online] 6 August 2008 (2008-08-06), "Chondrosia reniformis nonfibrillar collagen mRNA, complete cds.", XP002715173, retrieved from EBI accession no. EM_STD:DQ874470 Database accession no. DQ874470 * |
SWATSCHEK D ET AL: "Marine sponge collagen: isolation, characterization and effects on the skin parameters surface-pH, moisture and sebum", EUROPEAN JOURNAL OF PHARMACEUTICS AND BIOPHARMACEUTICS, ELSEVIER SCIENCE PUBLISHERS B.V., AMSTERDAM, NL, vol. 53, no. 1, 1 January 2002 (2002-01-01), pages 107 - 113, XP004331337, ISSN: 0939-6411, DOI: 10.1016/S0939-6411(01)00192-8 * |
Also Published As
Publication number | Publication date |
---|---|
WO2014170460A2 (en) | 2014-10-23 |
WO2014170460A3 (en) | 2014-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Functional genomic analysis of alkaloid biosynthesis in Hyoscyamus niger reveals a cytochrome P450 involved in littorine rearrangement | |
KR102647766B1 (ko) | 클래스 ii, 타입 v crispr 시스템 | |
ITGE20130040A1 (it) | Metodo per la produzione di collagene marino ricombinante e organismo capace di produrre detto collagene marino | |
US20220186195A1 (en) | Glucuronosyltransferase, gene encoding same and use thereof | |
EP4253531A2 (en) | Compositions and methods for making benzylisoquinoline alkaloids, morphinan alkaloids, thebaine, and derivatives thereof | |
DK2804949T3 (en) | GENES INVOLVED IN NOSCAPIN PRODUCTION | |
Qu et al. | Molecular cloning, heterologous expression, and functional characterization of an NADPH-cytochrome P450 reductase gene from Camptotheca acuminata, a camptothecin-producing plant | |
CN109576241A (zh) | 基因表达的调控 | |
JP6522640B2 (ja) | プテロスチルベンの生合成製造のためにo‐メチルトランスフェラーゼを使用する方法 | |
CN110628738B (zh) | 提高葡萄糖氧化酶活性的方法、突变体及其应用 | |
Hao et al. | OpNAC1 transcription factor regulates the biosynthesis of the anticancer drug camptothecin by targeting loganic acid O‐methyltransferase in Ophiorrhiza pumila | |
CN114277024A (zh) | 一种新型三萜合酶及其应用 | |
CN109750021A (zh) | 一种扇贝类胡萝卜素氧化裂解酶基因及其应用 | |
EP3150709B1 (en) | Algae and method for producing same, and method for producing biomass using said algae | |
JP2004073032A (ja) | 低温での組み換えタンパク質の発現に適した新規発現ベクター | |
Piljukov et al. | Irc3 of the thermotolerant yeast Ogataea polymorpha is a branched-DNA-specific mitochondrial helicase | |
CN106075396A (zh) | Cul4蛋白的应用 | |
GB2620254A (en) | Method for preparing multisubunit SCF E3 ligase with fusion protein through in vitro reconstitution, and use of multisubunit SCF E3 ligase | |
CN113755464A (zh) | 一种参与桂叶苷B和毛蕊花糖苷生物合成的LrUGT2蛋白及其编码基因与应用 | |
Jeandard | RNA import into mitochondria of human cells: large-scale identification and therapeutic applications | |
CN117106742A (zh) | 来源于粉防己的一个甲基转移酶及其在制备异汉防己甲素中的应用 | |
JP6120066B2 (ja) | 新規ヌクレアーゼ及びその遺伝子 | |
WO2005030948A1 (ja) | RNaseIII活性を有するポリペプチド | |
Courdavault et al. | An NPF transporter exports a central monoterpene indole alkaloid intermediate from the vacuole | |
Trinh et al. | Missing links of the protein Nα-terminal acetylation machinery in plants |