KR20090079258A - 타겟팅 발현 및 재조합 폴리펩타이드의 번역 후 변형 조절을 위한 서열 세트 - Google Patents
타겟팅 발현 및 재조합 폴리펩타이드의 번역 후 변형 조절을 위한 서열 세트 Download PDFInfo
- Publication number
- KR20090079258A KR20090079258A KR1020097011735A KR20097011735A KR20090079258A KR 20090079258 A KR20090079258 A KR 20090079258A KR 1020097011735 A KR1020097011735 A KR 1020097011735A KR 20097011735 A KR20097011735 A KR 20097011735A KR 20090079258 A KR20090079258 A KR 20090079258A
- Authority
- KR
- South Korea
- Prior art keywords
- arg
- protein
- ser
- gfp
- leu
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 201
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 156
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 151
- 230000008685 targeting Effects 0.000 title abstract description 76
- 230000014509 gene expression Effects 0.000 title description 65
- 238000012986 modification Methods 0.000 title description 12
- 230000004048 modification Effects 0.000 title description 11
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims abstract description 74
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims abstract description 74
- 238000000034 method Methods 0.000 claims abstract description 72
- 239000013598 vector Substances 0.000 claims abstract description 35
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 33
- 230000004481 post-translational protein modification Effects 0.000 claims abstract description 29
- 238000004519 manufacturing process Methods 0.000 claims abstract description 28
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 21
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 21
- 230000001131 transforming effect Effects 0.000 claims abstract description 6
- 238000003306 harvesting Methods 0.000 claims abstract description 5
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims description 301
- 210000004027 cell Anatomy 0.000 claims description 162
- 108090000623 proteins and genes Proteins 0.000 claims description 136
- 241000196324 Embryophyta Species 0.000 claims description 135
- 102000004169 proteins and genes Human genes 0.000 claims description 130
- 102000004190 Enzymes Human genes 0.000 claims description 94
- 108090000790 Enzymes Proteins 0.000 claims description 94
- 150000001413 amino acids Chemical group 0.000 claims description 81
- 244000061176 Nicotiana tabacum Species 0.000 claims description 63
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 63
- 230000004927 fusion Effects 0.000 claims description 63
- 239000012528 membrane Substances 0.000 claims description 36
- 102000051366 Glycosyltransferases Human genes 0.000 claims description 20
- 108700023372 Glycosyltransferases Proteins 0.000 claims description 20
- 102000005744 Glycoside Hydrolases Human genes 0.000 claims description 18
- 108010031186 Glycoside Hydrolases Proteins 0.000 claims description 18
- 244000068988 Glycine max Species 0.000 claims description 10
- 235000010469 Glycine max Nutrition 0.000 claims description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 10
- 240000003768 Solanum lycopersicum Species 0.000 claims description 9
- 102000035195 Peptidases Human genes 0.000 claims description 8
- 108091005804 Peptidases Proteins 0.000 claims description 8
- 239000004365 Protease Substances 0.000 claims description 8
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 claims description 8
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 7
- 239000000969 carrier Substances 0.000 claims description 7
- 238000013519 translation Methods 0.000 claims description 7
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 6
- 230000001323 posttranslational effect Effects 0.000 claims description 6
- 230000031787 nutrient reservoir activity Effects 0.000 claims description 5
- 240000004658 Medicago sativa Species 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 2
- 235000002560 Solanum lycopersicum Nutrition 0.000 claims 2
- 102000004031 Carboxy-Lyases Human genes 0.000 claims 1
- 108090000489 Carboxy-Lyases Proteins 0.000 claims 1
- 102000001253 Protein Kinase Human genes 0.000 claims 1
- 102000004879 Racemases and epimerases Human genes 0.000 claims 1
- 108090001066 Racemases and epimerases Proteins 0.000 claims 1
- 108060006633 protein kinase Proteins 0.000 claims 1
- 108010076504 Protein Sorting Signals Proteins 0.000 abstract description 14
- 230000008569 process Effects 0.000 abstract description 14
- 239000003814 drug Substances 0.000 abstract description 12
- 230000015572 biosynthetic process Effects 0.000 abstract description 7
- 230000005847 immunogenicity Effects 0.000 abstract description 6
- 238000003786 synthesis reaction Methods 0.000 abstract description 2
- 239000005090 green fluorescent protein Substances 0.000 description 242
- 235000018102 proteins Nutrition 0.000 description 113
- 229940088598 enzyme Drugs 0.000 description 89
- 235000001014 amino acid Nutrition 0.000 description 76
- 229940024606 amino acid Drugs 0.000 description 76
- 210000002288 golgi apparatus Anatomy 0.000 description 64
- 230000014759 maintenance of location Effects 0.000 description 57
- 108010052285 Membrane Proteins Proteins 0.000 description 56
- 108020004414 DNA Proteins 0.000 description 48
- 230000001086 cytosolic effect Effects 0.000 description 45
- 102000037865 fusion proteins Human genes 0.000 description 42
- 108020001507 fusion proteins Proteins 0.000 description 42
- 108010054377 Mannosidases Proteins 0.000 description 41
- 102000001696 Mannosidases Human genes 0.000 description 41
- 230000035800 maturation Effects 0.000 description 37
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 36
- 210000002919 epithelial cell Anatomy 0.000 description 34
- 239000003550 marker Substances 0.000 description 30
- 230000003248 secreting effect Effects 0.000 description 30
- 102000018697 Membrane Proteins Human genes 0.000 description 29
- 230000037361 pathway Effects 0.000 description 25
- 238000011282 treatment Methods 0.000 description 23
- 241000282414 Homo sapiens Species 0.000 description 21
- 238000002474 experimental method Methods 0.000 description 19
- 239000000725 suspension Substances 0.000 description 18
- KQNZDYYTLMIZCT-KQPMLPITSA-N brefeldin A Chemical compound O[C@@H]1\C=C\C(=O)O[C@@H](C)CCC\C=C\[C@@H]2C[C@H](O)C[C@H]21 KQNZDYYTLMIZCT-KQPMLPITSA-N 0.000 description 17
- JUMGSHROWPPKFX-UHFFFAOYSA-N brefeldin-A Natural products CC1CCCC=CC2(C)CC(O)CC2(C)C(O)C=CC(=O)O1 JUMGSHROWPPKFX-UHFFFAOYSA-N 0.000 description 17
- 230000004186 co-expression Effects 0.000 description 17
- 210000000172 cytosol Anatomy 0.000 description 17
- 230000013595 glycosylation Effects 0.000 description 17
- 238000006206 glycosylation reaction Methods 0.000 description 17
- 235000009697 arginine Nutrition 0.000 description 15
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 15
- 238000002372 labelling Methods 0.000 description 15
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 14
- 108090000288 Glycoproteins Proteins 0.000 description 14
- 102000003886 Glycoproteins Human genes 0.000 description 14
- 108010068380 arginylarginine Proteins 0.000 description 14
- 210000004748 cultured cell Anatomy 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 230000002163 immunogen Effects 0.000 description 14
- 239000004475 Arginine Substances 0.000 description 13
- 210000004899 c-terminal region Anatomy 0.000 description 13
- 108010050669 glucosidase I Proteins 0.000 description 13
- 150000002482 oligosaccharides Chemical class 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 241001080519 Zera Species 0.000 description 12
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 12
- 241000219195 Arabidopsis thaliana Species 0.000 description 11
- 102100022265 DnaJ homolog subfamily C member 21 Human genes 0.000 description 11
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 11
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 10
- 241000880493 Leptailurus serval Species 0.000 description 10
- 230000004988 N-glycosylation Effects 0.000 description 10
- 210000000170 cell membrane Anatomy 0.000 description 10
- YPHMISFOHDHNIV-FSZOTQKASA-N cycloheximide Chemical compound C1[C@@H](C)C[C@H](C)C(=O)[C@@H]1[C@H](O)CC1CC(=O)NC(=O)C1 YPHMISFOHDHNIV-FSZOTQKASA-N 0.000 description 10
- 229940079593 drug Drugs 0.000 description 10
- 229920001542 oligosaccharide Polymers 0.000 description 10
- 239000002243 precursor Substances 0.000 description 10
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 9
- 241000208125 Nicotiana Species 0.000 description 9
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 9
- 108010062796 arginyllysine Proteins 0.000 description 9
- 150000004676 glycans Chemical class 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- 238000012216 screening Methods 0.000 description 9
- 241000219194 Arabidopsis Species 0.000 description 8
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 8
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 7
- 241000219823 Medicago Species 0.000 description 7
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 7
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 7
- 238000001218 confocal laser scanning microscopy Methods 0.000 description 7
- 230000001054 cortical effect Effects 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 230000002797 proteolythic effect Effects 0.000 description 7
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 6
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 6
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 6
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 6
- 101001033280 Homo sapiens Cytokine receptor common subunit beta Proteins 0.000 description 6
- 101001040734 Homo sapiens Golgi phosphoprotein 3 Proteins 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 6
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 6
- 210000005220 cytoplasmic tail Anatomy 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 102000055647 human CSF2RB Human genes 0.000 description 6
- 108010009689 mannosyl-oligosaccharide 1,2-alpha-mannosidase Proteins 0.000 description 6
- 230000005012 migration Effects 0.000 description 6
- 238000013508 migration Methods 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 6
- 230000028327 secretion Effects 0.000 description 6
- 230000010473 stable expression Effects 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 108010003137 tyrosyltyrosine Proteins 0.000 description 6
- 210000003934 vacuole Anatomy 0.000 description 6
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 5
- 108010056891 Calnexin Proteins 0.000 description 5
- 102100021868 Calnexin Human genes 0.000 description 5
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 5
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 5
- 102100025315 Mannosyl-oligosaccharide glucosidase Human genes 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 5
- 230000004989 O-glycosylation Effects 0.000 description 5
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 5
- 208000006930 Pseudomyxoma Peritonei Diseases 0.000 description 5
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 5
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 5
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 5
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 5
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 5
- 108010005233 alanylglutamic acid Proteins 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 108010077245 asparaginyl-proline Proteins 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 210000002421 cell wall Anatomy 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000001493 electron microscopy Methods 0.000 description 5
- 210000003527 eukaryotic cell Anatomy 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 238000001764 infiltration Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 229920000306 polymethylpentene Polymers 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000009261 transgenic effect Effects 0.000 description 5
- 230000010474 transient expression Effects 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 4
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 4
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 4
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 4
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- 102100039371 ER lumen protein-retaining receptor 1 Human genes 0.000 description 4
- 101000812437 Homo sapiens ER lumen protein-retaining receptor 1 Proteins 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 4
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 4
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 4
- 101100491597 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) arg-6 gene Proteins 0.000 description 4
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 4
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 4
- 229940123573 Protein synthesis inhibitor Drugs 0.000 description 4
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- GKUROEIXVURAAO-BPUTZDHNSA-N Trp-Asp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GKUROEIXVURAAO-BPUTZDHNSA-N 0.000 description 4
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 4
- 108010070113 alpha-1,3-mannosyl-glycoprotein beta-1,2-N-acetylglucosaminyltransferase I Proteins 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 230000008595 infiltration Effects 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 125000001909 leucine group Chemical class [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 230000026731 phosphorylation Effects 0.000 description 4
- 238000006366 phosphorylation reaction Methods 0.000 description 4
- 239000000007 protein synthesis inhibitor Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 229960004793 sucrose Drugs 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- KQNZDYYTLMIZCT-KFKPYADVSA-N (2e,7s,10e,12r,13r,15s)-12,15-dihydroxy-7-methyl-8-oxabicyclo[11.3.0]hexadeca-2,10-dien-9-one Chemical compound O[C@@H]1\C=C\C(=O)O[C@@H](C)CCC\C=C\C2C[C@H](O)C[C@H]21 KQNZDYYTLMIZCT-KFKPYADVSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 3
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 3
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 3
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 3
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 3
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 235000013175 Crataegus laevigata Nutrition 0.000 description 3
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 3
- 108060003306 Galactosyltransferase Proteins 0.000 description 3
- 102000030902 Galactosyltransferase Human genes 0.000 description 3
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 3
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 3
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 3
- 125000002059 L-arginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C([H])([H])N([H])C(=N[H])N([H])[H] 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 3
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 3
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 3
- 239000000232 Lipid Bilayer Substances 0.000 description 3
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 3
- 108010056664 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 3
- 102000006437 Proprotein Convertases Human genes 0.000 description 3
- 108010044159 Proprotein Convertases Proteins 0.000 description 3
- 108010078762 Protein Precursors Proteins 0.000 description 3
- 102000014961 Protein Precursors Human genes 0.000 description 3
- 101800001295 Putative ATP-dependent helicase Proteins 0.000 description 3
- 101800001006 Putative helicase Proteins 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 3
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 3
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 3
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 3
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 125000003275 alpha amino acid group Chemical group 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000004624 confocal microscopy Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 230000029142 excretion Effects 0.000 description 3
- 230000006251 gamma-carboxylation Effects 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 102000005383 human beta1,4-galactosyltransferase Human genes 0.000 description 3
- 108010045961 human beta1,4-galactosyltransferase Proteins 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000005805 hydroxylation reaction Methods 0.000 description 3
- 230000002519 immonomodulatory effect Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 235000005772 leucine Nutrition 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 210000000826 nictitating membrane Anatomy 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 235000019419 proteases Nutrition 0.000 description 3
- 230000018883 protein targeting Effects 0.000 description 3
- 230000006337 proteolytic cleavage Effects 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000004064 recycling Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 230000009962 secretion pathway Effects 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- WXTMDXOMEHJXQO-UHFFFAOYSA-N 2,5-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC(O)=CC=C1O WXTMDXOMEHJXQO-UHFFFAOYSA-N 0.000 description 2
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 2
- VKJOGYLRXNAHPO-UHFFFAOYSA-N 2-aminobenzamide Chemical compound NC(=O)C1=CC=CC=C1N.NC(=O)C1=CC=CC=C1N VKJOGYLRXNAHPO-UHFFFAOYSA-N 0.000 description 2
- 108010036211 5-HT-moduline Proteins 0.000 description 2
- 108010013043 Acetylesterase Proteins 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 2
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 2
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 2
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102000004506 Blood Proteins Human genes 0.000 description 2
- 108010017384 Blood Proteins Proteins 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- GGIHYKLJUIZYGH-ZLUOBGJFSA-N Cys-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)O GGIHYKLJUIZYGH-ZLUOBGJFSA-N 0.000 description 2
- 102000005927 Cysteine Proteases Human genes 0.000 description 2
- 108010005843 Cysteine Proteases Proteins 0.000 description 2
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 108010023321 Factor VII Proteins 0.000 description 2
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 2
- 229930182566 Gentamicin Natural products 0.000 description 2
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 2
- KUYCTNQKTFGPMI-SXHURMOUSA-N Glc(a1-2)Glc(a1-3)Glc(a1-3)Man(a1-2)Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-6)]Man(a1-6)]Man(b1-4)GlcNAc(b1-4)GlcNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O[C@@H]4[C@@H]([C@@H](O[C@@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O[C@@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)O3)O)O2)O)[C@@H](CO)O1 KUYCTNQKTFGPMI-SXHURMOUSA-N 0.000 description 2
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 2
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 2
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 2
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 244000207740 Lemna minor Species 0.000 description 2
- 235000006439 Lemna minor Nutrition 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 102000004317 Lyases Human genes 0.000 description 2
- 108090000856 Lyases Proteins 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 2
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 2
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical group NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- 108010087568 Mannosyltransferases Proteins 0.000 description 2
- 102000006722 Mannosyltransferases Human genes 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 2
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 2
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 2
- OOXVBECOTYHTCK-WDSOQIARSA-N Met-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCSC)N OOXVBECOTYHTCK-WDSOQIARSA-N 0.000 description 2
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 2
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical group CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 2
- 102000004020 Oxygenases Human genes 0.000 description 2
- 108090000417 Oxygenases Proteins 0.000 description 2
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 2
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 2
- 102000009097 Phosphorylases Human genes 0.000 description 2
- 108010073135 Phosphorylases Proteins 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000195887 Physcomitrella patens Species 0.000 description 2
- 108010064851 Plant Proteins Proteins 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 2
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 2
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 2
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 2
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 2
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 2
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 2
- 108091058545 Secretory proteins Proteins 0.000 description 2
- 102000040739 Secretory proteins Human genes 0.000 description 2
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 2
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 2
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 2
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 2
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 2
- 108010022999 Serine Proteases Proteins 0.000 description 2
- 102000012479 Serine Proteases Human genes 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 102000005262 Sulfatase Human genes 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- JZHJLBPBQKPTNX-UBHSHLNASA-N Trp-Cys-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 JZHJLBPBQKPTNX-UBHSHLNASA-N 0.000 description 2
- IQLVYVFBJUWZNT-BPUTZDHNSA-N Trp-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N IQLVYVFBJUWZNT-BPUTZDHNSA-N 0.000 description 2
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 2
- QPBJXNYYQTUTDD-KKUMJFAQSA-N Tyr-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QPBJXNYYQTUTDD-KKUMJFAQSA-N 0.000 description 2
- NUQZCPSZHGIYTA-HKUYNNGSSA-N Tyr-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NUQZCPSZHGIYTA-HKUYNNGSSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 2
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 230000009435 amidation Effects 0.000 description 2
- 238000007112 amidation reaction Methods 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108010087667 beta-1,4-mannosyl-glycoprotein beta-1,4-N-acetylglucosaminyltransferase Proteins 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 230000013020 embryo development Effects 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 108010001671 galactoside 3-fucosyltransferase Proteins 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 2
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 230000033444 hydroxylation Effects 0.000 description 2
- 238000003126 immunogold labeling Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 230000002132 lysosomal effect Effects 0.000 description 2
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 2
- 230000010874 maintenance of protein location Effects 0.000 description 2
- 108010034507 methionyltryptophan Proteins 0.000 description 2
- 238000001000 micrograph Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- PXBFMLJZNCDSMP-UHFFFAOYSA-N ortho-aminobenzoylamine Natural products NC(=O)C1=CC=CC=C1N PXBFMLJZNCDSMP-UHFFFAOYSA-N 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000007030 peptide scission Effects 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010073101 phenylalanylleucine Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 235000021118 plant-derived protein Nutrition 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 102000035123 post-translationally modified proteins Human genes 0.000 description 2
- 108091005626 post-translationally modified proteins Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 230000009145 protein modification Effects 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 210000004739 secretory vesicle Anatomy 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 108060007951 sulfatase Proteins 0.000 description 2
- 230000019635 sulfation Effects 0.000 description 2
- 238000005670 sulfation reaction Methods 0.000 description 2
- 238000004114 suspension culture Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 108010014563 tryptophyl-cysteinyl-serine Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- INOZZBHURUDQQR-AJNGGQMLSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]-4-methylpentanoic acid Chemical group CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 INOZZBHURUDQQR-AJNGGQMLSA-N 0.000 description 1
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 1
- 101710102211 11S globulin Proteins 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- 101710168820 2S seed storage albumin protein Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108010029607 4-nitrophenyl-alpha-glucosidase Proteins 0.000 description 1
- ZZHVXIPXTCBVBE-UHFFFAOYSA-N 5-(diaminomethylideneamino)-2-[[2-[[1-[3-hydroxy-2-[[3-phenyl-2-[[2-[[1-(pyrrolidine-2-carbonyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]propanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]-3-phenylpropanoyl]amino]pentanoic acid Chemical compound C1CCN(C(=O)C(CO)NC(=O)C(CC=2C=CC=CC=2)NC(=O)CNC(=O)C2N(CCC2)C(=O)C2NCCC2)C1C(=O)NC(C(=O)NC(CCCN=C(N)N)C(O)=O)CC1=CC=CC=C1 ZZHVXIPXTCBVBE-UHFFFAOYSA-N 0.000 description 1
- HLXHCNWEVQNNKA-UHFFFAOYSA-N 5-methoxy-2,3-dihydro-1h-inden-2-amine Chemical compound COC1=CC=C2CC(N)CC2=C1 HLXHCNWEVQNNKA-UHFFFAOYSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 108010016281 ADP-Ribosylation Factor 1 Proteins 0.000 description 1
- 102100034341 ADP-ribosylation factor 1 Human genes 0.000 description 1
- 101150073246 AGL1 gene Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 102400000344 Angiotensin-1 Human genes 0.000 description 1
- 101800000734 Angiotensin-1 Proteins 0.000 description 1
- 101100373383 Arabidopsis thaliana XYLT gene Proteins 0.000 description 1
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- UBEKKPOFLCVTEZ-UHFFFAOYSA-N Arg-Lys-Val-Ser Chemical compound OCC(C(O)=O)NC(=O)C(C(C)C)NC(=O)C(CCCCN)NC(=O)C(N)CCCN=C(N)N UBEKKPOFLCVTEZ-UHFFFAOYSA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- ILQCHXURSRRIRY-YUMQZZPRSA-N Asp-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N ILQCHXURSRRIRY-YUMQZZPRSA-N 0.000 description 1
- ODNWIBOCFGMRTP-SRVKXCTJSA-N Asp-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CN=CN1 ODNWIBOCFGMRTP-SRVKXCTJSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 1
- CXEFNHOVIIDHFU-IHPCNDPISA-N Asp-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)O)N CXEFNHOVIIDHFU-IHPCNDPISA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000242587 Aurelia Species 0.000 description 1
- 101800001415 Bri23 peptide Proteins 0.000 description 1
- 101800000655 C-terminal peptide Proteins 0.000 description 1
- 102400000107 C-terminal peptide Human genes 0.000 description 1
- 102000004082 Calreticulin Human genes 0.000 description 1
- 108090000549 Calreticulin Proteins 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 241000272194 Ciconiiformes Species 0.000 description 1
- 102000016519 Coagulation factor VII Human genes 0.000 description 1
- 102100023804 Coagulation factor VII Human genes 0.000 description 1
- 102000016726 Coat Protein Complex I Human genes 0.000 description 1
- 108010092897 Coat Protein Complex I Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 239000000055 Corticotropin-Releasing Hormone Substances 0.000 description 1
- 101000637625 Cricetulus griseus GTP-binding protein SAR1b Proteins 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- OCEHKDFAWQIBHH-FXQIFTODSA-N Cys-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N OCEHKDFAWQIBHH-FXQIFTODSA-N 0.000 description 1
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 1
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 1
- XXDATQFUGMAJRV-XIRDDKMYSA-N Cys-Leu-Trp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XXDATQFUGMAJRV-XIRDDKMYSA-N 0.000 description 1
- LHMSYHSAAJOEBL-CIUDSAMLSA-N Cys-Lys-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O LHMSYHSAAJOEBL-CIUDSAMLSA-N 0.000 description 1
- JEKIARHEWURQRJ-BZSNNMDCSA-N Cys-Phe-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CS)N JEKIARHEWURQRJ-BZSNNMDCSA-N 0.000 description 1
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 1
- GQNZIAGMRXOFJX-GUBZILKMSA-N Cys-Val-Met Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O GQNZIAGMRXOFJX-GUBZILKMSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108010089072 Dolichyl-diphosphooligosaccharide-protein glycotransferase Proteins 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102100021771 Endoplasmic reticulum mannosyl-oligosaccharide 1,2-alpha-mannosidase Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 102000009114 Fatty acid desaturases Human genes 0.000 description 1
- 108010087894 Fatty acid desaturases Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102100035233 Furin Human genes 0.000 description 1
- 108090001126 Furin Proteins 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 1
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- BHXSLRDWXIFKTP-SRVKXCTJSA-N Glu-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BHXSLRDWXIFKTP-SRVKXCTJSA-N 0.000 description 1
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 1
- ZTVGZOIBLRPQNR-KKUMJFAQSA-N Glu-Met-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZTVGZOIBLRPQNR-KKUMJFAQSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 1
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 108010052778 Golgi Matrix Proteins Proteins 0.000 description 1
- 102000018884 Golgi Matrix Proteins Human genes 0.000 description 1
- 108010073141 Hepatitis C virus glycoprotein E2 Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 1
- CYHWWHKRCKHYGQ-GUBZILKMSA-N His-Cys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CYHWWHKRCKHYGQ-GUBZILKMSA-N 0.000 description 1
- IIVZNQCUUMBBKF-GVXVVHGQSA-N His-Gln-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 IIVZNQCUUMBBKF-GVXVVHGQSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 1
- WPUAVVXYEJAWIV-KKUMJFAQSA-N His-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WPUAVVXYEJAWIV-KKUMJFAQSA-N 0.000 description 1
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 208000001953 Hypotension Diseases 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- JHCVYQKVKOLAIU-NAKRPEOUSA-N Ile-Cys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N JHCVYQKVKOLAIU-NAKRPEOUSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- RWHRUZORDWZESH-ZQINRCPSSA-N Ile-Trp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RWHRUZORDWZESH-ZQINRCPSSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- ZSESFIFAYQEKRD-CYDGBPFRSA-N Ile-Val-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N ZSESFIFAYQEKRD-CYDGBPFRSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 101710172072 Kexin Proteins 0.000 description 1
- 101000829964 Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) Glucose N-acetyltransferase 1-B Proteins 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- GPXFZVUVPCFTMG-AVGNSLFASA-N Leu-Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C GPXFZVUVPCFTMG-AVGNSLFASA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 1
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- UFPLDOKWDNTTRP-ULQDDVLXSA-N Leu-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=C(O)C=C1 UFPLDOKWDNTTRP-ULQDDVLXSA-N 0.000 description 1
- SEOXPEFQEOYURL-PMVMPFDFSA-N Leu-Tyr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SEOXPEFQEOYURL-PMVMPFDFSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 1
- JPYPRVHMKRFTAT-KKUMJFAQSA-N Lys-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N JPYPRVHMKRFTAT-KKUMJFAQSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- KTINOHQFVVCEGQ-XIRDDKMYSA-N Lys-Trp-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CC(O)=O)C(O)=O KTINOHQFVVCEGQ-XIRDDKMYSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- 108010009254 Lysosomal-Associated Membrane Protein 1 Proteins 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 102100034028 Membrane-bound transcription factor site-1 protease Human genes 0.000 description 1
- 101710193467 Membrane-bound transcription factor site-1 protease Proteins 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- IVCPHARVJUYDPA-FXQIFTODSA-N Met-Asn-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IVCPHARVJUYDPA-FXQIFTODSA-N 0.000 description 1
- PQPMMGQTRQFSDA-SRVKXCTJSA-N Met-Glu-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O PQPMMGQTRQFSDA-SRVKXCTJSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 1
- JZNGSNMTXAHMSV-AVGNSLFASA-N Met-His-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JZNGSNMTXAHMSV-AVGNSLFASA-N 0.000 description 1
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 1
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 1
- UFOWQBYMUILSRK-IHRRRGAJSA-N Met-Lys-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 UFOWQBYMUILSRK-IHRRRGAJSA-N 0.000 description 1
- KBTQZYASLSUFJR-KKUMJFAQSA-N Met-Phe-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KBTQZYASLSUFJR-KKUMJFAQSA-N 0.000 description 1
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- KFEUJDWYNGMDBV-LODBTCKLSA-N N-acetyllactosamine Chemical group O[C@@H]1[C@@H](NC(=O)C)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KFEUJDWYNGMDBV-LODBTCKLSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 241001221668 Ostreococcus tauri Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000012220 PCR site-directed mutagenesis Methods 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000000447 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Human genes 0.000 description 1
- 108010055817 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Proteins 0.000 description 1
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 1
- KNPVDQMEHSCAGX-UWVGGRQHSA-N Phe-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KNPVDQMEHSCAGX-UWVGGRQHSA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- CTNODEMQIKCZGQ-JYJNAYRXSA-N Phe-Gln-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 CTNODEMQIKCZGQ-JYJNAYRXSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- JLDZQPPLTJTJLE-IHPCNDPISA-N Phe-Trp-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JLDZQPPLTJTJLE-IHPCNDPISA-N 0.000 description 1
- ZVJGAXNBBKPYOE-HKUYNNGSSA-N Phe-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 ZVJGAXNBBKPYOE-HKUYNNGSSA-N 0.000 description 1
- 101100428769 Pisum sativum BP80 gene Proteins 0.000 description 1
- 108090000051 Plastocyanin Proteins 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 1
- BFXZQMWKTYWGCF-PYJNHQTQSA-N Pro-His-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BFXZQMWKTYWGCF-PYJNHQTQSA-N 0.000 description 1
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 1
- TYMBHHITTMGGPI-NAKRPEOUSA-N Pro-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 TYMBHHITTMGGPI-NAKRPEOUSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- ANESFYPBAJPYNJ-SDDRHHMPSA-N Pro-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ANESFYPBAJPYNJ-SDDRHHMPSA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- SNSYSBUTTJBPDG-OKZBNKHCSA-N Pro-Trp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N4CCC[C@@H]4C(=O)O SNSYSBUTTJBPDG-OKZBNKHCSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- 108010050808 Procollagen Proteins 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 102100037097 Protein disulfide-isomerase A3 Human genes 0.000 description 1
- 101710106224 Protein disulfide-isomerase A3 Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241001620634 Roger Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- DMWVGXGXHPOEPT-UHFFFAOYSA-N Src Inhibitor-1 Chemical compound C=12C=C(OC)C(OC)=CC2=NC=NC=1NC(C=C1)=CC=C1OC1=CC=CC=C1 DMWVGXGXHPOEPT-UHFFFAOYSA-N 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 241000383558 Thalia <angiosperm> Species 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- MQVGIFJSFFVGFW-XEGUGMAKSA-N Trp-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MQVGIFJSFFVGFW-XEGUGMAKSA-N 0.000 description 1
- PXQPYPMSLBQHJJ-WFBYXXMGSA-N Trp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PXQPYPMSLBQHJJ-WFBYXXMGSA-N 0.000 description 1
- KIMOCKLJBXHFIN-YLVFBTJISA-N Trp-Ile-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O)=CNC2=C1 KIMOCKLJBXHFIN-YLVFBTJISA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- YLGQHMHKAASRGJ-WDSOQIARSA-N Trp-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YLGQHMHKAASRGJ-WDSOQIARSA-N 0.000 description 1
- UPNRACRNHISCAF-SZMVWBNQSA-N Trp-Lys-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UPNRACRNHISCAF-SZMVWBNQSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- SLOYNOMYOAOUCX-BVSLBCMMSA-N Trp-Phe-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SLOYNOMYOAOUCX-BVSLBCMMSA-N 0.000 description 1
- ACGIVBXINJFALS-HKUYNNGSSA-N Trp-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ACGIVBXINJFALS-HKUYNNGSSA-N 0.000 description 1
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 1
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 1
- SUGLEXVWEJOCGN-ONUFPDRFSA-N Trp-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)O SUGLEXVWEJOCGN-ONUFPDRFSA-N 0.000 description 1
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 description 1
- QJIOKZXDGFZQJP-OYDLWJJNSA-N Trp-Trp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QJIOKZXDGFZQJP-OYDLWJJNSA-N 0.000 description 1
- KPEVFMGKBCMTJF-SZMVWBNQSA-N Trp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N KPEVFMGKBCMTJF-SZMVWBNQSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- FBVGQXJIXFZKSQ-GMVOTWDCSA-N Tyr-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FBVGQXJIXFZKSQ-GMVOTWDCSA-N 0.000 description 1
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 1
- LQGDFDYGDQEMGA-PXDAIIFMSA-N Tyr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N LQGDFDYGDQEMGA-PXDAIIFMSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 1
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 1
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- HSCJRCZFDFQWRP-ABVWGUQPSA-N UDP-alpha-D-galactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-ABVWGUQPSA-N 0.000 description 1
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 description 1
- WOCYUGQDXPTQPY-FXQIFTODSA-N Val-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N WOCYUGQDXPTQPY-FXQIFTODSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- WPSXZFTVLIAPCN-WDSKDSINSA-N Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O WPSXZFTVLIAPCN-WDSKDSINSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- HLBHFAWNMAQGNO-AVGNSLFASA-N Val-His-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N HLBHFAWNMAQGNO-AVGNSLFASA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- LMVWCLDJNSBOEA-FKBYEOEOSA-N Val-Tyr-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N LMVWCLDJNSBOEA-FKBYEOEOSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229930003448 Vitamin K Natural products 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- NFQJPSORGYDNQB-UEMWAUEGSA-N [(2s,3r,4s,5s,6r)-3,5-dihydroxy-2-[(2r,3r,4r,5r,6r)-5-hydroxy-2-(hydroxymethyl)-6-(2-tetradecylhexadecoxy)-4-[(2s,3s,4r,5s,6s)-3,4,5-trihydroxy-6-methyloxan-2-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxan-4-yl] hydrogen sulfate Chemical compound O([C@@H]1[C@@H](CO)O[C@H]([C@@H]([C@H]1O[C@H]1[C@H]([C@H](O)[C@H](O)[C@H](C)O1)O)O)OCC(CCCCCCCCCCCCCC)CCCCCCCCCCCCCC)[C@@H]1O[C@H](CO)[C@H](O)[C@H](OS(O)(=O)=O)[C@H]1O NFQJPSORGYDNQB-UEMWAUEGSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 229960004784 allergens Drugs 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PQMKYFCFSA-N alpha-D-mannose Chemical compound OC[C@H]1O[C@H](O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-PQMKYFCFSA-N 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- ORWYRWWVDCYOMK-HBZPZAIKSA-N angiotensin I Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C1=CC=C(O)C=C1 ORWYRWWVDCYOMK-HBZPZAIKSA-N 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 238000003782 apoptosis assay Methods 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- -1 aromatic amino acid Chemical class 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- GPRBEKHLDVQUJE-VINNURBNSA-N cefotaxime Chemical compound N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C(O)=O)=O)C(=O)/C(=N/OC)C1=CSC(N)=N1 GPRBEKHLDVQUJE-VINNURBNSA-N 0.000 description 1
- 229960004261 cefotaxime Drugs 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000008166 cellulose biosynthesis Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 229940105772 coagulation factor vii Drugs 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 201000001577 congenital disorder of glycosylation type IIb Diseases 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- IDLFZVILOHSSID-OVLDLUHVSA-N corticotropin Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](N)CO)C1=CC=C(O)C=C1 IDLFZVILOHSSID-OVLDLUHVSA-N 0.000 description 1
- 229960000258 corticotropin Drugs 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000003436 cytoskeletal effect Effects 0.000 description 1
- 230000006240 deamidation Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000000635 electron micrograph Methods 0.000 description 1
- 210000003038 endothelium Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 229940012413 factor vii Drugs 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 230000036252 glycation Effects 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 108010041601 histidyl-aspartyl-glutamyl-leucine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000036543 hypotension Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 108010045758 lysosomal proteins Proteins 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 230000012066 maintenance of protein localization in endoplasmic reticulum Effects 0.000 description 1
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108010083819 mannosyl-oligosaccharide 1,3 - 1,6-alpha-mannosidase Proteins 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000001254 matrix assisted laser desorption--ionisation time-of-flight mass spectrum Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N phenol group Chemical group C1(=CC=CC=C1)O ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- SHUZOJHMOBOZST-UHFFFAOYSA-N phylloquinone Natural products CC(C)CCCCC(C)CCC(C)CCCC(=CCC1=C(C)C(=O)c2ccccc2C1=O)C SHUZOJHMOBOZST-UHFFFAOYSA-N 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 108010069742 plant subtilase Proteins 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000005522 programmed cell death Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 230000024128 protein localization in endoplasmic reticulum Effects 0.000 description 1
- 230000005892 protein maturation Effects 0.000 description 1
- 230000020978 protein processing Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000009609 protein targeting to ER Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 210000003412 trans-golgi network Anatomy 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 239000002435 venom Substances 0.000 description 1
- 231100000611 venom Toxicity 0.000 description 1
- 210000001048 venom Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 235000019168 vitamin K Nutrition 0.000 description 1
- 239000011712 vitamin K Substances 0.000 description 1
- 150000003721 vitamin K derivatives Chemical class 0.000 description 1
- 229940046010 vitamin k Drugs 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8221—Transit peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
본 발명은 재조합 폴리펩타이드의 번역 후 변형을 조절하기 유용한 새로운 도구를 제공한다. 이러한 도구는 호스트 세포에서 그들이 합성되는 동안 재조합 폴리펩타이드를 특정 서브-세포 구획으로 타겟팅하고, 상기 서브-세포 구획 내에서 상기 재조합 폴리펩타이드의 특정한 설계를 가능하게 하는 특정한 신호 펩타이드이다. 이러한 신호 펩타이드는 본 명세서에서 서열 번호 1 내지 서열 확인 31로 개시되어 있다. 본 발명은 유리하게, 예를 들어, 재조합 폴리펩타이드의 생산 수득률을 증가시키고, 재조합 폴리펩타이드의 면역원성을 막고, 그들의 천연 대응물의 정확한 복사본인 치료적 활성 재조합 폴리펩타이드를 얻도록 한다. 본 발명은 구체적으로 식물 제조 약물의 재적응 분야와 관련한다.
소포체, 골지체, 번역 후 변형, 재조합 단백질
Description
본 발명은 재조합 단백질 생산 분야와 관련 있고 더욱 구체적으로는 소포체(ER) 및/또는 골지체(GA)에서 번역 후 변형된 재조합 폴리펩타이드를 생산하는 방법과 관련된 것이다. 본 발명은 재조합 폴리펩타이드의 번역 후 변형을 조절하는데 유용한 도구를 제공하고 더 일반적으로 식물 유전적 변형을 위한 DNA 조작 도구를 제공한다. 본 발명은 또한 이러한 도구와 관련한 재조합 폴리펩타이드의 생산 과정을 제공한다.
본 발명의 도구는 호스트 세포에서 특정 서브-세포 구획으로 재조합 단백질이 합성되는 동안 그들의 구분을 이끌고 또한 상기 서브-세포 구획 내에서 상기 재조합 폴리펩타이드의 특정 설계도 이끄는 타겟팅 신호를 포함한다. 본 발명은, 유리하게, 예를 들어 재조합 폴리펩타이드의 생산 수득률을 증가시키고, 재조합 폴리펩타이드의 면역원성을 제한하거나 막으며, 그들의 천연 대응물과 완전한 복사물인 치료적으로 활성 있는 재조합 폴리펩타이드를 얻도록 한다.
본 발명은 구체적으로 식물 제조 약물(PMPs)의 재적응(reorientation) 분야 와 관련한다.
본 발명은 또한 타겟팅 신호에 융합된 단일 사슬 가변성 절편(ScFv)과 단백질의 상호작용을 이용한 식물 제조 약물의 면역 타겟팅(targeting) 분야와도 관련한다.
본 발명은 또한 식물 제조 약물의 번역 후 변형과 관계되는 식물 효소의 재적응 분야와도 관련한다.
본 발명은 또한 식물 제조 약물의 번역 후 변형과 관계되는 이종 효소의 재적응 분야와도 관련한다.
재조합 DNA 기술은 호스트 시스템에서 이종 재조합 단백질의 생산을 가능하게 해 왔다. 초기 작업의 대다수는 원핵 세포 호스트, 주로 대장균(Edcherichia coli.)에서 재조합 약제용 단백질의 발현을 향해 진행되었다. 생산 시스템으로 원핵 세포의 장점은 그들의 유전적 조작의 용이성, 그들의 빠른 성장 및 재조합 단백질의 높은 발현 수준 그리고 대-규모 발효의 가능성이다.
그러나 신호 펩타이드 절단(cleavage), 프로펩타이드(propeptide) 처리, 단백질 접힘(folding), 디설파이드 결합 형성 및 글리코실화를 포함하는 몇몇 번역 후 변형(PTMs)은 원핵생물에서 수행될 수 없었다. 그 결과, 원핵생물에서 생산된 복합체 약제용 단백질은 생물학적 활성의 의도한 정도를 제공하기 위해 항상 적절히 접히거나 처리되지는 않았다. 결론적으로, 미생물 발현 시스템은 일반적으로 인 슐린, 인터페론 또는 인간 성장 호르몬과 같이 상대적으로 단순한 약제용 단백질의 발현에만 사용되었고, 이는 생물학적 활성을 가지기 위해 접히거나 광범위한 번역 후 처리를 요하지 않는다.
약제용 단백질 생산을 위한 원핵 생물의 한계로 인하여, 바이오기술 산업은 포유동물 세포 배양물, 이스트, 균(fungi), 곤충 세포 및 트랜스제닉 동물과 같은 진핵 생물 호스트로 향한 노력을 해 왔다. 이러한 생산 시스템은 감내할 수 있기는 하지만, 다른 단점이 있다; 고가의 발효, 낮은 수득률, 분비 문제, 높은 작동 비용, 많은 양으로 하기에 어려움 및 바이러스나 프리온에 의한 잠재적 오염과 같은 것이다(Gomord et al. 2004(참조 23)).
식물 세포와 식물 서스펜션-배양된 세포는 우수한 대안이 될 수 있다: 유리한 비용, 인간에 대한 병원성 오염이 없음(Gomord et al. 2004(참조 23)).
그러나 모든 진핵 생물 세포의 주요한 문제점 중 하나는 적절하지 않은 번역 후 변형이다(PTMs).
실제로, 약제용 단백질의 많은 대다수는 몇몇 번역 후 변형을 겪고, 이는 유전자의 유전 정보가 기능성 유전자 산물의 형성을 지시하는 마지막 단계이다.
본 명세서에서, 용어 "번역 후 변형(PTM)"은, 예를 들어 글리코실화, 인산화, 메틸화, ADP-리보실화, 산화 및 글리케이션(glycation)과 같은 개별 아미노산 잔기의 유도체를 얻는 공유결합 변형을 포괄하고; 폴리펩타이드 백본(backbone)과 관련된 반응에 의한 단백질 가수분해 처리; 및 탈아미드화, 라세미화 및 단백질 구조에서의 임의적 변화와 같은 비-효소적 변형을 들 수 있다.
번역 후 변형의 대부분은 진핵 세포에서 내막 시스템의 존재에 의존한다. 분비 통로는 첨부 도면 1에 나타난 것 같이, 소포체(ER), 골지체(GA), 토노플라스트(tonoplast), 리소조말 구획, 원형질 막 및 세포외 매개물로 구성된다. 최근 연구는 초반 구획(ER 및 GA)이 막 연속체로 구성될 가능성이 있다는 것을 보여준다(도 1을 보라). 그러나, ER 내, ER과 GA 사이 및 골지 내 단백질 이동에 대한 상세한 연구는 단백질이 식물 세포 내에서 효소적으로 구별되는 4개의 도메인 안에 서브구획화되어 있다는 것을 보여 준다(도 1을 보라: 도메인 파란색, 노란색, 녹색 및 오렌지색).
혈액 단백질, 시토카인, 면역글로불린, 구조 단백질, (성장)호르몬, 백신, 효소 및 리소조말 단백질을 포함하는 대부분의 약제용 단백질은 ER의 루멘 내로 번역되면서 삽입되고, 이후 GA를 거쳐 리소조말 구획, 세포외 매트릭스 또는 혈액으로 이동된다. 대부분의 약제용 단백질 변형은 분비 통로에서 일어나나 구체적으로 그것의 초반 구획에서 일어난다(ER과 GA, Gomord와 Faye, 2004(참조 21).
예를 들어, 응고 인자 Ⅸ는 ER에서 461 아미노산의 전구체 분자로서 합성되는 비타민 K-의존 글리코단백질이다. 생물학적으로 활성인 인자 Ⅸ를 얻기 위해서, 본 전구체는 ER 및 GA에서 광범위한 번역 후 변형을 겪고, 이는 신호 펩타이드와 프로펩타이드의 절단, 디설파이드 연결 형성, 처음 12 글루탐산 잔기의 γ-카르복실화, 아스파테이트 64의 부분적 β-하이드록실화, 아스파라긴(Asn) 157과 Asn 167에 N-링크된 글리코실화, 세린(Ser) 63, Ser 61, 트레오닌(Thr) 159, Thr 169, Thr 172 및 Thr 179에 O-링크된 글리코실화, 티로신(Tyr) 155의 설페이션(sulfation), 및 Ser 158의 인산화를 포함한다. 이는 관찰된 약제용 단백질의 매우 복합적인 성숙 중 하나이다.
더욱 일반적으로, 대부분 약제용 단백질은 그들의 생물활성, 약물동력학, 안정성, 용해성을 위해 최소한 단백질 가수 분해적 절단 및 글리코실화를 필요로 한다.
진핵 세포는 이러한 변형의 대부분을 달성할 수 있다. 그러나, 더욱 일반적으로, 이러한 성숙은 호스트 시스템에 특이적이다. 게다가, 번역 후 변형이 포유 동물 세포와 식물 세포에서 다르다. 다른 진핵 세포에서처럼, 식물에서는 N-글리코실화가 ER에서 시작되고 올리고당 전구체(Glc3Man9GlcNAc2)가 잠재적인 N-글리코실화 서열인 Asn-X-Ser/Thr의 특정 아스파라긴 잔기에 공번역적으로 부가된다. 일단 초기 단백질 상으로 이동되면, 분비된 글리코단백질이 분비 통로를 통해 이동되는 동안, 올리고당 전구체는, 첨부 도면 2에서 도식적으로 나타난 바와 같이, ER과 GA 내에서 당 잔기의 제거나 부가와 관련된 몇몇 성숙을 겪는다. 식물과 포유 동물 N-글리칸 성숙이 상이한 것은 후반 GA에서 뿐이고, 이는 식물 제조 약물의 N-글리칸에 알파-(1,6)-링크된 푸코즈(fucose), 베타(1,4)-링크된 갈락토즈 및 시알릭 산(sialic acid)이 존재하지 않고 이등분 베타-(1,2)-자일로즈 및 코어 알파-(1,3)-푸코즈가 존재하기 때문이다(첨부 도면 2를 보라).
본문 중, 이종 발현 시스템에서 번역 중 및 번역 후 성숙을 조절할 수 있다는 것은 매우 중요하다.
식물 ER-존재 단백질의 구조적인 분석은 그들이 주로 높은-만노즈-유형 N-글 리칸을 가지고 있다는 것을 보여준다(Navazio et al., 1997(참조 41), 1998(참조 42); Pagny et al., 2000(참조 49)). 이러한 올리고당 구조는 식물과 포유동물에 공통적이므로, 면역원성이지 않다. 본 관찰은 베타-(1,2)-자일로즈 또는 알파-(1,3)-푸코즈와 같은 면역원성 잔기가 식물-제조 약물(PMPs) N-글리칸에 연결되는 것을 막기 위한 전략을 제시한다. 본 전략은 ER 내, 즉, 면역원성 글리코-에피톱이 식물 N-글리칸 복합체에 부가되는 골지 시스터나의 위쪽에, 재조합 단백질을 저장하는 것으로 구성된다. 재조합 용해성 단백질의 C-말단 끝에 H/KDEL 서열이 부가되는 것이 식물 ER 내 그것의 체류에 충분하다는 것이 처음 보여졌다(Gomord et al., 1997(참조 24), 1999(참조 22), Saint-Jore-Dupas et al., 2004(참조 57)).
동일한 전략을 사용하여, 우리는 두 개의 다른 항체의 중쇄 및 경쇄에 H/KDEL-ER 체류 서열을 융합하였다. 이러한 항체는 독점적으로 비 면역원성의 높은-만노즈-유형 N-글리칸을 나타내고(Sriraman et al., 2004(참조 59); Petrucelli et al., 2006(참조 51)), 이것은 알파-만노시다제 Ⅰ과 같은 ER 및 시스-골지에 위치한 효소에 제한된 글리칸 성숙에 기초한 매우 효과적인 재순환을 가리킨다(Nebenfuhr et al., 1999(참조 43)). 그러므로, ER 체류 신호에 융합하는 것을 통하여 면역원성 N-글리칸이 식물-제조 약물과 관련되는 것을 막는 것이 가능하다.
반대로, 식물 ER에서 막-결합 단백질을 유지하는 원인이 되는 분자 신호에 관해 알려진 것은 거의 극히 드물다.
실제로, 오직 극소수의 연구만이 C-말단 디-라이신 모티브(Barrieu와 Chrispeel, 1999(참조 3); Benghezal et al, 2000(참조 4); McCartney et al., 2004(참조 35); Reyer et al, 2006(참조 53)), 트랜스-막 도메인(TMD)의 길이(Brandizzi et al., 2002a(참조 9)) 또는 방향족 아미노산-풍부한 ER 복귀 신호(McCartney et al., 2004(참조 35))의 역할을 제공하였다. 알파-글루코시다제 Ⅰ은, 초기 글루코단백질에서 그것의 "엔 블록(En block)" 이동 직후 올리고당 전구체로부터 특이적으로 말단 알파-(1,2)-링크된 글루코즈 잔기를 제거함에 의해 N-링크된 올리고당 잔기를 성숙 시키는 것과 관련되는 제 1 효소이다(첨부 도면 2를 보라). ER에서 본 유형 Ⅱ 막 단백질의 기능 및 결론적으로 위치는 중요하다. 실제로, 포유동물 세포에서, 신생아 때의 결함은 생후 74일경에 치명적인 결과를 낳는 심각한 일반화된 저혈압 및 변형 특징을 유도한다(De Praeter et al., 2000(참조 14)).
글리코실화와 더불어, 분비 통로 아래쪽으로 단백질의 이동은 타겟팅 신호 및 조절 펩타이드 절단과 같은 특정 단백질 가수분해 과정을 전형적으로 겪는다. N-글리코실화의 경우, 문헌에서의 최근 증거는 분비 통로에서 단백질 가수 분해 성숙은 식물과 포유동물 세포에서 유사하다는 것을 나타낸다. 이러한 성숙은 내생적 및 재조합 단백질 모두의 처리에 필수적이나, 그들은 또한 안정하고 완전한 폴리펩타이드의 높은-수득률 생산을 어려운 과제로 만든다. 이러한 단백질 가수분해 성숙은 또한 단백질이 축적되는 서브세포 구획에도 의존한다(Faye et al., 2005(참조 17)).
분비 통로를 통해 이동된 많은 식물 단백질은 전-프로단백질(pre-propretein)로서 먼저 합성되고(하기 설명에서는 "번역 후 변형되지 않은"으로도 불림), 이는 소포체로 초기 폴리펩타이드 사슬을 인도하는 N-말단 절단가능한 신호 펩타이드-또는 전-지역-, 및 그것의 최종 세포 목적지로의 전좌(translocation) 및 처리 전에 성숙 단백질의 안정화, 타겟팅, 저해 및/또는 접힙과 관련되는 조절자 프로(폴리)펩타이드-또는 프로-지역-을 포함한다. 신호 펩티다제에 의해 그들의 신호 펩타이드가 제거된 후, 단백질은 적절히 모이고 접혀지기 위해 ER 루멘 내로 분비되고, 이후 GA로 전좌 되며, 결국 분비 시스템의 다른 구획을 향해 아래쪽으로 더 간다.
많은 식물 단백질들은, 프로단백질로서 ER을 떠나고, 프로지역(proregion)은 분비 통로를 통해 그들의 루트를 따라 아래쪽에서 단백질 가수 분해적으로 절단된다. C- 또는 N-말단 절단 가능한 구분 신호를 가지는 많은 액포 단백질의 경우, 이는 특정 프로테아제에 의해 액포로 이동하는 동안 또는 이후에 제거된다. 액포와 세포벽에서 발견되는 Asn-특정 시스테인 단백질 분해제는, 구체적으로, 몇몇 분비된 단백질의 처리에 관련될 것이고, 이는 2S 알부민 및 11S 글로불린과 같은 종자 저장 단백질 및 병원성-관련된 단백질, 키티나제(chitinases), 글루카나제(glucanases), 렉틴(lectin) 및 상처-유도되는 단백질 분해제 저해제와 같은 항미생물 또는 항해충제/항다이제스티브(antidigestive) 활성을 가진 단백질을 포함한다. 포유 동물 세포에서, 수많은 분비 단백질은 먼저 비활성 프로단백질 전구체로서 합성되고, 이는 이후 분비 통로를 통해 이동하는 동안, 용해성- 또는 막 결합 프로테아제에 의해 번역 후 처리된다.
많은 경우에서, 제한된 단백질 가수 분해에 의한 단백질 전구체의 활성은 박 테리아 서브틸리신 및 이스트 켁신(kexin)과 구조적으로 유사한 효소족인 서브틸리신(subtilisin)-유사 프로단백질 전환효소(convertase)에 의해 수행된다. 포유동물 프로단백질 전환효소는, 특히 푸린(furin)과 디베이직-특정 켁신-유사 프로테아제를 포함하고, 컨센서스(consensus) 서열 (Arg/Lys)-Xn-(Arg/Lys)에서 단백질 전구체를 전형적으로 절단하며, 여기서 X는 Cys를 제외한 어떤 아미노산도 가능하고, n=0, 2, 4 또는 6이다. 생체 내에서, 일반적으로 트랜스-골지 내에서 발견되는 이러한 효소들은 단백질을 성숙시키기 위해 다양한 단백질 전구체를 전환하고, 그리하여 직접 혹은 간접적으로 지모겐(zymogen) 활성, 유전자 발현, 세포 주기, 프로그램된 세포 죽음, 세포 내 단백질 타겟팅, 및 내분비/신경계 기능과 같은 중요한 과정의 미세한 조절에 기여한다.
실제로, 몇몇 실시예는 식물에서 동물 프로단백질을 그들의 생물학적으로 활성인 형태로 올바르게 처리하는 것을 설명하기 위해 제공되었다. 흥미로운 실시예는 인간 프로콜라겐에 대해 제공된 것이고, 그것의 C- 및 N-말단 프로펩티데인(propeptidein) 토바코 세포의 절단 후에 성숙 단백질로 전환되는 것을 보여준다(Lienard et al., 2006(참조 32)).
솔라나시애(Solanaceae)의 단백질 처리 효소에 대한 최근의 연구에 나타난 바에 따르면, 포유동물 처리 전환 효소의 기능적 상동체는 식물 세포의 분비 통로를 따른 단백질 성숙에 연관된다. 트랜스제닉 토바코 라인에서 발생하는 것으로 보여진 kex2p-유사 프로테아제 활성은 바이러스성 항균, KP6 킬러 프로톡신을 올바르게 처리할 수 있다. 본 골지-존재, kex2p-유사 전환효소는 이후 이스트 kex2p의 기 질 특이성 특성을 나타내는 것으로 보여졌고, 토마토로부터의 세포외 프로단백질 전환효소인 LeSBT1와 대조를 이루며, 처리 효소의 동일한 서브 집단에 속하는 포유동물 전환 효소 SKI-1과 같이, 구별적인 특이성을 나타낸다(Jansik et al, 2000(참조 31); Rautengarden et al., 2005(참조 52)).
더욱 최근에, 이스트와 포유동물의, C-말단 테트라펩타이드, 지질 변형을 겪은 단백질의 CAAX 모티브를 처리하는 CAAX 프로테아제의 기능성 상동체가 아라비도프시스에서 발견되었고, 다시 진핵세포의 분비 통로를 따라 잘 보존된 단백질 가수분해 처리의 발생이 확인되었다(Bracha et al, 2002(참조 7)).
실질적인 관점에서, 세포 수준에서 이러한 보존된 처리는, 전체적으로 보존된 N-글리코실화의 특성과 함께, 발현 및 복합적인 번역 후 변형을 요구하는 생물학적 또는 치료적으로 관련된 올바른 처리의 다양한 단백질을 위한 식물 시스템의 잠재성을 강력하게 지적한다.
식물에서, 알파-글루코시다제 Ⅰ은 아라비도프시스 탈리아나 배 발달 기간 동안 저장 단백질의 축적, 단백질체의 형성, 세포 분화 및 세포벽 분열에 있어서 기본적이다. 알파-글루코시다제 Ⅰ 활성 없이 아라비도프시스 탈리아나 종자 발달은 중앙 단계에서 차단되고(Boisson et al., 2001(참조 6)) 세포벽 생합성이 강하게 영향 받는다(Gillmor et al., 2002(참조 19)).
구체적으로 진핵 호스트에서, 구체적으로 식물 세포에서, 설계되거나 공학적으로 전사 후 변형된 재조합 단백질을 생산하기 위해, 예를 들어 호스트에서 실질적으로 그들의 천연 대응체와 동일하고, 가능한 적은 면역원성 특성을 가져 구체적 으로 인간에서, 치료적 물질로 사용할 수 있게 하는 이종 단백질이 발현되도록 하기 위해, 유전자 재조합으로 단백질을 생산할 수단이 당업계에서 여전히 필요하다.
본 발명의 발명자들은 아라비도프시스 탈리아나 글루코시다제 Ⅰ 상 ER에 존재하게 하는 2가지 독립적인 유형의 신호를 확인하였다. GFP에 융합된 본 글루코시다제의 다양한 제거와 변이를 사용하여, 그들은 아라비도프시스 탈라아나 알파-클루코시다제 Ⅰ(본 명세서에서 GCSI라고 명명)의 전체길이가 ER에 완전히 축적되고, ER로의 타겟팅 리포터를 위해 충분하며 시토졸 꼬리에 위치한 Arg-기초 모티프를 포함한다는 것을 보인다. 그러나, 이러한 기능성 Arg-기초 신호는 본 구획에 전체-길이 GCSI를 위치하기 위해 필요하지 않고 제 2 신호는 본 막 결합 ER 효소의 줄기에서 확인되었다.
발명의 발명자들은 아라비도프시스 탈리아나 글리코실트랜스퍼라제 상 GA에 존재하게 하는 3가지 유형의 독립적인 신호를 확인하였다.
본 발명의 목적은 본 필요에 따른 효과적인 도구를 정확하게 제공하고자 하는 것이다. 본 발명의 도구는 타겟팅(targeting) 또는 체류(retention) 신호 및 이러한 타겟팅 신호와 관련한 과정의 형태이다. 본 발명은 일반적으로 이러한 타겟팅 또는 체류 신호를 사용하는 다른 방법에 의한 재조합 폴리펩타이드의 번역 후 성숙(maturation)의 변형에 관한 것이다.
글리코시다제(glycosidases)와 글리코실트랜즈퍼라제(glycosyltransferases)와 같은 식물이나 인간 효소의 수송과 배치에 관한 그들의 수많은 연구에 기초하여, 본 발명자는 특히 식물 세포에서, ER와 GA 사이의 막 단백질 배치와 특정하게 관련된 다른 펩타이드 신호를 확인하였다.
따라서, 본 발명의 첫 번째 측면은 특히 식물세포에서, 특정 세포 서브-구획에 재조합 폴리 펩타이드를 체류하게 하는 특정한 펩타이드 신호를 제공하는 것이다. 이러한 펩타이드 신호의 서열과 구조는 아래 설명 되어진다. 본 발명의 펩타이드 신호는 서열 번호 1에서부터 서열 번호 31로 목록화 되어 있는 첨부된 서열에도 목록화 되어 있다. 앞으로, 이러한 펩타이드 신호는 "체류 신호 서열" 또는 "신호 서열" 또는 "타겟팅 신호" 또는 "펩타이드 신호"라고 언급될 수 있을 것이다. 본 발명의 범위에서 바람직한 서열은 표 1에 개시된 서열이다.
본 발명의 체류 신호 서열은 특히 식물 세포에서, 재조합 폴리펩타이드를 ER 및/또는 GA 구획 막으로 특정하게 타겟(target) 한다. 이러한 서열은 ER 및/또는 GA의 다른 서브 구획에서 또는 ER 및/또는 GA의 다른 서브-구획에서 막 결합 형태로 재조합 폴리펩타이드를 체류하게 한다. "타겟 하다" 또는 "타겟팅"은 본 발명의 펩타이드 신호와 융합된 폴리펩타이드가, 이 펩타이드화 신호 때문에 ER 및/또는 GA에 배치, 즉 갇히게 될 것이라는 것을 의미한다.
재조합 폴리펩타이드의 성숙과 안정성은 폴리펩타이드가 축적된 구획에 직접적으로 의존한다. 예를 들어, 본 발명자는 ER 내 재조합 폴리펩타이드의 체류는 그들의 안정성을 증가시키고 그들의 N-글리칸(glycan) 성숙을 막는다는 것을 보였다. 본 발명자들은 용해성 재조합 폴리펩타이드를 막 폴리펩타이드로서 발현시키는 것 또한 그것의 안정성을 증가시킨다는 것도 보였다. 마지막으로, 본 발명자들은 분비 통로의 초반 구획에서 재조합 폴리펩타이드의 체류는 상기 재조합 폴리펩타이드의 생산 수율을 증가시키고 글리칸 성숙에 기인하는 면역원성(immunogenecity)을 막을 수 있다는 것을 보였다.
본 발명자들은 이하에서 개시되는 다른 목표들을 위해 다른 재조합 폴리펩타이드들에 본 발명의 적절한 신호를 융합했다. 따라서, 본 발명의 다른 측면은 본 발명에 따른 펩타이드 신호를 포함하는 재조합 폴리펩타이드를 제공하는 것이고, 상기 펩타이드 신호가 상기 폴리펩타이드에 융합되어져 있는 폴리펩타이드를 제공하는 것이다. 본 발명의 펩타이드 신호의 융합은 폴리펩타이드의 C-말단 또는 N-말단 끝에서 될 수 있다. 즉, 상기 펩타이드 신호는 폴리펩타이드나 단백질의 C-말단 또는 N-말단 끝에 연결될 수 있다.
본 발명에 따라, 재조합 폴리펩타이드는 제약이나 농업-식품 산업에 이익이 되는 어떤 재조합 폴리펩타이드라도 될 수 있다. "재조합 폴리펩타이드"는 본 명세서에서 "재조합 단백질" 또는 "펩타이드 X" 또는 "타겟 단백질"이라고도 불리워질 수 있다. 그러나, 본 발명에 따른 방법으로 개시된 때에는, 예를 들어 약물적 용도로,생산되는 재조합 폴리펩타이드의 경우 "재조합 폴리펩타이드"로 쓰는 것이 바람직하고; 재조합 폴리펩타이드의 성숙 과정, 즉 번역 후 변형과 관련된(아래 방법 상세한 설명 중 설명을 보라) 단백질의 경우 "재조합 단백질"로 쓰는 것이 바람직하다.
본 발명에 따르면, 본 명세서에서 "타겟 폴리펩타이드"라고도 불리워지는 폴리펩타이드는 모든 막 치료적 폴리펩타이드, 막 단백질이거나 아닌 것으로 발현될 수 있는 모든 용해성 치료적 폴리펩타이드, 모든 항체 및 이의 부분이 될 수 있다.
예를 들어, 재조합 폴리펩타이드는 효소, 항체 또는 그의 부분, 리포터 단백질, 뉴클레오타이드 운반체 및 치료적 활성 폴리펩타이드를 포함하는 그룹으로부터 선택되어질 수 있다. 바람직하게, 상기 재조합 폴리펩타이드는 용해성 폴리펩타이드이거나 단백질이다.
본 발명으로 생산될 수 있는 치료적 활성 단백질의 예는: 백신, 알러겐(allergens), 효소, 혈액 단백질, 호르몬, 항체, 항체-유도된 부분이 있다. 바람직하게, 치료적 활성 폴리펩타이드는 용해성이다. "치료적 폴리펩타이드" 또는 "치료적 활성 폴리펩타이드"는 본 상세한 설명 및 청구범위에서 동일한 의미를 갖는다[또는 막 결합 단백질의 용해성 부분].
본 발명에 따르면, 재조합 폴리펩타이드가 효소일 때, 상기 효소는 식물 또는 동물의 효소일 수 있다. 본 발명에 따르면, 상기 효소는 예를 들어, 글리코시다제(glycosidase), 글리코실트랜스퍼라제(glycosyltransferase), 프로테아제(protease), 키나제(kinase), 디카르복실라제(decarboxylase), 에피머라제(epimerase), 뉴클레오타이드-당 운반체, 예를 들어 UDP-당 운반체, GDP-당 운반체 또는 CMP-당 운반체, 아미드화 효소 및 더욱 일반적으로 호스트 세포, 예를 들어 식물 세포,의 ER 및/또는 GA에 존재하거나 존재하지 않는 모든 성숙 효소를 포함하는 그룹으로부터 선택되어질 수 있다. 글리코시다제는 예를 들어 N- 또는 O- 글리코실화와 관련된 것일 수 있다. 글리코실트랜스퍼라제는 예를 들어 N- 또는 O-글리코실화와 관련된 것일 수 있다. 효소의 예는 하기 표에 나타내어진다.
N-글리코실화 | 인간 베타(1,4) 갈락토실레이션 이스트 만노실트랜스퍼라제 OCH1p 인간 GNT Ⅲ |
O-글리코실화 | N-아세틸글루코사미닐 트랜스퍼라제 갈락토실트랜스퍼라제 |
단백질 가수분해 절단(Proteolytic cleavage) | 세린 프로테아제 시스테인 프로테아제 |
아미드화 | 옥시게나제 리아제(lyase) |
인산화 | 포스포릴라제 |
감마-카르복실화 | 감마 카르복실라제 |
프로테오글리칸(proteoglycan) 변형 | 글리코트랜스퍼라제 글리코시다제 |
설패이션(sulfation) | 설파타제 |
하이드록실화 | 하이드록실라제 |
아세틸화 | 아세틸라제 |
세포벽 다당류 변형 | 글리코트랜스퍼라제 글리코시다제 |
상기 표는 효소에 관한 것이다.
"성숙 효소"는 호스트 세포에서 재조합 단백질의 성숙에 참여하는 모든 효소를 의미한다.
본 발명에 따르면, 단백질이 무엇이건 간에, 저장 단백질 또는 단백질체에 저장된 단백질, 예를 들어 ZERA®에 융합된 단백질과 융합될 수 있다. 이는 호스트 세포에서의 생산 후 재조합 폴리펩타이드의 회수에 흥미롭다. 이 점은 아래 본 발명의 처리 설명으로 논의되어진다.
본 발명의 또다른 측면은 본 발명의 펩타이드 신호를 인코딩하는 핵산 서열을 제공하는 것이다. 서열 번호 1-31를 인코딩하는 핵산 서열의 실시예는 서열 번호: 102-132 참조번호 아래 부가된 서열 목록에 주어진다. 유전 코드의 동의성(degenerescence)로 인해, 당업자는 서열 번호:1-31을 역시 인코딩하는 다른 적절한 핵산 서열을 용이하게 추론할 것이다.
본 발명의 또다른 측면은 본 발명에 따른 재조합 폴리펩타이드를 인코딩하는 핵산 서열을 제공하는 것이다.
본 발명의 나아간 측면은 본 발명에 따른 핵산 서열을 포함하는 핵산 벡터를 제공하는 것이다. 본 발명의 핵산 벡터는 본 발명의 펩타이드 신호를 코딩하는 핵산 서열을 포함하고, 상기 핵산은 상기 폴리펩타이드의 하나(혹은 두 개)의 끝(끝들)에 "체류 신호 서열"을 포함하는 재조합 폴리펩타이드나 단백질을 생산하기 위하여 폴리펩타이드나 단백질을 코딩하는 핵산 서열과 프레임을 맞추어(in frame) 벡터로 도입된다.
모든 알려지고 적절한 방법이 이러한 핵산과 핵산 벡터를 만들기 위해 사용될 수 있다. 예를 들어, 개시된 방법(Gomord et al., 1997(참조 24) 및 1998(참조 25), Pagny et al, 2000(참조 49) 및 2003(참조 50), Saint-Jore-Dupas et al 2006(참조 58))이 유용하게 사용될 수 있다.
본 발명의 또다른 측면은 본 발명의 하나 이상의 펩타이드 신호 및/또는 본 발명의 하나 이상의 재조합 폴리펩타이드(즉, 본 발명의 펩타이드 신호를 포함하는) 및/또는 본 발명의 재조합 폴리펩타이드를 인코딩하는 하나 이상의 핵산 서열 및/또는 본 발명의 하나 이상의 핵산 벡터를 포함하는 식물세포를 제공하는 것이다. 본 발명에 따라, 상기 재조합 폴리펩타이드는 동종 또는 이종 폴리펩타이드일 수 있다. 재조합 폴리펩타이드는 상기 정의한 바와 같을 것이다.
모든 알려지고 적절한 방법이 상기 식물 세포를 획득하는데 사용될 수 있다. 예를 들어, Gomord et al., 1997(참조 24) 및 1998(참조 25), Pagny et al, 2000(참조 49) 및 2003(참조 50), Saint-Jore-Dupas et al 2006(참조 58), Saint-Jore et al., 2002(참조 56)에 개시된 방법은 유용하게 사용될 수 있다.
본 발명의 또다른 측면은 본 발명의 하나 이상의 펩타이드 신호 및/또는 본 발명의 하나 이상의 재조합 단백질(즉, 본 발명의 펩타이드 신호를 포함하는) 및/또는 본 발명의 재조합 단백질을 인코딩하는 하나 이상의 핵산 서열 및/또는 본 발명의 하나 이상의 핵산 벡터를 포함하는 식물을 제공하는 것이다. 본 발명에 따라, 상기 재조합 단백질은 동종 또는 이종 단백질일 수 있다. 재조합 단백질은 상기 정의한 바와 같다.
모든 알려지고 적절한 방법이 상기 식물을 획득하는데 사용될 수 있다. 예를 들어, Saint-Jore-Dupas et al 2006(참조 58), Saint-Jore et al., 2002(참조 56)에 개시된 방법이 유용하게 사용될 수 있다.
본 발명에 따라, 상기 식물은 재조합 단백질의 생산이 가능한 적절한 모든 식물이라도 될 수 있다. 예를 들어, 상기 식물은 알팔파, 아라비도스프시스 탈리아나(Arabidospsis thaliana), 니코티아나 타바쿰(Nicotiana tabacum), 글라이신 맥스(Glycine max), 리코펄시콘 에스컬렌툼(Lycopersicon esculentum), 솔라넘 투베로숨(Solanum tubersum) 오리자 사티바(oriza sativa), 지 마이즈(zea maize), 이끼(피스코미트렐라 패텐스)(physcomitrella patens), 렘나 마이너(Lemna minor), 조류(오스테오코커스 타우리, 패로닥틸럼)(osteococcus tauri, phaelodactylum), 크라미도모나스 레인할드티(shlamydomonas reinhardtii)를 포함하는 그룹으로부터 선택될 수 있다.
본 발명에 따라, 상기 식물 세포는 이러한 식물 중 어떤 것으로부터도 유래되거나 유도된 것일 수 있다.
본 발명자들은 나아가 상기 재조합 폴리펩타이드의 타겟 발현을 위하여 설계된 벡터로 형질전환 되어진 호스트 세포에서 번역 후 변형된 이종 폴리펩타이드를 생산하는 제 1 방법을 제공한다. 본 제 1 방법은 첨부된 도 3, (A)줄에 도식적으로 나타나 있다.
번역 후 변형된 재조합 폴리펩타이드를 생산하는 본 제 1 방법은 다음의 단계를 포함한다:
- 본 발명에 따른 하나 이상의 핵산 벡터로 세포를 트랜스펙팅(transfecting)시키거나 형질전환(transforming)시키는 단계로서, 상기 벡터는 번역 후 변형되지 않은 때의 폴리펩타이드인 재조합 단백질을 인코딩하는 단계;
- 트랜스펙팅된 세포를 키우는 단계; 및
- 번역 후 변형된 폴리펩타이드를 수확하는 단계.
본 발명에 따르면, 상기 과정은 트랜스펙팅되고 형질전환된 세포를 키우는 단계 이전에 세포를 스크리닝하는 단계를 더 포함할 수 있다. 당업자에게 알려진 어떠한 스크리닝 방법이라도 사용될 수 있다. 예를 들어, 현미경을 사용한 직접 선택, 전기 영동 SPS 페이지(page), 면역탐지(immunodetection), 막 전이(membrane tranfert) 등에 의할 수 있다. 스크리닝을 수행하기에 유용한 방법의 예는 예를 들어 문서 Gomord et al. 1997(참조 24)에 개시되어 있다. 본 스크리닝 단계는 본 발명에 따라 트랜스펙팅되거나 형질전환되어진 세포를 선택하도록 한다. 본 단계는 변형된 폴리펩타이드와 관련하여 더 높은 수득율을 유도한다.
상기 발명의 과정에 대한 명세서에 있어서, 상기 언급한 바와 같이, 예를 들어 약물적 용도로, 생산되는 재조합 폴리펩타이드를 지정하기 위해서는 "재조합 폴리펩타이드"로 쓰는 것이 바람직하고; 재조합 폴리펩타이드의 성숙 과정, 즉 번역 후 변형,과 관련된(아래 제 2 방법 상세한 설명 중 설명을 보라) 단백질의 경우 "재조합 단백질"로 쓰는 것이 바람직하다.
본 방법에 의하면, 재조합 폴리펩타이드와 융합된 본 발명의 펩타이드 신호를 인코딩하는 상기 핵산 벡터의 사용은 재조합 폴리펩타이드가 ER 및/또는 GA의 다른 서브-구획에서 자유롭게 또는 막 결합된 형태로 체류하도록 한다. 선행 기술 방법에서 재조합 폴리펩타이드에서 관찰된 이질성 부분은 골지를 통해 운반되고 성숙되는 동안 발생한다. 본 발명의 펩타이드 신호의 사용에 의한 ER 또는 ER-유도된 단백질체 또는 초반 골지 구획에서의 재조합 폴리펩타이드 체류는 본 이질성을 감소시킬 수 있다.
주요 난제는 천연 대응물을 그대로 복사한 재조합 단백질을 생산하는 것이다. 폴리펩타이드 번역 후 성숙은 발현 시스템간에 다른 것뿐만 아니라 동일한 발현 시스템에서 기관간에 다르고 동일한 기관의 세포 구성에서 서브-세포 구획간에도 다르다.
본 발명의 제 1 방법에 따라 특정 구획에로의 PMP를 타겟하기 위한 펩타이드 신호의 부가는 이 난제를 해결할 수 있을 것이나, 본 재조합 단백질의 구조적 변형은 물론 비-고유한 단백질에로의 과정을 유도한다. 유리하게, 본 발명의 상기 펩타이드 신호는 호스트 세포의 ER 및 GA 매개물을 공학 또는 설계하는 것에 의해, 재조합 폴리펩타이드의 성숙을 조절할 수 있는 실제 도구이다. 본 조절은 호스트 세포 내에서 보다 안정한 재조합 폴리펩타이드의 생산을 이끌고, 이는 보다 적은 면역원성을 가지고 그들의 천연 대응물의 정확한 복사물에 도달한다. 이는 사람을 치료하는데 사용될 수 있는 치료적 활성 단백질의 생산, 특히 식물에 의한 생산을 위해 매우 중요하다.
본 발명은 ER과 GA 환경을 설계하기 위한 몇 가지 해결책을 제공한다. 이러한 해결책은 단독으로 또는 함께(조합하여) 사용될 수 있다. 이러한 해결책의 예는 첨부된 도 3, (B)와 (C)줄에 도식적으로 나타나있다. 이러한 해결책 모두에 있어, 호스트 세포는 하기 것들로 트랜스펙팅되거나 형질전환된다:
-생산될 재조합 폴리펩타이드와 다른 재조합 단백질과 융합된 본 발명의 펩타이드 신호를 인코딩하는 하나 이상의 벡터 및
-상기 재조합 폴리펩타이드를 인코딩하는 하나 이상의 핵산 벡터
따라서, 본 발명의 또다른 측면은 다음의 단계를 포함하는 번역 후 변형된 재조합 폴리펩타이드를 생산하는 제 2 방법을 제공한다:
-세포를 본 발명에 따른 하나 이상의 핵산 벡터로 트랜스펙팅시키거나 형질전환시키고, 상기 벡터는 상기 폴리펩타이드와 다른 재조합 단백질을 인코딩하는 단계;
-상기 폴리펩타이드를 인코딩하는 하나 이상의 핵산 벡터로 상기 세포를 트랜스펙팅시키거나 형질전환하는 단계;
- 트랜스펙팅된 세포를 키우는 단계; 및
- 번역 후 변형된 폴리펩타이드를 수확하는 단계
본 발명에 따라, 상기 과정은 트랜스펙팅되거나 형질전환된 세포를 키우는 단계 전에 세포를 스크리닝하는 단계를 더 포함할 수 있다. 스크리닝 방법은 당업자에게 알려진 어떠한 방법이라도 사용될 수 있다. 스크리닝 방법은 상기 개시된 것일 수 있다. 본 스크리닝 단계는 본 발명에 따라 트랜스펙팅되거나 형질전환된 세포를 선택하도록 한다. 본 단계는 변형된 폴리펩타이드와 관련하여 더 높은 수득을 가능하게 한다.
본 두 번째 방법에서, 호스트 세포에서 번역된 재조합 단백질은 본 발명의 펩타이드 신호를 포함하고 본 재조합 단백질은 생산되는 폴리펩타이드와 다르다.
본 두 번째 방법에서, 상기 재조합 단백질은 생산되는 재조합 폴리펩타이드의 번역 후 변형 중 조정에서 역할을 하는데, 즉, 재조합 폴리펩타이드의 성숙 과정에 관여하는 것, 즉 상기 재조합 단백질의 번역 후 변형에 관여한다.
본 역할은 선택된 재조합 단백질의 성질에 의존한다. 당업자는 본 발명의 상세한 설명 및 실시예를 이해함으로써 본 발명을 사용하여 달성하기 원하는 것을 달성하기 위해 재조합 단백질을 어떻게 선택할 것인지 쉽게 이해할 수 있을 것이다.
본 발명에 따라서, 본 재조합 단백질은, 예를 들어 효소 및/또는 항체 또는 그의 부분이 될 수 있다.
본 발명의 두 번째 방법에 따라서, 재조합 단백질이 항체 또는 그의 부분인 경우, 생산되는 폴리펩타이드를 특정하게 인지하거나 결합하는 것 및/또는 상기 폴리펩타이드의 번역 후 변형과 관계된 효소를 특정하게 인지하거나 결합하는 항체 또는 그의 부분 같은 것이 될 수 있다.
본 방법에 의해, 본 발명의 펩타이드 신호와 융합된 항체 또는 그의 부분은 호스트 세포의 ER 및/또는 GA에 위치될 것이다. 여기에서 재조합 단백질의 역할은 ER 및/또는 GA에서 재조합 폴리펩타이드를 잡는 것이다. 그래서 상기 예시적인 발명은 발현 벡터로 형질전환된 호스트 세포에서 항체 또는 항체 절편을 발현함에 의해 번역 후 변형된 이종 폴리펩타이드를 생산하는 방법을 제공하고, 상기 발현 벡터는 다음을 인코딩하는 핵산 서열을 포함한다.
-ER/GA를 타겟으로 하는 항체 또는 항체 절편 및
-생산되는 폴리펩타이드.
생산되는 상기 폴리펩타이드를 특정하게 인지하고 결합하는 항체 또는 그의 부분에 대한 내용에서, 본 발명은 본 발명에 따른 펩타이드 신호와 상기 항체 또는 그의 절편을 융합함으로써, 이 구획 중 하나 내에 체류된 특정 항체 또는 항체 절편에 결합시킴으로써, 호스트 세포의 ER 및/또는 GA 내에 변형되지 않은(본 발명의 펩타이드 신호로 구성된 태그 추가에 의해 변형되지 않은) 재조합 단백질을 체류시킬 수 있게 한다. 본 목적을 위해, 본 발명에 따른 ER 및/또는 GA 체류 펩타이드 신호는 재조합 폴리펩타이드에 특정한 친화성을 가진 항체에 융합되었고, 이의 최종 목적은 재조합 단백질의 성숙을 조절하거나 조정하는 것이다.
상기 폴리펩타이드의 번역 후 변형과 관련한 효소와 특정하게 결합하고 인지하는 항체 또는 그의 부분에 대한 내용에서, 상기 항체 또는 그의 부분은 바람직하게 상기 효소를 조정한다. 여기서, 본 발명의 응용은 ER 및/또는 GA로 비활성화 항체를 특정하게 사용하여 이 구획에 위치된 특정 효소를 비활성화시키는 것이다. 본 목적을 위해서, 본 발명에 따른 ER 및/또는 GA 체류 펩타이드 신호는 ER 또는 GA 효소의 카탈리틱 도메인(catalytic domain)에 특정한 친화성을 가진 항체에 융합되었고, 이는 재조합 단백질의 성숙을 조절하거나 조정하기 위하여 내생적 효소를 비활성화하는 것이 최종 목적이다. 여기에서 재조합 단백질의 역할은 재조합 폴리펩타이드의 성숙과 관련된 효소를 잡는 것이다. 그러므로 본 발명은 호스트 세포 내에서 내생적 효소를 "면역-조정"하도록 한다.
본 발명에 따라서, 제 2 방법은 나아가 다음을 위해 사용될 수 있다:
1) 본 발명의 펩타이드 신호에 융합된 이종 효소를 인코딩하는 본 발명에 따른 하나 이상의 벡터를 사용함으로써 호스트 세포를 이종 효소로 보완하기 위함. 및/또는
2) 본 발명의 펩타이드 신호에 융합된 상기 내생적 효소를 인코딩하는 본 발명에 따른 하나 이상의 벡터를 사용함으로써 호스트 세포의 생산 능력을 최적화하기 위해 내생적 효소를 재배치하기 위함.
재조합 단백질의 성숙을 조정하는 이종 혹은 동종 효소의 능력은 세포 내에서의 그것의 배치에 의존할 것이다. 이때, 호스트 세포의 효소적 준비를 조정하기 위해서 "좋은" 구획으로 적절한 효소를 타겟으로 하는 것이 바람직하다. 그래서 본 발명은 발현벡터로 형질전환된 호스트 세포에서 성숙 효소를 발현함으로써 번역 후 변형된 이종 폴리펩타이드를 생산하는 방법을 제공하고, 발현벡터는 다음을 인코딩하는 핵산 서열을 포함한다:
1) 타겟팅된 성숙 효소인 재조합 단백질, 즉 본 발명의 펩타이드 신호와 융합된 성숙 효소, 및
2) 생산되는 재조합 폴리펩타이드.
따라서, 상기 재조합 단백질은 상기 폴리펩타이드의 번역 후 변형과 관련된 내생적 혹은 이종 효소일 수 있다. 본 실시예에서, 본 발명은 특히 식물 세포에서, 호스트 세포 내 ER 및/또는 GA의 효소적 준비를 조정할 수 있도록 하고, 이는 두 가지로 분리되지만 병렬될 수 있는 다음의 전략에 따른다: (a) ER 및/또는 GA로 내생적 효소를 다시 위치시키는 것에 의함, 및 (b) 이종 효소를 ER/GA로 타겟팅 하여 다른 서브-세포 구획에 위치하게 할 수 있는 것에 의함. 호스트 세포 내의 ER 및/또는 GA의 효소적 준비의 조정은 재조합 폴리펩타이드의 번역 후 성숙을 조정(즉, 설계)할 수 있도록 하는 도구이다. 예를 들어, 본 조정은 안정성을 향상시키는 것 및/또는 생산된 재조합 폴리펩타이드의 면역원성을 조절하는 것을 가능하게 해 준다. 여기에서 재조합 단백질의 역할은 ER 및/또는 GA에서 재조합 폴리펩타이드의 성숙과 관련된 동종 또는 이종 효소를 잡는 것이다.
그러므로 본 발명은 유리하게 비-면역원성 글리코단백질(glycoprotein)인 재조합 폴리펩타이드는 물론이고 동종 글리코단백질인 재조합 단백질을 얻을 수 있도록 한다.
본 발명에 따라서, 상기 폴리펩타이드는 특히 식물 세포 또는 전체 식물에서, 유전적 재조합으로 생산되는 것이 필요한 어떤 폴리펩타이드라도 될 수 있다. 본 발명으로 생산된 수 있는 폴리펩타이드는, 예를 들어 본 발명의 상기 재조합 폴리펩타이드의 개시에서 언급한 것들이다.
본 발명에 따라, 제 1 방법 및 제 2 방법은 동시에 사용될 수 있다. 이러한 경우, 제 2 방법에서, 상기 폴리펩타이드를 인코딩하는 핵산 벡터도 또한 본 발명에 따른 핵산 벡터, 즉, 본 발명의 펩타이드 신호와 융합된 폴리펩타이드를 인코딩하는 벡터이다. 본 발명의 이 실시예를 가지고, 혹자는 재조합 단백질을 ER 및/또는 GA로 위치하도록 하기 위한 성숙을 위하여 타겟팅 할 수 있고, 동시에 성숙을 위해 ER 및/또는 GA를 설계할 수 있으며, 즉, 재조합 단백질의 번역 후 변형을 할 수 있다. 상기 폴리펩타이드는 상기 정의한 바와 같을 수 있다. 예를 들어, 이는 치료적 활성 단백질일 수 있다.
본 명세서에서 개시한 바와 같이, 본 발명에 따라, 폴리펩타이드의 번역 후 변형은 유리하게 ER 및/또는 GA 구획 막에서 수행된다.
본 발명은 특히 식물 세포에서, 호스트 세포 내에서 설계된 재조합 폴리펩타이드를 생산하는 매우 강력한 도구를 제공하는 가장 우선하는 발명이다.
사용되는 본 발명의 방법이 무엇이든지 간에(제 1 방법 및/또는 제 2 방법), 상기 폴리펩타이드는 저장 단백질과 함께-발현될 수 있다. 이 저장 단백질은 ZERA® 또는 어떤 다른 적합한 단백질에 융합된 단백질을 예로 들 수 있다. 첨부된 도 3 의, (D)줄은 ZERA®-재조합 단백질 융합체의 골지로의 타겟팅을 도식적으로 나타낸다. 예를 들어, 단백질체는 호스트 세포에서의 ZERA®-재조합 단백질 발현에 의해 ER 막으로부터 개시될 수 있다(첨부된 도 5A를 보라). ER에 축적된 재조합 글리코단백질(아래 실시예를 보라)은 독점적으로 높은 만노즈(mannose) 유형 N-글리칸을 가진다. 본 발명은 ER 동종성 및 글리칸 변형의 조합을 유리하게 가능하도록 하는 펩타이드 신호를 제공하는데, 예를 들어 약제학적 글리코단백질의 경우, ER 체류 신호와 융합된 후 ER 내에 저장된다.
본 발명의 방법에 사용되는 벡터를 얻기 위해 이용 가능한 방법은 상기 개시되어 있다.
특히 식물 세포에서, 세포를 트랜스펙팅하거나 형질전환하기 위해 이용 가능한 방법은, 상기 개시되어 있다.
본 발명에 따라, 상기 세포는 바람직하게 식물 세포이고, 예를 들어 상기 정의한 바와 같은, 예를 들어 식물 세포는 메디카고 사티바(Medicago sativa), 아라비도스프시스 탈리아나(Arabidospsis thaliana), 니코티아나 타바쿰(Nicotiana tabacum), 글라이신 맥스(Glycine max), 리코펄시콘 에스컬렌툼(Lycopersicon esculentum), 솔라넘 투버로숨(Solanum tuberosum) 오리자 사티바(Oriza sativa), 지 매이스(Zwa mays), 피스코미트렐라 패텐스(Physcomitrella patens), 렘나 마이너(Lemna minor), 오스트레오코쿠스 타우리(Ostreococcus tauri), 패로닥티룸(Phaelodactylum)을 포함하는 그룹으로부터 선택된 식물로부터 유래된 세포이다.
트랜스펙팅된 세포 또는 그로부터 얻은 식물을 키우고, 번역 후 변형된 폴리펩타이드를 수확하기 위해 이용 가능한 방법은 당업계의 통상의 기술자에게 알려져 있다. 예를 들어, lienard et al., 2006(참조 32)에 개시된 방법은 유리하게 사용될 수 있다.
다른 이점은 첨부된 도면에 의해 설명된 하기 제한되지 않는 실시예로부터 당업계의 통상의 기술자에게 명백할 수 있다.
도 1은 식물 세포의 분비 통로의 도식적인 표현이다. ER과 골지 연속체의 도메인은 다음과 같이 표시된다.
도 2는 식물과 포유동물의 소포체와 골지체 내에서, 단백질 위의 N-링크된 글리칸의 전이 및 처리를 나타낸다. 지질 운반체(carrier) 위에 모인 전구체 올리고당은 초기 폴리펩타이드의 특정 Asn 잔기 위에 전이된다. N-글리칸은 이후 글루코실과 대부분의 만노실(mannosyl) 잔기의 제거로 정리된다. 식물과 포유동물의 복합적인 N-글리칸의 처리 중 차이점은 후반 골지 성숙 과정이다. ER과 골지 도메인은 도 1에 기재된 것처럼 주요 화살표 상으로 나타난다.
도 3은 재조합 단백질(A줄), 항체 또는 그의 부분(ScFv)(B줄), 효소(C줄) 또 는 ZERA®-융합(D줄)의 타겟팅에서 다른 신호(어두운 부분)의 잠재적 응용을 보여준다.
도 4는 분석된 융합 단백질의 도식적인 표현이다.
- GCSI-GFP: GFP에 융합된 아라비도프시스 탈리아나 GCSI의 전체 길이,
- GCS90-GFP: GFP에 융합된 GCSI의 처음 90 N-말단 aa,
- △13GCS90-GFP: GCS90-GFP에서 처음 13 N-말단 aa를 뺀 것,
- ManI-GFP: GFP에 융합된 글라이신 맥스 ManI의 전체 길이,
- △19CTMan-GFP: ManI-GFP에서 처음 19 N-말단 aa를 뺀 것,
- Man99-GFP와 Man49-GFP: 각각 GFP에 융합된 ManI의 처음 99와 49 aa,
- △19CTMan49-GFP: Man49-GFP에서 처음 19 N-말단 aa를 뺀 것,
- △CTMan49-GFP: Man49-GFP에서 전체 CT를 제거한 것,
- MAAAMan49-GFP: Man49-GFP의 CT가 3 Ala 잔기를 포함하는 인공 CT로 대체된 것,
- ManTMD23-GFP와 Man99TMD23-GFP: 각각 ManI-GFP와 Man99-GFP로, TMD가 16에서 23 aa로 연장된 것,
- GNTI-GFP: GFP에 융합된 니코티아나 타바쿰 GNTI의 전체 길이,
- GNT38-GFP: GFP에 융합된 GNTI의 처음 38 N-말단 aa,
- XylT-GFP: GFP에 융합된 아라비도프시스 탈리아나 XylT의 전체 길이,
- XylT35-GFP: GFP에 융합된 XylT의 처음 35 aa,
- ST52-mRFP: mRFP에 융합된 쥐 α-2,6-시알릴트랜스퍼라 제(sialytransferase)의 처음 52 aa,
- GFP-HDEL: 스폴아민(sporamine) 신호 펩타이드와 C-말단 HDEL ER 체류 서열을 포함하는 GFP 버전.
도 5는 토바코(tobacco) BY-2 세포들의 안정한 발현(3-4일) 후에, N-글리칸 처리 수단의 4개의 다른 구성원(α-글루코시다제 Ⅰ, 만노시다제 Ⅰ, N-아세틸글루코사미닐트랜스퍼라제 Ⅰ, β-1,2-자일로실트랜스퍼라제, 도 4) 및 C-말단 HDEL ER 체류 서열에의 GFP 융합체 시리즈가 골지 및/또는 ER 내에 위치된 것을, 공초점 레이저 스캐닝 현미경(confocal laser scanning microscopy)을 사용하여 보여준다.
(A,B) ManI-GFP,
(C) ManI-GFP(단백질 합성 저해제 사이클로헥시미드로 2시간 처리한 후),
(D,E) GFP-HDEL,
(F) ManI-GFP[BFA(50mg/mL)로 2시간 처리한 후],
(G) GCSI-GFP,
(H) GNTI-GFP
(I) XylT-GFP,
모든 바 = 8μm.
도 6은 토바코(tobacco) BY-2 세포들에서의 안정한 발현(3-4일)이나 잎 침투(leaf infiltration)에 의한 토바코(tobacco) 잎 상피 세포에서의 임시 발현(5일) 후에, N-글리칸 처리 수단의 잘려진 구성원들(Man99, Man49, GNT38, XylT35, 도 4)에 융합된 일련의 GFP 융합체가 골지 및/또는 ER 내로 배치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.
(A,B) BY-2 서스펜션(suspension) 배양된 세포에서의 Man99-GFP의 발현,
(C) BY-2 서스펜션(suspension) 배양된 세포에서의 Man99-GFP의 발현(단백질 합성 저해제 사이클로헥시미드로 2시간 처리 후),
(D) BY-2 서스펜션(suspension) 배양된 세포에서의 Man49-GFP의 발현,
(E-F) 니코티아나 잎 상피 세포에서의 각각 Man99-GFP와 Man49-GFP의 발현,
(G) BY-2 서스펜션(suspension) 배양된 세포에서의 GNT39-GFP(G)의 발현
(H) 니코티아나 잎 상피 세포에서의 GNT38-GFP, 및
(I) 니코티아나 잎 상피 세포에서의 XylT35-GFP의 발현.
모든 바 = 8μm.
도 7은 이러한 GFP 융합체 중 하나 또는 다른 것과 ST52-mRFP의 토바코 BY-2 세포들에서의 안정한 공-발현(3-4일) 후에, ManI, Man99, Man49 또는 GNT38(도 4)에 융합된 일련의 GFP 융합체 및 트랜스 골지 마커 ST52-mRFP가 골지 스택(stack)으로 위치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.
(A-C) BY-2 서스펜션-배양된 토바코 세포에서 ManI-GFP (A)와 ST52-mRFP (B)의 공-발현,
(D-F) BY-2 서스펜션-배양된 토바코 세포에서 Man99-GFP (D)와 ST52-mRFP (E)의 공-발현,
(G-I) BY-2 서스펜션-배양된 토바코 세포에서 Man49-GFP (G)와 ST52-mRFP (H)의 공-발현,
(J-L) BY-2 서스펜션-배양된 토바코 세포에서 GNT38-GFP (J)와 ST52-mRFP(K)의 공-발현, 및
(C, F, I 및 L) GFP 융합체 + ST52-mRFP에 대응하는 병합된 발현.
삽입: 선택된 골지 스택의 확대(X2,2)
스택들은 종종 한 쪽의 GFP 융합체(녹색), 다른 쪽의 ST52-RFP(빨강색) 및 그들 사이의 겹쳐진 부분(노란색)이라는 "3개의 색"(F와 I의 화살표)을 나타낸다.
A-I: 바 = 8μm; J-L: 바 = 16μm.
도 8은 식물 N-글리코실레이션 효소의 시토졸(cytosol) 꼬리와 TMD 길이를 비교하여 나타낸다:
(A) 식물 세포의 소포체(ER)과 골지체에서 N-링크된 글리칸의 처리.
(B) 다른 식물 종으로부터 클론된 N-글리칸 처리 효소의 시토졸 꼬리와 트랜스막(transmembrane) 도메인 길이. 접근 번호는 각 도식적 표현의 오른쪽에 나타난다.
각 막 단백질에 대한, 트랜스막 도메인의 위치와 크기는 TmHMM_v2 소프트웨어(http://www.cbsdtu.dk/services/TMHMM/)로 측정되었다.
몇몇 단백질에 대해, TMD의 위치를 정의할 가능성은 50% 미만이다(//).
굵은 선으로 표시된 박스는 공초점 및/또는 전자 현미경을 사용하여 세포 내 배치가 최근까지 연구되어 온 N-글리칸 처리 효소에 대응한다.
GCSI: 글루코시다제 I, α1,2 ManI: α1,2-만노시다제 I, β1,2 GNTI: , β1,2-N-아세틸글루코사미닐트랜스퍼라제 I, α1,3 ManⅡ: α1,3-만노시다제 Ⅱ, β 1,2 GNTⅡ: β1,2-아세틸글루코사미닐트랜스퍼라제 Ⅱ, β1,2 XylosylT: β1,2-자이로실트랜스퍼라제, α1,3 FucT: α1,3-푸코실트랜스퍼라제, α1,4 FucT: α1,4-푸코트랜스퍼라제, α2,6 sialylT: α2,6-시알릴트랜스퍼라제.
도 9는 토바코(tobacco) BY-2 세포들에서의 안정한 발현(3-4일)이나 잎 침투(leaf infiltration)에 의한 토바코(tobacco) 잎 상피 세포에서의 임시 발현(5일) 후에, ManI의 잘려진 형태(△19Man, △19Man49, 도 3) 및 MAAAMan49에 융합된 일련의 GFP 융합체가 골지 및/또는 ER 내에 위치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.
(A) BY-2 서스펜션 배양된 세포에서의 △19Man-GFP의 발현,
(B,C) BY-2 서스펜션 배양된 세포에서의 △19Man49-GFP의 발현,
(D) 잎 상피 세포에서의 △19Man49-GFP의 발현,
(E) 잎 상피 세포에서의 MAAAMan49-GFP의 발현.
A-C: 바 = 16μm, D,E = 8μm
도 10은 이러한 GFP 융합체 중 하나 또는 다른 것 및 ST52-mRFP의 토바코 BY-2 세포들에서 안정한 공-발현(3-4일) 후에, ManTMD23, Man99TMD23, XylT35(도 3)에 융합된 일련의 GFP 융합체 및 트랜스 골지 마커 ST52-mRFP가 골지 구획으로 위치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.
(A-C) BY-2 서스펜션-배양된 토바코 세포에서 ManTMD23-GFP (A)와 ST52-mRFP (B)의 공-발현,
(D-F), (G-I) BY-2 서스펜션-배양된 토바코 세포에서 Man99TMD23-GFP (D,G) 와 ST52-mRFP (E, H)의 공-발현,
(J-L) BY-2 서스펜션-배양된 토바코 세포에서 XylT35-GFP (J)와 ST52-mRFP (K)의 공-발현,
(C, F, I 및 L) GFP 융합 + ST52-mRFP에 대응하는 병합된 발현.
삽입: 확대(X2,2)
모든 바 = 8μm.
도 11은 서스펜션-배양된 BY2 토바코 세포로부터 폴리클로날 항-GFP 항체를 이용한 면역금-라벨링과 커플된 전자 현미경을 사용하여, Man99 및 Man99TMD23에 융합된 GFP 융합체가 골지체 내로 위치된 것을 보여준다.
(A) 야생형 BY2 토바코 세포,
(B) Man99-GFP를 발현한 BY2 세포,
(C) Man99TMD23-GFP를 발현한 BY2 세포,
(D) 두 도메인으로 나눠진 골지를 가진 후 시스-사이드 및 트랜스-사이드 상 금 입자를 계수하여 다른 세포에서 분석된 15개 각각 개별 스택에서 관찰된 라벨의 퍼센트로서 골지 내에서 융합 단백질 분배의 발현.
SV= 분비 소포
도 12는 잎 침투에 의한 잎 상피 세포에서 임시 발현(5일) 후에, N-글리칸 처리 수단(ManI, XylT), 이들의 잘려진 형태(Man99TMD23, Man99,, 도 4) 종류에 융합된 일련의 GFP 융합체가 골지 및 ER 내로 위치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.
(A) 글라이신 맥스 잎 상피 세포에서의 Man99-GFP의 발현,
(B) 글라이신 맥스 잎 상피 세포에서의 Man99TMD23-GFP의 발현,
(C) 리코펄시쿰 에스쿨렌툼 잎 상피 세포에서의 Man99-GFP의 발현,
(D) 리코펄시쿰 에스쿨렌툼 잎 상피 세포에서의 Man99TMD23-GFP의 발현,
모든 바 = 16μm.
도 13은 용해성 ER 마커(GFP-HDEL, A-B), 막 ER 마커(Glu90-GFP, C-D), ER과 초반 골지 마커(△19Man49-GFP, E-F), 중앙 골지 마커(XylT35-GFP, G-H), 또는 후반 골지 마커(Man99TMD23-GFP, ST52-mRFP, I-L)를 발현한 BY-2 세포 내에서 ER 및/또는 골지 단백질에 BFA를 2시간 처리한 효과를, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.
모든 경우에서, ER 네트워크는 종종 작은 구멍이 있는 형광의 시트로 전환된다.
모든 바 = 8μm.
도 14는 ER 및 골지 클러스터 내로 초반 및 후반 골지 마커 양자 모두의 동시 재분배에 대한 BFA(50mg/mL)로 2시간 처리한 것의 효과를, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다:
(A-F) 각각 BFA가 존재하거나 없는 상태에서 BY-2 서스펜션 배양된 토바코 세포에서의 HDEL-GFP (A,B)와 ST52-mRFP (B,E)의 공-발현,
(G,L) 각각 BFA가 존재하거나 없는 상태에서 BY-2 서스펜션 배양된 토바코 세포에서의 △19Man49-GFP (G,J)와 ST52-mRFP (H,K)의 공-발현,
(M-R) 각각 BFA가 존재하거나 없는 상태에서 BY-2 서스펜션 배양된 토바코 세포에서의 Man99TMD23-GFP (M,P)와 ST52-mRFP (N,Q)의 공-발현,
(C,F,I,L,O,R) BFA가 존재하거나 없는 상태에서 GFP 융합 + ST-mRFP에 대응하는 병합 발현.
도 15는 본 연구에서 우리가 사용한 구조물의 도식적인 표현이다: GCSI: GFP에 융합된 전체 길이 아라비도프시스 탈리아나 α-글루코시다제 Ⅰ/ GSC150: GCSI의 처음 150개 아미노산이 GFP에 융합된 것/ GCS90: GCSI의 처음 90개 아미노산이 GFP에 융합된 것/ △13GCS150: GCS 150으로부터 처음 13개 N-말단 아미노산(MTGASRRSARGRI-서열 번호 1)이 제거된 것/ △13GCS90: 처음 13개 N-말단 아미노산이 GCS90으로부터 제거된 것/ Hs10-△13GCS90: 호모 사피엔스(Homo sapiens) GCSI의 처음 10개 N-말단 아미노산(MARGERRRRA- 서열 번호 2)이 △13GCS90의 N-말단에 융합된 것/ XYLT35: 아라비도프시스 탈리아나 β-1,2-자일로실트랜스퍼라제의 처음 35개의 아미노산이 GFP에 융합된 것/ XYLT35-GCS(91-150):GFP에 융합된 GCSI의 루미날(luminal) 도메인의 처음 60개 아미노산(a.a. 91에서 150)에, XYLT의 처음 35개 아미노산이 융합된 것/ XYLT35-GCS(70-150):GFP에 융합된 GCSI의 루미날(luminal) 도메인의 처음 80개 아미노산(a.a. 70에서 150)에, XYLT의 처음 35개 아미노산이 융합된 것/ GCS13-XYLT35: XYLT35에 GCSI의 처음 13개 N-말단 아미노산이 융합된 것/ CNX11-XYLT35: XYLT35의 N-말단에 아라비도프시스 탈리아나 칼넥신(calnexin)(CNX)의 마지막 11개 아미노산(NDRRPQRKRPA-서열 번호 3)이 융합된 것/ ST52-GFP/mRFP: GFP 또는 mRFP에 쥐 α-2,6-시알릴트랜스퍼라제(ST)의 처음 52개 아미노산이 융합된 것/ GFP/mRFP-HDEL: 스폴아민 신호 펩타이드 및 HDEL ER 체류 서열의 제어 하의 GFP 또는 mRFP CT: 시토졸 꼬리; TMD:트랜스막 도메인; CD: 카탈리틱 도메인.
도 16은 GCSI가 ER 내에 완전하게 축적하는 것을 보여준다: 트랜스제닉(transgenic) BY-2 세포 라인은 서브-배양 후 3-4일에 관찰된다. 피질(A,C)과 중앙 옵티칼 단면(B,D)은 GCSI가 ER(A,B)내에 위치한다는 것과 패턴 염색이 GFP-HDEL(C,D)의 그것과 유사하다는 것을 보여준다.
바 = 8μm
도 17은 GCSI 구조물 전체 길이와 같이, N-말단 도메인이 ER에 GSCI를 위치시키기에 충분하다는 것을 보여준다(GCS 150과 GCS 90이 BY-2 세포의 ER에 축적된다)(각각 A, B와 D, E). 그들의 타겟팅은 니코티아나 타바쿰 잎 상피 세포에서 동일하다(각각 C와 F). 바 = 8μm
도 18은 13개 아미노산의 N-말단 서열이 ER 위치 정보를 포함한다는 것을 보여준다. 한편 GCS90은 BY-2 세포 내 ER에 축적되는(A,B) 반면, △13GCS90은 골지에 위치한다(C,D). XYLT35는 골지 단백질인(E,F) 반면, GCS13-XYLT35는 ER과 골지에서 발견된다(G,H).
바 = 8μm
도 19는 Arg 풍부한 ER 서열이 △13GCS90, XYLT35, GCS13-XYLT35, Hs10-GCS90 또는 CNX11-XYT35 단독으로(A,D,G,J,M), 또는 mRFP-HDEL과 함께(B,E,H,K,N), 또는 ST52-mRFP와 함께(C,F,I,L,O) 발현하는 니코티아나 타바쿰 잎 상피 세포계 사 이에서 보존된다는 것을 보여준다. BY-2 세포에서처럼(도 4), △13GCS90(A-C)는 골지에서 독점적인 반면 GCS90은 ER에서 있고 △13GCS90은 완벽하게 ST-mRFP와 함께 공-위치된다(C,F). △13GCS90(A-C)를 XYLT35(D-F)와 비교하는 경우 현미경 사진은 동일하다. GCS13-XYLT35(G)는 mRFP-HDEL과 공-발현될 때, ER은 노란색으로 나타나며 골지는 녹색으로 남아 있는(H) 반면 ST52-mRFP와 함께인 경우 골지는 노란색이고 ER은 녹색인 것은, GCS13-XYLT35가 ER과 골지에 이원적으로 위치된다는 것을 보여준다. 흥미롭게도, GCS90의 처음 13aa.는 인간 GCSI(J-I)의 처음 10 aa.로 대체될 수 있다: Hs10-GCS90 키메릭(chimeric) 단백질은 오직 ER 내에만 있고(J) mRFP-HDEL와 함께 위치되나(K) ST52-mRFP와는 함께 위치되지 않는다(L). 이는 신호가 계 사이에서 보존되는 것을 나타낸다. 동일한 방법으로, CNX11-XYLT35(M)가 mRFP-HDEL과 공-발현되는 경우, ER은 노란색으로 나타나고 골지는 녹색으로 남아 있는(N) 반면 ST52-mRFP와 함께인 경우 골지는 노란색이고 ER은 녹색인 것은, GCS13-XYLT35 역시 ER과 골지에 이원적으로 위치된다는 것을 보여준다.
바 = 8μm
도 20은 GFP 융합체 단독으로(왼쪽 패널), 또는 mRFP-HDEL과 함께(중간 패널) 또는 ST52-mRFP와 함께(오른쪽 패널) 발현되는 니코티아나 타바쿰 잎 상피 세포에서의 N-말단 알기닌이 ER 위치 정보를 포함한다는 것을 보여준다. GCS90(A)는 완벽하게 mRFP-HDEL과 공-위치되나(B, 노란색의 ER) ST52-mRFP와는 공-위치되지 않는다(C, 녹색의 ER, 빨간색의 골지). 6,7,10 및 12 위치의 4개 Arg가 Ala(D-F) 또는 Leu(G-I)으로 치환되는 경우, 전자 현미경 사진 F와 I에서 관찰되는 노란 점으 로 설명되는 것처럼 R/LGCS90 또는 R/AGCS90은 독점적으로 골지에 축적된다. Arg가 쌍으로 돌연변이되는 경우, R/L6-7GCS90(J-L) 또는 R/L10-12GCS90(M-O) 또는 R/L6-L12(P-R)은 ER에 위치되고 ER 용해성 단백질 mRFP-HDEL을 포함하지 않는 작은-점으로 위치되며(K,N,Q) 골지 스택과 근접하게 결합하나(L,O,R) 독립적으로 남아 있다. 이러한 데이터는 N-말단에서의 RR, RXR 또는 RXXR 모티프는 GCS90이 ER로 타겟팅되게 한다는 것을 보여준다.
바 = 8μm
도 21은 R/L6-7이 골지와 근접하게 결합한다는 것을 보여준다. R/L6-7GCS90은 mRFP-HDEL 및 ST52-mRFP와 공-발현되고, 형광 구조가 노란색으로 나타난다는 것은 그들이 골지와 매우 가까이 결합한다는 것을 보여준다.
바 = 8μm
도 22는 Sar1p-mRFP와 GFP-융합체(패널 B,E 및 K) 또는 Sar1p-GTP-mRFP(패널 H와 N)을 발현하는 니코티아나 타바쿰 잎 상피 세포를 보여준다. Arg가 쌍으로 변이되는 경우, R/L6-7GCS90(A-C) 또는 GCS90(D-I)는 변이되거나 변이되지 않은 Sar1p와 공-발현되고, 라벨링 변형은 GFP-융합체에서 관찰되지 않는다. 반대로, Sar1p와의 공-발현이 R/LGCS90의 패턴을 변형하지 않는 반면, Sar1p-GTP(M-O)와 R/LGCS90의 공-발현은 ER에 R/LGCS90의 이동을 막는다.
바 = 8μm
도 23은 N-말단 알기닌 모티프가 AtGCSI의 ER 체류의 주요 결정요소가 아니라는 것을 보여준다. ER은 임시 GCS150-GFP(A), GCS90-GFP(B), 및 △13GCS150- GFP(C) 형질전환된 니코티아나 타바쿰 잎 상피 세포, 피질 단면에서 시각화된다. △13GCS150-GFP의 ER 위치는 피층 단면에서 mRFP-HDEL(E)와 ST52-mRFP(G)의 공-발현으로 확인된다. 본 유형 Ⅱ 막 단백질의 처음 13 aa는 디-알기닌 모티프임에도 불구하고 GCS150-GFP ER 타겟팅과 연관되지 않은 것처럼 보인다. (D) (F) (H)골지는 피층 단면에서 임시 △13GCS90-GFP 형질전환된 니코티아나 타바쿰 잎 상피 세포(D)에서, mRFP-HDEL를 공발현하는(F) 또는 ST52-mRFP를 공발현하는 것에서(H) 시각화된다. ER로 타겟팅 함에 있어 GCS150-GFP와 반대로 GCS90-GFP의 경우 처음 13 aa가 필수적이다. 루미날 도메인 옆의 아미노산은 ER 타겟팅 정보를 포함할 수 있다. 바:8μm
도 24는 루미날 타겟팅을 결정인자는 ER 내에 XYLT35를 보유하는 것에 충분하다는 것을 보여준다.
(A) 골지는 임시 XYLT35-GFP 형질전환된 니코티아나 타바쿰 잎 상피 세포, 피층 단면에서 시각화된다.
(B) (C) ER과 골지는 임시적으로 ST520mRFP과 XYLT35-GCS60(B) XYLT35-GCS80(C)을 공-발현하는 니코티아나 타바쿰 잎 상피 세포, 피층 단면에서 시각화된다. AtGCSI의 루미날 도메인은 ER에서 XYLT35의 대다수를 재위치하게 한다.
바=8μm
도 25는 BY-2 세포 내 GFP 융합체의 공초점 현미경을 사용한 위치 분석을 보여준다; 피층의 (A) 또는 횡단면의 (B) 보기. 우리 그룹에서 최근 확인된 신호는 GFP에 융합되었고 재조합 단백질의 위치는 BY-2 토바코 세포 내 안정한 발현 후에 분석되었다. GFP와 신호 1, 2, 3 또는 4 간의 융합체는 GFP-HDEL 융합체와 같이 ER을 가장 밝게 했다(패널 A-F). GFP와 신호 5, 6, 7, 8, 또는 9 사이의 융합체는 ManI-GFP 대조군처럼, ER뿐만 아니라 골지 클러스터로 융화한 집합체를 밝게 했다(패널 G-L). GFP와 신호 11-12 사이의 융합체는, XylT35-GFP와 D13Glu90-GFP 대조군처럼, 오직 골지 클러스터로 융합하는 집합체만 밝게 했다(패널 M-O). 마지막으로, GFP와 신호 사이의 융합체는 골지 클러스터로 융합하는 집합체뿐만 아니라 리소조말 구획도 밝게 했다(패널 R).
도 26은 디-알기닌 모티프를 포함하는 재조합 단백질의 위치를 보여준다. 하나 또는 두 개의 디-알기닌 모티프를 포함하는 재조합 단백질은 mRFP-HDEL ER 마커와 함께 공-위치되는(A-C; G-R) 반면 알기닌의 변이는 재조합 단백질이 ST52-mRFP 골지 마커와 함께 공-위치되는 원인이 된다.
도 27은 유형 Ⅰ 또는 유형 Ⅱ 막 단백질 상 타겟팅 신호의 위치를 보여준다.
도 28은, 막 단백질에 특정하고 본 명세서에서 설명된 타겟팅 서열 중 하나와 융합된 항체 또는 항체 절편이 분비 통로의 다른 구획에서 막 단백질을 타겟팅 하는 능력을 가지는 것을 설명한다. 여기에서 골지에 위치된 GFP가 예시로 사용된다. 플라스미드 구조 및 scFv의 타겟팅 발현에 사용되는 몇몇 플라스미드의 예가 패널 A와 B에 나타난다. 여기(패널C)에서 단독으로 발현된 경우 골지로 위치되는 막 단백질(GFP-골지)이, 서열 번호:33과 융합된 GFP-특정 scFv와 동일한 식물 세포에서 공-발현된 경우 ER-골지 구획으로 재위치된다.
도 29는 이종 효소가, 여기에서는 인간 베타 1,4 갈락토실트랜스퍼라제, 본 명세서에 설명된 타겟팅 신호 중 하나와 융합된 후 식물 분비 통로의 다른 구획만으로 타겟될 수 있다는 것을 설명한다. 예를 들어, 패널 B는 식물 세포에서 서열 번호:8, 33, 36, 또는 38과 인간 β1,4 갈락토실트랜스퍼라제의 융합체의 발현에 사용되는 플라스미드를 설명한다.
도 30은 서열 번호: 36과 본 글리코실트랜스퍼라제 카탈리틱 도메인의 융합 후 인간 베타 1,4-갈락토실트랜스퍼라제의 타겟팅 발현은, 동일한 글리코실트랜스퍼라제가 그것 고유의 인간 타겟팅 서열에 의해 식물 분비 통로에서 타겟되는 경우 얻는 글리코실화 패턴(패널 A)과 비교할 때 본 이종 글리코실트랜스퍼라제의 효율을 매우 높인다는 것(패널 B)을 설명한다.
도 31은 ZERA® 펩타이드에 의해 생산된 단백질체에 글리칸 성숙 효소를 축적하기 위해 제조된 플라스미드 중 하나를 나타낸다. 본 명세서에서 상세화된 상기 플라스미드는 식물 세포에서 ZERA®와 융합된 만노시다제의 발현을 이끈다.
실시예 A: ER 및/또는 GA로 위치하는 단백질(첨부 도면 3A)
실시예 1: 타겟팅 신호의 동정
1. 초반 골지 유형 Ⅱ 막 단백질의 배치
초반 골지 구획에 N-글리칸 처리 효소의 선택적인 체류를 가능하게 하는 메카니즘을 더 잘 이해하기 위해, 4개의 다른 종류의 N-글리칸 처리 수단(a-글루코시 다제 Ⅰ, 만노시다제 Ⅰ, N-아세틸글루코사미닐트랜스퍼라제 Ⅰ 및 b-1,2-자일로실트랜스퍼라제, 첨부 도면 4)에 융합된 일련의 GFP 융합체의 위치가 토바코 BY-2 세포에서 안정한 발현 후에 연구되었다.
GFP 융합 단백질의 발현을 위한 구조물은 Saint-Jore-Dupas et al, 2006(참조 58)에 개시된 것과 같이 제조되었다. 모든 만노시다제 Ⅰ 융합 구조물은, 본래 Nebenfuhr et al.(1999)(참조 43)에 설명된 GFP 융합 전체 길이(여기서는 ManI-GFP)로부터 유래되었다.
먼저, Aatll 제한 사이트를 포함하는 링커가 ManI와 GFP 코딩 지역 사이에 도입되었다. 예상된 줄기(stem) 지역의 끝과 가까운 본래의 Aatll 지역과 조합되어 이는 Man99-GFP를 얻기 위하여 카탈리틱 도메인의 간단한 제거를 가능하게 하였다.
두 번째로, N-말단 지역의 특정 단편을 용이하게 제거하기 위해, 3개의 새로운 제한 사이트가 PCR 돌연변이 생성에 의해 도입되었다: 하나의 Nhrl 사이트가 시작 코돈 뒤에 바로, 다른 하나의 Spel 사이트가 코돈 21과 22에, 그리고 다른 하나의 Aatll 사이트가 코돈 50과 51에 도입되었다. 변형된 구조물의 완전함은 서열분석에 의해 확인되었다. 본 새로운 구조물에서, 세포질 꼬리는 △19CTManIGFP를 주면서 Nhrl과 Spel로 제거될 수 있고, 동시에 Aatll 자르기는 Man49-GFP를 생산하면서 ManI의 전체 루메날 부분을 제거할 것이다. 두 과정의 조합은 △19CTMan9-GFP를 낳는다. 마지막으로, 시작 코돈과 함께 TMD 도메인의 18 aa를 인코딩하는 포워드 (5'-GATCCTTGGGAATGCTTGCTCTGCTCTTCATCGTTTTCGTTTGTGTCTCTTTCGTTTTCTGGGACCGTCAAA-3'(서열 번호 40)) 및 리버스 (5'-CTAGTTTGACGGTCCCAGAAAACGAAAGAGACACAAACGAAAACGATGAAGAGCAGAGCAAGCATTCCCAAG-3'(서열 번호 41)) 올리고뉴클레타이드가 합성되고, 융합되고, 어떠한 시작 코돈도 없이 GFP를 포함하는 pBLTI121 바이너리 벡터(binary vector) 내로 서브클론 되어(Kiefer-Meyer et al., 간행되지 않은 데이터) DCTMan49-GFP를 만든다. 동일한 전략이 포워드 (5'-GATCCTTGGGAATGGCTGCTGCTCTTGCTCTGCTCTTCATCGTTTTCGTTTGTGTCTCTTTCGTTTTCTGGGACCGTCAAA-3'(서열 번호 42))와 리버스 (5'-CTAGTTTGACGGTCCCAGAAAACGAAAGAGACACAAACGAAAACGATGAAGAGCAGAGCAAGAGCAGCAGCCATTCCCAAG-3' 서열 번호 43) 프라이머를 사용하여 MAAMan49-GFP를 생산하기 위해 사용되었다.
세 번째로, 더 긴 TMD 지역이 상기 설명된 변형 ManI의 두-단계 PCR 돌연변이 생성에서 도입되었다. 제 1 단계에서, 상기 TMD를 뒤따르는 Aatll 사이트가 BspEl 사이트로 대체되었다. 제 2 단계에서 긴 PCR 프라이머가 ManTMD23-GFP를 얻기 위해 예상되는 TMD의 마지막 7개 aa를 복제하는데 사용되었다. 마지막으로, 본 구조물의 카탈리틱 도메인은 Man99TMD23-GFP를 만들기 위해 Aatll로 제거되었다.
상기 설명된 모든 클로닝 단계는 pBluescript에서 수행되었다. 완료된 발현 카세트(이중 35S 프로모터와 Nos 터미네이터를 포함)는 이후 pBIN20으로 이동되었다.
ST-mRFP를 인코딩하는 식물 바이너리 벡터를 얻기 위해, GFP는 pVKH18EnST-GFP에서 단량체 RFP(로저 시엔에 의해 제공됨)로 대체되었다(Saint-Jore et al., 2002(참조 56). ST-mRFP 발현은 6x 직렬-반복된 CaMV 35S 프로모터의 조절 하에 있다.
GNTI-GFP, GNT38-GFP는 템플릿(template)으로서 N-아세틸글루코사미닐트랜스퍼라제를 인코딩하는 니코티아나 타마쿰 cDNA를 사용하는 PCR에 의해 증폭되었다(Strasser et al, 1999(참조 60)). 리버스 프라이머 5'-GGTCACTAGTATCTTCATTTCCGAGTTG-3'(서열 번호 44)와 5'-GGTCACTAGTGCGATCTGCATATTCTGACTG-3'(서열 번호 45)가 포워드 5'-AACGTCTAGAATGAGAGGGTACAAGTTTTGC-3'(서열 번호 46) 프라이머와 함께 PCR을 위해 사용되어 GNTI 및 GNTI의 N-말단 38aa 끝을 증폭하고 각각 GNTI-GFP 및 GNT38-GFP를 얻었다. GCSI-GFP를 발현하기 위해 총 cDNA가 Boisson et al, 2001에서 클론된 아라비도스프시스 탈리아나 cDNA를 사용하는 PCR에 의해 증폭되었고, GFP N-말단 끝에서 융합되었으며 pBLAI121에서 서브-클론되었다(Pagny et al., 2003(참조 50)). 이후, GCS90-GFP를 만들기 위해 처음 90aa가 포워드 (5'-CGGGGTACCCCATGACCGGAGCTAGCCGT-3'(서열 번호 48))과 리버스 (5'-GACTAGAAAAGGAGTGATAACCCT-3'(서열 번호 49)) 프라이머와 함께 PCR에 의해 증폭되었고, pBLTI121 바이너리 벡터에 포함된 GFP의 5' 끝에 위치한 Spe I 제한 사이트에서 서브클론 되었다. 동일한 방법으로, D13GCS90-GFP를 만들기 위해 처음 13 aa가 제거된 90 aa가 포워드 (5'-CGGGGTACCCCATGAAATCATCATCATTATCTCCC-3'(서열 번호 49)) 및 상기와 동일한 리버스 프라이머와 함께 PCR에 의해 증폭되었다.
ManI-GFP 융합 구조물 전체 길이의 형광성은 다른 독립적 셀 라인에서 본 구 조물에 대해 앞서 설명한 바와 같이 세포질을 통해 이동한 작은 바디로 공초점 레이저 스캐닝 현미경에 의해 탐지되었다(첨부 도면 5A와 5B)(Nebenfuhr et al., 1999(참조 43)).
더욱이, 실질적인 형광성 신호는 GFP-HDEL 구조물에 의해 염색된 ER 네트워크와 구별할 수 없는, 세포질 전체적인 망상 네트워크에서 관찰되었다(첨부 도면 5D와 5E). ER 라벨링이 재조합 단백질의 과도 발현에 기인하는지 여부를 점검하기 위해, ManI-GFP를 발현하는 BY-2 세포가 단백질 합성 저해제 사이클로헥시미드와 배양되었다. 2시간 동안의 처리 후에, 타겟팅 패턴이 변하지 않은 채로 남아 있었고, 이는 ManI-GFP의 안정된 상태 위치가 골지와 ER이라는 것을 보여준다(첨부 도면 5C와 5B의 비교).
형광성 점이 골지 스택이라는 것을 확인하기 위해, 세포는 브레펠딘 A(brefeldin A)(BFA) 50mg/mL로 2시간 동안 처리되었다. 토바코 잎 상피와 BY-2 서스펜션 배양된 세포에서 발현되고 골지-위치된 GFP 융합 단백질 중 몇몇에 대해 앞서 설명한 것과 같이, 본 BFA 처리는 녹색 점을 사라지게 하고 피층과 도관 경유(transvascular) ER을 더욱 형광성이 되도록 한다(첨부 도면 5F와 첨부 도면 5B 및 5E를 비교)(Saint-Jore et al., 2002(참조 56); Ritzenthaler et al., 2002(참조 54)).
분비 통로에서 ManI의 위치와 다른 식물 N-글루코실화 효소 중 하나의 비교는 ManI 전, ManI 바로 뒤 또는 훨씬 후에 작용하는 N-글리칸 성숙 효소의 서브-세포 위치의 동일한 조건 아래 분석되었다. 연구된 첫 번째 효소는 아라비도프시스의 α-글루코시다제 I(GSCI)이었다. 본 유형 Ⅱ 막 단백질은 초기 글리코단백질에의 부착 후에 즉시 ER에서 올리고당 전구체로부터 첫 번째 당 잔기를 자른다(첨부 도면 2B의 식물 N-글리칸 성숙에 대한 도식적인 표현을 보라). 단백질 전체 길이(Boisson et al., 2001(참조 6))가 GFP에 융합되었고, COS 세포에서 인간 GCSI에서 보여지는 것과 일치하며(Hardt et al., 2003(참조 28)), 융합 단백질은 BY-2 세포 내 ER에 독점적으로 위치된다(첨부 도면 5G).
두 번째 조사된 후보는 니코티아나 타마쿰의 GNTI였다(Strasser et al., 1999(참조 60)). 본 글리코실트랜스퍼라제는 ManI가 a-1,2-만노즈를 제거한 후 바로 N-글리칸 상 첫 번째 N-아세틸글루코사민 잔기를 부가한다(첨부 도면 2B). 단백질 전체 길이는 GFP에 융합되었고 GNTI-GFP는 토바코 BY-2 서스펜션-배양된 세포에서 발현되었다. 흥미롭게도, 융합체의 안정한 상태 위치는 골지와 ER였고(첨부 도면 5H), 이는 ManI-GFP와 매우 유사한 패턴(첨부 도면 5H와 5B의 비교)이었다. 이러한 데이터는 ManI와 GNTI와 같이 골지체에서 매우 초반에 작용하는 것으로 생각되는 N-글리칸 처리 효소가 골지로 타겟팅 되지만, 타바코 BY-2 서스펜션 배양된 세포에서는 ER로도 타겟팅된다는 것을 강하게 암시한다.
마지막으로, 세 번째 후보인 아라비도프시스의 b-1,2-자일로실트랜스퍼라제(XylT)는, 오직 골지에만 위치되고(첨부 도면 5), 본 효소의 N-말단 끝이 골지 스택의 시스터나 중간 작은 부분으로 GFP를 타겟팅하는 것을 설명한 Pagny et al.(2003)(참조 50)의 결과를 확인한다.
단백질 발현 레벨이 우리 융합 단백질의 위치를 변화시킬 수 있는지 여부를 확인하기 위해, 이러한 결과를 융합 단백질을 발현하는 다른 안정하게 독립적인 세포 라인에서 확인하였다. 세포의 이미지화는 항상 우리의 배양 조건 아래 최적의 성장 단계에 상응하는 서브-배양 후 3일째 또는 4일째 날에 수행되었다. ER 라벨링이 융합체의 과도-발현에 기인하지 않는다는 것을 더 확인하기 위하여, 각 융합체에서의 라벨링 패턴은 사이클로헥시미드로 2시간 처리한 후에 변하지 않았다는 것을 증명함으로써 조절되었다.
항-GFP 항체와 ECL 염색으로 나타나는 웨스턴 블랏은 재조합 단백질에 대하여 배경 대비 매우 낮은 신호를 보여주고, 이는 본 연구에서 모든 융합 단백질의 낮은 발현 레벨을 가리킨다(데이터 없음). 기능성 불 포화된 분비 통로와 양립 가능한 융합 단백질 발현 레벨에 대한 추가 증거는 동일한 세포에서 ManI-GFP가 ER과 골지에 모두 위치하는 동안 골지 마커(ST52-mRFP)는 독점적으로 골지에서만 발견되는(첨부 도면 7A-C) 공-발현 실험으로부터 얻을 수 있었다.
모두 함께, 이렇게 주의 깊게 조절된 조건 하에 얻어진 결과는 N-글리코실화 효소가 특정하게 ER(GCSI)로 또는 골지로(XYLT) 독점적으로 타겟팅되는 것을 명백하게 보여주나, 몇몇 효소는 ManI와 GNTI 및 프롤일 4-하이드록실라제(Yuasa et al., 2005(참조 65))와 ERD2(Boevink et al., 1998(참조 5); Saint-Jore et al., 2002(참조 56))와 같은 다른 막 단백질의 경우에서처럼 양 기관 모두에서 이중 안정한 상태 위치를 가진다.
다음 단계에서, 이중의 안정한 상태의 골지/ER 분배를 나타내는 글리코실화 효소 집단의 타겟팅의 원인이 되는 신호를 조사하였다.
2. 루미날 도메인이 ManI와 GNTI의 골지 및 ER 타겟팅에 필수적이지 않다는 것을 나타내는 실험
3가지 식물 글리코실화 효소인 GNTI, XylT 및 아라비도프시스 ManI(첨부 도면 2)의 특정 골지 체류와 관련해서 그들의 특정 타겟팅은 세포질 꼬리, TMD 및 GNTI를 위한 줄기(Essl et al., 1999(참조 16), Dirnberger et al., 2002(참조 15); Pagny et al., 2003(참조 50); Strasser et al., 2006(참조 61))를 포함하는 그들의 N-말단 부분에 포함된 신호에 의해 매개 된다는 것을 가리킨다. 본 실험은 ManI 및 GNTI의 타겟팅에서 루미날 도메인의 역할을 조사한다.
골지 루멘에 위치한 ManI의 부분이 골지 및 ER 막으로의 본 글리코시다제의 타겟팅에 역할을 하는지 여부를 결정하기 위해, ManI의 처음 99 aa(CT+TMD+S) 또는 처음 49 aa(CT+TMD)가 GFP에 융합되었고 해당 키메릭 단백질이 각각 Man99-GFP와 Man49-GFP로 이름붙여졌다(첨부 도면 4). Man99-GFP와 Man49-GFP는 BY-2 서스펜션 배양된 세포에서 안정적으로 발현 또는 잎 침투에 의하여 토바코 잎 상피 세포에서 임시적으로 발현되었다. Man99-GFP와 Man49-GFP 키메릭 단백질 양자 모두는 전체 길이 구조물에 대하여 앞서 관찰된 것과 마찬가지로(첨부 도면 5A와 5B) 모든 발현 시스템에서 골지와 ER에서 관찰된다(각각 첨부 도면 6A, 6B, 6E 및 6D, 6F).
이러한 잘려진 융합체가 토바코 잎에서 임시적으로 발현되는 경우, ER 라벨링은 과도한 발현 레벨이 이미 급격히 감소하는(첨부 도면 6F) 형질전환 5일 후에도 여전히 관찰되었고, 반면에 XylT35는 오직 골지에만 위치되었다는 것에 주목하 는 것이 중요하다(Pagny et al., 2003(참조 50); 첨부 도면 6I). 이는 나아가 ER 내 ManI-융합체가 부분적으로 위치됨이 키메릭 단백질의 과도-발현에 기인하지 않는다는 것을 확인한다. 더욱이, Man99-GFP를 발현하는 BY-2 세포를 단백질 합성 저해제 사이클로헥시미드로 2시간 동안 처리한 경우, ER 라벨링은 전체 길이 융합체에서 관찰되었던 것처럼(첨부 도면 5C와 비교) 사라지지 않았다(첨부 도면 6C).
융합 단백질이 골지 스택 내 위치되는 곳을 더 잘 이해하기 위해, ManI-GFP는, GFP를 단량체 빨강 형광 단백질(mRFP, Cambell et al., 2002(참조 11))로 대체함에 의해 ST52-GFP로부터 유래된 트랜스 골지 마커 ST52-mRFP(Saint-Jore et al., 2002(참조 56); Runions et al., 2006(참조 55)와 공-발현되었다. 두 개의 키메릭 단백질이 BY-2 세포에서 동시적으로 발현되는 경우, ManI-GFP와 반대로, ST52-mRFP는 ER에서 탐지되지 않았고 2개의 형광 신호는 골지체에서 발견되었지만 완벽하게 공-위치하지는 않았다(첨부 도면 7A-C). 이러한 결과는 다음을 설명하는 선행 연구와 일치한다.
1) ManI-GFP 융합체가 BY-2 세포 내 골지의 시스-하프에 위치된다(Nebenfuhr et al., 1999(참조 43)) 및
2) 쥐의 a-2,6-시알릴트랜스퍼라제의 52 아미노-말단 아미노산은 리포터 단백질이 골지 스택의 트랜스-하프로 탁월하게 타겟팅하기에 충분하다(Boevink et al., 1998(참조 5)).
그러므로, 공초점 현미경은 ManI-GFP와 ST52-mRFP가 골지체 내 시스터나의 다른 작은 부분에 축적된다는 것을 설명하기에 충분했다. 마지막으로, Man99-GFP 또는 Man49-GFP가 트랜스-골지 마커인 ST52-mRFP와 공-발현될 때, 두 개의 플루오포어(fluophore)가 단지 부분적으로 겹쳐진다는 것은(각각, 첨부 도면 7D-F 및 7G-I) 잘려진 융합 단백질의 인트라-골지 위치가 ManI-GFP 전체 길이 융합체의 그것과 동일하다는 것을 나타낸다.
CT, TMD 및 줄기를 포함하는, 토바코 GNTI의 처음 77 N-말단 aa는, 본 글리코실트랜스퍼라제의 골지 체류를 유지하기 위해 요구되는 정보를 포함하는 것으로 앞서 설명되었다(Essel et al., 1999(참조 16)). GFP에 융합된 본 폴리펩타이드 도메인은 바람직하게 골지에 위치되나, 키메릭 단백질은 본 명세서에서 전체길이 구조물에 대해 관찰된 것과 같이 ER 내에서도 역시 탐지된다는 것이 보여졌다(첨부 도면 5H). 골지 루멘에 남은 서열이 GNTI의 골지 및 ER 타겟팅에 관련 있는지 여부를 결정하기 위해, 루메날 부분(39 aa)가 제거되었고 본 글리코실트랜스퍼라제의 남은 처음 38N-말단 aa(CT=TMD)은 GFP에 융합되었다(첨부 도면 4). 상기 융합 단백질은 GNT38-GFP로 명명되었고 BY-2 서스펜션 배양된 세포에서 안정하게 발현되거나 토바코 잎 상피 세포에서 임시적으로 발현되었다.
양 발현 시스템에서, GNT38-GFP는 전체 길이 구조물에서 앞서 관찰된 것(GNTI-GFP, 첨부 도면 5H)과 마찬가지로 골지와 ER 내에 위치되었다(첨부 도면 6G와 6H). 더욱이, GNT38-GFP가 ST52-mRFP와 BY-2 세포 내에서 안정하게 공-발현될 때, Man99-GFP와 Man49-GFP에서 이전에 관찰된 것과 마찬가지로, 두 개의 형광 점이 겹쳐졌지만, 몇몇 빨간 형광은 노란색으로부터 구별가능하였고, 이는 ManI에서 앞서 관찰된 것과 마찬가지로 GNT38-GFP가 트랜스-골지 내에 있지 않다는 것을 의 미한다(첨부 도면 7 J-L).
이러한 결과로부터 세포질 꼬리 및 ManI와 GNTI 양자의 TMD가 ER 및 초반 골지 구획 내인 안정한 상태의 위치로 글리코실화 효소를 타겟팅하기에 충분하다는 것이 명백하다. 반대로, 동일한 도메인(CT+TMD)는 BY-2 세포(pagny et al., 2003(참조 50)와 니코티아나 잎 상피 세포(첨부 도면 6I) 양자 모두에서 골지로만 XylT35-GFP를 타겟팅한다.
3. 세포질 꼬리가 분비 통로의 초반 구획 내 ManI의 체류에 필수적이지 않다는 것을 보여 주는 실험.
포유동물 및 이스트 ER 및/또는 골지체 내에 존재하는 많은 막 결합 단백질의 N-말단 세포질 지역은 골지 뒤로부터 ER로의 그들의 복귀(Teasdale과 Jackson, 1996(참조 62); Zerangue et al., 1999(참조 66)) 또는 ER에서부터 골지로의 그들의 배출(Giraudo와 Maccioni, 2003(참조 20))중 하나를 용이하게 하는 신호를 포함한다. 식물에서, 세포질 꼬리의 길이는 다른 글리코시다제와 글리코실트랜스퍼라제 간에 널리 다양할 수 있다(첨부 도면 8). 예를 들어, GCSI와 ManI는 긴 세포질 꼬리를 포함한다(각각 51/29 aa). 이와 비교할 때, GNTI와 XylT의 CT들은 오직 11 aa로만 구성된다.
ManI의 타겟팅 신호를 더욱 정밀하게 정의하고 본 타겟팅에서 본 글리코시다제의 상대적으로 긴 세포질 도메인(29 aa)의 역할을 조사하기 위해, 두 개의 융합 단백질 D19Man-GFP와 D19Man49-GFP가 생성되었다. 후자의 두 단백질에서, 19 아미 노산은 제거되었기에 CT는 XylT와 GNTI의 CT들과 같이, 10 아미노산으로 짧아졌다. 비록 다른 잠재적인 ER-배출 신호가 남아 있지만, 본 자르기는 ER에서 골지로의 이동에 기능을 할 수 있는 잠재적 2염기성 모티프(KxR)을 제거하였다(Giraudo와 Maccioni, 2003(참조 20)). CT의 완전한 제거가 시도되었지만(DCTMan49-GFP, 첨부 도면 4) 토바코 세포에서 본 융합 단백질의 발현을 얻는 것은 불가능하였다. CT의 남은 10 aa에서 타겟팅 결정요소를 찾기 위해, CT 서열은 인공 서열 MAAA로 대체되었다(MAAAMan49-GFP, 첨부 도면 4). 본 인공 서열은 어떠한 알려진 타겟팅 서열도 포함하지 않고 소수성 트랜스막 도메인의 길이에 영향을 주지 않는다.
3가지 구조물, MAAAMan49-GFP, D19Man-GFP 및 D19Man49-GFP는 토바코 세포에서 발현되었다. 두 개의 후자의 라벨된 ER과 골지는(첨부 도면 9A-D) 그들이 유래된 본래 구조물과 같다(각각 첨부 도면 5A, 5B 및 6D, 6F). 더욱이, 인공 MAAA CT를 포함하는 융합 단백질은 동일한 구획 내에 위치하였고(첨부 도면 9E), 이는 N-말단 시토졸 지역이 ManI 타겟팅에 필수적이지 않고 결과적으로 안정된 상태에서 ER 및 골지체 양자에 위치되기에 요구되는 모든 정보는 MAAAMan49-GFP 구조물의 20 aa 내에, 즉 TMD와 C- 말단 측면에 있는 아미노산 내에 포함된다는 것을 나타낸다.
4. 트랜스 막 도메인(TDM) 길이가 ManI의 골지 타겟팅과 서브-구획화에 중요한 역할을 한다는 것을 보여 주는 실험
포유동물 세포에 있어, 유형 Ⅱ 막 단백질이 골지 내에서 어떻게 다른 레벨로 유지되는지를 설명하기 위해 몇몇 모델이 제안되었다.
제 1 모델에 따라, "킨(kin)-인지" 모델(Nilsson et al., 1993b(참조 45)), 상동/이종-올리고머화에 의한 N-글리칸 성숙 효소의 집합은 생성되는 큰 복합체가 분비 소포로의 전달 및 분비 통로에서 계속되는 아래 방향으로의 정방향 이동되는 것을 막을 것이다.
본 유형의 연합에 대하여 첫 번째로 보고된 사례 중 하나는 중앙-골지에 위치되고 포유동물 N-글리칸 성숙에 연속적으로 작용하는 a-만노시다제 Ⅱ, 및 GNTI, 두 개의 글리코실화 효소와 관련된다(Nilsson et al., 1994(참조 46)). 본 모델이 안정한 골지 시스터나의 존재와 소포성 셔틀을 통한 분비 화물의 진행성 흐름을 원래부터 가정하고 있다는 것에 주목해야 할 것이다(Nilsson et al., 1993(참조 45)). 시스터나 진행/성숙 개념에 맞도록, 상기 "킨-인지" 모델은, 올리고머 복합체가 바람직하게 되돌아가는 소포 내로 포장될 수 있게 하기 위해 변형될 필요가 있을 것이다(Fullekrug와 Nilsson, 1998(참조 18)).
제 2 모델, 지질 이중층 모델(Bretscher와 Munro, 1993(참조 10))은 글리칸 성숙 효소의 TMD 길이와 각 기관 막의 지질 이중층 두께 간을 맞추는 것이 위치를 결정한다고 제안하는데, 각 기관은 그것의 특정한 막 지질 구성을 가지고 결과적으로 그것 고유의 두께를 가지기 때문이다(Hartmann과 Benveniste, 1987(참조 29); Lynch, 1993(참조 33); Moreau et al., 1998(참조 36); Morre와 Mollenhauer, 1974(참조 37)).
막 두께 모델에 따르면, 분비 통로에서 N-글리칸 성숙 효소의 분배는 그들의 TMD들의 길이에 기초한다(Betscher과 Munro, 1993(참조 10)). 분비 통로 기관의 막 은 ER에서부터 원형질 막에 이르기까지 두께에서 증가한다. ER과 시스-골지 막의 두께는 단지 4-5 nm인 반면 트랜스-골지, 분비 소포 및 원형질 막의 두께는 8-9.5 nm이다(Grove et al., 1968(참조 26); Morre와 Mollenhauer, 1974(참조 37)). 게다가, TMD 길이와 관련된 타겟팅은 동물 시스템에서 그들의 TMD의 길이를 다양하게 한 후 리포터 단백질의 위치(Munro 1991, 1995a, 1995b(참조 38))를 연구하고 식물 세포에서는 또한 유형 I 단백질에 대해(Brandizzi et al., 2002a(참조 9)) 연구함에 의해 앞서 설명되었다. 이는, 특정 구획의 막이 오직 매칭되는 길이의 소수성 TMD들만을 수용할 수 있다는 것을 함축한다.
비교는, 골지 단백질 TMD의 길이가 원형질 막 단백질의 그것보다 평균 5 aa 짧다는 것을 나타내었다(Masibay et al., 1993(참조 41); Munro, 1995a(참조 48)). 몇 가지 실시예는 본 모델을 뒷받침한다. 쥐 a-2,6-시알릴트랜스퍼라제와 소 b-1,4-갈락토실트랜스퍼라제의 TMD 길이의 증가는 글리코실트랜스퍼라제의 골지 체류를 감소시켰다. 게다가, 17개의 류신으로 만들어진 합성 유형 I TMD는 림포사이트 표면 항원 CD8 세포외 도메인의 골지 체류를 야기하는 반면 23개의 류신 TMD는 세포 표면에서 증가된 양으로 발견되었다(Masibay et al., 1993(참조 41); Munro, 1991(참조 47), 1995(참조 49)). 더욱이, 1-9 소수성 아미노산의 삽입으로 인한 18개의 아미노산의 a-2,6-시알릴트랜스퍼라제 TMD 길이의 점진적인 증가는 또한 유사 a-2,6-시알릴트랜스퍼라제-리소짐 키메라(chimera)의 증가된 세표 표면 발현 결과를 낳고, 원형질 막 단백질 TMD 길이의 감소는 골지 내 그것의 체류를 증가시킨다(Munro, 1995b(참조 49)).
식물 세포에서, TMD 길이와 관련된 내막 시스템을 따른 막 단백질의 서브구획화를 지지하는 예비 데이터는 GFP와 융합된 두 개의 유형 Ⅰ막 단백질에서 TMD들의 길이를 다양하게 하는 것에 의해 얻어졌다(Brandizzi et al., 2002a(참조 9)).
먼저, 23 aa TMD를 포함하는 인간 리소조말 막 단백질 LAMP1은 GFP에 융합되었고 토바코 잎에서 발현되었다. 상기 융합체는 원형질 막에 위치되었다. 그에 반하여, TMD가 20과 17 aa로 줄어드는 경우, GFP 키메라는 각각 골지와 ER 막에 위치되었다. 둘째로, 액포 분류 수용체 BP80의 19 aa 길이 TMD는 GFP를 골지로 타겟팅하는 반면 22 aa로 길어진 TMD는 GFP를 원형질막으로 타겟팅한다.
유형 Ⅱ 막 단백질 ManI의 TMD 길이는 이것이 어떻게 골지 내 서브 구획화에 영향을 주는지를 알기 위해서 조사되었다. 구체적으로, TMD 길이는 본 도메인의 7개 마지막 aa를 두 배로 하여 16에서 23 aa로 증가 되었다. ER과 골지체의 시스-하프 내에 위치되는 16 aa TMD를 포함하는 그들의 동종체와 달리, 23 aa TMD를 가진 키메릭 단백질은 독점적으로 골지로만 위치되고 더욱 정확하게는 골지 스택의 트랜스-하프 내에 위치된다.
본 실시예에서, ManI 타겟팅에 요구되는 정보는 16 aa TMD를 포함하는 20개의 아미노산(aa) 서열 내에 포함된다. TMD의 길이가 초반 식물 분비 통로에서 본 유형 Ⅱ 막 단백질의 타겟팅에 중요한 역할을 하는지 여부를 조사하기 위해서, 두 개의 융합 단백질, ManTMD23-GFP와 Man99TMD23-GFP가 설계 되었고, ManI의 TMD가 그것의 마지막 7개의 aa을 두 배로 함에 의해 16에서부터 23 aa로 늘어났다(첨부 도면 4). ManTMD23-GFP와 Man99TMD23-GFP는 BY-2 서스펜션 배양된 세포와 토바코 잎 상피 세포에서 발현되었다. 양 식물 발현 시스템에서, ManTMD23-GFP와 Man99TMD23-GFP는 밝은 점으로 독점적으로 위치되었고(첨부 도면 10 A, 10B, 10D), 곰팡이 독 브레펠딘 A에 민감하였다(50μg/mL, 2시간, 첨부 도면 11C). ManTMD23-GFP와 Man99TMD23-GFP의 발현 패턴은 XylT-GFP 융합체(첨부 도면 10), 또는 ST52-mRFP 융합체(첨부 도면 10)에 유사하고, 양자는 BY-2 서스펜션 배양된 세포와 토바코 잎 상피 세포 내 골지에 독점적으로 위치되며, 이는 전자 현미경에 의해 이미 확인된 바 있다(Boevink et al., 1998(참조 7); Pagny et al., 2003(참조 63)).
ManTMD23-GFP와 Man99TMD23-GFP의 서브-구획화를 더 조사하기 위해, 이러한 GFP 융합체 중 하나 또는 다른 것과 ST52-mRFP를 공-발현한 안정한 BY-2 서스펜션 배양된 세포가 만들어졌다. 병합된 이미지에서, 빨간 점으로부터 녹색 점을 분리하는 것은 불가능한데, 이는 23 aa TMD를 포함하는 GFP-융합체가 골지 내에서 트랜스-면을 향해 앞으로 이동하였고 그래서 그들이 공초점 레벨에서 ST52-mRFP와 공-위치한다는 것을 나타낸다(첨부 도면 10 비교). 흥미롭게도, 점 패턴은 횡단면과 비교(첨부 도면 10 G-I)했을 때 피층 이미지(첨부 도면 8D-F)에서 유사하였고, 이는 더 긴 TMD를 가진 Man-GFP 융합체와 트랜스-골지 마커 ST52-mRFP가 완벽하게 공-위치된다는 가정을 강화하였다. 반대로, 중앙 골지 마커(XylT35-GFP)와 트랜스 골지 마커(ST52-mRFP)는 병합 이미지에서 완벽하게 겹쳐지지 않는 형광 점 결과를 낳았다(첨부 도면 10 J-L).
폴리클로날 항-GFP 항체를 가진 면역금-라벨링에 커플된 전자 현미경은 우리에게 이러한 융합 단백질의 더욱 정확한 인트라-골지 위치를 결정할 수 있도록 하 였다. 첨부 도면 11에서 기재한 바와 같이, Man99-GFP 융합체는 골지의 시스-쪽에 주로 축적된(첨부 도면 11B) 반면, Man99TMD23-GFP 융합체는 골지의 트랜스-쪽에 주로 위치되었다(첨부 도면 11C).
유사한 결과가 ManI-GFP와 ManTMD23-GFP(데이터는 나타나지 않음)에서도 얻어졌다. 전(pre)-면역 세럼이나 야생형 토바코 BY-2 서스펜션-배양된 세포를 사용한 대조군 실험에서는 비특정 골지 라벨링이 없거나 매우 거의 나타나지 않았다(첨부 도면 11A).
본 결과는 TMD가 전체 길이 단백질 ManI와 동일한 배치를 가져다 주기에 충분한 것을 나타내고, 상기 데이터는 TMD의 길이가 골지 스택과 ER 내에서 본 유형 Ⅱ 막 단백질의 정확한 위치 선정에 중요한 요소라는 것을 나타낸다. 그러므로, 단백질-지질 상호 작용은 분비 시스템 내에서 ManI의 타겟팅에 주요 역할을 하는 것으로 예상된다.
흥미롭게도, 이러한 결과는 또한 식물 분비 시스템에 있어서, 유형 Ⅰ과 유형 Ⅱ 막 단백질의 타겟팅에서 TMD 길이 필요 정도의 차이를 명확하게 지적한다. 실제로 XylT의 23 aa TMD(Dirnberger et al, 2002(참조 15); Pagny et al., 2003(참조 50) 또는 ManI의 22 aa TMD(Strasser et al., 2006(참조 60))는 오직 골지로만 GFP를 타겟한다. 게다가, 본 실시예에서, 연장된 TMD(23 aa)를 가진 ManI 또한 독점적으로 골지에서 탐지되었다. 반대로 유형 Ⅰ 막 단백질의 23 aa TMD와 BP 80의 연장된 22 aa TMD는 원형질 막 내로 GFP를 타겟 한다(Brandizzi et al., 2002a(참조 8)).
막 단백질이 주어진 두께를 가진 막에 머물기 위한 TMD 길이 필요 정도는 단백질의 토폴로지(topology)에 의존할 수 있다(유형 Ⅰ 또는 유형 Ⅱ).
이러한 실험이 ManI 단백질 타겟팅에서 TMD 길이의 역할을 명백하게 나타내는 반면, 다른 실험은 다른 효소들이 적절한 배치를 위해 다른 신호를 필요로 한다는 것을 보여준다. 예를 들어, 골지의 후반부에서 TMD들의 더 길어지는 경향과 모순되게, 23 aa TMD를 가진 XylT35-GFP 융합체(Pagny et al., 2003(참조 50)) 보다는 18 aa TMD를 가진 ST52-GFP 융합체가 트랜스 골지 내 더 아래쪽 부분에서 발견되었다(Boevink et al., 1998(참조 5); Wee et al., 1999(참조 63)).
임시 발현을 위해 사용된 다른 식물 시스템에서 유사한 결과가 얻어졌다. 실제로, Man99-GFP는 콩(첨부 도면 12A)이나 토마토(첨부 도면 12C)의 골지와 ER에 위치된 반면, Man99TMD23-GFP는 양 발현 시스템의 골지에서 거의 독점적으로 발견되었다(첨부 도면 12B 및 12D).
그 TMD가 식물 글리코실화 효소에서 지금까지 가장 짧은 것으로 확인된 것 중 하나이고 ER 내 위치를 유도한다고 GSCI로 본 명세서에서 설명된 상황에조차, 상기 실험은 CT에 포함된 부가적인 정보가 적절한 타겟팅에 필요하다는 것을 보여준다. 그러므로, GCSI상 수행된 가상 실험(in silico) 분석 및 돌연변이 생성 연구는 식물 분비 시스템에서 글리코실화 효소의 구획을 위한 유일한 신호로서 TMD 길이와 일치하지 않는다.
즉, TMD 길이가 ER과 시스-골지 내 ManI 타겟팅에 주요한 역할을 하는 한편, GCSI로 얻은 결과는 ER 또는 골지 막에서 몇몇 막 단백질의 특정 위치는 단백질 지 질(TMD 경유) 및 단백질-단백질(특정 분류 모티프) 상호 작용 모두에 역시 의존할 수 있다는 것을 설명한다. 골지 매트릭스 단백질이나 세포질 조절자와 같은 시토졸 파트너의 확인은, 식물 분비 통로를 따른 N-글리칸 성숙 효소의 구획화를 위한 본 제 2 모델과 관련된 메카니즘을 설명하도록 한다.
골지 내 다른 레벨로 위치하는 효소의 큰 집합은, 골지 스택 내의 모든 시스터나가 곰팡이 독 브레펠딘 A(BFA)로 처리되는 것에 대응해서 ER과 융합될 수 있는지 여부에 대한 질문을 테스트하도록 한다. 실제로 16 또는 23 aa TMD 중 하나를 포함하는 Man-GFP 융합체와 ST52-mRFP는 BFA와 함께 한 2시간 넘는 코스의 실험에서 모두 ER이나 골지 클러스터 내로 다시 이동했다. 이러한 결론은 예전에 공개된 결과와 일치한다(첨부 도면 12)(NebenFuhr et al., 2002(참조 43); Ritzenthaler et al., 2002(참조 54))
결론적으로, 이러한 결과는 모두 TMD 길이가 ER 및 시스-골지 구획으로 ManI를 타겟팅하는데 주요한 역할을 한다는 것과 16에서 23 aa로의 TMD 길이의 증가는 본 유형 Ⅱ 막 단백질을 골지의 트랜스-면을 향해 더 아래쪽으로 재배치하게 한다는 점(첨부 도면 11D)을 가리킨다.
5. 브레펠딘 A(BFA)의 존재 하에서 후반 및 초반 골지 단백질이 ER 내에서 재분배된다는 것을 보여주는 실험.
본 연구 동안 생성된 골지 마커 중 큰 패널을 이용하여, 다른 골지 서브 구획에 위치된 골지 단백질이 BFA 처리 후에 다르게 행동할 가능성이 조사되었다.
ER 용해성 또는 막 마커(GFP-HDEL 또는 Glu90-GFP, 첨부 도면 13A-D), ER/초반 골지 마커(D19Man49-GFP, 첨부 도면 13E-F), 중앙 골지 마커(XylT35-GFP, 첨부 도면 13G-H), 또는 후반 골지 마커(Man99TMD23-GFP 또는 ST52-mRFP, 첨부 도면 13I-L)을 발현하는 세포가 2시간 동안 BFA(50mg/mL)로 처리되었다. BFA 처리 마지막에, 모든 융합 단백질이 밝은 집합체 및 ER(첨부 도면 13E-L)에 축적되었고, 예외적으로 ER 마커는 집합체에서 발견되지 않았다(첨부 도면 13A-D). 모든 마커는 BFA 존재 하에 ER에 재배치되었다.
ST52-mRFP를 가진 ER/초반 골지 또는 후반 골지 단백질을 공발현하는 세포에서, BFA가 ER 및 골지 집합체 내로 양 마커의 재분배를 유도하고(첨부 도면 14), 예외적으로 GFP-HDEL(첨부 도면 14A-F)와 Glu90-GFP(첨부 도면 14D)는 집합체에서 발견되지 않았다. 몇몇 경우, 시간의 미묘한 차이는 있었지만, 사소하지 않아 탐지되었고 인트라-골지 위치와 관련하여 정보성도 없었다. 게다가, 용해성(GFP-HDEL) 또는 막 단백질(Glu90-GFP) 마커 중 어느 하나를 발현한 세포의 BFA 처리 후에 관찰된 형광 패턴에서 어떠한 유의할만한 차이점도 관찰되지 않았다(첨부 도면 14A-D).
6. TMD 길이 모델이 모든 유형 Ⅱ 막 단백질에 적용되지 않는다는 것을 보여주는 실험
TMD 길이만이 식물 분비 시스템에 따른 모든 글리코시다제와 글리코실트랜스퍼라제의 서브구획화를 이끄는 유일한 골지 분류 결정요소가 될 수 있는지 여부를 결정하기 위해, 특성화된 글리코실화 효소의 N-말단 서열이 비교되었다(첨부 도면 14).
본 분석은 단일 식물 시스템에서 TMD 길이 및 막 두께를 관련시키는 더욱 더 적은 숫자의 전자 현미경 데이터뿐만 아니라, 클론되고 단일 종으로부터 기능적으로 특성화된 적은 숫자의 다른 효소들의 서열에 의해 저해되었다. 지금까지 클론된 모든 식물 글리코실화 효소의 N-말단 서열(CT + TMD)의 가상 실험 분석은 골지 스택에서 가장 아래쪽에 위치된 단백질이 더 긴 TMD를 갖는 경향을 명확하게 보여준다(첨부 도면 14). 예를 들어, a-1,3-푸코실트랜스퍼라제 및 a-1,4,-푸코실트랜스퍼라제와 같이 후반 골지에 위치되는 것으로 여겨지는 효소 중 어떤 것도 20 aa보다 짧은 TMD를 갖는 것은 없다는 것을 주목하는 것은 흥미롭다. 이러한 결과는 TMD 길이 예상에 사용되는 MENSAT_V1,8, PHOBIUS 또는 PRED_TMR 프로그램 (http://bioinf.cs.ucl.ac.uk/psipred/psiform.html 및 http://biophysics.biol.uoa.gr/PRED-TMR/input.html)로 확인되었다. 그러나 이 일반적 경향의 예외가 다른 종의 유사한 글리코실화 효소와 비교했을 때 발견될 수 있고, 예를 들어 ManI TMD들은 16 aa(콩) 내지 20 aa(아라비도프시스)의 범위에 있다.
ER 막에서 이의 위치를 설명하기 위한 지질 이중층 모델에 완벽하게 맞을 수 있는 짧은 18 aa TMD에 기초하여, GluI는 본 모델의 일반적 적용 가능성을 검토하기 위해 선택될 수 있다. GluI의 TMD가 ER 내 타겟팅과 체류에 충분한지 여부를 정의하기 위해, 본 글리코시다제의 대부분의 루미날 부분이 삭제되었고(카탈리틱 도 메인 포함) GFP에 그것의 처음 N-말단 90 aa(CT+TMD+S)가 융합되어 융합 단백질 Glu90-GFP를 얻었다(첨부 도면 4). 본 융합이 토바코 세포에서 발현되었을 때, ER은 전체 길이 구조물 Glu-GFP 및 GFP-HDEL 구조물에서 얻어진 것과 매우 유사한 패턴으로 강조된다(첨부 도면 15A 및 15B)(마이크로그래프 14A 및 14B를 4G에 및 4D, 4E 및 12C에 비교).
본 결과는 ER로 GluⅠ 타겟팅 하는 것은 CT, TMD 및/또는 본 잘려진 단백질에 남아 있는 21 루미날 aa 내 위치된 신호에 의존한다는 것을 명백하게 보여준다.
ER 내 GluI의 배치에 요구되는 최소한 단백질 서열을 정의하기 위한 또 다른 시도에서, Glu90-GFP 구조물의 처음 N-말단 13 aa는 D13Glu90-GFP를 얻기 위해 제거되었다(첨부 도면 4). 본 융합이 토바코 서스펜션 배양된 또는 잎 상피 세포에서 발현되었을 때, 키메릭 단백질은 XylT-GFP(첨부 도면 6I 및 9E)와 ST52-GFP(첨부 도면 15F)에서 관찰되는 것과 같이 골지-같은 점에 독점적으로 위치되었다(첨부 도면 15D 및 15E).
결론적으로, GluI의 18 aa 길이 TMD는 ER 막에 글리코시다제를 타겟팅하는데 충분하지 않고 CT의 처음 13 aa에 포함된 부가적인 정보가 분비 시스템에서 본 글리코실화 효소의 정상적인 배치에 필요하다.
본 결과는 TMD 길이 외의 다른 요소가 초반 분비 통로에서 글리코실화 효소의 위치 선정에 영향을 준다는 실험적 증거를 제공한다.
7. 아라비도프시스 탈리아나 GCSI 유형 Ⅱ 막 단백질의 위치
GCSI는 완전히 토바코 소포체 내 축적한다.
아라비도프시스 탈리아나 GCSI는 유형 Ⅱ 막 단백질이고, 51 아미노산 시토졸 꼬리, 약 18 잔기의 트랜스막 도메인 및 루멘을 향해 있는 큰 카탈리틱 도메인으로 구성된다(Boisson et al., 2001(참조 6)). 본 글리코시다제의 위치를 조사하기 위하여 전체 길이 GCSI와 GFP 융합체의 위치가(첨부 도면 15) 토바코 BY-2 세포 내 안정한 발현 후에 연구되었다(첨부 도면 16A 및 16B; 첨부 도면 17A 및 17B). 전체-길이 GCSI-GFP 융합체 구조물의 형광성이 공초점 레이저 스캐닝 현미경에 의해, GFP-HDEL 구조물에 의해 염색된 ER 네트워크로부터 구별될 수 없었던 세포질 전체적인 소포체 네트워크에서 독점적으로 탐지되었다(첨부 도면 16C 및 16D).
본 결과는 초기 글리코단백질에 부착한 후 즉시 ER 내 전구체 올리고당의 처음 당 잔기를 자르는 것과 일치하고, COS 세포들 내 인간 GluI에서 보여지는 것과 일치한다.(Hardt et al., 2003(참조 28)). 더욱이, 용해성(GFP-HDEL) 또는 막 단백질(GCSI-GFP) 마커 중 하나를 발현하는 세포의 형광 패턴에서 관찰되는 것과 유의성 있는 차이가 없다(첨부 도면 16A 내지 D).
8. GCSI의 처음 90개 아미노산은 ER 내 GFP를 보유하기에 충분하다는 것을 보여주는 실험.
ER 내 GCSI의 선택적인 체류를 이끄는 메카니즘을 이해하기 위해서, GCSI 타겟팅에서 루미날 도메인의 역할이 먼저 조사되었다. ER 루멘에 위치된 GCSI 부분이 ER로의 본 글리코시다제의 타겟팅에 역할을 하는지 여부를 결정하기 위해서, GCSI 의 처음 150개 아미노산(aa)(CT+TMD+줄기 81aa) 또는 처음 90 aa(CT+TMD+줄기 21aa)이 GFP에 융합되었고 해당하는 키메릭 단백질이 각각 GCS150과 GCS90으로 명명되었다(첨부 도면 15). GCS 150과 GCS 90은 BY-2 서스펜션 배양된 세포에서 안정하게 발현되거나 토바코 잎 상피 세포에서 아그로-침투(Agro-infiltration)에 의해 임시적으로 발현되었고 양 발현 시스템의 ER에서 양자가 관찰되었으며(각각 첨부 도면 17 A,C,E 및 17 B,D,F), 전체 길이 구조물에서 예전에 관찰된 것과 정확히 같다(첨부 도면 16 A,B). 이러한 잘려진 융합체가 토바코 잎 상피 세포에서 임시적으로 발현되는 경우, ER 라벨링은 전체적인 발현 수준이 이미 급격하기 감소하는 형질전환 후 5일 째에 여전히 관찰되는 반면, 같은 조건에서 분석된 골지 융합체는 골지에서 독점적으로 위치된다(Saint-Jore-Dupas et al., 2006; 데이터는 나타나지 않음)는 것을 아는 것이 중요하다. 본 데이터는 글루코시다제 Ⅰ의 카탈리틱 루미날 도메인이 효소의 ER 배치에 필요하지 않고 GCSI의 처음 90개 아미노산이 ER 내 GFP를 보유하기에 충분하다는 것을 보여준다.
9. 세포질 꼬리가 ER 체류 서열을 포함하는 것을 보여주는 실험
포유 동물 및 이스트 ER에 존재하는 많은 막 단백질의 N-말단 시토졸 지역은 정확한 체류(Nilsson et al., 1994(참조 46); Opat et al., 2000(참조 48); Hardt et al., 2003(참조 28); Ciczora et al., 2005(참조 12), 또는 골지 뒤에서부터 ER까지 그들의 복귀(Teasdale과 Jackson, 1996(참조 62); Zerangue et al., 1999(참조 66))를 용이하게 하는 신호를 포함하는 반면, 몇몇 다른 것들은 ER에서부터 골 지로 배출시키는 것을 촉진한다(Giraudo와 Maccioni, 2003(참조 20)). 식물에서, 오직 일부 연구만이 막 단백질의 CT 내 ER의 배출 서열의 존재를 설명하고(Contreras et al., 2004(참조 13); Yuasa etal., 2005(참조 65); Hanton etal., 2005b(참조 27)) 막 단백질 ER 체류의 원인이 되는 시토졸 모티프의 특성화를 언급한다(Benghezal et al., 2000(참조 4; McCartney et al., 2004(참조 35)).
GCSI N-말단에서 ER 타겟팅 정보를 포함하는 서열을 더욱 정확하게 정의하기 위해서, GCS90의 N-말단 끝에 위치된 처음 13 아미노산을 먼저 제거하였고 상기 결과 생성된 키메릭 단백질을 D13GCS90으로 명명하였다(첨부 도면 15). 본 자르기는, 다른 잠재적 ER-체류 신호(RR 또는 KXK)가 본 융합 단백질의 CT 내에 남아 있음에도 불구하고, ER 체류에 작용할 수 있는 두 개의 잠재적 디-베이직 모티프 RR 또는 RXR을 제거하였다. 병행하여, GCSI의 처음 13 N-말단 아미노산 펩타이드는 이전에 중앙 골지에 위치된 골지 리포터 단백질(XYLT35, 첨부 도면 15)에 융합되었다(Pagny et al., 2003(참조 50)). 상기 실험 조건에서, 본 연구에 사용된, XYLT35는 도 18 G 내지 H에 설명된 것과 같이, BY-2 토바코 세포의 골지체에 독점적으로 축적되는 것이 확인되었다.
두 개의 구조물(D13GCS90과 13GCS-XYLT35) 또한 BY-2 세포에서 안정하게 발현된다. 시토졸 꼬리 중 처음 13개 아미노산의 제거는 골지 마커 XYLT35를 이용하여 관찰된 것(도 18E-F)과 유사하게 GCS90 단백질을 밝은 점 내로 재배치하였다(첨부 도면 18C-D, 도 19A). 게다가, 상기 D13GCS90은 토바코 잎 상피 세포 내 임시적 발현 후에 ER 마커 mRFP-HDEL와 공위치 되지 않았으나(도 19B), ST-mRFP 골지 마커 와 완전하게 공위치되었다(도 19C). 흥미롭게도, XYLT35 골지 마커에의 GCSI의 13 N-말단 아미노산의 융합은 리포터 단백질이 ER 내에 있는 것을 막았다(도 18G-H; 도 19G). GCS13-XYLT35 융합 단백질은 GCS90 구조물과 같이 ER를 라벨하였고(도 18A-D) mRFP-HDEL ER 마커와 공위치되었다(도 19H). 강한 ER 라벨링에 부가하여, GCS13-XYLT35가 토바코 잎 상피 세포에서 발현된 경우 적은 밝은 점이 역시 관찰되었다. 이러한 점은 이동하여 ST-mRFP 골지 마커와 공위치한다(도 19I).
결론적으로, GCSI의 처음 13 아미노산은 ER 내 GCS90 융합 단백질을 보유하게 하는데 필수적이고 ER 내 골지 마커를 재배치하는데 충분하다.
10. 시토졸릭 알기닌-풍부한 서열은 식물에서 ER 체류 신호라는 것을 보여 주는 실험
알기닌 잔기가 AtGCSI의 13 N-말단 아미노산에서 ER 체류에 필수적인지 여부를 더 조사하기 위해, 인간 동족체 AtGCSI의 N-말단 끝에 위치된 알기닌 풍부 도메인이나 유형Ⅰ식물 ER 존재 막 단백질인 아라비도스프시스 탈리아나 칼넥신의 시토졸 C-말단 끝에 위치된 알기닌 풍부 도메인 중 어느 하나의 펩타이드가 변경되었다.
인간 GCSI의 N-말단 끝에 위치된 알기닌-풍부 펩타이드가 식물 세포에서 인지되는 가능성을 조사하기 위해, GCS90의 처음 N-말단 13 아미노산이 인간 GCSI의 처음 N-말단 10개 아미노산에 의해 대체되었다(Hs10-GCS90, 도 15). 토바코 잎 상피 세포에서 임시적으로 발현되는 경우, Hs10-GCS90은 ER에 위치되고 이는 N-말단 시토졸 지역이 완전하게 식물 분비 시스템에 의해 인지된다는 것을 가리킨다(도 17J 내지 L).
두 번째로, 유형 Ⅰ 막 단백질에 의해 수행되는 유사한 알기닌-풍부 모티프가 ER 내 유형 Ⅱ 단백질의 타겟팅을 매개할 수 있는지 여부를 조사하기 위해, 아라비도스프시스 탈리아나 칼넥신의 C-말단 끝에 위치한 마지막 11개 아미노산이 골지 마커 XYLT35의 N-말단 끝에 융합되었다(CNX11-XYLT35, 도 15, 표 1). CNX11-XYLT35는 토바코 잎 상피 세포에서 임시적으로 발현되었다. 도 19M 내지 O에서 설명한 바와 같이, 유형 Ⅰ 막 단백질의 알기닌 풍부한 C-말단 펩타이드는 ER 내 유형 Ⅱ XYLT 35 골지 마커를 보유하기에 충분하다(도 19M 내지 N). 동일한 골지 라벨링(도 19 O)이 GCS13-XYLT35 융합체에서(도 19 I)와 같이 또한 탐지된다.
11. GCSI 시토졸 꼬리의 알기닌 잔기가 ER 위치 정보를 포함한다는 것을 보여주는 실험.
GCSI의 13개 처음 아미노산 내에서 4개의 알기닌 잔기의 역할을 보다 정확하게 정의하기 위해서, 이러한 잔기를 PCR 위치 지정(site-directed)된 돌연변이 생성(상세한 구조는 표 1을 보라)을 사용하여 류신이나 알라닌 잔기 중 하나로 대체하였고 상기 결과 융합 단백질이 토바코 세포에서 발현되었다.
GCS90이 ER에 독점적으로 위치되고 완전하게 ER 마커 mRFP-HDEL과 공-위치되지만(도 20 A,B), 골지 마커 ST-52-mRFP와는 그렇지 않은(도 20 C) 반면, Arg-6, Arg-7, Arg-10 및 Arg-12가 알라닌 잔기로 대체하는 경우, R/LGCS90은 독점적으로 밝은 점을 강조 했다(도 20 D). 이러한 점은 골지 마커 ST-mRFP와 공위치되는 것으로부터 설명된 것처럼 골지체에 대응한다(도 20F). 어떠한 ER 라벨링도 탐지되지 않았다(도 20 E). 서브-세포 위치에 대한 동일한 효과가 4개의 류신 잔기에 의한 4개의 알기닌 잔기의 치환 후에 관찰되었다(도 20 G-I). 이러한 관찰은 N-말단의 6-7-10 및 12 위치에 위치된 4개의 알기닌이 GCS90의 ER 존재의 원인이 되는 구조적 정보를 인코딩할 수 있다는 것을 가리킨다.
두 번째 단계로, (RR)과 (RXR)이 두 개의 독립적인 신호로 작용하는지 여부를 정의하기 위해, Arg-6와 Arg-7 또는 Arg-10과 Arg-12가 류신 잔기로 치환되었다. RR 모티프(구조물 R/L10 -12GCS90의 Arg-6과 Arg-7) 또는 RXR 모티프(구조물 R/L6 -7GCS90의 Arg-10과 Arg-12) 중 어느 하나의 존재뿐만 아니라 RXXR 모티프(구조물 R/L6-12GCS90의 Arg-7과 Arg-10)의 존재도 융합 단백질의 ER 체류에 충분하였다(도 20J 내지 L 및 M 내지 O). 그러나, ER 라벨링에 덧붙여 이러한 3 가지 경우에서, 골지 스택과 구별되는 형광 점이 관찰되었다(도 20 L 및 20 O).
12. RR, RXR 또는 RXXR 모티프를 가지는 융합 단백질이 ER 및 골지와 관련된 형광 점에 축적된다는 것을 보여 주는 실험
다음 단계는 R/L6 -7GCS90, R/L10 -12GCS90, 및 R/L6 -12GCS90 키메릭 융합 단백질에 의하여 형광 점으로 라벨된 구조를 확인하기 위한 것이었다. R/L6 -7GCS90 단백질에서 설명한 바와 같이, GFP 형광은 ER 및 골지 스택보다 더 작은 형광성 구조에 축적되었다(도 20 J 내지 L 및 도 21 A 내지 B).세포에서 이러한 구조의 위치를 더 정확하게 정의하기 위해, mRFP-HDEL ER 마커, ST52-mRFP 골지 마커 및 R/L6 -7GCS90, R/L10-12GCS90, 또는 R/L6 -12GCS90 융합 단백질 중 하나가 동시에 발현되었다.
상기 결과는 도 21A-B에서 설명되고 작은 형광 점이 골지 스택과 가까이 관련되지만 구별된다는 것을 보여준다. 하나의 골지체와 하나의 점의 연관에 의해 형성된 단위는 ER을 따라 함께 이동하고 그들은 분리되지 않는다.
이러한 결과를 고려할 때, R/L6 -7GCS90, R/L10 -12GCS90, 및 R/L6 -12GCS90 융합 단백질은 ER과 골지 사이에 위치한 작은 중간 도메인 내 ER에 축적되었고, 그로부터 ER 존재 용해성 단백질로부터 차단되었다(도 20K 및 20N). 이러한 도메인은 골지와 강하게 연관되어 있고 ER 피층 네트워크를 따라 골지 스택과 함께 이동하며, 그래서 이러한 도메인은 Yang et al., 2005에 설명된 ER-출구-사이트(ERES)가 될 수 있다. 입증하기 위해 본 R/L6 -7GCS90, R/L10 -12GCS90, 및 R/L6 -12GCS90 융합 단백질가 토바코 잎 상피 세포에서 Sar1p-mRFP와 공-발현되었다.
불행하게도, 형광 점에서 Sar1p-mRFP의 보충은 보이지 않았다(도 22 A 내지C). 그럼에도 불구하고, Sar1p는 GCS90의 돌연변이된 형태의 이동과 관련되는 것으로 보여진다. 실제로, 도 22 J 내지 L에 설명된 것처럼, R/LGCS90은 Sar1p/GTP-mRFP와 공-발현되었고, Sar1p는 ER 및 형광점에 축적되었다(도 22 K).
반대로, 단독 발현된 Sar1p-mRFP가 ER 내에 있는 것처럼(데이터는 나타나지 않음) GCS90은 Sar1p-mRFP를 보충하지 않았고 Sar1p-RFP와 GCS의 공-발현은 GCS 라벨링을 변형하지 않았다(도 22D 내지 I). 더욱이, 돌연변이된 형태 Sar1p/GTP-mRFP의 발현은 ER 내 골지 R/LGCS90의 체류를 이끌었다.
결론적으로, R/LGCS90의 이동은 시토졸 단백질 Sar1p에 의해 조절된다. 그러나, 비록 그들이 ER과 골지 구획 사이에 위치되지만, 하나의 RR, RXR 또는 RXXR 모티프를 가지는 융합 단백질로 라벨된 작은 도메인은 Sar1p-mRFP와 연관되지 않는다.
13. AtGCSI의 ER 체류는 N-말단 알기닌 모티프에만 의존하지 않는다는 것을 보여 주는 실험
본 실시예에서 골지 리포터 단백질에 융합된 GCSI 알기닌-모티프는 ER로 그것을 위치시킨다. 그러나, 이러한 신호가 전체 길이 GCSI의 ER 위치와 관련 있는 주요 체류 신호라는 증거는 없다.
류신 또는 알라닌에 의해 Arg-6, Arg-7, Arg-10 및 Arg-12의 치환이 GCS90 구조물에 대한 ER-배치 정보의 방해를 야기한다는 관찰에 기초하여, 야생형 효소(D13GCSI, 도 15)의 ER 타겟팅에서 상기 모티프(RXR과 RR)의 중요성을 평가하기 위하여 N-말단 13 aa는 GCSI의 전체-길이 서열로부터 제거되었다. 게다가, GCS150 잘려진 형태가 N-말단 끝에 아미노산 잔기 1-13이 부족하게 합성되었다(D13GCS150. 도 15). 융합 단백질은 이후 잎 상피 세포에서 임시적으로 발현되었다. 골지체에 축적된 D13GCS90과 달리, D13GCSI과 D13GCS150 양자는 ER에 독점적으로 위치되었다(도 23 D-E). 게다가, 키메릭 단백질이 토바코 세포에서 ER-마커(mRFP-HDEL)와 동시에 발현되는 경우, GCS90과 달리, D13GCSI와 D13GCS150 양자는 골지에서 탐지되지 않고 양 형광 신호는 ER에서 관찰되었으며, 완벽하게 m-RFP-HDEL과 공-위치된다(도 23 G-L). 이러한 결과는 인간 GCSI가 전체 길이 효소를 배치하는데 필요하지 않은 기능성 알기닌-기초 신호를 포함한다는 것을 설명하는 Hardt et al.,(2003)(참조 28)의 예전 연구와 일치한다. GCS90(도 23F, 23I 및 23L), GCSI(도 23D, 23G 및 23J) 및 GCS150(도 23E, 23H 및 23K) 사이에서 관찰된 라벨링의 차이는 ER 위치를 결정하는 주요 정보는 GCSI의 루미날 폴리펩타이드 사슬에, 더욱 가능성 있게는 줄기 도메인에, 아미노산 잔기 70-150 사이에 포함될 것이라는 것을 나타냈다.
본 가정을 증명하기 위해, 81개의 아미노산 잔기 70-150 또는 61개의 아미노산 90-150이 중앙 골지 마커 XYLT35의 루미날 도메인에 융합되었고(도 24 A) 토바코 잎 상피 세포에서 이러한 새 단백질(XYLT35-GCS81과 XYLT35-GCS60, 도 24 B,C)을 임시적으로 발현되었다. GFP 라벨링의 대부분은 ER에서 발견되었고, "잔여물"이 골지에 있었다.
포유 동물 세포에서 ER 배치는, 그들의 트랜스막 및/또는 루메날 도메인을 경유하여 큰 올리고머 복합체를 만드는 단백질 서브단위의 연관과 관계된 직접적 체류에 의해 달성될 수 있다는 것이 보여졌고, 이는 골지 위치된 막 단백질에 대한 킨-인지 모델에서 예전에 설명된 바 있다(Nilsson et al., 1994(참조 46); Opat et al., 2000(참조 48)). 이러한 큰 단백질 올리고머는 이동 소포 내로 포장되고 그 결과 상기 기관으로부터 배출되는 것을 막는 것을 벗어난다고 가정되었다. 본 유형의 메카니즘은 헤테로-올리고머 올리고당트랜스퍼라제 복합체의 서브 단위 구성요소의 ER 체류에 기능할 수 있으나 아직 식물에서는 기재되지 않았다.
결론적으로, 시토졸 꼬리와 AtGCSI의 루미날 도메인 양자는 ER 타겟팅 결정 요소를 포함하고 상기 결정요소는 그것의 특이성과 일치하고 다른 진핵 시스템에서 이루어진 관찰과 완전하게 일치하며, 상기 결과들은 AtGCSI가 식물 ER 및 본 구획에 독점적으로 위치된다는 것을 나타낸다. N-아세틸글루코사미닐트랜스퍼라제 Ⅰ(GNTⅠ)과 a1,2 만노시다제(ManⅠ)와 같은 식물 N-글리칸 성숙에 초기 작용하는 다른 글리코실화 효소는 ER 및 시스-골지 모두에 위치되는 것으로 보여졌다. GNTI와 ManI, ER과 시스-골지는 시토졸 꼬리에 존재하는 타겟팅 정보를 포함하는 것으로 보여진 반면, GCSI 시토졸 꼬리의 처음 13 N-말단 아미노산은 ER 타겟팅 정보를 포함하는 것으로 보여진다. 본 실시예는 무엇이 ER 타겟팅과 관련된 시토졸 꼬리의 주요 아미노산인지 보여주고 또한 알기닌-풍부한 시토졸 꼬리가 전체 단백질 서열에서 유일한 ER 타겟팅 결정요소가 아니라는 것도 나타낸다.
실제로, GCS150으로부터 알기닌-풍부한 서열의 제거는 골지와 같이 더 후반 구획으로 ER의 배출을 허용하지 않고 D13GCS90은 여전히 ER에 독점적으로 위치된다.
이러한 결과들은 모두, 적어도 2개의 도메인은 골지 유형 Ⅱ 막 단백질이 ER 체류를 하게 하는데 충분하고 GCSI 서열에 공존하는 것을 가리킨다. GCSI의 루미날 도메인의 제거는 ER 체류를 위한 정보가 GCSI 서열에서 아미노산 90과 150 사이에 위치된 60개 아미노산 펩타이드에 포함된다는 것을 가리킨다.
루미날 ER 타겟팅 신호의 존재와 관련되어 인간 글루코시다제 Ⅰ에서 동등한 결과가 얻어졌으나, 현재까지 관련된 루미날 서열은 아직 특성화되지 않았다(Hardt et al., 2003(참조 28)). 상기 언급한 바와 같이, 골지 리포터 단백질 XYLT35와 연관될 때, 식물 루미날 펩타이드는 ER로 XYLT35를 재배치하는데 충분하다. GCSI의 루미날 도메인은 AtGCSI와 용해성 및/또는 막 결합 ER 존재 단백질 사이에 복합체 형성을 용이하게 할 수 있었다. 그러나, 킨-인지 모델과 모순되게, 몇몇 큰 단백질 복합체는 원형질막에 위치되고 ER 밖으로 이동되기 위해서 완전하게 모여져야만 한다는 것이 보여졌다.
사실, 이러한 복합체의 크기를 고려하는 것은 체류를 설명하는데 필요하지 않은 것처럼 보인다. 실제로, ER 루멘 내 단백질의 매우 높은 농도 때문에, 아마도 단백질-단백질 복합체를 형성하는 능력을 가지는 단백질에 대하여 안에 머무는 것보다 ER를 떠나는 것이 더 어려울 것이다. BiP와 관련된 다른 ER 샤페론(chaperon) 시스템에서 예전에 설명된 바와 같이, 우리는 초기 글리코단백질의 폴딩 수단이 식물 ER 내 GCSⅠ, 글루코시다제 Ⅱ, 칼넥신, 칼레티쿨린(calreticulin) 및 ERp57로 이루어진 큰 복합 단백질 복합체를 형성할 수 있는지 여부를 현재 조사하고 있다.
14. GCSI의 시토졸 꼬리는 ER 체류에 독립적으로 충분한 3개의 디-알기닌 신호를 포함한다
알기닌-풍부한 서열(MTAGASRRSARGRI(서열 번호 1)은 ER 내 골지 마커 XYLT35를 타겟하기에 충분하다는 것이 보여졌다. 포유 동물 세포의 분비 통로에서 막 단백질 타겟팅에 대한 예전 연구에 기초하여, 본 실시예는 4개의 알기닌 잔기가 ER 체류 정보를 포함하는지 여부를 확인하기 위해 만들어졌다. 알라닌 또는 류신 잔기로 4개의 알기닌을 돌연변이한 것은, L/GGCS90이 골지에서 발견되는 것과 같이, 본 서열의 ER 체류 능력을 완전하게 없앴고, 그 결과 ER 체류에 있어서 알기닌 잔기의 중요한 역할을 확인하였다.
본 알기닌-풍부한 서열의 지정된 돌연변이 생성에 기초한 또 다른 분석은, 사실 두 개의 알기닌 잔기가(RR, RXR, 또는 RXXR 서열 번호 70) GCS90이 ER 체류를 하도록 하기 충분하고, 결과적으로 GCSI의 시토졸 꼬리에 공존하는 ER 체류에 충분한 13 aa 펩타이드가 3개의 구별되는 디-알기닌 모티프를 포함한다는 것을 보여주었다. 흥미롭게도, 이러한 3개의 디-알기닌 모티프 중 오직 하나만이 GCS90의 시토졸 꼬리에 존재하는 경우, 형광이 ER에서 뿐만 아니라 골지 스택과 연관되고 ER 트랙을 따라 골지 스택과 함께 이동하는 작은 점에서도 탐지된다.
게다가, 용해성 ER 마커 단백질 GFP-HDEL은 이러한 작은 점으로부터 구분된다. 상기 가정은 R/L6 -7GCS90, R/L6 -12GCS90 및 R/L10 -12GCS90이 탐지되는 이러한 작은 점이 ER 표면에 위치되고 ER과 골지체 사이의 물질 교환을 중개하는 분비 단위(ERES)와 대응한다는 것이다(Runion et al., 2006(참조 55)). 본 가정을 증명하는 또 다른 조사는 골지체에 연결되고 ER 표면에서 골지체와 이동하는 단일 분비 단위에 기초한 ER/골지 이동 모델을 지지할 것이다. 그러나, 미니-점들은 Sar1p와 공위치하지 않는다, 디-알기닌 모티프는 포유동물 막 단백질에서 광범위하게 연구되어 왔으나 그들의 식물 상동체에서는 본 연구 전에 특성화 되어지지 않았다. 흥미롭게도 예전에 인간 GCSI에서 확인된 디-알기닌 모티프는 식물 세포에서 ER 체류를 중개하는 것으로 나타났다(Hardt et al., 2003(참조 28)).
그러나 AtGCSI에서 확인된 디-알기닌 모티프는 그들의 인간 상동체보다 더욱 유연해 보인다. 실제로 인간 글루코시다제 Ⅰ의 디-알기닌 모티프는 위치 +7과 +8에 존재하는 두 개의 알기닌 잔기 및 위치 +9의 염기성 아미노산으로 이루어져 있다. AtGCSI에서 두 알기닌 사이의 거리는 더욱 유연해 보이나 우수한 효과를 위해 두 아미노산을 초과할 수 없다. 더욱이 본 모티프는 단백질의 N-말단 끝에 가까이 근접해야만 한다. 실제로, GCSI에서 위치 +23과 +24의 디-알기닌 모티프 RR은 융합 단백질 D13GCS90-GFP에 여전히 존재하나 ER 체류를 허여하기에는 충분하지 않다.
마지막으로 이용 가능한 GCSI 서열의 비교는 이러한 ER 존재 단백질의 말단 끝에서 디-알기닌 모티프가 높게 유지된다는 것을 보여 준다(표 2, Boisson et al., 2001(참조 6); Hong et al., 2004(참조 30)).
실시예 2: 서열 확인에 대한 설명
앞선 실시예에서 본 것처럼, 표 3에 목록화된 각 신호는 녹색 형광 단백질과 같은 리포터 단백질을 ER 및/또는 골지체로 타겟하는데 충분하다(첨부 도면 25A와 25B를 보라).
위치= 신호와 융합되었을 때 리포터 단백질의 위치(cf 첨부 도면 1)
앞서 개시한 것처럼, 서열 번호 1 내지 3은 ER로의 막 단백질 타겟팅을 위한 앵커(anchor)서열 세트를 나타낸다. 이러한 서열은 C- 또는 N-말단 끝에 위치된 막 단백질의 시토졸 꼬리에 위치된다.
서열 번호 1: MTAGASRRSARGRI
서열 번호 2: MARGERRRRA
서열 번호 3: MNDRRPQRKRPA
이러한 시토졸 꼬리에 존재하는 하기 디-알기닌 모티프(들) 서열은(서열 번호 1 내지 3) ER 내에 리포터 막 단백질을 보유시키기에 충분하다고 보여졌다:
모티프 서열:
서열 번호 | 서열 번호 | 서열 번호 | |||
RR | RRXXRXR | 76 | RRRK | 88 | |
RXR | RKXXRXR | 77 | RRKK | 89 | |
RXXR | 70 | RRXXRXK | 78 | RKKR | 90 |
RXXXR | 71 | RRXXKXR | 79 | KKRR | 91 |
RK | KRXXRXR | 80 | |||
RKX | KKXXRXR | 81 | |||
RXXK | 72 | RRXXKXK | 82 | ||
RXXXK | 73 | RKXXKXR | 83 | ||
KR | RKXXRXK | 84 | |||
KXR | RRRR | 85 | |||
KXXR | 74 | RKRR | 86 | ||
KXXXR | 75 | RRKR | 87 |
도 25에서 설명한 것처럼, 이러한 디-알기닌 모티프는 각각 유형 Ⅱ 또는 유형 Ⅰ 막 단백질의 N- 또는 C-말단 부분에 위치될 수 있다.
다른 하기 서열은 다음에 따라 테스트되었다:
서열 번호 4 내지 7은 ER 내 재조합 막 폴리펩타이드의 완전한 체류의 이유가 된다. 이러한 서열은 ER 루멘에 위치된다.
서열 번호 4:
FQGEHKESLYWGTYRPHVYFGVRARTPLSLVAGLMWLGVKDEMYVMRHFC
서열 번호 5:
FQGDHKESLYWGTYRPNVYLGIRARTPLSLIAGIMWIGAKNGQYFLRHVC
서열 번호 6:
ESDASLLWGTYRPQIYFGLRPRLPGSLLTGLAWFGLQDYSDFQHIRHQC
서열 번호 7:
ERSNRLFWGTYRPGIYFGMKHRSPISLLFGVMWTVQDAENFAFRHSC
본 발명의 서열 번호 4와 70% 이상의 상동 관계를 가지는 모든 서열은 본 발명의 타겟팅 신호와 동일한 효과를 가지는 것으로 추정된다.
도 26에서, 줄기(S3)에 위치한 서열 번호 4 내지 7은 ER 내 막 단백질의 완전한 체류에 원인이 된다. S3는 트랜스막 도메인 근처에 위치한 서열이다.
ER 내 재조합 폴리펩타이드의 완전한 체류는(도 26을 보라) 서열 번호 8에 설명된 것처럼, 디-알기닌 모티프를 포함하는 서열 번호 1 내지 3 중 하나와 서열 번호 4 내지 7 중 하나의 연결에 의해 행해지고, 막 단백질의 ER 내 완전한 체류 및 재조합 단백질의 안정화의 원인이 된다.
16 내지 23 아미노산의 트랜스막 도메인(GS2)은 골지로 단백질을 보내는데 충분한 것으로 보여졌다. 본 도메인의 사용은 재조합 단백질 또는 골지 막의 효소를 고정하는데 충분하다. 본 발명의 펩타이드 신호에 포함되는 테스트된 트랜스막 도메인(GS2)의 실시예는 다음과 같다:
골지 효소로부터 시토졸 꼬리(GS1), 트랜스막 도메인(GS2) 및 줄기(GS3) 간의 배열은 시스, 중앙 또는 트랜스 골지 내 막 단백질의 체류의 원인이 된다(첨부 도면 26, 아래 도식도를 보라). 본 배열은 골지체 내 효소 또는 재조합 단백질이 서브구획화 되도록 한다, 본 발명에 따른 이러한 펩타이드 신호 서열의 실시예는 다음과 같다:
GS1
서열 번호 17: MARGSRSVGSSSSKWRYCNPSYYLKRPKR
서열 번호 18: MGVFSNLRGPRAGATHDEFPATNGSPSSSSSPSSSIKRK
서열 번호 19: MRGYKFCCDFR
서열 번호 20: MGVFSNLRGPKIGLTHEELPVVANGSTSSSSSPSSFKRK
서열 번호 21: MLVMPQPPKPFN
서열 번호 22: MARGSRSVGSSSSKWRYCNPSYYLKRPKR
서열 번호 23: MANLWKKQRLRDTGLCR
GS3 도메인으로부터 나온 펩타이드 신호의 실시예는 다음과 같다:
이러한 신호는 임시적 또는 안정한 형질전환 후에 토바코, 콩, 토마토 또는 무 세포의 몇몇 막 단백질의 발현을 타겟팅 하는데 사용되었다. 이러한 신호는 막 단백질의 N-말단(유형 Ⅱ 막 단백질) 또는 C-말단 끝(유형 Ⅰ 막 단백질) 중 하나에, 동일한 타겟팅 효율 및 특정성을 가지고 부가될 수 있다(상기 신호는 유형 Ⅲ 또는 Ⅳ 막 단백질에도 역시 부가될 수 있는 것으로 보여진다).
GS1/GS2/GS3 간 배열의 예
실시예 3: 타겟팅 서열을 사용하여 초반 분비 통로 구획 내에 재조합 단백질을 저장함으로써 N-글리칸 상 면역원성 잔기의 부가의 방지.
식물 ER-존재 단백질의 구조적 분석은 그들이 높은-만노즈-유형 N-글리칸을 독점적으로 가진다는 것을 보여준다(Navazio et al., 1997(참조 41); 1998(참조 42); Pagny et al., 2000(참조 49)). 이러한 올리고당 구조는 식물과 포유 동물에 공통적이고 그러므로 면역원성이 아니다. 본 관찰은 식물-제조 약물(PMPs) N-글리칸에 베타 1,2 자일로즈 또는 알파 1,3 푸코즈와 같은 면역원성 잔기의 연결을 막는 전략을 제시한다. 본 전략은 ER 내, 즉, 면역원성 글리코-에피톱(epitope)이 성숙한 식물 N-글리칸에 부가되는 골지 시스터나의 위쪽,에 재조합 단백질을 저장하는 것에 있다. 재조합 용해성 단백질의 C-말단 끝에 H/KDEL 아미노산 서열의 부가는 식물 ER에 그것을 체류하게 하는데 충분하다는 것이 처음 보여졌다(Gomord et al., 1997(참조 24), 1999(참조 22).
본 실시예에서, 동일한 전략을 사용하여, KDEL-ER 신호 서열이 두 개의 다른 항체들의 중쇄 및 경쇄 모두에 융합되었다.
서열 번호 1 내지 8의 서열은 ER로 항체의 중쇄 및 경쇄를 타겟 하는데 사용되었다.
서열 번호 32 내지 36의 서열은 ER과 GA로 항체의 중쇄 및 경쇄를 타겟 하는데 사용되었다.
이러한 항체는 비 면역원성 높은-만노즈-유형 N-글리칸을 독점적으로 나타내고(Sriraman et al., 2004(참조 59); Petrucelli et al., 2006(참조 51)), 이는 a-만노시다제 Ⅰ과 같이, ER 및 시스-골지에 위치된 효소에 제한되는 글리칸 성숙에 기초한 매우 효율적인 재순환을 가리킨다(Nebenfuhr et al., 1999(참조 43)). 그러므로 ER 체류 신호에의 융합을 통해 면역원성 N-글리칸이 PMPs에 연결되는 것을 막는 것이 가능하다.
실시예 B: ER 및/또는 GA 내 항체 또는 항체 절편의 발현(첨부 도면 15, B줄)
ER 및/또는 GA 내 항체 또는 항체 절편의 발현은 재조합 단백질 생산을 향상하기 위한 다른 전략을 제공한다. 예를 들어 이는 비 변형된(변이된) 약제용 단백질을 ER 및/또는 골지체로 타겟하는 것을 이끌 수 있다.
식물에서 기능성 발현 항체의 원 설명 이후 두 개의 주요 연구 지침이 성립되었다. 첫 번째는 약제용 항체 또는 항체 절편의 대-규모 생산을 위하여 바이오-반응기로서 식물을 사용하는 것이다. 두 번째는, 항체 또는 항체 절편이 면역조정(immunomodulation)이라고 명명된 메카니즘에 의해 생리적 과정에 영향을 주기 위해 호스트 세포에서 발현된다. 상기 잠재적 면역 조정은 제초제 특이적인 항체의 발현이 in planta 저항성을 주는 것으로 보여졌을 때 최근 설명되었다(Almquist KC et al., 2004(참조 1)와 첨부 도면 27을 보라).
실시예 C: 식물 세포의 ER 및/또는 GA 내 동종 또는 이종 효소의 발현 및 상기 세포 내 재조합 단백질의 발현:
실시예 1 포유동물 글리코실트랜스퍼라제를 식물 세포의 ER/GA 내로 이동시킴에 의한 식물 세포 내 N-글리코실화의 인간화(첨부 도면 15, C줄).
식물에서, 다른 진핵세포에서처럼, N-글리코실화는 초기 폴리펩타이드 상의 특정 아스파라긴 잔기에 올리고당 전구체(Glc3Man9GlcNAc2)를 번역과 동시에 부가하면서 ER에서 시작한다. 일단 단백질로 전이되면, 분비된 글리코단백질이 분비 통로를 따라 이동되는 동안, 올리고당은 복잡한 N-글리칸을 야기하는 몇몇 성숙을 겪는다. 면역 반응의 야기(triggering)와 같은 그들의 작용자(effector) 기능을 위해 사용되는 항체를 포함하는 많은 약제들은(Wright와 Morrison, 1994(참조 64)), 그들의 생체 내 활성 및 안정성을 위하여 글리코실화가 필요하다. 재조합 항체의 생산을 위해 잠재적 식물이 제공할 수 있는 용도, "인간화"된 비-면역원성 N-글리칸을 얻기 위해서 이러한 식물-특정 성숙을 저해하는 것이 필요하게 되는 이유이다.
식물 N-글리칸을 인간화 하기 위한 매력적인 전략은 식물에서 포유 동물 글리코실트랜스퍼라제를 발현하는 것이고, 이는 식물 골지체에서 N-글리칸 성숙의 내생적 수단을 완성(혹은 함께 경쟁)할 것이다. 이러한 합식(complementation) 전략에 기초하여, 인간 베타(1,4)-갈락토실트랜스퍼라제의 발현은, 식물 세포 골지 내에서, 식물 N-글리칸의 부분적 인간화를 이끌고, 어쩌면, 베타(1,2)-자일로즈와 알파(1,3)-푸코즈의 부가와 경쟁한다.
알팔파나 토바코 식물에서 인간 베타(1,4)-갈락토실트랜스퍼라제의 발현은 식물 N-글리칸의 말단 N-아세틸글루코사민 잔기 상에 갈락토즈 잔기를 이동시킨다. 그러나 오직, 본 인간 갈락토실트랜스퍼라제를 발현하는 토바코나 알팔파 식물에서 생산된 글리코단백질에 의해 수행된 30 내지 40%의 N-글리칸만이, 포유동물 유형의 말단 N-아세틸락토사민 서열을 가진다(Bakker et al., 2001(참조 2)).
인간 베타(1,4)-갈락토실트랜스퍼라제는 골지 타겟팅 신호와 융합되었다.
hGalT와 GNTIhGalT 발현을 위한 플라스미드는 pBLTI121로부터 모였다(Pagny et al., 2003 참조 50). CaMV 35S 프로모터는 HindⅢ-Xbal 사이트에서 알팔파 플라스토시아닌(plastocyanin) 프로모터로 치환되었다. 인간 β(1,4)-갈락토실트랜스퍼라제(hGalT) 유전자(UDP 갈락토즈: β-N-아세틸글루코사미니드: β(1,4)-갈락토실트랜스퍼라제; EC2.4.1.22)는 EcoRI 자르기로 pUC19-hGalT로부터 분리되었다. 크레노우(klenow) 처리 후에, 1.2kb hGalT 절편이 Smal 사이트에서 pBLTI221로 클론되었다. 플래그 태그가 이후 FGalT 포워드 (5'-GACTCTAGAGCGGGAAGATGAGGCTTCGGGAGCCGCTC-3' 서열 번호 92)와 리버스 RGalTFlagStu (5'-AAGGCCTACGCTACTTGTCATCGTCATCTTTGTAGTCGCACGGTGTCCCGAAGTCCAC-3' 서열 번호 93) 프라이머를 사용한 PCR에 의해 코딩 지역의 C-말단 끝에 융합되었다. R622는 이후 플라스토(Plasto) 프로모터와 Nos 터미네이터의 조절 하에 바이너리 벡터 pBLTI121 내로 본 Xbal-Stul 절편을 클로닝함에 의해 생산되었다.
트랜스막 도메인에 상응하는 니코티아나 타바쿰 N-아세틸글루코사미닐트랜스퍼라제 Ⅰ(GNTI)의 처음 N-말단 38 aa가 포워드 FGNT(5'-ATCGAAATCGCACGATGAGAGGGTACAAGTTTTGC-3' 서열 번호 94)와 리버스 RGNTspe(5'-CCCATGATGCGATCTGCATATTCTGACTGTGTCGC-3' 서열 번호 95) 프라이머를 사용한 PCR에 의해 증폭되었고, 연속해서 Apal/BamHl에 의해 pGEM-T 벡터 및 pBLTI221로 클론되었다. GNTI와 hGalT 사이의 융합을 위해, 그것 자체의 TMD를 제거하고 Spel과 Stul 사이트를 만들기 위하여 PCR 증폭이 pUC19-hGalT로부터 행해졌다. 포워드 FGalTspe (5'-GGACTAGTGCACTGTCGCTGCCCGCCTGC-3' 서열 번호 96)과 리버스 RgalFlagStu (5'-AAGGCCTACGCTACTTGTCATCGTCATCTTTGTAGTCGCACGGTGTCCCGAAGTCCAC-3' 서열 번호 97)이 Spel/Stul hGalT 절편을 증폭시키는데 사용되었다.
본 절편은 이후 pBLTI221-GNTI로 클론되었다. 마지막으로, 주위 사이트 Xbal/Stul에 의한 자르기는 1030 bp 절편을 분리할 수 있도록 하였고 R 622는 이후 바이너리 벡터 pBLTI121-플라스토로 본 1030 스트레치를 클로닝하여 생산되었다.
알팔파 식물의 형질전환은 하기와 같이 행해졌다.
알팔파(메디카고 사티바 엘.)(Medicago sativa L.), 에코타입 R2336은 아그로박테리움 투메파시엔(Agrobacterium tumefaciens) AGL1을 사용하여 형질전환되었고 다음과 같이 변형되었다: 잎 꼭지(petiole), 줄기 및 잎 외식편이 5 내지 7일 동안 아그로박테리움과 함께 배양되었다. 상기 함께 배양하는 단계는 SH2K 배지의 0.8 내지 1 OD와 3% 수크로즈(1.5% 수크로즈 대신)에서 아그로박테리움의 희석되지 않은 배양액으로 수행되었다. 반응성 외식편의 배 발달 결과로 잘-성립된(Well-established) 식물이 온실 내 흙으로 이동되었고 잎이 분석되었다.
야생형 및 GalT 또는 GNTI/GalT-형질전환된 알팔파 식물로부터 분리된 N-링크된 글리칸의 분석이 다음과 같이 행해졌다.
단백질이 5mL 추출 완충액(0.7M 사카로즈, 0.5M 트리스, 30mM HCl, 0.1M KCl, 2% 베타-멀캅토에탄올) 속에서 신선한 알팔파 잎 500mg으로부터 4℃에서 30분 동안 추출되었다. 불용해성 물질이 4℃에서, 5000g, 10분 동안의 원심분리에 의해 제거되었다. 상기 결과 상청액이 4℃에서 30분 동안 물 포화된 페놀 1 부피를 부가함에 의해 처리되었다. 이후, 페놀성 분획에 포함된 단백질과 글리코단백질이 밤새, 20℃에서 PB(메탄올에 용해된 0.1M 암모늄 아세테이트) 5 부피에 의해 침전되었다. 5mL PB로 펠렛을 세척한 후에, 단백질과 글리코단백질이 Bakker et al., 2001에서 이전에 설명된 것과 같이 펩신과 PNGase A로 연속 처리됨에 의해 잘려졌다. 이후, N-글리칸이 2-아미노 벤즈아미드(2-AB)에 의해 형광 라벨되었다.
이러한 유도된 N-글리칸의 MALDI-TOF 질량 스펙트럼들이 337-nm 질소 레이저를 구비한 보야져(Voyager) DE-Pro MALDI-TOF 장비(미국, Applied Biosystems)에서 획득되었다. 질량 스펙트럼들은 반사기에서 수행되었고, 매트릭스로서, 2,5-디하이드록시벤조산(Sima-Aldrich)을 사용한 지연화 추출 모드에서 수행되었다.
70:30% 아세토니트릴/0.1% TFA 5mg/mL에 방금 용해된, 상기 매트릭스가 1:1(V/V)의 비율로 용해된 올리고당과 혼합되었다. 이러한 스펙트럼들은 양성 모드에서 기록되었고, 100ns 지연 시간과 함께 20,000V의 가속 전압을 사용하였다. 이들은 일단 진정되고 상업적으로 이용 가능한 펩타이드와 단백질 혼합물(Applied Biosystems)을 사용하여 외부적으로 조정되었다. 본 연구에서, 상기 스펙트럼들은 des-Arg1-Bradykinin(904.4681 Da), 안지오텐신(Angiotensin) Ⅰ (1296.6853), Glu1-Fibrinopeptide B(1570.6774 Da), ACTH 클립 18-39(2465.1989)와 소(bovine) 인슐린(5730.6087)을 사용하여 조정되었다. 레이저 샷이 허용 가능한 신호 대 잡음비를 얻기 위해 각 스펙트럼에 대하여 축적되었다.
앞서 개시한 것과 같이, 본 발명은 큰 패널 신호를 제공하는데, 이는 서브세포 구획 및 서브도메인 내에 오직 글리코실트랜스퍼라제 활성만을 타겟하기 위해서 사용된다, 이는 호스트 발현 시스템에서 N- 및 O-글리코실화의 효율을 향상시키고 표 4에 나타난 효소와 공-발현함에 의해 이종 단백질의 번역 후 변형을 최적화하기 위해 큰 패널을 제공한다.
N-글리코실화 | 인간 베타(1,4) 갈락토실레이션 이스트 만노실트랜스퍼라제 OCH1p 인간 GNT Ⅲ |
O-글리코실화 | N-아세틸글루코사미닐 트랜스퍼라제 갈락토실트랜스퍼라제 |
단백질 가수분해 절단(Proteolytic cleavage) | 세린 프로테아제 시스테인 프로테아제 |
아미드화 | 옥시게나제 리아제(lyase) |
포스포릴화 | 포스포릴라제 |
감마-카르복실화 | 감마 카르복실라제 |
프로테오글리칸 변형 | 글리코트랜스퍼라제 글리코시다제 |
설패이션(sulfation) | 설파타제 |
하이드록실화 | 하이드록실라제 |
아세틸화 | 아세틸라제 |
세포벽 다당류 변형 | 글리코트랜스퍼라제 글리코시다제 |
표 4는 본 발명의 서열과 융합된 효소를 나타낸다.
앞선 실시예에서 개시한 것처럼, 본 발명은 단백질을 생산하고, 식물 세포의 서브구획에서 단백질을 발현하는 것을 변형하며, 식물 세포의 ER 및/또는 골지체 내에 이종 단백질을 발현하는 방법을 제공한다. 상기 발명은 또한 번역 후 변형된 단백질을 제공한다.
실시예 D: 신호 서열과 융합된 ZERA® 단백질의 발현.
본 실시예에서, ZERA®와 서열 신호((서열 번호 8) 및 만노시다제 Ⅰ을 포함하는 융합된 단백질이 단백질체에 막 단백질로서 글리코시다제를 축적하기 위해 만들어졌다, 타겟팅 신호(서열 번호 8)가 막 ER 내 효소를 축적하기 위해 사용되었고 ZERA 펩타이드를 통하여 집합체를 형성함에 의해 단백질체의 생산을 가능하게 했다.
상기 목적은 단백질체에서, N-글리칸을 가진 글리코단백질(Man5GlcNac2)를 축적하는 것이었다.
플라스미드 구조물: 인간 만노시다제 Ⅰ에 융합된 ZERA를 인코딩하는 ADNc(접근 넘버 Q9UKM7)가 PCR에 의해 증폭되었고 SPel와 Sacl 엔도뉴클레아제(endonuclease) 사이트에 타겟팅 신호(서열 번호 8)를 포함하는 pBLTI121 내 서브클론되었다.
아그로박테리움-중개 토바코 BY-2 세포 형질전환
pVKH18En6-mRFP, PBLTI121-GFP 및 pBIN20-GFP-융합체는 열 충격에 의해 아그로박테리움 투메파시엔(품종 GV3101 pMP90, Koncz와 Schell, 1986)내로 이동되었다. 트랜스제닉 아그로박테리움이 카나마이신(kanamycin)(100mg/mL)와 젠타마이신(gentamycin)(10mg/mL)을 포함하는 YEB 배지(리터당, 비프 추출물 5g, 이스트 추출물 1g, 수크로즈 5g, MgSO4-7H2O 0.5g) 상에서 선택되었고 Gomord et al., 1998에 설명된 것과 같이, 니코티아나 타바쿰(c.v. 밝은 노랑-2) BY-2 세포를 형질전환하는데 사용되었다. 형질전환된 토바코 세포는 PBLTI121-GFP와 pBIN20-GFP-융합체를 위해서 카나마이신(100mg/mL) 존재 하에서 선택되었고, 또는 pVKH18En-mRFP를 위해서 하이그로마이신(hygrpmycin) 및 세포탁심(cefotaxime)(250 mg/mL)의 존재 하에서 선택되었다. GFP와 mRFP 융합체를 공발현하는 이중 형질전환주를 위해, 마이크로캘러스들(microcalli)이 카나마이신 플레이트 상에서 먼저 선택되었고, 이후 하이그로마이신 플레이트 상에 이동되었다. 스크리닝 후에, GFP 및/또는 mRFP-융합체를 발현하는 캘러스들(calli)이 트랜스제닉 세포의 서스펜션 배양을 시작하기 위해 사용되었다. 3-4일 된 BY-2 서스펜션-배양된 세포가 실험을 위해 사용되었다.
본 실시예에서 만들어진 융합된 단백질은 형질전환된 세포 내에서 발현되었고 막 ER에 효소를 축적하였으며 ZERA 펩타이드를 통해 집합체를 형성함에 의해 단백질체를 생산하도록 하였다.
앞선 실시예에 개시한 바와 같이, 본 발명은 세포의 특정 도메인에 단백질을 타겟하고, 재조합 폴리펩타이드의 생산 수득률을 높이며, 재조합 폴리펩타이드의 면역원성을 막고, 그들의 천연 대응물의 정확한 복사체인, 치료적으로 활성있는 재조합 폴리펩타이드를 얻도록 한다. 이는 역시 번역 후 변형된 단백질을 생산하는 것을 가능하게도 한다.
[참조 문헌]
참조 1
알므퀴스트, 쿠르트 씨. 용퀸 니우, 마이클 디. 맥린, 프랭크 엘. 메나, 케른 와이. 에프, 야우, 키르크 브라운, 짐 이. 브랜들, 제이. 크리스토퍼 할(2004) 식물에서 해충제 저항성을 부여하는 면역조정. 식물 바이오테크놀로지 저널 2(3), 189-197.
참조 2
배컬 한스, 뮤리엘 발돌, 조스 더블유. 몰토프, 베로니크 고몰드, 잉그리드 엘버, 루카스 에이치. 스티븐스, 윌코 조르디, 아르젠 로멘, 로익 파예, 패트리스 레로우제, 및 디르크 보쉬(2001) 트랜스제닉 식물에 의해 생산되는 갈락토즈-확장 글리칸 항체. PNAS 2001년 2월 27일 98권 넘버5 2899-2904
참조 3
바리에우 프란코스 및 마르텐 제이. 크리스필(1999) 막 앵커를 경유한 액포로 분비된 용해성 단백질의 전달. 식물 생리학(1999) 120:961-968
참조 4
벵헤잘, 엠., 와스테니스, 지., 오., 및 존스, 디. 에이. 2000. 식물에서 C-말단 딜리신 모티프에 의한 유형 Ⅰ 막 단백질의 소포체로의 위치. 식물 세포 12:1179-1201
참조 5
보에빙크, 피., 오파르카, 케이., 산타 크루즈, 에스., 마틴, 비., 베테리즈, 에이. 및 하웨스, 씨.(1998). 경로 상 스택: 식물 골지체의 액틴/ER 네트워크상 이동. 식물 저널. 15. 441-447.
참조 6
보이슨, 엠., 고몰드, 브이., 아우드란, 씨., 버걸, 엔., 두브레우크, 비., 그라니엘, 에프., 레우즈, 피., 파예, 엘., 카보쉬, 엠. 및 레피니엑, 엘.(2001). 배 발달에서 아라비도프시스 글루코시다제 Ⅰ변이가 나타내는 N-글리칸 자르기의 중요한 역할. EMBO 저널. 20, 1010-1019.
참조 7
브라차 케이, 래비 엠, 얄로브스키 에스. 넓은 기질 특이성을 가진 CAAX 프로테아제인 아라비도프시스 AtSTE24. 저널 바이올로지 케미스트리. 2002년 8월 16일;277(33):29856-64
참조 8
브란디지, 에프., 프랑느, 엔., 마르트-마틴, 에스., 하웨스, 씨., 네우하우스, 제이-엠. 및 파리스, 엔.(2002a). 소수성 도메인의 길이에 의해 넓게 영향을 받는 단일-통과 막 단백질의 목적. 플랜트 셀, 14, 1077-1092.
참조 9
브란디지, 에프., 스냅, 이., 로버트, 에이., 리핀코트-스왈츠, 제이. 및 하웨스, 씨.(2002b). 에너지에 의존적이나 세포골격에는 독립적인 토바코 잎에서의 ER과 골지 사이 막 단백질 이동: 선택적인 사진탈색의 증거. 식물 세포 14, 1293-1309.
참조 10
브레츠컬, 엠.에스. 및 문로, 에스.(1993). 콜레스테롤과 골지체. 사이언스 261,1280-1281.
참조 11
캠벨, 알. 이., 투어, 오., 팔머, 에이. 이., 스텐바흐, 피.에이., 바일드, 지. 에스., 자카리아스, 디.에이. 및 시엔, 알. 와이.(2002). 모노머 붉은 형광 단백질. Proc. Natl. Acad. Sci. 미국 99, 7877-7882.
참조 12
킥조라 얀 1, 나탈리 칼렌스1, 크레어 몬트펠리에1, 비르케 바르토쉬2, 프란퀴스-로익 코셋2, 앤 오프 드 빅1, 및 진 두부이슨1 간염 C 바이러스 글리코단백질 E2 트랜스막 도메인의 대전된 잔기의 E1E2 헤테로다이머 기능에 대한 기여. 저널 Gen Virol 86(2005), 2793-2798;
참조 13
콘트레라스, 엘레나 오르티즈-자패털, 페르난도 아니엔토(2004) 식물 ARF1 및 코오토머의 상호작용과 관련된 막 단백질 시토졸 꼬리의 구분 신호. 식물 저널 38(4), 685-698
참조 14
드 프래털, 씨. 엠., 게르윙, 지. 제이., 바우스, 이., 누이팅크, 엘. 케이., 브리에젠타르트, 제이. 에프., 브레우얼, 더블유., 카메르링, 제이. 피., 에스필, 엠. 에프., 마틴, 제이. 제이., 드 패페, 에이. 엠., 등(2000). 글루코시다제 Ⅰ 결핍에 기인한 N-링크된 올리고당의 불완전한 생합성으로 야기된 새로운 무질서. 미국 저널 인간 유전학 66, 1744-1756.
참조 15
디른버걸, 디, 벤커, 피, 마흐, 엘. 및 스테인켈널, 에이치.(2002). 식물 세포에서 아라비도프시스 탈리아나 베타 1,2-자일로실트랜스퍼라제의 골지 국지화는 원형질 및 트랜스막 서열에 의존, 식물 분자생물학 50, 273-281.
참조 16
에슬, 디., 디른벌걸, 디., 고몰드, 브이., 스트라설, 알., 파예, 엘., 글로슬, 제이 및 스테인켈너, 에이치.(1999). 토바코 N-아세틸글루코사미닐트랜스퍼라제 Ⅰ의 N-말단 77 아미노산은 니코티아나 벤타미아나 세포의 골지체에서 리포터 단백질을 보유하기에 충분함. FEBS Lett. 453, 169-173.
참조 17
파예 로익, 아우렐리아 보우라플라우스, 메리엠 벤카반, 베로니크 고몰드a 및 도미니크 미카우드 식물 분비 통로에서 단백질 변형: 분자 파밍에서의 현 상태 및 실제 관련성 23권, 15판, 2005년 3월 7일, 1770-1778
참조 18
풀레크러그, 제이. 및 닐슨, 티.(1998). 골지 복합체에서의 단백질 구획. 생화학. 생리학. Acta 1404, 77-84.
참조 19
길모르, 씨. 에스., 포인덱스터, 피., 로리에아우, 제이., 팔식, 엠. 엠., 및 소머르빌, 씨.(2002). 알파-글루코시다제 Ⅰ은 아라비도프시스의 셀룰로스 생합성 및 발생에 필요하다. 저널 세포 생물학 156, 1003-1013.
참조 20
기라우도, 씨.디. 및 미시오니, 에이치.제이. 에프.(2003). Sar1과 원형질 디베이직 모티프의 상호작용에 의존하는 글리코실트랜스퍼라제의 소포체 배출. 분자 생물학 세포 14, 3753-3766.
참조 21
고몰드, 브이., 및 파예, 엘.(2004). 식물에서 치료적 단백질의 번역 후 변형. 현재 의견 식물 생물학 7, 171-181.
참조 22
고몰드, 브이, 위 이. 및 파예 엘.(1999). 소포체와 골지체에서의 단백질 체류와 국지화. 생화학, 81, 607-618.
참조 23
고몰드 브이, 소우로우일 씨., 피쉐트 에이. 씨., 발보르 엠. 패그니 에스., 레우즈 피., 및 파예 엘.(2004) 식물 제조 약물의 생산과 글리코실화: 도전과제로서의 항체. 식물 바이오테크놀로지., 2, 83-100.
참조 24
고몰드 브이., 덴마트 엘.에이., 피쉐트-래인 에이.씨., 새티아트-제운네마이트리, 하웨스 씨. 및 파예 엘.(1997). 분비 단백질 체류에 충분하나 소포체에서 배출되는 단백질의 액포 타켓팅을 촉진하는 C-말단 HDEL 서열. 식물 저널, 11, 313-326
참조 25
고몰드, 브이., 피쉐트, 에이.씨., 덴마트, 엘.에이., 미샤우드, 디. 및 파예, 엘.(1998). 토바코 세포 서스펜션 배양에서 외부 단백질의 생산. 분자 바이오테크놀로지의 방법 3권(커닝햄 씨. 및 포터 에이.제이.알.에즈.)토토와: 휴마나 출판 주식회사 155-164.
참조 26
그로브, 에스.엔., 브레커, 씨.이. 및 모레, 디.제이.(1968). 소포체-골지체-기관 복합체의 세포막 차이. 사이언스 161, 171-173.
참조 27
한톤 에스엘, 레나 엘, 볼토로티 엘이, 샤트레 엘, 스테파노 지, 브란디지 에프.(2005). 식물 세포에서 소포체로부터 트랜스막 단백질의 배출에 영향을 주는 디애시드 모티프. 식물 세포학 2005 17, 3081-3093.
참조 28
하르드트, 비., 칼즈-풀러, 비., 아파리시오, 알., 볼커, 씨. 및 바우스, 이(2003). ER 타겟팅 정보를 포함하나 절대적으로 ER 위치화를 요구하는 것은 아닌 글루코시다제 Ⅰ의 N-말단 도메인 내의 (Arg)3. 글리코생물학, 13, 159-168.
참조 29
하트만, 엠.에이. 및 벤베니스테, 피.(1987). 식물 막 스테롤: 분리, 확인 및 생합성. 방법 효소학. 148:632-650.
참조 30
홍, 와이., 순다람, 에스., 신, 디.-제이., 및 스탠리, 피.(2004). 글리코실화 IIb(CDG IIb)에 선천적인 혼란을 주는 {알파}-글리코시다제 Ⅰ의 불완전한 변이에 민감한 호스트인 Lec23 중국 햄스터 난소 변이 10.1074/jbc.M41010121200. 저널 생화학 279, 49894-49901.
참조 31
잔지크 아이, 마케룩스 피, 암레인 엔, 스찰러 LeSBT1, 토마토 식물의 서브틸라제. 곤충 세포에서의 과도발현, 정화, 및 특성화. 저널 생화학. 2000년 2월 18일;275(7):5193-9
참조 32
리에나르드 디., 트란 딘 오., 이. 반 오르트, 엘, 반 오베르트벨트, 씨. 본네우, 이. 왐브레, 엠. 발도르, 피. 코세트, 에이. 디디엘-라우렌트, 에프. 돌학 드 보른, 알. 델론, 알. 반 리, 피. 모인게온, 엘. 파예 및 브이. 고몰드(2007) 서스펜션-배양된 BY-2 토바코 세포에서 생산 및 성숙하는 면역학적으로 활성인 집 먼지 진드기 항원....* DL 및 OTD가 본 작업에 동등한 기여를 함, 식물 바이오테크놀로지 저널 5, 93-108
참조 33
린크, 디. 브이.(1993). 스핑고지질. 식물에서 지질 대사(모르 티.에스. 에드.) 보카 라톤, 에프엘:씨알씨 출판, 285-308.
참조 34
마시베이, 에이.에스., 바라지, 피.브이., 보에게만, 이.이. 및 콰스바, 피.케이.(1993). 보빈 b-1,4-갈락토실트랜스퍼라제의 골지 체류 신호의 변이적 분석. 저널 생화학. 268, 9908-9916.
참조 35
맥카트니, 에이. 더블유., 드예르, 제이. 엠., 다노아, 피. 케이., 킴, 피. 케이., 앤드류, 디. 더블유., 맥뉴, 제이. 에이., 및 뮬렌, 알. 티.(2004). 막-결합 지방산 탈포화효소는 ER 내로 공-번역되며 삽입되고 그것의 카르복시 말단에 다른 ER 복구 모티프를 포함함. 식물 저널 37, 156-173.
참조 36
모레우, 피., 하트만, 엠.에이., 페렛, 에이.엠., 스털보이스-발세르작, 비. 및 카산, 씨.(1998). 릭 묘목의 원형질 막으로의 스테롤 운반. 식물 생리학. 117, 931-937.
참조 37
모레, 디.제이. 및 모렌하우어, 에이치.에이치.(1974). 내막 개념: 소포체와 골지체의 기능적 융합. 식물 울트라구조의 다이나믹한 측면(로발드 에이. 더블유.에드.) 런던: 맥그로우-힐 북, 84-137.
참조 38
문로, 에스.(1991). 골지 체류에 특이한 b-2,6-시알릴트랜스퍼라제의 트랜스막 단편 내 및 근접한 서열. EMBO 저널 10, 3577-2588. 문로, 에스(1995a). 골지와 세포질 막 단백질의 트랜스막 도메인의 비교. 생화학. Soc. Trans. 23, 527-530.
참조 39
문로, 에스.(1995b). 골지 단백질 체류의 트랜스막 도메인의 역할 조사. EMBO 저널 14, 4695-4704.
참조 40
문로, 에스.(1998). 골지체에 단백질의 국지화. 세포 생물학 경향 8, 11-15.
참조 41
나바지오 엘., 스폰가 엘., 다메세 피., 피쉐트-레인 에이-씨., 파예 엘., 발단 비. 및 마리아니 피.(1997). 리리오덴드론 툴리피페라 엘의 꽃가루 내 칼슘 결합 단백질 칼레티쿨린. 식물 과학, 131, 35-42
참조 42
나바지오 엘., 나르디 씨., 판칼두 씨., 다네스 피., 발단 비., 피쉐트-래인 에이.씨., 파예 엘., 메집 에프., 마틴 더블유. 및 마리아니 피.(1998). 유글레나 그라시리스 내 칼레티쿨린의 기능적 보존. 저널 Euk. 미생물학, 45, 307-313.
참조 43
네벤풀, 에이., 갈라걸, 엘.에이., 두나해이, 티.지., 프로릭, 제이.에이., 마줄키윅즈, 에이.엠., 밀, 제이.비. 및 스태헬린, 엘.에이.(1999). 액토미오신 시스템에 의해 중개되는 식물 골지 스택의 자주 멈추는 이동. 식물 생리학 121, 1127-1142.
참조 44
닐슨, 티., 피팰트, 엠., 호, 엠.에이치., 스루사레윅즈, 피., 버걸, 이.지. 및 와렌, 지.(1993a). 헬라 세포의 골지체 내 2개의 글루코실트랜스퍼라제의 겹쳐지는 분배. 저널 세포 생물학 120, 5-13.
참조 45
닐슨, 티., 슬루사레윅즈, 피., 호, 엠.에이치. 및 와렌, 지(1993b). 킨 인지: 골지 효소 체류의 모델. FEBS Lett. 330, 1-4.
참조 46
닐슨, 티., 호, 엠.에이치., 스루사레윅즈, 피., 라보울리, 씨., 왓슨, 알., 헌트, 에프., 왓젤, 지., 버걸, 이.지. 및 와렌, 지.(1994). 헬라 세포에서 중앙 골지 효소 사이의 킨 인지. EMBO 저널 13, 562-574.
참조 47
닐슨, 티., 라보울리, 씨., 후이, 엔., 왓슨, 알. 및 와렌, 지.(1996). 체류에서 막 스패닐 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 Ⅰ의 줄기 지역의 역할, 헬라 세포에서 킨 인지 및 골지체의 구조적 유지. 저널 세포 사이언스 109, 1975-1989.
참조 48
오파트, 에이.에스., 호우톤, 에프. 및 글리슨, 피.에이.(2000). 높은 몰 중량 복합체로 존재하는, 후반 골지가 아닌 중앙 골지 글리코실트랜스퍼라제. 저널 바이올로지 케미스트리 275, 11836-11845.
참조 49
패그니 에스., 카반스-마쉐티우 엠., 길리킨 제이.더블유.,; 레볼느-캐스텔 엔., 레루즈 피., 보스톤 알. 파예 엘. 및 고몰드 브이.(2000). 식물에서 골지체에서부터 소포체까지의 단백질 재순환 및 칼레티쿨린 체류에 대한 그것의 작은 기여. 식물 세포, 12, 739-755
참조 50
페그니, 에스., 보우소니, 에프., 살칼, 엠., 폴렛-구예, 엠.엘., 드리오우이치, 에이., 스차크터, 에이치., 파예, 엘. 및 고몰드, 브이.(2003). 아라비도프시스 b-1,2-자일로실트랜스퍼라제 활성 및 골지에 타겟팅을 위한 구조적 요구. 식물 저널 33, 189-203.
참조 51
페트루셀리 에스., 오테구이 엠에스., 라레우 에프., 트랜딘탄리엔 오., 페쉬트 에이씨., 키르코스타 에이., 럼보 엠., 발도르 엠., 칼카모 알., 고몰드 브이. 및 비치 알엔. 잎의 소포체에 효과적으로 보유되었지만 종자에서 단백질 저장 액포로 양자 모두 부분적으로 분비되고 구분된 KDEL 태그된 모노클로날 항체. 식물 바이오테크놀로지 저널, 4, 511-527
참조 52
라우텐가르텐 씨, 스테인하우설 디, 부시스 디, 스틴치 에이, 스칼러 에이, 코프카 제이, 알트만 티 유전자의 기능성 관계의 추론 가정: 아라비도프시스 탈라이나 서브틸라제 유전자족의 분석. PLoS 컴퓨터 바이올로지 2005년 9월;1(4):e40.Epub 2005년 9월 2일
참조 53
레이스, 에프., 말찬트, 엘., 노람부에나, 엘., 닐로, 알., 실바, 에이치., 및 오렐라나, 에이.(2006). 소포체에 위치하고 접히지 않은 단백질 반응에 의해 업-조절되는 AtITr1, 알라비도프시스 탈리아나의 UDP-글루코즈/UDP-갈락토즈 운반체. 저널 바이올로지 케미스트리 281, 9145-9151.
참조 54
리트젠탈러, 씨., 네벤풀, 에이., 모바페기, 에이., 스투시-가라우드, 씨., 베니아, 엘., 핌플, 피., 스태헬린, 엘.에이. 및 로빈슨, 디.지.(2002). 골지-타켓된 녹색 형광 단백질 및 COPI 항혈청을 발현하는 토바코 밝은 노랑 2 세포를 사용한 식물 세포 상 브레펠딘 A 효과의 재평가, 식물 세포학 14, 237-261.
참조 55
루니온스 제이., 브라흐 티., 쿨널 에스 및 하웨스 씨.(2006). 소포체 막 내에 단백질 동력을 나타내는 GFP 광활성. 저널 Exp. Bot. 57, 43-50.
참조 56
세인트-조르, 씨.엠., 에빈스, 제이., 바토코, 에이치., 브란디지, 에프., 모르, 아이. 및 하웨스, 씨.(2002). 식물에서 골지체와 소포체 간의 막 단백질 재분배가 가역적이고 세포골격 네트워크에 의존적이지 않음. 식물 저널 29, 661-678.
참조 57
세인트-조르-듀파스 씨., 고몰드 브이. 및 패리스 엔.(2004). 골지체와 트랜스-골지 네트워크의 단백질 국지화. 세포 분자 생활 과학, 61, 159-171.
참조 58
세인트-조르-듀파스 씨., 네벤풀 에이., 폴렛-규예 엠엘., 보우라플로우스 에이., 하웨스 씨., 드리오우이치 에이., 파예 엘. 및 고몰드 브이.,(2006) 분비 통로를 따라 N-글리칸 성숙 효소의 절단 및 초반-골비 타겟팅에서 트랜스막 도메인 길이의 주요 역할. 식물 세포 18, 3182-3200
참조 59
스리라만 알., 바르도르 엠., 삭 엠., 바퀘로 씨., 파예 엘., 피숴 알., 핀네른 알, 레루오게 피.(2004) 코어-자일로즈 및 코어-알파(1,3)-푸코즈가 부족한 형질전환된 식물의 소포체에 보유된 재조합 항-hCG 항체. 식물 바이오테크놀로지; 2, 279-287
참조 60
스트라설, 알., 무차, 제이., 스위라, 에이치., 알트만, 에프., 그로슬, 제이. 및 스테인켈널, 에이치.(1999). 니코티아나 타바쿰의 b-1,2-N-아세틸글루코사미닐트랜스퍼라제 Ⅰ(GlcNAc-TI)를 코딩하는 cDNA의 분자 클로닝과 특성. 글리코바이올로지 9, 779-785.
참조 61
스트라설, 알., 쇼베르얼 제이., 진 씨., 무차, 제이., 글로슬, 제이., 마흐 엘. 및 스텐켈널, 에이치.(2006). 식물에서 복합 N-글리칸 형성의 주요 효소인 아라비도프시스 탈라이나 골지 a-만노시다제 Ⅱ의 분자 클로닝과 특성. 식물 저널 45, 789-803.
참조 62
태스달, 알.디. 및 잭슨, 엠.알,.(1996). 소포체와 골지체 사이 막 단백질의 신호-중개된 구분. Ann.리뷰 세포 발달 생물학 12, 27-54.
참조 63
위, 이.지.티., 쉐리어, 제이., 프라임, 티. 및 두프리, 피.(1998). 식물 골치체에 활성 시알릴트랜스퍼라제의 타겟팅. 식물 세포 10, 1759-1768.
참조 64
라이트 에이, 모리슨 에스엘. 기능적 특성상 CH2-연관된 탄수화물 구조 및 키메릭 쥐-인간 면역글로불린 G1의 생체 내 운명. 저널 Exp Med. 1994년 9월 1일;180(3):1087-96
참조 65
유아사, 케이., 토유카, 케이., 푸쿠다, 에이치. 및 매트수오카, 케이.(2005). 소포체로부터 배출 신호를 가진 막-앵커된 프로일 하이드록시라제. 식물 저널 41, 81-94.
참조 66
제란구, 엔., 스와파크, 비., 잰, 와이.엔. 및 잰, 엘.와이.(1999). 원형질막 K(ATP) 채널의 서브단위 화학양론을 조절하는 새로운 ER 통행 신호. 뉴론 22, 537-548.
SEQUENCE LISTING
<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS)
<120> A SET OF SEQUENCES FOR TARGETING EXPRESSION AND CONTROL OF THE
POST-TRANSLATIONNAL MODIFICATIONS OF A RECOMBINANT POLYPEPTIDE
<130> IF09P037FR
<150> US 60/857,524
<151> 2006-11-08
<160> 132
<170> PatentIn version 3.2
<210> 1
<211> 14
<212> PRT
<213> Artificial
<220>
<223> peptidic signal (S1)
<400> 1
Met Thr Ala Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile
1 5 10
<210> 2
<211> 10
<212> PRT
<213> Artificial
<220>
<223> peptidic signal (S1)
<400> 2
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala
1 5 10
<210> 3
<211> 12
<212> PRT
<213> Artificial
<220>
<223> peptidic signal (S1)
<400> 3
Met Asn Asp Arg Arg Pro Gln Arg Lys Arg Pro Ala
1 5 10
<210> 4
<211> 50
<212> PRT
<213> Artificial
<220>
<223> stem sequence S3
<400> 4
Phe Gln Gly Glu His Lys Glu Ser Leu Tyr Trp Gly Thr Tyr Arg Pro
1 5 10 15
His Val Tyr Phe Gly Val Arg Ala Arg Thr Pro Leu Ser Leu Val Ala
20 25 30
Gly Leu Met Trp Leu Gly Val Lys Asp Glu Met Tyr Val Met Arg His
35 40 45
Phe Cys
50
<210> 5
<211> 50
<212> PRT
<213> Artificial
<220>
<223> stem sequence S3
<400> 5
Phe Gln Gly Asp His Lys Glu Ser Leu Tyr Trp Gly Thr Tyr Arg Pro
1 5 10 15
Asn Val Tyr Leu Gly Ile Arg Ala Arg Thr Pro Leu Ser Leu Ile Ala
20 25 30
Gly Ile Met Trp Ile Gly Ala Lys Asn Gly Gln Tyr Phe Leu Arg His
35 40 45
Val Cys
50
<210> 6
<211> 49
<212> PRT
<213> Artificial
<220>
<223> stem sequence S3
<400> 6
Glu Ser Asp Ala Ser Leu Leu Trp Gly Thr Tyr Arg Pro Gln Ile Tyr
1 5 10 15
Phe Gly Leu Arg Pro Arg Leu Pro Gly Ser Leu Leu Thr Gly Leu Ala
20 25 30
Trp Phe Gly Leu Gln Asp Tyr Ser Asp Phe Gln His Ile Arg His Gln
35 40 45
Cys
<210> 7
<211> 47
<212> PRT
<213> Artificial
<220>
<223> stem sequence S3
<400> 7
Glu Arg Ser Asn Arg Leu Phe Trp Gly Thr Tyr Arg Pro Gly Ile Tyr
1 5 10 15
Phe Gly Met Lys His Arg Ser Pro Ile Ser Leu Leu Phe Gly Val Met
20 25 30
Trp Thr Val Gln Asp Ala Glu Asn Phe Ala Phe Arg His Ser Cys
35 40 45
<210> 8
<211> 150
<212> PRT
<213> Artificial
<220>
<223> conjonction S1 and S3
<400> 8
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu Ser Pro Gly Ser Asp Glu Gly Ser Ala Tyr Pro Pro Ser Ile
20 25 30
Arg Arg Gly Lys Gly Lys Glu Leu Val Ser Ile Gly Ala Phe Lys Thr
35 40 45
Asn Leu Lys Ile Leu Val Gly Leu Ile Ile Leu Gly Ile Ile Val Ile
50 55 60
Tyr Phe Val Ile Asn Arg Leu Val Arg His Gly Leu Leu Phe Asp Glu
65 70 75 80
Ser Gln Lys Pro Arg Val Ile Thr Pro Phe Pro Ala Pro Lys Val Met
85 90 95
Asp Leu Ser Met Phe Gln Gly Glu His Lys Glu Ser Leu Tyr Trp Gly
100 105 110
Thr Tyr Arg Pro His Val Tyr Phe Gly Val Arg Ala Arg Thr Pro Leu
115 120 125
Ser Leu Val Ala Gly Leu Met Trp Leu Gly Val Lys Asp Glu Met Tyr
130 135 140
Val Met Arg His Phe Cys
145 150
<210> 9
<211> 21
<212> PRT
<213> Artificial
<220>
<223> transmembrane domain GS2
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 9
Xaa Xaa Xaa Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser Phe
1 5 10 15
Val Phe Trp Asp Arg
20
<210> 10
<211> 25
<212> PRT
<213> Artificial
<220>
<223> transmembrane domain GS2
<220>
<221> MISC_FEATURE
<222> (1)..(2)
<223> Xaa can be any naturally occurring amino acid
<400> 10
Xaa Xaa Arg Tyr Leu Leu Ile Leu Ala Ala Val Ala Phe Ile Tyr Ile
1 5 10 15
Gln Met Arg Leu Phe Ala Thr Gln Ser
20 25
<210> 11
<211> 24
<212> PRT
<213> Artificial
<220>
<223> transmembrane domain GS2
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (22)..(24)
<223> Xaa can be any naturally occurring amino acid
<400> 11
Xaa Xaa Xaa Leu Gly Ile Leu Phe Ala Val Thr Leu Ser Ile Val Leu
1 5 10 15
Met Leu Val Ser Val Xaa Xaa Xaa
20
<210> 12
<211> 23
<212> PRT
<213> Artificial
<220>
<223> transmembrane domain GS2
<220>
<221> MISC_FEATURE
<222> (1)..(2)
<223> Xaa can be any naturally occurring amino acid
<400> 12
Xaa Xaa Lys Ile Phe Leu Tyr Met Leu Leu Leu Asn Ser Leu Phe Leu
1 5 10 15
Ile Ile Tyr Phe Val Phe His
20
<210> 13
<211> 26
<212> PRT
<213> Artificial
<220>
<223> transmembrane domain GS2
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 13
Xaa Xaa Xaa Arg Lys Leu Ser Asn Leu Leu Pro Leu Cys Val Ala Leu
1 5 10 15
Val Val Ile Ala Glu Ile Gly Phe Leu Gly
20 25
<210> 14
<211> 26
<212> PRT
<213> Artificial
<220>
<223> transmembrane domain GS2
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 14
Xaa Xaa Xaa Arg Lys Val Ser Thr Phe Leu Pro Ile Cys Val Ala Leu
1 5 10 15
Val Val Ile Ile Glu Ile Gly Phe Leu Cys
20 25
<210> 15
<211> 29
<212> PRT
<213> Artificial
<220>
<223> transmembrane domain GS2
<220>
<221> MISC_FEATURE
<222> (1)..(2)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (28)..(29)
<223> Xaa can be any naturally occurring amino acid
<400> 15
Xaa Xaa Phe Asn Thr Ile Thr Ile Thr Ile Met Ile Ala Phe Thr Phe
1 5 10 15
Phe Leu Leu Phe Leu Thr Gly Phe Leu Gln Phe Xaa Xaa
20 25
<210> 16
<211> 29
<212> PRT
<213> Artificial
<220>
<223> transmembrane domain GS2
<220>
<221> MISC_FEATURE
<222> (1)..(2)
<223> Xaa can be any naturally occurring amino acid
<400> 16
Xaa Xaa Lys Arg Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser
1 5 10 15
Phe Val Phe Trp Cys Val Ser Phe Val Phe Trp Asp Arg
20 25
<210> 17
<211> 29
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail GS1
<400> 17
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg
20 25
<210> 18
<211> 39
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail GS1
<400> 18
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Arg Ala Gly Ala Thr His
1 5 10 15
Asp Glu Phe Pro Ala Thr Asn Gly Ser Pro Ser Ser Ser Ser Ser Pro
20 25 30
Ser Ser Ser Ile Lys Arg Lys
35
<210> 19
<211> 11
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail GS1
<400> 19
Met Arg Gly Tyr Lys Phe Cys Cys Asp Phe Arg
1 5 10
<210> 20
<211> 39
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail GS1
<400> 20
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Lys Ile Gly Leu Thr His
1 5 10 15
Glu Glu Leu Pro Val Val Ala Asn Gly Ser Thr Ser Ser Ser Ser Ser
20 25 30
Pro Ser Ser Phe Lys Arg Lys
35
<210> 21
<211> 12
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail GS1
<400> 21
Met Leu Val Met Pro Gln Pro Pro Lys Pro Phe Asn
1 5 10
<210> 22
<211> 29
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail GS1
<400> 22
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg
20 25
<210> 23
<211> 17
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail GS1
<400> 23
Met Ala Asn Leu Trp Lys Lys Gln Arg Leu Arg Asp Thr Gly Leu Cys
1 5 10 15
Arg
<210> 24
<211> 166
<212> PRT
<213> Artificial
<220>
<223> stem sequence GS3
<400> 24
Arg Ile Asn Leu Ala Arg Glu His Glu Val Glu Val Phe Lys Leu Asn
1 5 10 15
Glu Glu Val Ser Arg Leu Glu Gln Met Leu Glu Glu Leu Asn Gly Gly
20 25 30
Val Gly Asn Lys Pro Leu Lys Thr Leu Lys Asp Ala Pro Glu Asp Pro
35 40 45
Val Asp Lys Gln Arg Arg Gln Lys Val Lys Glu Ala Met Ile His Ala
50 55 60
Trp Ser Ser Tyr Glu Lys Tyr Ala Trp Gly Lys Asp Glu Leu Gln Pro
65 70 75 80
Arg Thr Lys Asp Gly Thr Asp Ser Phe Gly Gly Leu Gly Ala Thr Met
85 90 95
Val Asp Ser Leu Asp Thr Leu Tyr Ile Met Gly Leu Asp Glu Gln Phe
100 105 110
Gln Lys Ala Arg Glu Trp Val Ala Ser Ser Leu Asp Phe Asp Lys Asp
115 120 125
Tyr Asp Ala Ser Met Phe Glu Thr Thr Ile Arg Val Val Gly Gly Leu
130 135 140
Leu Ser Ala Tyr Asp Leu Ser Gly Asp Lys Met Phe Leu Glu Lys Ala
145 150 155 160
Lys Asp Ile Ala Asp Arg
165
<210> 25
<211> 280
<212> PRT
<213> Artificial
<220>
<223> stem sequence GS3
<400> 25
Thr Leu Phe His Phe Gly Val Pro Gly Pro Ile Ser Ser Arg Phe Leu
1 5 10 15
Thr Ser Arg Ser Asn Arg Ile Val Lys Pro Arg Lys Asn Ile Asn Arg
20 25 30
Arg Pro Leu Asn Asp Ser Asn Ser Gly Ala Val Val Asp Ile Thr Thr
35 40 45
Lys Asp Leu Tyr Asp Arg Ile Glu Phe Leu Asp Thr Asp Gly Gly Pro
50 55 60
Trp Lys Gln Gly Trp Arg Val Thr Tyr Lys Asp Asp Glu Trp Glu Lys
65 70 75 80
Glu Lys Leu Lys Ile Phe Val Val Pro His Ser His Asn Asp Pro Gly
85 90 95
Trp Lys Leu Thr Val Glu Glu Tyr Tyr Gln Arg Gln Ser Arg His Ile
100 105 110
Leu Asp Thr Ile Val Glu Thr Leu Ser Lys Asp Ser Arg Arg Lys Phe
115 120 125
Ile Trp Glu Glu Met Ser Tyr Leu Glu Arg Trp Trp Arg Asp Ala Ser
130 135 140
Pro Asn Lys Gln Glu Ala Leu Thr Lys Leu Val Lys Asp Gly Gln Leu
145 150 155 160
Glu Ile Val Gly Gly Gly Trp Val Met Asn Asp Glu Ala Asn Ser His
165 170 175
Tyr Phe Ala Ile Ile Glu Gln Ile Ala Glu Gly Asn Met Trp Leu Asn
180 185 190
Asp Thr Ile Gly Val Ile Pro Lys Asn Ser Trp Ala Ile Asp Pro Phe
195 200 205
Gly Tyr Ser Ser Thr Met Ala Tyr Leu Leu Arg Arg Met Gly Phe Glu
210 215 220
Asn Met Leu Ile Gln Arg Thr His Tyr Glu Leu Lys Lys Asp Leu Ala
225 230 235 240
Gln His Lys Asn Leu Glu Tyr Ile Trp Arg Gln Ser Trp Asp Ala Met
245 250 255
Glu Thr Thr Asp Ile Phe Val His Met Met Pro Phe Tyr Ser Tyr Asp
260 265 270
Ile Pro His Thr Cys Gly Pro Glu
275 280
<210> 26
<211> 183
<212> PRT
<213> Artificial
<220>
<223> stem sequence GS3
<400> 26
Gln Thr Gln Ser Gln Tyr Ala Asp Arg Leu Ser Ser Ala Ile Glu Ser
1 5 10 15
Glu Asn His Cys Thr Ser Gln Met Arg Gly Leu Ile Asp Glu Val Ser
20 25 30
Ile Lys Gln Ser Arg Ile Val Ala Leu Glu Asp Met Lys Asn Arg Gln
35 40 45
Asp Glu Glu Leu Val Gln Leu Lys Asp Leu Ile Gln Thr Phe Glu Ser
50 55 60
Ala Leu Leu Ser Pro Met Pro Val Ala Ala Val Val Val Met Ala Cys
65 70 75 80
Ser Arg Ala Asp Tyr Leu Glu Arg Thr Val Lys Ser Val Leu Thr Tyr
85 90 95
Gln Thr Pro Val Ala Ser Lys Tyr Pro Leu Phe Ile Ser Gln Asp Gly
100 105 110
Ser Asp Gln Ala Val Lys Ser Lys Ser Leu Ser Tyr Asn Gln Leu Thr
115 120 125
Tyr Met Gln Ile Asn Glu Asp Glu Gly Ser Phe Ser Pro Phe Gln His
130 135 140
Leu Asp Phe Glu Pro Val Val Thr Glu Arg Pro Gly Glu Leu Thr Ala
145 150 155 160
Tyr Tyr Lys Ile Ala Arg Lys Asp Trp Phe Leu Phe Ser Leu Arg Pro
165 170 175
Ser Ser Ser Ile Thr Glu Thr
180
<210> 27
<211> 174
<212> PRT
<213> Artificial
<220>
<223> stem sequence GS3
<400> 27
Arg Thr Ala Leu Asn Gly Ser Ser Ile Asp Asp Asp Leu Asp Gly Leu
1 5 10 15
Asp Lys Asp Leu Glu Ala Lys Leu Asn Ala Ser Leu Leu Ser Val Ala
20 25 30
Arg Gly Asn Arg Met Ser Leu Arg Leu His Arg Arg Asn His Phe Ser
35 40 45
Pro Arg Asn Thr Asp Leu Phe Pro Asp Leu Ala Lys Asp Arg Val Val
50 55 60
Ile Val Leu Tyr Val His Asn Arg Ala Gln Tyr Phe Arg Val Thr Val
65 70 75 80
Glu Ser Leu Ser Lys Val Lys Gly Ile Ser Glu Thr Leu Leu Ile Val
85 90 95
Ser His Asp Gly Tyr Phe Glu Glu Met Asn Arg Ile Val Glu Ser Ile
100 105 110
Lys Phe Cys Gln Val Lys Gln Ile Phe Ser Pro Tyr Ser Pro His Ile
115 120 125
Tyr Arg Thr Ser Phe Pro Gly Val Thr Leu Asn Asp Cys Lys Asn Lys
130 135 140
Gly Asp Glu Ala Lys Gly His Cys Glu Gly Asn Pro Asp Gln Tyr Gly
145 150 155 160
Asn His Arg Ser Pro Lys Ile Val Ser Leu Lys His His Trp
165 170
<210> 28
<211> 181
<212> PRT
<213> Artificial
<220>
<223> stem sequence GS3
<400> 28
His Ser Ser Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr
1 5 10 15
His Val Ser Val Asn Asn Gln Ser Ala Ile Gln Lys Pro Trp Pro Ile
20 25 30
Leu Pro Ser Tyr Leu Pro Trp Thr Pro Pro Gln Arg Asn Leu Pro Thr
35 40 45
Gly Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Lys Arg Val Asp
50 55 60
Phe Leu Lys Pro Arg Ile Gly Gly Gly Gly Glu Gly Ser Trp Phe Arg
65 70 75 80
Cys Phe Tyr Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Arg Asn
85 90 95
Leu Arg Met Val Pro Asp Arg Ile Val Met Ser Arg Gly Gly Glu Lys
100 105 110
Leu Glu Glu Val Met Gly Arg Lys Glu Glu Glu Glu Leu Pro Ala Phe
115 120 125
Arg Gln Gly Ala Phe Glu Val Ala Glu Glu Val Ser Ser Arg Leu Gly
130 135 140
Phe Lys Arg His Arg Arg Phe Gly Gly Gly Glu Gly Gly Ser Ala Val
145 150 155 160
Ser Arg Arg Leu Val Asn Asp Glu Met Leu Asn Glu Tyr Met Gln Glu
165 170 175
Gly Gly Ile Asp Arg
180
<210> 29
<211> 150
<212> PRT
<213> Artificial
<220>
<223> stem sequence GS3
<400> 29
Arg Leu Asp Asn Ala Ser Leu Val Asp Thr Leu Thr His Phe Phe Thr
1 5 10 15
Lys Ser Ser Ser Asp Leu Lys Val Gly Ser Gly Ile Glu Lys Cys Gln
20 25 30
Glu Trp Leu Glu Arg Val Asp Ser Val Thr Tyr Ser Arg Asp Phe Thr
35 40 45
Lys Asp Pro Ile Phe Ile Ser Gly Ser Asn Lys Asp Phe Lys Ser Cys
50 55 60
Ser Val Asp Cys Val Met Gly Phe Thr Ser Asp Lys Lys Pro Asp Ala
65 70 75 80
Ala Phe Gly Leu Ser His Gln Pro Gly Thr Leu Ser Ile Ile Arg Ser
85 90 95
Met Glu Ser Ala Gln Tyr Tyr Gln Glu Asn Asn Leu Ala Gln Ala Arg
100 105 110
Arg Lys Gly Tyr Asp Ile Val Met Thr Thr Ser Leu Ser Ser Asp Val
115 120 125
Pro Val Gly Tyr Phe Ser Trp Ala Glu Tyr Asp Ile Met Ala Pro Val
130 135 140
Gln Pro Lys Thr Glu Lys
145 150
<210> 30
<211> 205
<212> PRT
<213> Artificial
<220>
<223> stem sequence GS3
<400> 30
Leu Glu Phe Pro Ser Ala Ser Thr Ser Met Glu His Ser Ile Asp Pro
1 5 10 15
Glu Pro Lys Leu Ser Asp Ser Thr Ser Asp Pro Phe Ser Asp Val Leu
20 25 30
Val Ala Tyr Lys Lys Trp Asp Phe Glu Val Gly Cys Ala Arg Phe Arg
35 40 45
Glu Asn His Lys Asp Ala Ile Leu Gly Asn Val Ser Ser Gly Ser Leu
50 55 60
Gln Glu Phe Gly Cys Gly Lys Leu Lys Met Lys His Val Lys Val Leu
65 70 75 80
Val Lys Gly Trp Thr Trp Ile Pro Asp Asn Leu Glu Asn Leu Tyr Ser
85 90 95
Cys Arg Cys Gly Met Thr Cys Leu Trp Thr Lys Ser Ser Val Leu Ala
100 105 110
Asp Ser Pro Asp Ala Leu Leu Phe Glu Thr Thr Thr Pro Pro Leu Gln
115 120 125
Arg Arg Val Gly Asp Pro Leu Arg Val Tyr Met Glu Leu Glu Ala Gly
130 135 140
Arg Lys Arg Ser Gly Arg Glu Asp Ile Phe Ile Ser Tyr His Ala Lys
145 150 155 160
Asp Asp Val Gln Thr Thr Tyr Ala Gly Ser Leu Phe His Asn Asn Arg
165 170 175
Asn Tyr His Ile Ser Pro His Lys Asn Asn Asp Val Leu Val Tyr Trp
180 185 190
Ser Ser Ser Arg Cys Leu Pro His Arg Asp Arg Leu Ala
195 200 205
<210> 31
<211> 150
<212> PRT
<213> Artificial
<220>
<223> stem sequence GS3
<400> 31
Arg Leu Asp Lys Val Ala Leu Val Asp Thr Leu Thr Asp Phe Phe Thr
1 5 10 15
Gln Ser Pro Ser Leu Ser Gln Ser Pro Pro Ala Arg Ser Asp Arg Lys
20 25 30
Lys Ile Gly Leu Phe Thr Asp Arg Ser Cys Glu Glu Trp Leu Met Arg
35 40 45
Glu Asp Ser Val Thr Tyr Ser Arg Asp Phe Thr Lys Asp Pro Ile Phe
50 55 60
Ile Ser Gly Gly Glu Lys Asp Phe Gln Trp Cys Ser Val Asp Cys Thr
65 70 75 80
Phe Gly Asp Ser Ser Gly Lys Thr Pro Asp Ala Ala Phe Gly Leu Gly
85 90 95
Gln Lys Pro Gly Thr Leu Ser Ile Ile Arg Ser Met Glu Ser Ala Gln
100 105 110
Tyr Tyr Pro Glu Asn Asp Leu Ala Gln Ala Arg Arg Arg Gly Tyr Asp
115 120 125
Ile Val Met Thr Thr Ser Leu Ser Ser Asp Val Pro Val Gly Tyr Phe
130 135 140
Ser Trp Ala Glu Tyr Asp
145 150
<210> 32
<211> 49
<212> PRT
<213> Artificial
<220>
<223> GS1-GS2-GS3
<400> 32
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Asp Arg Gln
35 40 45
Thr
<210> 33
<211> 99
<212> PRT
<213> Artificial
<220>
<223> GS1-GS2-GS3
<400> 33
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Asp Arg Gln
35 40 45
Thr Leu Val Arg Glu His Gln Val Glu Ile Ser Glu Leu Gln Lys Glu
50 55 60
Val Thr Asp Leu Lys Asn Leu Val Asp Asp Leu Asn Asn Lys Gln Gly
65 70 75 80
Gly Thr Ser Gly Lys Thr Asp Leu Gly Arg Lys Ala Thr Lys Ser Ser
85 90 95
Lys Asp Val
<210> 34
<211> 22
<212> PRT
<213> Artificial
<220>
<223> GS1-GS2-GS3
<400> 34
Met Ala Ala Ala Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser
1 5 10 15
Phe Val Phe Trp Asp Arg
20
<210> 35
<211> 68
<212> PRT
<213> Artificial
<220>
<223> GS1-GS2-GS3
<400> 35
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Arg Ala Gly Ala Thr His
1 5 10 15
Asp Glu Phe Pro Ala Thr Asn Gly Ser Pro Ser Ser Ser Ser Ser Pro
20 25 30
Ser Ser Ser Ile Lys Arg Lys Leu Ser Asn Leu Leu Pro Leu Cys Val
35 40 45
Ala Leu Val Val Ile Ala Glu Ile Gly Phe Leu Gly Arg Leu Asp Lys
50 55 60
Val Ala Thr Ser
65
<210> 36
<211> 38
<212> PRT
<213> Artificial
<220>
<223> GS1-GS2-GS3
<400> 36
Met Arg Gly Tyr Lys Phe Cys Cys Asp Phe Arg Tyr Leu Leu Ile Leu
1 5 10 15
Ala Ala Val Ala Phe Ile Tyr Ile Gln Met Arg Leu Phe Ala Thr Gln
20 25 30
Ser Glu Tyr Ala Asp Arg
35
<210> 37
<211> 68
<212> PRT
<213> Artificial
<220>
<223> GS1-GS2-GS3
<400> 37
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Lys Ile Gly Leu Thr His
1 5 10 15
Glu Glu Leu Pro Val Val Ala Asn Gly Ser Thr Ser Ser Ser Ser Ser
20 25 30
Pro Ser Ser Phe Lys Arg Lys Val Ser Thr Phe Leu Pro Ile Cys Val
35 40 45
Ala Leu Val Val Ile Ile Glu Ile Gly Phe Leu Cys Arg Leu Asp Asn
50 55 60
Ala Ser Thr Ser
65
<210> 38
<211> 41
<212> PRT
<213> Artificial
<220>
<223> GS1-GS2-GS3
<400> 38
Met Leu Val Met Pro Gln Pro Pro Lys Pro Phe Asn Thr Ile Thr Ile
1 5 10 15
Thr Ile Met Ile Ala Phe Thr Phe Phe Leu Leu Phe Leu Thr Gly Phe
20 25 30
Leu Gln Phe Pro Ser Ile Ser Pro Ser
35 40
<210> 39
<211> 106
<212> PRT
<213> Artificial
<220>
<223> GS1-GS2-GS3
<400> 39
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Cys Val Ser
35 40 45
Phe Val Phe Trp Asp Arg Gln Thr Leu Val Arg Glu His Gln Val Glu
50 55 60
Ile Ser Glu Leu Gln Lys Glu Val Thr Asp Leu Lys Asn Leu Val Asp
65 70 75 80
Asp Leu Asn Asn Lys Gln Gly Gly Thr Ser Gly Lys Thr Asp Leu Gly
85 90 95
Arg Lys Ala Thr Lys Ser Ser Lys Asp Val
100 105
<210> 40
<211> 72
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 40
gatccttggg aatgcttgct ctgctcttca tcgttttcgt ttgtgtctct ttcgttttct 60
gggaccgtca aa 72
<210> 41
<211> 72
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 41
ctagtttgac ggtcccagaa aacgaaagag acacaaacga aaacgatgaa gagcagagca 60
agcattccca ag 72
<210> 42
<211> 81
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 42
gatccttggg aatggctgct gctcttgctc tgctcttcat cgttttcgtt tgtgtctctt 60
tcgttttctg ggaccgtcaa a 81
<210> 43
<211> 81
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 43
ctagtttgac ggtcccagaa aacgaaagag acacaaacga aaacgatgaa gagcagagca 60
agagcagcag ccattcccaa g 81
<210> 44
<211> 28
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 44
ggtcactagt atcttcattt ccgagttg 28
<210> 45
<211> 31
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 45
ggtcactagt gcgatctgca tattctgact g 31
<210> 46
<211> 31
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 46
aacgtctaga atgagagggt acaagttttg c 31
<210> 47
<211> 29
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 47
cggggtaccc catgaccgga gctagccgt 29
<210> 48
<211> 24
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 48
gactagaaaa ggagtgataa ccct 24
<210> 49
<211> 35
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 49
cggggtaccc catgaaatca tcatcattat ctccc 35
<210> 50
<211> 51
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence (GCSI ER signal)
<400> 50
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu Ser Pro Gly Ser Asp Glu Gly Ser Ala Tyr Pro Pro Ser Ile
20 25 30
Arg Arg Gly Lys Gly Lys Glu Leu Val Ser Ile Gly Ala Phe Lys Thr
35 40 45
Asn Leu Lys
50
<210> 51
<211> 41
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence (human GCSI ER targeting)
<400> 51
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Val Pro Ala Glu Gly Val
1 5 10 15
Arg Thr Ala Glu Arg Ala Ala Arg Gly Gly Pro Gly Arg Arg Asp Gly
20 25 30
Arg Gly Gly Gly Pro Arg Ser Thr Ala
35 40
<210> 52
<211> 39
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 52
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Ala Ala Ala Glu Gly Ala
1 5 10 15
Arg Pro Leu Glu Arg Ala Arg Ala Ala Gly Arg Arg Asp Gly Arg Ala
20 25 30
Gly Gly Ala Arg Gly Ser Ala
35
<210> 53
<211> 36
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 53
Met Ala Arg Gly Glu Arg Arg Arg Arg Gly Ala Pro Val Asp Gly Ala
1 5 10 15
Arg Thr Ala Glu Arg Ala Ala Arg Gly Gly Pro Ala Arg Arg Gly Gly
20 25 30
Glu Ala Arg Gly
35
<210> 54
<211> 42
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 54
Met Ala Ala Arg Thr Arg Ile Ala Asp Ser Gly Gly Gly Ala Arg Ser
1 5 10 15
Arg Glu Thr Lys Thr Lys Pro Lys Ser Gly Asn Gly Ala Gln Ser Arg
20 25 30
Asn Asn Glu Thr Gln Ser Ser Ser Lys Asn
35 40
<210> 55
<211> 39
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 55
Met Gly Arg Arg Arg Lys Arg Val Ala Thr Gly Asp Gly Val Pro Ser
1 5 10 15
Pro Arg Lys Glu Glu Lys Ala Pro Ala Pro Pro Arg Lys Glu Lys Lys
20 25 30
Lys Lys Thr Asp Ile Gly Lys
35
<210> 56
<211> 37
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 56
Met Ala Arg Gln Arg Arg Thr Gln Gly Ala Ala Asp Pro Asn Lys Gly
1 5 10 15
Thr Asn Ser Ser Ser Ser Asn Gly Ser Asn Ser Thr Asn Asn Arg Ser
20 25 30
Ser Lys Ser Thr Ser
35
<210> 57
<211> 51
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 57
Met Ala Lys Lys Lys Val Pro Arg Glu Lys Asn His Ser Gly Gly Thr
1 5 10 15
Thr Arg Arg Thr Ser Glu Ser Ser Ser Asn Asn His Ala Asp Ser Lys
20 25 30
Arg Gln Ile Arg Ile Lys Leu Asn Glu Lys Arg Lys Arg Gln Glu Pro
35 40 45
Gly Ser Lys
50
<210> 58
<211> 46
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 58
Met His Arg Glu His Glu Glu Met His Gln Pro Ser Arg Arg Arg Arg
1 5 10 15
Pro Pro Arg Glu Val Glu Arg Pro Ser Ala Thr Ile Arg Tyr Glu Pro
20 25 30
Val Ala Glu Pro Glu Pro Trp Cys Ser Phe Cys Ser Trp Asp
35 40 45
<210> 59
<211> 62
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 59
Met Ser Gly Gly Gly Gly Ser Ser Ser Val Arg Arg Pro Val Ala Ala
1 5 10 15
Ala Arg Ser Arg Ser Gly Pro Glu Pro Asp Ala Arg Arg Ala Ala Ala
20 25 30
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Arg Arg Gly Arg Gly
35 40 45
Asp His Gly Pro Leu Arg Leu Met Glu Val Ser Pro Arg Asn
50 55 60
<210> 60
<211> 11
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 60
Met Ala Pro Pro Pro Pro Arg Gln Pro Arg Gln
1 5 10
<210> 61
<211> 42
<212> PRT
<213> Artificial
<220>
<223> cytosolic tail sequence
<400> 61
Met Ser Ile Leu Asn Ile Ser Ile Thr Val Leu Cys Ile Ala Ile Ala
1 5 10 15
Thr Trp Phe Ser Tyr Lys Gly Tyr Leu Glu Thr Arg Val Asn Thr Pro
20 25 30
Tyr Asp Ile Lys Lys Leu Val Thr Ile Ser
35 40
<210> 62
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 62
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 63
<211> 7
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain - SEQ ID NO: 64 - SEQ ID NO: 2
<400> 63
Met Ile Lys Ser Ser Ser Leu
1 5
<210> 64
<211> 16
<212> PRT
<213> Artificial
<220>
<223> elongated cytosolic domain - SEQ ID NO: 2
<400> 64
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Ile Lys Ser Ser Ser Leu
1 5 10 15
<210> 65
<211> 14
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 65
Met Thr Ala Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile
1 5 10
<210> 66
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 66
Met Thr Gly Ala Ser Ala Ala Ser Ala Ala Gly Ala Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 67
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 67
Met Thr Gly Ala Ser Leu Leu Ser Ala Leu Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 68
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 68
Met Thr Gly Ala Ser Leu Leu Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 69
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 69
Met Thr Gly Ala Ser Arg Arg Ser Ala Leu Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 70
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 70
Arg Xaa Xaa Arg
1
<210> 71
<211> 5
<212> PRT
<213> Unknown
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 71
Arg Xaa Xaa Xaa Arg
1 5
<210> 72
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 72
Arg Xaa Xaa Lys
1
<210> 73
<211> 5
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 73
Arg Xaa Xaa Xaa Lys
1 5
<210> 74
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 74
Lys Xaa Xaa Arg
1
<210> 75
<211> 5
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 75
Lys Xaa Xaa Xaa Arg
1 5
<210> 76
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 76
Arg Arg Xaa Xaa Arg Xaa Arg
1 5
<210> 77
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 77
Arg Lys Xaa Xaa Arg Xaa Arg
1 5
<210> 78
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 78
Arg Arg Xaa Xaa Arg Xaa Lys
1 5
<210> 79
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 79
Arg Arg Xaa Xaa Lys Xaa Arg
1 5
<210> 80
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 80
Lys Arg Xaa Xaa Arg Xaa Arg
1 5
<210> 81
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 81
Lys Lys Xaa Xaa Arg Xaa Arg
1 5
<210> 82
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 82
Arg Arg Xaa Xaa Lys Xaa Lys
1 5
<210> 83
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 83
Arg Lys Xaa Xaa Lys Xaa Arg
1 5
<210> 84
<211> 7
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 84
Arg Lys Xaa Xaa Arg Xaa Lys
1 5
<210> 85
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<400> 85
Arg Arg Arg Arg
1
<210> 86
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<400> 86
Arg Lys Arg Arg
1
<210> 87
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<400> 87
Arg Arg Lys Arg
1
<210> 88
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<400> 88
Arg Arg Arg Lys
1
<210> 89
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<400> 89
Arg Arg Lys Lys
1
<210> 90
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<400> 90
Arg Lys Lys Arg
1
<210> 91
<211> 4
<212> PRT
<213> Artificial
<220>
<223> arginine motif sequence
<400> 91
Lys Lys Arg Arg
1
<210> 92
<211> 38
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 92
gactctagag cgggaagatg aggcttcggg agccgctc 38
<210> 93
<211> 58
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 93
aaggcctacg ctacttgtca tcgtcatctt tgtagtcgca cggtgtcccg aagtccac 58
<210> 94
<211> 35
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 94
atcgaaatcg cacgatgaga gggtacaagt tttgc 35
<210> 95
<211> 35
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 95
cccatgatgc gatctgcata ttctgactgt gtcgc 35
<210> 96
<211> 29
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 96
ggactagtgc actgtcgctg cccgcctgc 29
<210> 97
<211> 58
<212> DNA
<213> Artificial
<220>
<223> primer
<400> 97
aaggcctacg ctacttgtca tcgtcatctt tgtagtcgca cggtgtcccg aagtccac 58
<210> 98
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 98
Met Thr Gly Ala Ser Leu Arg Ser Ala Arg Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 99
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 99
Met Thr Gly Ala Ser Leu Arg Ser Ala Leu Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 100
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 100
Met Thr Gly Ala Ser Arg Leu Ser Ala Arg Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 101
<211> 18
<212> PRT
<213> Artificial
<220>
<223> cytosolic domain
<400> 101
Met Thr Gly Ala Ser Arg Leu Ser Ala Leu Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210> 102
<211> 39
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 1
<400> 102
atgaccggag ctagccgtcg gagcgcgcgt ggtcgaatc 39
<210> 103
<211> 30
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 2
<400> 103
atggctcggg gcgagcggcg gcgccgcgca 30
<210> 104
<211> 36
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 3
<400> 104
atgaatgatc gtagaccgca aaggaaacgc ccagca 36
<210> 105
<211> 147
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 4
<400> 105
tttcagggcg agcacaaaga gagcttatac tggggaactt atcgtcctca tgtttatttt 60
ggagttcgag ctagaactcc attgtccttg gtagctggct tgatgtggct tggtgtcaaa 120
gatgagatgt atgttatgcg gcatttc 147
<210> 106
<211> 150
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 5
<400> 106
ttccaaggag atcacaagga aagcttgtat tggggtacct acaggccgaa tgtatatctt 60
ggaattcgtg caagaacccc gttgtctcta attgctggga taatgtggat tggtgcaaag 120
aatgggcaat actttcttcg tcatgtttgc 150
<210> 107
<211> 148
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 6
<400> 107
tgaatctgac gcatcgctgc tctggggaac ataccgtcca caaatttact ttggccttcg 60
tcctcgtctt cccggatccc tcttaaccgg cctcgcttgg tttggcctac aagattacag 120
cgactttcag catattcgac atcagtgc 148
<210> 108
<211> 142
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 7
<400> 108
agaacgatct aatcgtctct tctggggtac ttatcgtcct ggaatttatt tcggtatgaa 60
acacagaagt cccatatctc ttttgtttgg agttatgtgg acagttcaag acgcagaaaa 120
ctttgccttc cgtcactcat gt 142
<210> 109
<211> 480
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 8
<400> 109
atgaccggag ctagccgtcg gagcgcgcgt ggtcgaatca aatcatcatc attatctccc 60
ggctccgatg aaggaagcgc ttatcctccg agtatccgcc gcggcaaagg caaggaactt 120
gtatcgatcg gtgctttcaa gacgaatctc aagatattgg ttgggttaat catattaggg 180
attatagtaa tctacttcgt aatcaatcgg ctagttcgtc acgggttgtt gtttgatgag 240
tcccagaagc ctagggttat cactcctttt cctgctccga aagtcatgga tttgtcaatg 300
tttcagggcg agcacaaaga gagcttatac tggggaactt atcgtcctca tgtttatttt 360
ggagttcgag ctagaactcc attgtccttg gtagctggct tgatgtggct tggtgtcaaa 420
gatgagatgt atgttatgcg gcatttctgt gaaaactctg atgatttaag tacatttggc 480
<210> 110
<211> 54
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 9
<400> 110
cttgctctgc tcttcatcgt tttcgtttgt gtctctttcg ttttctggga ccgt 54
<210> 111
<211> 69
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO:10
<400> 111
cggtacctcc tcatcttggc tgctgtcgcc ttcatctaca tacagatgcg gctttttgcg 60
acacagtca 69
<210> 112
<211> 54
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 11
<400> 112
ttagggattc tatttgctgt tactttgtct atagttctga tgttggtgtc tgta 54
<210> 113
<211> 60
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 12
<400> 113
atttttctgt atatgttact tctcaactct ctctttctca tcatctactt cgtttttcac 60
<210> 114
<211> 69
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 13
<400> 114
cgaaaattat cgaatttgtt accactctgc gttgctctgg tagttatcgc tgagatcggg 60
tttctgggt 69
<210> 115
<211> 69
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 14
<400> 115
cgtaaagtct cgaccttttt gccaatctgc gtggctcttg tcgtcattat cgagatcggg 60
ttcctctgt 69
<210> 116
<211> 75
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 15
<400> 116
ttcaacacaa tcaccatcac aatcatgata gctttcacct tcttcctcct cttcctcacc 60
ggtttcctcc aattc 75
<210> 117
<211> 60
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 16
<400> 117
aagcgtcttg ctctgctctt catcgttttc gtttgtgtct ctttcgtttt ctgggaccgt 60
<210> 118
<211> 87
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 17
<400> 118
atggcgagag ggagcagatc agtgggtagc agcagcagca aatggaggta ctgcaaccct 60
tcctattact tgaagcgccc aaagcgt 87
<210> 119
<211> 117
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 18
<400> 119
atgggtgttt tctcgaatct tcgaggaccc agagccggag ctacccacga tgaatttccg 60
gcgaccaatg gctctccttc gtcttcttct tctccatctt catcaatcaa gcgaaaa 117
<210> 120
<211> 32
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 19
<400> 120
atgagagggt acaagttttg ctgtgatttc cg 32
<210> 121
<211> 117
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 20
<400> 121
atgggtgttt tctccaatct tcgaggtcct aaaattggat tgacccatga agaattgcct 60
gtagtagcca atggctctac ttcttcttct tcgtctcctt cctctttcaa gcgtaaa 117
<210> 122
<211> 35
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 21
<400> 122
atgcttgtaa tgccacagcc acccaaaccc ttcaa 35
<210> 123
<211> 87
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 22
<400> 123
atggcgagag ggagcagatc agtgggtagc agcagcagca aatggaggta ctgcaaccct 60
tcctattact tgaagcgccc aaagcgt 87
<210> 124
<211> 50
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 23
<400> 124
atggcaaatc tttggaagaa gcagagattg agagatacag gtttatgtcg 50
<210> 125
<211> 499
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 24
<400> 125
tcgtattaat cttgcccgag aacatgaggt tgaagttttt aagctaaatg aagaagtttc 60
acggttggag cagatgttag aagagcttaa tggtggtgtt ggcaataagc ctttgaagac 120
tctgaaggat gccccagaag atccagttga taaacagcga aggcagaaag taaaagaggc 180
aatgatccat gcttggagct cttatgaaaa gtatgcatgg gggaaagatg agcttcagcc 240
tcggacaaaa gatggcactg atagctttgg tggccttgga gcaactatgg tagattcttt 300
agatacactc tatataatgg gtctagatga gcagtttcaa aaagccagag agtgggttgc 360
aagctcattg gatttcgaca aggattatga cgccagtatg tttgagacaa ccataagagt 420
tgtaggcgga cttcttagtg cgtatgatct ttctggggac aaaatgttcc ttgaaaaggc 480
taaggatatt gcagacaga 499
<210> 126
<211> 837
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 25
<400> 126
actctcttcc acttcggcgt accaggaccg atctcctcac gattccttac ctccagatcc 60
aatcggatcg tcaagccacg gaagaatatt aatcgccgac ccttaaacga ttccaattca 120
ggcgccgtcg ttgatatcac aactaaagat ctatacgata ggattgagtt tcttgataca 180
gatggtggtc catggaaaca aggttggaga gttacgtata aagacgatga gtgggagaaa 240
gagaagctca aaatcttcgt tgttcctcat tctcataacg atcctggttg gaaattgact 300
gtagaggagt attatcagag acaatccaga catattcttg acaccattgt tgagacttta 360
tctaaggatt caagaagaaa gtttatatgg gaggagatgt catatctgga gagatggtgg 420
agagacgctt cacctaataa acaagaagct ttgactaaat tggttaagga tgggcagcta 480
gagattgttg gaggtggctg ggttatgaat gatgaggcta attcacatta ttttgccata 540
attgaacaga tagcagaggg taatatgtgg ctgaatgaca caattggggt tattcctaag 600
aattcttggg ctatagatcc ctttggctat tcatcaacca tggcttatct tctccggcgt 660
atgggttttg aaaacatgct tattcaaagg actcattacg agctcaagaa agaccttgcc 720
cagcataaga atcttgaata tatttggcgt cagagctggg atgctatgga aaccacagat 780
atctttgttc atatgatgcc gttttattca tacgatatcc cacacacttg tggacca 837
<210> 127
<211> 550
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 26
<400> 127
ccagacgcaa tcacagtatg cagatcgcct cagttccgct atcgaatctg agaaccattg 60
cactagtcaa atgcgaggcc tcatagatga agttagcatc aaacagtcgc ggattgttgc 120
cctcgaagat atgaagaacc gccaggacga agaacttgtg cagcttaagg atctaatcca 180
gacgtttgaa agtgccttac tatcacctat gcctgtggct gctgtagtgg ttatggcctg 240
cagtcgtgca gactatcttg aaaggactgt taaatcagtt ttaacatatc aaactcccgt 300
tgcttcaaaa tatcctctat ttatatctca ggatggatct gatcaagctg tcaagagcaa 360
gtcattgagc tataatcaat taacatatat gcagataaat gaggatgaag gctcgttttc 420
cccttttcag cacttggatt ttgaaccagt ggtcactgaa aggcctggcg aactgactgc 480
gtactacaag attgcacgta aggactggtt tctcttttct ctgcgtccct ccagctccat 540
tactgaaaca 550
<210> 128
<211> 523
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 27
<400> 128
tagaactgct ttgaatggtt cttctattga cgatgatttg gatggtttag ataaagattt 60
ggaagctaag cttaatgctt cattgctaag tgtagctaga ggtaatagaa tgtctctaag 120
gttgcataga aggaaccatt tttcgcctag aaatacggat ctgttcccgg atttggcaaa 180
agatcgtgtg gttatcgtct tgtatgtgca taatcgggct cagtattttc gagtcacagt 240
ggaaagtttg tcgaaggtta aaggtataag tgagacattg ttgattgtta gtcatgatgg 300
ttactttgaa gagatgaata ggattgtgga gagtattaag ttttgtcaag tgaaacagat 360
tttctcgcct tattcgcctc atatatatcg tactagcttc ccgggtgtga ccctgaatga 420
ttgtaagaac aagggtgatg aggcaaaggg gcattgtgaa ggtaatcctg atcagtatgg 480
gaatcatcgg tctccgaaga ttgtatcttt gaagcatcac tgg 523
<210> 129
<211> 544
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 28
<400> 129
tcactcatcg tcgttttcac cggagcagtc acagcctcct catatatacc acgtttcagt 60
gaataaccaa tcggcgattc agaaaccgtg gccgatctta ccttcttacc tcccatggac 120
gccgccgcag aggaatctac caactggctc ctgcgaaggt tacttcggga atggatttac 180
aaagagagtt gacttcctta agccgaggat tggaggagga ggagaaggaa gctggttccg 240
atgtttttac agtgagacat tacagagttc gatttgtgaa ggaaggaatc tgagaatggt 300
tccggatcgg attgttatgt cgagaggagg tgagaagtta gaggaagtta tggggaggaa 360
agaggaggag gagcttcctg cgtttcgaca aggtgcgttt gaggtagcgg aagaggtttc 420
ttcacggtta ggttttaaga gacaccgtcg ttttggtgga ggagaaggag gtagtgcggt 480
ttctcggcgg ctggtgaatg atgagatgtt gaatgaatat atgcaagaag gtggaattga 540
taga 544
<210> 130
<211> 450
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 29
<400> 130
cggctcgata acgcttcttt ggtcgatacg ttaacccatt ttttcaccaa gtcgtcgtcc 60
gatttgaaag ttgggtcagg aatagagaaa tgccaggagt ggttagagag agtggattca 120
gttacttatt ctagagattt cactaaagat ccgattttta tctctggtag taacaaggac 180
ttcaaatcgt gctctgttga ttgtgtaatg ggattcactt cagataagaa acctgatgcg 240
gcttttggat taagtcatca acctggaaca ctcagtataa tccgttccat ggaatcagca 300
cagtattacc aagagaataa tcttgctcaa gcacgacgga aaggttatga tattgtgatg 360
acaactagtc tgtcatcaga tgttcctgtt gggtattttt catgggcgga atatgatatt 420
atggctccag tgcaaccaaa aacagagaaa 450
<210> 131
<211> 616
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 30
<400> 131
tttagaattc ccatctgctt caacttcgat ggagcattca atagacccgg aaccgaaatt 60
gtctgattca acatcggatc cattcagtga tgttcttgta gcttataaaa aatgggactt 120
tgaagtgggt tgtgctcggt ttagggagaa tcataaagat gcgattttgg gtaatgttag 180
ttcgggttct ttacaagaat ttggttgtgg taagcttaag atgaagcatg ttaaggtatt 240
ggttaaaggg tggacttgga ttccggataa tttggaaaat ttgtattctt gtcgttgtgg 300
gatgacttgt ttgtggacta aatcatcggt tttggctgat tcacctgatg ctttgttgtt 360
cgagacaaca actcctccac tacagagacg tgttggagat ccgctccgtg tgtacatgga 420
gctagaggcc ggaagaaaac gctcaggccg tgaagatata ttcatcagct accatgcgaa 480
agacgatgtc caaacaactt acgccggttc gctctttcat aataacagaa actatcacat 540
ctctccacat aaaaacaatg atgttctggt gtattggtct tcctcaagat gcctccctca 600
cagagatcgt ctagca 616
<210> 132
<211> 450
<212> DNA
<213> Artificial
<220>
<223> nucleic sequence encoding SEQ ID NO: 31
<400> 132
cggctcgata aagtcgcttt ggttgatacg ttgactgatt tcttcaccca gtctccgtca 60
ctctcgcagt ctccaccggc gagatccgat cggaagaaga tcggattatt tactgatagg 120
agctgcgagg agtggttgat gagagaagat tcagttactt actctagaga ttttactaaa 180
gatccaattt ttatctctgg tggtgaaaag gactttcaat ggtgttctgt ggattgtaca 240
tttggagata gttcagggaa aacaccagat gctgcgtttg gattaggtca gaaacctgga 300
actcttagta taatacgttc catggaatca gcacagtatt atccagaaaa tgatcttgca 360
caggcacgac ggagaggtta tgatatagtg atgaccacta gtctatcatc agatgttcct 420
gttggatatt tttcgtgggc ggagtatgat 450
Claims (21)
- 서열 번호 1 내지 서열 번호 31로 구성된 그룹으로부터 선택된 아미노산 서열.
- 제1항의 아미노산 서열 및 단백질을 포함하는 재조합 단백질로서,상기 아미노산 서열은 상기 단백질의 C-말단 또는 N-말단 끝에 융합된 것임을 특징으로 하는 재조합 단백질.
- 제2항에 있어서,상기 단백질은 효소, 항체 또는 그의 부분, 리포터 단백질, 재조합 단백질, 치료적 활성 단백질을 포함하는 그룹으로부터 선택되는 것을 특징으로 하는 재조합 단백질.
- 제2항에 있어서,상기 단백질은 효소이고,상기 효소는 글리코시다제(glycosidase), 글리코실 트랜스퍼라제(glycosyl transferases), 프로테아제(protease), 키나제(kinase), 디카르복실라제(decarboxylase), 에피머라제(epimerase), 뉴클레오티드-당 운반체를 포함하는 그룹으로부터 선택되는 것을 특징으로 하는 재조합 단백질.
- 제1항의 아미노산 서열 또는 제3항 또는 제4항의 재조합 단백질을 인코딩하는 핵산 서열.
- 제5항의 핵산 서열을 포함하는 핵산 벡터.
- 제1항에 따른 하나 이상의 아미노산 서열 및/또는 제3항 또는 제4항에 따른 하나 이상의 재조합 단백질 및/또는 제6항에 따른 하나 이상의 핵산 벡터를 포함하는 식물 세포.
- 제7항에 있어서,상기 식물 세포는 제3항 또는 제4항에 따른 하나 이상의 단백질을 포함하고, 상기 단백질은 이종(heterologous) 단백질인 것을 특징으로 하는 식물 세포.
- 제1항에 따른 하나 이상의 아미노산 서열 및/또는 제3항 또는 제4항에 따른 하나 이상의 재조합 단백질 및/또는 제6항에 따른 하나 이상의 핵산 벡터를 포함하는 식물.
- 제9항에 있어서,상기 식물은 제3항 또는 제4항에 따른 하나 이상의 단백질을 포함하고, 상기 단백질은 이종 단백질인 것을 특징으로 하는 식물.
- 제9항 또는 제10항에 있어서,상기 식물은 알팔파(Alfalfa), 아라비도스프시스 탈리아나(Arabidospsis thaliana), 니코티아나 타바쿰(Nicotiana tabacum), 글라이신 맥스(Glycine max), 리코펄시콘 에스컬렌툼(Lycopersicon esculentum), 솔라넘 리코펄시쿰(Solanum lycopersicum)을 포함하는 그룹으로부터 선택되는 것을 특징으로 하는 식물.
- 번역 후 변형된 폴리펩타이드를 생산하는 방법으로서,- 제6항에 따른 하나 이상의 핵산 벡터로 세포를 트랜스펙팅(transfecting)시키거나 형질전환 시키는 단계로서, 상기 벡터는 번역 후 변형되기 전 폴리펩타이드인 재조합 단백질 또는 상기 폴리펩타이드와 다른 재조합 단백질을 인코딩하는 단계;- 트랜스펙팅된 세포를 키우는 단계; 및- 번역 후 변형된 폴리펩타이드를 수확하는 단계를 포함하며;상기 재조합 단백질이 상기 폴리펩타이드와 다른 경우 상기 방법은, 상기 폴리펩타이드를 인코딩하는 하나 이상의 핵산 벡터로 상기 세포를 트랜스펙팅하는 단계를 더 포함하는 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항에 있어서,상기 재조합 단백질은 번역 후 변형되기 전 폴리펩타이드인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항에 있어서,상기 재조합 단백질은 상기 폴리펩타이드와 다르고, 상기 재조합 단백질은 상기 폴리펩타이드를 특정하게 인지하고 결합하는 항체 또는 그의 부분인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항에 있어서,상기 재조합 단백질은 상기 폴리펩타이드와 다르고, 상기 재조합 단백질은 상기 폴리펩타이드의 번역 후 변형과 관련된 내생적(endogenous) 또는 이종 효소인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항에 있어서,상기 재조합 단백질은 상기 폴리펩타이드와 다르고, 상기 재조합 단백질은 상기 폴리펩타이드의 번역 후 변형과 관련된 효소를 조정하는 항체 또는 그의 부분인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항 내지 제16항 중 어느 한 항에 있어서,폴리펩타이드는 저장 단백질과 함께 공-발현(co-expressed)되는 것임을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항 내지 제17항 중 어느 한 항에 있어서,상기 펩타이드의 번역 후 변형은 소포체(ER) 및/또는 골지체(GA) 구획 막에서 수행되는 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항 내지 제18항 중 어느 한 항에 있어서,상기 번역 후 변형된 폴리펩타이드는 치료적 활성 단백질인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항 내지 제19항 중 어느 한 항에 있어서, 상기 세포는 식물 세포인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
- 제12항 내지 제20항 중 어느 한 항에 있어서,상기 식물 세포는 메디카고 사티바(Medicago sativa), 아라비도스프시스 탈리아나(Arabidospsis thaliana), 니코티아나 타바쿰(Nicotiana tabacum), 글라이신 맥스(Glycine max), 리코펄시콘 에스컬렌툼(Lycopersicon esculentum), 솔라넘 리코펄시쿰(Solanum lycopersicum)을 포함하는 그룹으로부터 선택된 식물에 속하는 세포인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US85752406P | 2006-11-08 | 2006-11-08 | |
US60/857,524 | 2006-11-08 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20090079258A true KR20090079258A (ko) | 2009-07-21 |
Family
ID=39364897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097011735A KR20090079258A (ko) | 2006-11-08 | 2007-11-08 | 타겟팅 발현 및 재조합 폴리펩타이드의 번역 후 변형 조절을 위한 서열 세트 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20110195452A1 (ko) |
EP (1) | EP2089526B1 (ko) |
JP (1) | JP5568702B2 (ko) |
KR (1) | KR20090079258A (ko) |
CN (1) | CN101622354A (ko) |
AU (1) | AU2007318926B2 (ko) |
BR (1) | BRPI0716711A2 (ko) |
CA (1) | CA2669455A1 (ko) |
IL (1) | IL198659A (ko) |
MX (1) | MX2009004985A (ko) |
RU (1) | RU2481399C2 (ko) |
WO (1) | WO2008056265A2 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140302999A1 (en) * | 2011-11-03 | 2014-10-09 | Magdalena Leszczyniecka | Method for determination of pharmacological properties of recombinant proteins |
FR2991996B1 (fr) * | 2012-06-13 | 2016-07-08 | Angany Genetics | Methode de production d'allergenes recombinants de haute qualite par expression transitoire chez nicotiana benthamiana |
FR3004462B1 (fr) | 2013-04-15 | 2016-04-01 | Angany Genetics | Production commerciale de peptidases c1a par expression transitoire chez les plantes |
WO2014172618A2 (en) * | 2013-04-19 | 2014-10-23 | The Board Of Trustees Of The University Of Illinois | Compositions and method for treating thrombosis |
FR3021328B1 (fr) | 2014-05-23 | 2018-01-05 | Angany Inc. | Production commerciale de l'allergene amb a1 par expression transitoire chez les plantes |
EA038931B9 (ru) * | 2014-11-20 | 2022-02-18 | Йиссум Рисерч Дивелопмент Компани Оф Зе Хебрю Юниверсити Оф Иерусалим Лтд. | Композиции и способы получения полипептидов с модифицированным профилем гликозилирования в клетках растений |
FR3054547B1 (fr) | 2016-07-29 | 2020-06-05 | Angany Inc. | Particules pseudo-virales et leurs utilisations |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2252960C2 (ru) * | 1996-12-13 | 2005-05-27 | Зингента Партисипейшнс Аг | Ген, обусловливающий устойчивость растений к болезням, и его применение |
BR0014945A (pt) * | 1999-10-21 | 2004-08-31 | Monsanto Co | Modificação pós-traducional de proteìnas recombinantes produzidas em plantas |
FR2808286B1 (fr) * | 2000-04-26 | 2004-12-17 | Agronomique Inst Nat Rech | Nouvelle glucosidase i de plante et son application a la production de proteines recombinantes a glycosylation modifiee |
NZ534880A (en) * | 2002-03-19 | 2008-04-30 | Plant Res Int Bv | Optimizing glycan processing in plants |
-
2007
- 2007-11-08 BR BRPI0716711-3A2A patent/BRPI0716711A2/pt not_active Application Discontinuation
- 2007-11-08 US US12/513,947 patent/US20110195452A1/en not_active Abandoned
- 2007-11-08 MX MX2009004985A patent/MX2009004985A/es active IP Right Grant
- 2007-11-08 JP JP2009535834A patent/JP5568702B2/ja not_active Expired - Fee Related
- 2007-11-08 EP EP07859279A patent/EP2089526B1/en active Active
- 2007-11-08 RU RU2009120298/10A patent/RU2481399C2/ru not_active IP Right Cessation
- 2007-11-08 CA CA002669455A patent/CA2669455A1/en not_active Abandoned
- 2007-11-08 CN CN200780049458A patent/CN101622354A/zh active Pending
- 2007-11-08 WO PCT/IB2007/004234 patent/WO2008056265A2/en active Application Filing
- 2007-11-08 KR KR1020097011735A patent/KR20090079258A/ko not_active Application Discontinuation
- 2007-11-08 AU AU2007318926A patent/AU2007318926B2/en not_active Ceased
-
2009
- 2009-05-07 IL IL198659A patent/IL198659A/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
WO2008056265A3 (en) | 2008-08-28 |
IL198659A0 (en) | 2011-08-01 |
MX2009004985A (es) | 2009-10-08 |
JP2010508839A (ja) | 2010-03-25 |
AU2007318926A1 (en) | 2008-05-15 |
IL198659A (en) | 2015-05-31 |
EP2089526A2 (en) | 2009-08-19 |
EP2089526B1 (en) | 2013-03-13 |
AU2007318926B2 (en) | 2013-05-02 |
CN101622354A (zh) | 2010-01-06 |
RU2481399C2 (ru) | 2013-05-10 |
CA2669455A1 (en) | 2008-05-15 |
WO2008056265A2 (en) | 2008-05-15 |
BRPI0716711A2 (pt) | 2013-10-01 |
US20110195452A1 (en) | 2011-08-11 |
JP5568702B2 (ja) | 2014-08-13 |
RU2009120298A (ru) | 2010-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101196023B1 (ko) | 식물에서 글리칸 프로세싱의 최적화 | |
Weise et al. | High‐level expression of secreted complex glycosylated recombinant human erythropoietin in the Physcomitrella Δ‐fuc‐t Δ‐xyl‐t mutant | |
JP4890712B2 (ja) | 植物における哺乳類型グリコシレーション | |
Strasser et al. | Molecular cloning and characterization of Arabidopsis thaliana Golgi α‐mannosidase II, a key enzyme in the formation of complex N‐glycans in plants | |
KR101426576B1 (ko) | 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화 | |
KR20090079258A (ko) | 타겟팅 발현 및 재조합 폴리펩타이드의 번역 후 변형 조절을 위한 서열 세트 | |
JP2018524985A (ja) | 改変されたn−およびo−グリコシル化パターンを有する糖タンパク質を産生する細胞ならびにその方法および使用 | |
Czlapinski et al. | Synthetic glycobiology: exploits in the Golgi compartment | |
Navarre et al. | N-Glycosylation of an IgG antibody secreted by Nicotiana tabacum BY-2 cells can be modulated through co-expression of human β-1, 4-galactosyltransferase | |
Dirnberger et al. | The Golgi localization of Arabidopsis thaliana β1, 2-xylosyltransferase in plant cells is dependent on its cytoplasmic and transmembrane sequences | |
US9024110B2 (en) | Methods for glyco-engineering plant cells for controlled human O-glycosylation | |
KR20090077059A (ko) | 갈락토실트랜스퍼라아제 | |
Dicker et al. | Subcellular targeting of proteins involved in modification of plant N-and O-glycosylation | |
Herman et al. | In vivo deglycosylation of recombinant glycoproteins in tobacco BY‐2 cells | |
Schoberer et al. | The tobacco GNTI stem region harbors a strong motif for homomeric protein complex formation | |
AU2016203395A1 (en) | Optimizing glycan processing in plants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |