KR20160002819A - 단백질의 제조 방법 - Google Patents
단백질의 제조 방법 Download PDFInfo
- Publication number
- KR20160002819A KR20160002819A KR1020157030530A KR20157030530A KR20160002819A KR 20160002819 A KR20160002819 A KR 20160002819A KR 1020157030530 A KR1020157030530 A KR 1020157030530A KR 20157030530 A KR20157030530 A KR 20157030530A KR 20160002819 A KR20160002819 A KR 20160002819A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- sf3b4
- ala
- seq
- glu
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 260
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 216
- 238000004519 manufacturing process Methods 0.000 title claims description 16
- 210000004027 cell Anatomy 0.000 claims abstract description 230
- 239000002773 nucleotide Substances 0.000 claims abstract description 156
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 156
- 230000014509 gene expression Effects 0.000 claims abstract description 97
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 63
- 230000001737 promoting effect Effects 0.000 claims abstract description 48
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims abstract description 47
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 38
- 239000012528 membrane Substances 0.000 claims abstract description 37
- 230000004807 localization Effects 0.000 claims abstract description 35
- 210000002729 polyribosome Anatomy 0.000 claims abstract description 23
- 102100021815 Splicing factor 3B subunit 4 Human genes 0.000 claims description 186
- 101710190372 Splicing factor 3B subunit 4 Proteins 0.000 claims description 183
- 102100023542 Ribosome-binding protein 1 Human genes 0.000 claims description 143
- 150000001413 amino acids Chemical class 0.000 claims description 101
- 238000000034 method Methods 0.000 claims description 95
- 241000282414 Homo sapiens Species 0.000 claims description 71
- 230000028327 secretion Effects 0.000 claims description 50
- 108020004414 DNA Proteins 0.000 claims description 49
- 230000006870 function Effects 0.000 claims description 45
- 230000001965 increasing effect Effects 0.000 claims description 34
- 108010035532 Collagen Proteins 0.000 claims description 33
- 101500027203 Homo sapiens MLL cleavage product C180 Proteins 0.000 claims description 31
- 102000008186 Collagen Human genes 0.000 claims description 30
- 229920001436 collagen Polymers 0.000 claims description 29
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 20
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 18
- 101000616167 Homo sapiens Splicing factor 3B subunit 4 Proteins 0.000 claims description 17
- 241000699802 Cricetulus griseus Species 0.000 claims description 16
- 241000124008 Mammalia Species 0.000 claims description 14
- 102000056470 human SF3B4 Human genes 0.000 claims description 14
- 150000007523 nucleic acids Chemical class 0.000 claims description 12
- 108020004707 nucleic acids Proteins 0.000 claims description 11
- 102000039446 nucleic acids Human genes 0.000 claims description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 10
- 241000282577 Pan troglodytes Species 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 108010067306 Fibronectins Proteins 0.000 claims description 8
- 241000282693 Cercopithecidae Species 0.000 claims description 7
- 108010022452 Collagen Type I Proteins 0.000 claims description 7
- 101000575639 Homo sapiens Ribonucleoside-diphosphate reductase subunit M2 Proteins 0.000 claims description 7
- 102100026006 Ribonucleoside-diphosphate reductase subunit M2 Human genes 0.000 claims description 7
- 230000002401 inhibitory effect Effects 0.000 claims description 7
- 238000011144 upstream manufacturing Methods 0.000 claims description 7
- 101710159080 Aconitate hydratase A Proteins 0.000 claims description 6
- 101710159078 Aconitate hydratase B Proteins 0.000 claims description 6
- 206010016654 Fibrosis Diseases 0.000 claims description 6
- 102000003886 Glycoproteins Human genes 0.000 claims description 6
- 108090000288 Glycoproteins Proteins 0.000 claims description 6
- 102000044126 RNA-Binding Proteins Human genes 0.000 claims description 6
- 101710105008 RNA-binding protein Proteins 0.000 claims description 6
- 108091081024 Start codon Proteins 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 6
- 230000004761 fibrosis Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 6
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 claims description 5
- 102000005741 Metalloproteases Human genes 0.000 claims description 4
- 108010006035 Metalloproteases Proteins 0.000 claims description 4
- 101500027201 Mus musculus MLL cleavage product C180 Proteins 0.000 claims description 4
- 101100203068 Mus musculus Sf3b4 gene Proteins 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000007792 addition Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000006467 substitution reaction Methods 0.000 claims description 4
- 229920000742 Cotton Polymers 0.000 claims description 3
- 102000016359 Fibronectins Human genes 0.000 claims description 3
- 230000004570 RNA-binding Effects 0.000 claims description 3
- 210000002821 alveolar epithelial cell Anatomy 0.000 claims description 3
- 239000008194 pharmaceutical composition Substances 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 21
- 101000614345 Homo sapiens Prolyl 4-hydroxylase subunit alpha-1 Proteins 0.000 claims 1
- 102100040477 Prolyl 4-hydroxylase subunit alpha-1 Human genes 0.000 claims 1
- 239000013613 expression plasmid Substances 0.000 abstract description 40
- 230000003248 secreting effect Effects 0.000 abstract description 27
- 230000014616 translation Effects 0.000 abstract description 14
- 230000002708 enhancing effect Effects 0.000 abstract description 12
- 210000003705 ribosome Anatomy 0.000 abstract description 6
- 238000001243 protein synthesis Methods 0.000 abstract description 5
- 230000007246 mechanism Effects 0.000 abstract description 3
- 102100022307 DNA polymerase alpha catalytic subunit Human genes 0.000 abstract 3
- 230000026447 protein localization Effects 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 48
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 44
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 40
- 108010005233 alanylglutamic acid Proteins 0.000 description 35
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 32
- 210000004379 membrane Anatomy 0.000 description 32
- 108010054155 lysyllysine Proteins 0.000 description 31
- 206010057190 Respiratory tract infections Diseases 0.000 description 28
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 26
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 26
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 26
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 24
- 108010079364 N-glycylalanine Proteins 0.000 description 24
- 108010078144 glutaminyl-glycine Proteins 0.000 description 24
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 23
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 21
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 20
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 18
- 241000282326 Felis catus Species 0.000 description 16
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 16
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 16
- 239000013604 expression vector Substances 0.000 description 16
- 239000012634 fragment Substances 0.000 description 12
- 239000002299 complementary DNA Substances 0.000 description 11
- 239000012228 culture supernatant Substances 0.000 description 11
- 238000001638 lipofection Methods 0.000 description 11
- 108010009298 lysylglutamic acid Proteins 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 108010077112 prolyl-proline Proteins 0.000 description 10
- 108010050808 Procollagen Proteins 0.000 description 9
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 9
- 229940079593 drug Drugs 0.000 description 9
- 239000003814 drug Substances 0.000 description 9
- 230000000977 initiatory effect Effects 0.000 description 9
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 8
- 210000000712 G cell Anatomy 0.000 description 8
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 8
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 8
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 8
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 8
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 8
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 8
- 108010013835 arginine glutamate Proteins 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 229930182817 methionine Natural products 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 8
- 108010026333 seryl-proline Proteins 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 101800000695 MLL cleavage product C180 Proteins 0.000 description 7
- 108010084455 Zeocin Proteins 0.000 description 7
- 230000004913 activation Effects 0.000 description 7
- 210000002950 fibroblast Anatomy 0.000 description 7
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 6
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 6
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 6
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 6
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 6
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 6
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 238000012258 culturing Methods 0.000 description 6
- 239000012091 fetal bovine serum Substances 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 108010053725 prolylvaline Proteins 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 5
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 5
- 101100244725 Caenorhabditis elegans pef-1 gene Proteins 0.000 description 5
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 5
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 230000001629 suppression Effects 0.000 description 5
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 4
- 108010076441 Ala-His-His Proteins 0.000 description 4
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 4
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 4
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 4
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 4
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 4
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 4
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 4
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 4
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 4
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 4
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 4
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 4
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 4
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 4
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 4
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 4
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 4
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 4
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 4
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 4
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 4
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 4
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 4
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 4
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 4
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 4
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 4
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 4
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 4
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 4
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 4
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 4
- QAAYIXYLEMRULP-SRVKXCTJSA-N Pro-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 QAAYIXYLEMRULP-SRVKXCTJSA-N 0.000 description 4
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 4
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 4
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 4
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 3
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 3
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 239000011668 ascorbic acid Substances 0.000 description 3
- 229960005070 ascorbic acid Drugs 0.000 description 3
- 235000010323 ascorbic acid Nutrition 0.000 description 3
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 230000001086 cytosolic effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 210000002826 placenta Anatomy 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 210000003935 rough endoplasmic reticulum Anatomy 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- BCHIXGBGRHLSBE-UHFFFAOYSA-N (4-methyl-2-oxochromen-7-yl) dihydrogen phosphate Chemical compound C1=C(OP(O)(O)=O)C=CC2=C1OC(=O)C=C2C BCHIXGBGRHLSBE-UHFFFAOYSA-N 0.000 description 2
- SCAKQYSGEIHPLV-IUCAKERBSA-N (4S)-4-[(2-aminoacetyl)amino]-5-[(2S)-2-(carboxymethylcarbamoyl)pyrrolidin-1-yl]-5-oxopentanoic acid Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SCAKQYSGEIHPLV-IUCAKERBSA-N 0.000 description 2
- HGHOBRRUMWJWCU-FXQIFTODSA-N (4s)-4-[[(2s)-2-aminopropanoyl]amino]-5-[[(2s)-3-carboxy-1-(carboxymethylamino)-1-oxopropan-2-yl]amino]-5-oxopentanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O HGHOBRRUMWJWCU-FXQIFTODSA-N 0.000 description 2
- XZKIHKMTEMTJQX-UHFFFAOYSA-N 4-Nitrophenyl Phosphate Chemical compound OP(O)(=O)OC1=CC=C([N+]([O-])=O)C=C1 XZKIHKMTEMTJQX-UHFFFAOYSA-N 0.000 description 2
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 2
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 2
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 2
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 2
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 2
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 2
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 2
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 2
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 2
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 2
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 2
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 2
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- HIMXTOIXVXWHTB-DCAQKATOSA-N Arg-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HIMXTOIXVXWHTB-DCAQKATOSA-N 0.000 description 2
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 2
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 2
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 2
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 2
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 2
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 2
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 2
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 2
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 2
- KCOPOPKJRHVGPE-AQZXSJQPSA-N Asp-Thr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O KCOPOPKJRHVGPE-AQZXSJQPSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 2
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 2
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 2
- FEJCUYOGOBCFOQ-ACZMJKKPSA-N Cys-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N FEJCUYOGOBCFOQ-ACZMJKKPSA-N 0.000 description 2
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 2
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 2
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 2
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 2
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 2
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 2
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 2
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 2
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 2
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 2
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 2
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 2
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 2
- NMYFPKCIGUJMIK-GUBZILKMSA-N Gln-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NMYFPKCIGUJMIK-GUBZILKMSA-N 0.000 description 2
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 2
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- XFHMVFKCQSHLKW-HJGDQZAQSA-N Gln-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XFHMVFKCQSHLKW-HJGDQZAQSA-N 0.000 description 2
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 2
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 2
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 2
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- LSTFYPOGBGFIPP-FXQIFTODSA-N Glu-Cys-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O LSTFYPOGBGFIPP-FXQIFTODSA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 2
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 2
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 2
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 2
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 2
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 2
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 2
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 2
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 2
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 2
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 2
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 2
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 2
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 2
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 2
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 2
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 2
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- DKEZVKFLETVJFY-CIUDSAMLSA-N Leu-Cys-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DKEZVKFLETVJFY-CIUDSAMLSA-N 0.000 description 2
- LJKJVTCIRDCITR-SRVKXCTJSA-N Leu-Cys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LJKJVTCIRDCITR-SRVKXCTJSA-N 0.000 description 2
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 2
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 2
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 2
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 2
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- JBRWKVANRYPCAF-XIRDDKMYSA-N Lys-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N JBRWKVANRYPCAF-XIRDDKMYSA-N 0.000 description 2
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 2
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 2
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 2
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 2
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 2
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 2
- 108091027974 Mature messenger RNA Proteins 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- DBOMZJOESVYERT-GUBZILKMSA-N Met-Asn-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N DBOMZJOESVYERT-GUBZILKMSA-N 0.000 description 2
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 2
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 2
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 2
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 2
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- OKQQWSNUSQURLI-JYJNAYRXSA-N Phe-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N OKQQWSNUSQURLI-JYJNAYRXSA-N 0.000 description 2
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 2
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 2
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 2
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 2
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 2
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 2
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 2
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 2
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 2
- 102000015097 RNA Splicing Factors Human genes 0.000 description 2
- 108010039259 RNA Splicing Factors Proteins 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 2
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 2
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 2
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 2
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 2
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 2
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 2
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 2
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 2
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 2
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 2
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 2
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 2
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 2
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 2
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 2
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 2
- KLCCPYZXGXHAGS-QTKMDUPCSA-N Thr-His-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N)O KLCCPYZXGXHAGS-QTKMDUPCSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 2
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 2
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 2
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 2
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- DTPWXZXGFAHEKL-NWLDYVSISA-N Trp-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DTPWXZXGFAHEKL-NWLDYVSISA-N 0.000 description 2
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 2
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 2
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 2
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 2
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- HVRRJRMULCPNRO-BZSNNMDCSA-N Val-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 HVRRJRMULCPNRO-BZSNNMDCSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 108010084217 alanyl-glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010029483 alpha 1 Chain Collagen Type I Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 229940125644 antibody drug Drugs 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000016784 immunoglobulin production Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010059573 lysyl-lysyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 229920001542 oligosaccharide Polymers 0.000 description 2
- 150000002482 oligosaccharides Chemical class 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 230000018552 positive regulation of protein secretion Effects 0.000 description 2
- 230000024715 positive regulation of secretion Effects 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 210000001324 spliceosome Anatomy 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 101150008656 COL1A1 gene Proteins 0.000 description 1
- 101150082216 COL2A1 gene Proteins 0.000 description 1
- FMOPHFSPINWSOV-QGZVFWFLSA-N C[C@@H](CC(=O)O)CCCOC1=C(C=CC=C1)CN1C(=NC=C1C)C1=CC=C(C=C1)C(F)(F)F Chemical compound C[C@@H](CC(=O)O)CCCOC1=C(C=CC=C1)CN1C(=NC=C1C)C1=CC=C(C=C1)C(F)(F)F FMOPHFSPINWSOV-QGZVFWFLSA-N 0.000 description 1
- 101100449641 Chlorobium chlorochromatii (strain CaD3) hemL gene Proteins 0.000 description 1
- 101100091691 Chlorobium chlorochromatii (strain CaD3) rpoA gene Proteins 0.000 description 1
- 102000000503 Collagen Type II Human genes 0.000 description 1
- 108010041390 Collagen Type II Proteins 0.000 description 1
- 102000001187 Collagen Type III Human genes 0.000 description 1
- 108010069502 Collagen Type III Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- 101000707770 Homo sapiens Splicing factor 3B subunit 2 Proteins 0.000 description 1
- 201000009794 Idiopathic Pulmonary Fibrosis Diseases 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- 102000007547 Laminin Human genes 0.000 description 1
- 108010085895 Laminin Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000029749 Microtubule Human genes 0.000 description 1
- 108091022875 Microtubule Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 102100031436 Splicing factor 3B subunit 2 Human genes 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000006986 U2 Small Nuclear Ribonucleoprotein Human genes 0.000 description 1
- 108010072724 U2 Small Nuclear Ribonucleoprotein Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- -1 ascorbic acid phosphate ester Chemical class 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 230000037319 collagen production Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 102000038379 digestive enzymes Human genes 0.000 description 1
- 108091007734 digestive enzymes Proteins 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 210000002907 exocrine cell Anatomy 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 208000036971 interstitial lung disease 2 Diseases 0.000 description 1
- 210000005061 intracellular organelle Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 210000004688 microtubule Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001343 mnemonic effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 210000002955 secretory cell Anatomy 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000003381 solubilizing effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/39—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/395—Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70546—Integrin superfamily
- C07K14/70553—Integrin beta2-subunit-containing molecules, e.g. CD11, CD18
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/78—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Cell Biology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pulmonology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
고효율의 단백질 합성에는 mRNA 에 다수의 리보솜이 부착된 폴리솜 형성의 촉진이 매우 효과적이라고 생각되고 있었지만, p180 단백질의 폴리솜 형성의 촉진 기능의 기구는 분명하지 않았다.
본 출원의 발명자들은, p180 단백질의 폴리솜 형성 촉진 기능의 책임 영역인 coiled-coil 도메인과 특이적으로 상호작용하는 단백질, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질로서의 SF3b4 단백질을 새롭게 찾아내고, 그리고 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질 (예를 들어, SF3b4 단백질) 과 p180 단백질의 양방을 고발현하는 세포에 있어서, mRNA 의 소포체 상에의 국재화가 현저하게 상승해, 배양 세포의 분비 기능을 상승시키는 것이 가능해지는 것을 밝혀냈다. 또, 발현 플라스미드 중에도 특정 뉴클레오티드 배열을 삽입함으로써, 단백질 발현 증강 효과가 있는 SF3b4 단백질을 소포체막 상에 국재화, 및 폴리솜 중 mRNA 를 중량화 시프트시키는 것이 가능해지고, 이것을 통하여 세포의 분비능을 증강 가능한 것이 나타났다.
본 출원의 발명자들은, p180 단백질의 폴리솜 형성 촉진 기능의 책임 영역인 coiled-coil 도메인과 특이적으로 상호작용하는 단백질, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질로서의 SF3b4 단백질을 새롭게 찾아내고, 그리고 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질 (예를 들어, SF3b4 단백질) 과 p180 단백질의 양방을 고발현하는 세포에 있어서, mRNA 의 소포체 상에의 국재화가 현저하게 상승해, 배양 세포의 분비 기능을 상승시키는 것이 가능해지는 것을 밝혀냈다. 또, 발현 플라스미드 중에도 특정 뉴클레오티드 배열을 삽입함으로써, 단백질 발현 증강 효과가 있는 SF3b4 단백질을 소포체막 상에 국재화, 및 폴리솜 중 mRNA 를 중량화 시프트시키는 것이 가능해지고, 이것을 통하여 세포의 분비능을 증강 가능한 것이 나타났다.
Description
본 출원은, 재조합 세포에 있어서의 외래성 유전자로부터의 단백질의 발현을 항진하기 위한, 재조합 세포, 그리고 그와 같은 세포를 이용한 발명에 관한 것이다. 보다 구체적으로는, p180 단백질의 발현, 및/또는 SF3b4 단백질의 발현이 모두 항진된 세포, 또는 그와 같은 특징을 갖는 세포를 이용한, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 방법을 제공하는 것에 관한 것이다. 상기 특징을 갖는 세포를 이용한, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 방법에 있어서는, 목적물인 단백질 발현을 위한 벡터 중에서 cis-엘리먼트를 이용하는 것도 또, 특징으로 한다.
유전자 재조합 기술을 응용한 바이오 테크놀러지 의약품은, 최근, 특히 항체 의약품 시장이 급속히 확대되는 가운데, 그 의료비에 대한 부하도 위구되도록 되어 있어, 종래보다 효율적으로 단백질 생산을 실시할 수 있고, 그리고 비용이 보다 낮은 바이오 테크놀러지 의약품의 제조 기술의 개발이 항상 요구되고 있다.
유전자 재조합 기술을 이용한 단백질 생산을 위한 숙주로는, 지금까지, 동물 세포, 효모, 대장균 등이 이용되고 있다. 대장균 등은, 목적물로서의 단백질을 저비용으로 생산할 수 있지만, 당사슬 수식 등의 번역 후 수식을 실시할 수 없어, 당단백질의 생산에는 적합하지 않다. 또, 대장균에서는 생산한 단백질을 포함하는 봉입체를 만들기 쉬운 성질이 있어, 목적물로서의 단백질의 취득에는, 합성 후에 추가로 가용화 프로세스가 필요해져, 작업 부하가 높다는 결점이 존재한다.
특히, 항체 등의 당단백질의 경우, 부가된 당사슬이, 목적물로서의 단백질의 수용성, 프로테아제에 대한 저항성, 조직 표적성, 나아가서는 그 생물 활성에도 영향을 주기 때문에, 고등 진핵생물인 동물 세포를 사용한 생산 기술이 필요로 되고, 최근 그 기술은 크게 진보하였다. 그러한 상황 아래, 현재의 항체 의약품의 상당수는 Chinese Hamster Ovary (CHO) 세포로 생산되고 있지만, 그 제조 프로세스의 최적화는 여전히 중요한 과제이다.
포유 동물 세포를 포함하는 진핵생물 세포로부터 세포 밖으로 분비되는 단백질은, 내막으로 구획된 세포 내 소기관인 소포체에 있어서 합성된다. 소포체는, RNA-단백질의 거대 복합체로 이루어지는 단백질 합성 장치인 리보솜을 표면에 갖는 조면 소포체와, 리보솜이 없는 활면 소포체의 2 종으로 크게 구별되지만, 조면 소포체의 자세한 형성 기구는 분명하지 않다.
생체 내에는, 특정 단백질의 분비에 전문적으로 종사하는 분비 전문 세포 (professional secretory cells) 가 존재하고, 그들 세포에 있어서는 조면 소포체가 현저하게 발달하여 있어, 고효율의 단백질 생산을 가능하게 하고 있다고 생각된다. 예로는 콜라겐을 분비하는 선유아세포, 소화 효소군을 분비하는 췌장선방외분비세포 등이, 그러한 분비 전문 세포에 해당한다. 이들 분비 전문 세포와 비교해, 현재 유전자 공학적 단백질 생산에 많이 이용되고 있는 CHO 세포, HEK293 세포 등의 조면 소포체는 매우 소량이고, 분비 활성이 낮다는 문제가 있다.
유전자 재조합 기술을 이용하여 바이오 테크놀러지 의약품을 생산할 때에는, 목적물인 단백질의 유전자는 발현 벡터 중에서 높은 전사 활성을 나타내는 프로모터의 제어화에 있고, 그 mRNA 는 고레벨로 발현하고 있다고 예상된다. 그러나, 그러한 상황하에 있어서도, mRNA 레벨과 단백질 발현량 그 자체가 상관하지 않는 경우도 자주 있고, 그 일요인으로서 소포체막 상에서의 번역 효율이 낮은 것을 들 수 있다.
즉, 현재 이들 유전자 공학적 단백질 생산에 많이 이용되고 있는 세포에 있어서도, mRNA 를 소포체막 상에서의 번역 장치에 대해 이용하기 쉬운 형태로 제공할 수 있으면, 선유아세포의 경우와 마찬가지로, 단백질 합성능을 한층 증강시킬 수 있는 여지가 남아 있다고 생각되는 것을 의미하고 있다.
콜라겐을 항상적으로 분비하고 있는 선유아세포에서는, 콜라겐 단백질을 코드하는 mRNA 는 항상 고레벨로 발현하고 있고, 그 대부분이 분비 단백질의 생합성의 장인 소포체막 상에서 검출되는 것이 알려져 있다 (비특허문헌 1). 그러나, 콜라겐 합성을 활성화시키기 위해서는 그 mRNA 가 소포체 상에 존재하는 것만으로는 불충분하여, 번역 효율이 높은 폴리솜을 형성시키는 것이 필요하게 된다.
발명자들의 지금까지의 해석에 의해, 콜라겐 유전자 등의 일부 단백질의 mRNA 에는, 단백질 합성 장치인 리보솜이 복수 부착된 폴리솜이 형성되기 쉬운 성질을 구비하는 것이 밝혀져 있다 (특허문헌 1, 비특허문헌 2). 이들로부터, 유전자 재조합 기술을 이용하여 바이오 테크놀러지 의약품을 생산할 때에, 목적 단백질을 코드하는 유전자 전사 산물이 고레벨로 발현하고 있는 것에 관계없이, 그 단백질 합성/분비량이 낮은 문제가 생기는 것은, 이용되고 있는 세포에 있어서 mRNA 가 소포체막 상에서의 번역 장치에 이용하기 쉬운 형태로 제공되고 있지 않을 가능성이 추측되었다.
Ueno, T., et al., (2010). J Biol Chem 285(39), 29941-50.
Ueno, T., et al., (2012). Regulation of polysome assembly on the endoplasmic reticulum by a coiled-coil protein, p180. Nucleic Acids Res.
소포체에 있어서의 단백질 합성에 있어서 소포체에의 mRNA 의 국재화 (폴리솜 형성) 가 필수이다. 또한 고효율의 단백질 합성에는 mRNA 에 다수의 리보솜이 부착된 폴리솜 형성의 촉진이 매우 효과적이라고 생각되고 있었지만, p180 단백질의 폴리솜 형성의 촉진 기능의 기구는 분명하지 않았다.
본 출원의 발명자들은, 상세한 해석을 진행한 결과, p180 단백질의 폴리솜 형성 촉진 기능의 책임 영역인 coiled-coil 도메인 (비특허문헌 2) 과 특이적으로 상호작용해, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질을 새롭게 찾아냈다. 그리고, SF3b4 단백질과 p180 단백질의 양방을 고발현하는 세포를 작출한 바, 그와 같은 특징을 갖는 세포에 있어서, mRNA 의 소포체 상에의 국재화가 현저하게 상승해, 배양 세포의 분비 기능을 상승시키는 것이 가능해지는 것을 밝혔다. 그 결과, 본원 발명을 완성하기에 이르렀다.
본 발명의 발명자들은, 세포에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현, 그리고 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현이 항진된, 세포 내에서의 목적물로서의 단백질의 합성능 또는 분비능이 항진된 재조합 세포를 제공할 수 있는 것을 나타냈다.
본 발명의 발명자들은 또, 본 발명의 제 2 양태에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현을 항진시키고, 그리고 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현을 항진시킨 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시킴으로써, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 방법을 제공할 수 있는 것을 나타냈다.
본 발명에 있어서는, 이와 같은 특징적인 재조합 세포를 제공하거나, 혹은 그러한 특징적인 재조합 세포를 이용하여, 목적물로서의 단백질의 합성능 또는 분비능을 항진시킴으로써, 상기 서술한 과제를 해결할 수 있는 것을 나타냈다.
[1] 세포에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현, 또는 이들 양방의 발현이 모두 항진된, 세포 내에서의 목적물로서의 단백질의 합성능 또는 분비능이 항진된 재조합 세포.
[2] p180 단백질이,
(a) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 과 적어도 70 % 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(b) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(c) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 적어도 70 % 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(d) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질, 및
(e) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질
로 이루어지는 군에서 선택되는, [1] 에 기재된 재조합 세포.
[3] p180 단백질이 포유 동물 유래의 것인, [1] 또는 [2] 에 기재된 재조합 세포.
[4] 포유 동물의 p180 단백질의 전체 길이 또는 그 부분이, 인간 p180 단백질 (SEQ ID NO : 2), 마우스 p180 단백질 (GenBank Accession No. NP_077243), 래트 p180 단백질 (GenBank Accession No. XP_230637), 차이니즈 햄스터 p180 단백질 (GenBank Accession No. XM_003496471), 개 p180 단백질 (GenBank Accession No. NP_001003179), 말 p180 단백질 (GenBank Accession No. XP_001915027), 원숭이 p180 단백질 (GenBank Accession No. XP_002798281), 침팬지 p180 단백질 (GenBank Accession No. XP_514527), 돼지 p180 단백질 (GenBank Accession No. XP_001926148), 또는 그들의 부분인, [3] 에 기재된 재조합 세포.
[5] p180 단백질의 부분이, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 945 ∼ 1540 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분에서 선택되는, [1] ∼ [4] 중 어느 한 항에 기재된 재조합 세포.
[6] mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질이, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분 (SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 으로 이루어지는 군에서 선택되는, [1] ∼ [5] 중 어느 한 항에 기재된 재조합 세포.
[7] SF3b4 단백질이,
(i) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 과 적어도 70 % 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(ii) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(iii) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 적어도 70 % 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(iv) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(v) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질
로 이루어지는 군에서 선택되는, [6] 에 기재된 재조합 세포.
[8] SF3b4 단백질이 포유 동물 유래의 것인, [6] 또는 [7] 에 기재된 재조합 세포.
[9] 포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분이, 인간 SF3b4 단백질 (SEQ ID NO : 4), 마우스 SF3b4 단백질 (GenBank Accession No. NP_694693.1), 래트 SF3b4 단백질 (GenBank Accession No. NP_001011951.1), 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1), 개 SF3b4 단백질 (GenBank Accession No. XP_540295.3), 말 SF3b4 단백질 (GenBank Accession No. XP_001488649.2), 원숭이 SF3b4 단백질 (GenBank Accession No. NP_001097793.1), 침팬지 SF3b4 단백질 (GenBank Accession No. XP_513768.2), 돼지 SF3b4 단백질 (GenBank Accession No. XP_001926524.1), 또는 그들의 부분인, [8] 에 기재된 재조합 세포.
[10] 목적물로서의 단백질의 합성능 또는 분비능이, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시킴으로써 항진된, [1] ∼ [9] 중 어느 한 항에 기재된 재조합 세포.
[11] 수탁 번호 NITE BP-01753 (CHO 3D5), 수탁 번호 NITE BP-1535 (CHO YA7), 또는 수령 번호 NITE ABP-01811 (CHO 1B2) 에 의해 나타내는, 세포주.
[12] p180 단백질의 전체 길이 또는 그 부분의 발현을 항진시키고, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현을 항진시키고, 또는 이들 단백질 양방의 발현을 항진시킨 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시키는 것에 의한, 목적물로서의 단백질을 제조하는 방법.
[13] p180 단백질이 포유 동물 유래의 것인, [12] 에 기재된 방법.
[14] 포유 동물의 p180 단백질의 전체 길이 또는 그 부분이, 인간 p180 단백질 (SEQ ID NO : 2), 마우스 p180 단백질 (GenBank Accession No. NP_077243), 래트 p180 단백질 (GenBank Accession No. XP_230637), 차이니즈 햄스터 p180 단백질 (GenBank Accession No. XM_003496471), 개 p180 단백질 (GenBank Accession No. NP_001003179), 말 p180 단백질 (GenBank Accession No. XP_001915027), 원숭이 p180 단백질 (GenBank Accession No. XP_002798281), 침팬지 p180 단백질 (GenBank Accession No. XP_514527), 돼지 p180 단백질 (GenBank Accession No. XP_001926148), 또는 그들의 부분인, [13] 에 기재된 방법.
[15] 포유 동물의 p180 단백질의 부분이, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역을 포함하는 부분, 945 ∼ 1540 번 아미노산으로 이루어지는 영역을 포함하는 부분에서 선택되는, [13] 또는 [14] 에 기재된 방법.
[16] mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질이, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분 (SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 으로 이루어지는 군에서 선택되는, [12] ∼ [15] 중 어느 한 항에 기재된 방법.
[17] SF3b4 단백질이 포유 동물 유래의 것인, [16] 에 기재된 방법.
[18] 포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분이, 인간 SF3b4 단백질 (SEQ ID NO : 4), 마우스 SF3b4 단백질 (GenBank Accession No. NP_694693.1), 래트 SF3b4 단백질 (GenBank Accession No. NP_001011951.1), 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1), 개 SF3b4 단백질 (GenBank Accession No. XP_540295.3), 말 SF3b4 단백질 (GenBank Accession No. XP_001488649.2), 원숭이 SF3b4 단백질 (GenBank Accession No. NP_001097793.1), 침팬지 SF3b4 단백질 (GenBank Accession No. XP_513768.2), 돼지 SF3b4 단백질 (GenBank Accession No. XP_001926524.1), 또는 그들의 부분인, [17] 에 기재된 방법.
[19] 재조합 세포가, 수탁 번호 NITE BP-01753 (CHO 3D5), 수탁 번호 NITE BP-1535 (CHO YA7), 또는 수령 번호 NITE ABP-01811 (CHO 1B2) 에 의해 나타내는 세포주인, [12] ∼ [18] 중 어느 한 항에 기재된 방법.
[20] 목적물로서의 단백질이, 당단백질인, [12] ∼ [19] 중 어느 한 항에 기재된 방법.
[21] 목적물로서의 단백질이, 콜라겐, 피브로넥틴 또는 항체인, [20] 에 기재된 방법.
[22] 목적물로서의 단백질을 발현하기 위한 발현 유닛 중, 프로모터의 하류이고 또한 목적물로서의 단백질을 코드하는 DNA 의 뉴클레오티드 배열의 개시 코돈의 상류에, RNA 결합 단백질이 인식/결합 (혹은 상호작용) 하는 cis-엘리먼트를 삽입함으로써, 발현계 세포 내에 있어서의 목적물로서의 단백질의 발현량을 증대시키는 방법.
[23] cis-엘리먼트가, RNA 인식 모티프 (RRM) 형 RNA 결합 단백질이 인식/결합 (혹은 상호작용) 하는 것인, [22] 에 기재된 방법.
[24] cis-엘리먼트가, SF3b4 단백질의 RNA 인식 모티프 (RRM) 가 인식/결합 (혹은 상호작용) 하는 것인, [23] 에 기재된 방법.
[25] cis-엘리먼트의 뉴클레오티드 배열이, 1 또는 몇 개의 9 mer ∼ 12 mer 의 배열 모티프 GAN1-(X)n-ACN2 (n = 3 ∼ 6) (N1 및 N2 는 독립적으로 A, T, C, G 중 어느 뉴클레오티드여도 된다) 를 포함하는 것인, [22] ∼ [24] 중 어느 하나에 기재된 방법.
[26] cis-엘리먼트의 뉴클레오티드 배열이, 1 또는 몇 개의 9 mer ∼ 12 mer 의 배열 모티프 (GAG-(X)n-ACV (n = 3 ∼ 6) (V 는 A 또는 G 또는 C 를 나타낸다), SEQ ID NO : 17 ∼ 20) 를 포함하는 것인, [25] 에 기재된 방법.
[27] cis-엘리먼트의 뉴클레오티드 배열이, 타입 I 콜라겐 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 피브로넥틴 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 매트릭스 메탈로프로테아제 14 (MMP14) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A2 (P4HA2) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A1 (P4HA1) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열로 이루어지는 군에서 선택되는 배열인, [22] ∼ [26] 중 어느 한 항에 기재된 방법.
[28] cis-엘리먼트의 뉴클레오티드 배열이, SEQ ID NO : 5 의 전체 길이 또는 SEQ ID NO : 7 의 전체 길이 외, SEQ ID NO : 5 중 1 ∼ 102 번 뉴클레오티드, 1 ∼ 78 번 뉴클레오티드, 1 ∼ 60 번 뉴클레오티드, 61 ∼ 126 번 뉴클레오티드, 16 ∼ 57 번 뉴클레오티드, 79 ∼ 126 번 뉴클레오티드, 103 ∼ 126 번 뉴클레오티드, 58 ∼ 78 번 뉴클레오티드, 51 ∼ 78 번 뉴클레오티드, 1 ∼ 27 번 뉴클레오티드, 70 ∼ 78 번 뉴클레오티드로 이루어지는 군에서 선택되는 어느 배열인 [22] ∼ [27] 중 어느 한 항에 기재된 방법.
[29] 발현계 세포가, 손상되지 않은 숙주 세포, p180 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, SF3b4 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, 또는 이들 양방의 발현이 모두 항진된 세포인, [22] ∼ [28] 중 어느 한 항에 기재된 방법.
[30] SF3b4 를 기능 저해 또는 발현 억제함으로써, 콜라겐 합성을 억제해, 이상 콜라겐에 의한 폐포 상피, 섬유증의 중증화를 방지하기 위한 의약 조성물.
p180 단백질의 전체 길이 또는 그 부분의 발현, 및/또는 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질 (예를 들어, SF3b4 단백질의 전체 길이 또는 그 부분) 의 발현이 항진된 본 발명의 재조합 세포를 이용하여, 목적물로서의 단백질을 코드하는 DNA 를 형질 전환하면, 목적물로서의 단백질의 합성능 또는 분비능이, 비약적으로 증가하고, 목적물로서의 단백질을 효율적으로 제조하는 것이 밝혀졌다. 또한, cis-엘리먼트를 발현 유닛 내에 부가하면, 단백질 발현 증강 효과가 있는 SF3b4 단백질을 소포체막 상에 국재화, 및 폴리솜 중 mRNA 를 중량화 시프트시키는 것이 가능해지고, 이것을 통하여 세포의 분비능을 증강 가능한 것이 나타났다.
도 1 은, 실시예 1 에 있어서 조제한 각 세포 (CHO 세포, CHO 3D5 세포, CHO 5g 세포, 그리고 CHO YA7 세포) 에 관해서, 세포 내에 있어서의 p180 단백질의 발현과 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질인 SF3b4 단백질의 발현을 웨스턴 블롯에 의해 조사한 결과를 나타내는 도면이다.
도 2 는, 실시예 1 에 있어서 조제한 각 세포에 대해, 분비 마커인 인간 태반 유래 분비형 알칼리 포스파타아제 (SEAP) 의 발현 플라스미드를 외래성으로 도입한 경우의, SEAP 단백질의 발현 결과를 비교해 나타낸 도면이다.
도 3 은, 실시예 1 에 있어서 조제한 각 세포에 대해, 분비 마커인 인간 태반 유래 분비형 알칼리 포스파타아제 (SEAP) 의 발현 플라스미드를 외래성으로 도입한 경우의, SEAP mRNA 의 막 획분에의 국재화의 정도를 비교해 나타낸 도면이다.
도 4 는, cis-엘리먼트를 포함하는 발현 벡터의 인서트 부분의 개략도 (A) 그리고 cis-엘리먼트의 분비 활성화능을 평가한 결과 (B 및 C) 를 나타내는 도면이다.
도 5 는, 콜라겐을 발현시킨 경우의 단백질의 분비 활성의 변화를 나타내는 도면이다.
도 6 은, cis-엘리먼트를 삽입함으로써, 항체의 분비 활성화가 생기는 것을 나타내는 도면이다.
도 7 은, kozak 배열과 cis-엘리먼트 #1 의 분비 활성화에 대한 효과를 CHO 세포 및 CHO YA7 세포를 이용하여 비교한 도면이다.
도 8 은, cis-엘리먼트 #1, cis-엘리먼트 #2, cis-엘리먼트 #3, 및 cis-엘리먼트 #4 를 사용하여, cis-엘리먼트의 구조와 단백질 발현 증강 작용의 관련성을 나타낸 도면이다.
도 9 는, cis-엘리먼트 내의 모티프의 일례가, GAG-(X)n-ACN2 (n = 3 ∼ 6) 인 것 (A), 및 각 엘리먼트의 SEAP 분비 활성을 평가하는 도면인 것 (B) 을 나타내는 도면이다.
도 10 은, 모티프 GAN1-(X)n-ACN2 의 뉴클레오티드에 있어서의, 치환, 결실, 삽입에 의한, 그 모티프의 활성에의 영향을 조사한 도면이다.
도 11 은, SF3b4 의 발현 억제에 수반해 콜라겐의 산생이 현저하게 억제되는 것을 나타내는 도면이다.
도 12 는, cis-엘리먼트를 포함하지 않는 경우와 비교해, cis-엘리먼트를 포함하는 경우에, 폴리솜 획분 중의 COL1A1 cDNA 의 중량이 고밀도측으로 시프트하는 것을 나타내는 도면이다.
도 2 는, 실시예 1 에 있어서 조제한 각 세포에 대해, 분비 마커인 인간 태반 유래 분비형 알칼리 포스파타아제 (SEAP) 의 발현 플라스미드를 외래성으로 도입한 경우의, SEAP 단백질의 발현 결과를 비교해 나타낸 도면이다.
도 3 은, 실시예 1 에 있어서 조제한 각 세포에 대해, 분비 마커인 인간 태반 유래 분비형 알칼리 포스파타아제 (SEAP) 의 발현 플라스미드를 외래성으로 도입한 경우의, SEAP mRNA 의 막 획분에의 국재화의 정도를 비교해 나타낸 도면이다.
도 4 는, cis-엘리먼트를 포함하는 발현 벡터의 인서트 부분의 개략도 (A) 그리고 cis-엘리먼트의 분비 활성화능을 평가한 결과 (B 및 C) 를 나타내는 도면이다.
도 5 는, 콜라겐을 발현시킨 경우의 단백질의 분비 활성의 변화를 나타내는 도면이다.
도 6 은, cis-엘리먼트를 삽입함으로써, 항체의 분비 활성화가 생기는 것을 나타내는 도면이다.
도 7 은, kozak 배열과 cis-엘리먼트 #1 의 분비 활성화에 대한 효과를 CHO 세포 및 CHO YA7 세포를 이용하여 비교한 도면이다.
도 8 은, cis-엘리먼트 #1, cis-엘리먼트 #2, cis-엘리먼트 #3, 및 cis-엘리먼트 #4 를 사용하여, cis-엘리먼트의 구조와 단백질 발현 증강 작용의 관련성을 나타낸 도면이다.
도 9 는, cis-엘리먼트 내의 모티프의 일례가, GAG-(X)n-ACN2 (n = 3 ∼ 6) 인 것 (A), 및 각 엘리먼트의 SEAP 분비 활성을 평가하는 도면인 것 (B) 을 나타내는 도면이다.
도 10 은, 모티프 GAN1-(X)n-ACN2 의 뉴클레오티드에 있어서의, 치환, 결실, 삽입에 의한, 그 모티프의 활성에의 영향을 조사한 도면이다.
도 11 은, SF3b4 의 발현 억제에 수반해 콜라겐의 산생이 현저하게 억제되는 것을 나타내는 도면이다.
도 12 는, cis-엘리먼트를 포함하지 않는 경우와 비교해, cis-엘리먼트를 포함하는 경우에, 폴리솜 획분 중의 COL1A1 cDNA 의 중량이 고밀도측으로 시프트하는 것을 나타내는 도면이다.
본 발명의 발명자들은, 본 발명의 제 1 양태에 있어서, 세포에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현 및/또는 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분의 발현이 모두 항진된, 세포 내에서의 목적물로서의 단백질의 합성능 또는 분비능이 항진된 재조합 세포를 제공할 수 있는 것을 나타냈다.
본 발명의 이 양태에 있어서, p180 단백질의 전체 길이 또는 부분 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을 양방 모두 세포 중에서 발현시킴으로써, 그 세포 내의 소포체막 상에서의 목적물로서의 단백질을 코드하는 핵산 분자의 발현 산물인 mRNA 가 관여하는 폴리솜 형성을 촉진할 수 있다. 여기서, 폴리솜은, 세포 내의 소포체막 상에 존재하는 복수의 리보솜에 대해, 1 분자의 mRNA 가 결합한 것을 말한다. 이와 같은 폴리솜 형성 촉진의 결과로서, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조할 수 있다.
본 발명의 상기 서술한 재조합 세포는, 세포에 있어서, p180 단백질, 특히 포유 동물의 p180 단백질의 전체 길이 또는 그 부분의 발현이 항진되어 있는 것을 제 1 특징으로 하고 있다. p180 단백질이란, 필수의 소포체막 단백질이고, 그리고 분비 조직 중에서 많이 발현되고 있고, 폴리솜 형성을 촉진할 수 있는 단백질이다.
여기서, p180 단백질의 아미노산 배열을, 인간의 p180 단백질 (GenBank Accession No. AB287347) 과 비교한 경우, 마우스의 p180 단백질은 87 % 의 유사성, 래트의 p180 단백질은 87 % 의 유사성, 차이니즈 햄스터의 p180 단백질은 88 % 의 유사성, 개의 p180 단백질은 91 % 의 유사성, 말의 p180 단백질은 89 % 의 유사성, 원숭이의 p180 단백질은 91 ∼ 92 % 의 유사성, 침팬지의 p180 단백질은 98 % 의 유사성, 돼지의 p180 단백질은 86 % 의 유사성을, 각각 갖는 것이 알려져 있고, 포유 동물의 p180 단백질은 모두, 아미노산 유사성으로 84 % 이상의 범위 내에, 그 이외의 생물의 p180 단백질로까지 범위를 넓혀도 아미노산 유사성으로 76 % 이상의 범위 내에, 포함되는 것이 보고되어 있다.
[표 1-1]
[표 1-2]
따라서, 본 발명에 있어서 「p180 단백질」이라고 하는 경우,
(a) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 과 적어도 70 % 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(b) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(c) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 적어도 70 % 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(d) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(e) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질
을 말한다.
이 양태의 (a) 에 있어서, 아미노산 배열 동일성에 관해서, 「인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 과 적어도 70 % 의 배열 동일성을 갖는다」라고 하는 경우, 배열 동일성의 % 값은, 70 % ∼ 100 % 사이의 어느 값을 선택해도 되고, 예를 들어 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, 100 % 등의 배열 동일성의 % 값을 선택할 수 있다.
이 양태의 (b) 에 있어서, 「1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가」라고 하는 경우, 결실, 치환, 또는 부가되는 아미노산수는 1 ∼ 10 개 정도까지인 것을 의미하고, 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개의 아미노산의 수를 선택할 수 있다.
이 양태의 (c) 에 있어서, 「인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 적어도 70 % 의 배열 동일성을 갖는다」라고 하는 경우, 배열 동일성의 % 값은, 70 % ∼ 100 % 사이의 어느 값을 선택해도 되고, 예를 들어 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, 100 % 등의 배열 동일성의 % 값을 선택할 수 있다.
이 양태의 (d) 에 있어서, 「1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가」라고 하는 경우, 결실, 치환, 또는 부가되는 뉴클레오티드수는 1 ∼ 10 개 정도까지인 것을 의미하고, 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개의 아미노산의 수를 선택할 수 있다. 또한, 이와 같은 「1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가」됨으로써, 종지 코돈이 도입되지 않고, 목적으로 하는 기능을 갖는 단백질을 규정할 수 있는 것은 전제이다.
이 양태의 (e) 에 있어서, 「스트린젠트한 조건하」라고 하는 경우, 예를 들어 유전자의 뉴클레오티드 배열의 길이에 근거해, 일반적인 기술을 가진 당업자에 의해, 용이하게 결정할 수 있다. 기본적인 조건은, 예를 들어 Current Protocols in Molecular Biology Vol.1 (John Wiley and Sons, Inc.) 이나 Molecular Cloning 2nd edition (Sambrook et al. (1989)) 에 기재되어 있는 바와 같이, 5×SSC, 5×Denhardt's solution, 1 % SDS, 25 ℃ 내지 68 ℃ 에서, 수시간 내지 하룻밤 등의 하이브리다이제이션 조건을 들 수 있다. 이 경우, 하이브리다이제이션의 온도로는, 보다 바람직하게는 45 ℃ 내지 68 ℃ (포름아미드 없음) 또는 30 ℃ 내지 42 ℃ (50 % 포름아미드) 를 들 수 있다. 세정의 조건으로는, 예를 들어 0.2×SSC 에서 45 ℃ 내지 68 ℃ 를 들 수 있다. 포름아미드 농도, 염 농도 및 온도 등의 하이브리다이제이션 조건을 적절히 설정함으로써, 어느 일정 동일성 이상의 동일성을 갖는 뉴클레오티드 배열을 포함하는 핵산 분자를 클로닝할 수 있는 것은 당업자에게 주지이고, 이와 같이 하여 클로닝된 핵산 분자는 모두 본 발명의 범위 중에 포함된다.
인간 p180 단백질의 전체 길이는, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질이고 (GenBank Accession No. AB287347), 이 단백질은, SEQ ID NO : 1 에 나타내는 뉴클레오티드 배열에 의해 코드된다 (GenBank Accession No. AB287347). 이 외, 상기 서술한 마우스의 p180 단백질은, GenBank Accession No. NP_077243 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 래트의 p180 단백질은, GenBank Accession No. XP_230637 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 차이니즈 햄스터의 p180 단백질은, GenBank Accession No. XM_003496471 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 개의 p180 단백질은, GenBank Accession No. NP_001003179 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 말의 p180 단백질은, GenBank Accession No. XP_001915027 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 원숭이의 p180 단백질은, GenBank Accession No. XP_002798281 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 침팬지의 p180 단백질은, GenBank Accession No. XP_514527 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 돼지의 p180 단백질은, GenBank Accession No. XP_001926148 에 의해 나타내는 뉴클레오티드 배열에 의해 코드된다.
예를 들어, p180 단백질로서 인간의 p180 단백질을 사용하는 경우, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역, 623 ∼ 737 번 아미노산으로 이루어지는 영역, 738 ∼ 944 번 아미노산으로 이루어지는 영역, 945 ∼ 1540 번 아미노산으로 이루어지는 영역 중 어느 것을 포함하는 부분을 발현시킴으로써, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진할 수 있다 (특허문헌 1).
따라서, 본 발명에 있어서, 「p180 단백질의 부분」이라고 하는 경우, SEQ ID NO : 2 로 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 945 ∼ 1540 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분 등의 부분인 것을 의미한다. 이와 같은 부분을 포함하는 것은, 폴리솜 형성을 촉진하는 능력을 나타낼 수 있다. 인간에 관해서, 이와 같이 하여 규정되는 p180 단백질의 부분으로는, 상기 서술한 SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역, 623 ∼ 737 번 아미노산으로 이루어지는 영역, 738 ∼ 944 번 아미노산으로 이루어지는 영역, 945 ∼ 1540 번 아미노산으로 이루어지는 영역을 포함하는 부분, 등을 포함하는 부분 그 자체 외, 인간 p180 단백질의 N 말단막 관통 도메인의 C 말단측에 인접하는 MTB-2 도메인, 또는 리보솜-결합 리피트 도메인을 포함하는 고도로 염기성의 N-말단 영역, 고도로 염기성의 탠덤 리피트 도메인, 또는 미소관 결합 및 다발 형성 도메인 (MTB-1 도메인) 등이 일례로서 포함된다 (특허문헌 1).
전술한 바와 같이, 다른 포유 동물의 p180 단백질의 부분을 사용하는 경우도, 인간의 p180 단백질의 아미노산 배열과 그 밖의 포유 동물의 p180 단백질의 아미노산 배열이, 전체적으로 고도로 보존되고 있는 점에서, 전술한 (a) ∼ (e) 로 나타내는 단백질의 아미노산 배열 중, 대응하는 부분 또는 영역을 포함하는 단편의 아미노산 배열도 또, 「p180 단백질의 부분」으로서 사용할 수 있다.
본 발명의 상기 서술한 재조합 세포는, 세포에 있어서, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현이 항진되고 있는 것을 제 2 특징으로 하고 있다. 이와 같은 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질로는, SF3b4 단백질, 특히 포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분 (예를 들어, SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 ∼ 179 AA ; .C-말단역인 180 ∼ 424 AA.) 등이 포함된다.
이 중, SF3b4 단백질은, 통상은 핵 내에 있어서만 검출되는 단백질이지만, 콜라겐을 활발하게 분비하고 있는 선유아세포에서는, 그 대부분은 핵 내에서 검출되지만, 추가로 상세하게 검토한 바, 세포질 내의 소포체를 포함하는 막 분획에 SF3b4 단백질이 일부 존재하는 것이 밝혀졌다. SF3b4 단백질 (SAP49/SF3b49 라고도 한다) 은, 그 아미노 말단측에 RNA 인식 모티프 (RRM) 를 2 개 포함하는 것으로부터 RNA 인식 모티프 (RRM) 형의 RNA 결합 단백질 (RBP) 패밀리로 분류되고, 카르복시 말단측에는 기능 미지의 프롤린 리치 도메인을 갖는 물질이다. 정상적인 스플라이싱 반응 과정에는, 이들 2 개의 RNA 인식 모티프 (RRM) (RRM1, RRM2) 의 양자가 모두 필요하고, 이들은 효모에 있어서도 고도로 보존되고, 중요한 기능 도메인이라고 추측되고 있다. 또, SF3b4 단백질은, SF3b 복합체의 다른 구성 단백질인 SAP145 단백질과도 결합하고, 이 결합에도 SF3b4 단백질의 2 개의 RNA 인식 모티프 (RRM) (RRM1, RRM2) 가 양자 모두 필요하다는 것이 나타나 있다 (Champion-Arnaud & Reed, 1994). 즉, SF3b4 단백질의 RRM 도메인은, RNA 인식에 필요할 뿐만 아니라, 단백질-단백질간의 상호작용에도 기능하고 있다고 생각된다.
여기서, SF3b4 단백질의 아미노산 배열을 비교하면, 인간 SF3b4 단백질과 비교한 경우, 포유 동물의 조사된 모든 포유 동물종에 있어서 100 % 의 유사성을 나타내고, 그 밖의 종에 있어서도, 효모의 SF3b4 단백질은 40 ∼ 54 % 의 유사성, 곤충의 SF3b4 단백질은 63 ∼ 81 % 의 유사성을 각각 갖는 것이 알려져 있어, 모든 생물에 있어서 매우 보존적인 단백질인 것이 보고되어 있다.
[표 2-1]
[표 2-2]
이상과 같이, SF3b4 단백질의 1 차 아미노산 배열이 생물종간을 넘어 널리 고도로 보존되고 있는 사실로부터, 인간 SF3b4 단백질을 이용하여 확인된 기능은 다른 생물종 유래의 SF3b4 단백질을 사용한 경우에도 재현되는 것이 용이하게 추측된다.
따라서, 본 발명에 있어서 「SF3b4 단백질」이라고 하는 경우,
(i) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 과 적어도 70 % 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(ii) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(iii) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 적어도 70 % 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(iv) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(v) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질
을 말한다.
이 양태의 (i) 에 있어서, 아미노산 배열 동일성에 관해서, 「인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 과 적어도 70 % 의 배열 동일성을 갖는다」라고 하는 경우, 배열 동일성의 % 값은, 70 % ∼ 100 % 사이의 어느 값을 선택해도 되고, 예를 들어 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, 100 % 등의 배열 동일성의 % 값을 선택할 수 있다.
이 양태의 (ii) 에 있어서, 「1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가」라고 하는 경우, 결실, 치환, 또는 부가되는 아미노산수는 1 ∼ 10 개 정도까지인 것을 의미하고, 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개의 아미노산의 수를 선택할 수 있다.
이 양태의 (iii) 에 있어서, 「인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 적어도 70 % 의 배열 동일성을 갖는다」라고 하는 경우, 배열 동일성의 % 값은, 70 % ∼ 100 % 사이의 어느 값을 선택해도 되고, 예를 들어 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, 100 % 등의 배열 동일성의 % 값을 선택할 수 있다.
이 양태의 (iv) 에 있어서, 「1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가」라고 하는 경우, 결실, 치환, 또는 부가되는 뉴클레오티드수는 1 ∼ 10 개 정도까지인 것을 의미하고, 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개의 아미노산의 수를 선택할 수 있다. 또한, 이와 같은 「1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가」됨으로써, 종지 코돈이 도입되지 않고, 목적으로 하는 기능을 갖는 단백질을 규정할 수 있는 것은 전제이다.
이 양태의 (v) 에 있어서, 「스트린젠트 조건하」라고 하는 경우, 그 취할 수 있는 조건에 대해서는, p180 단백질에 관해서 전술한 바와 같다.
인간 SF3b4 단백질의 전체 길이는, SEQ ID NO : 4 에 나타내는 아미노산 배열을 갖는 단백질이고 (GenBank Accession No. NP_005841.1), 이 단백질은, SEQ ID NO : 3 에 나타내는 뉴클레오티드 배열에 의해 코드된다 (GenBank Accession No. NP_005841.1). 이 외, 상기 서술한 마우스의 SF3b4 단백질은, GenBank Accession No. NP_694693.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 래트의 SF3b4 단백질은, GenBank Accession No. NP_001011951.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 차이니즈 햄스터의 SF3b4 단백질은, GenBank Accession No. XP_003498680.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 개의 SF3b4 단백질은, GenBank Accession No. XP_540295.3 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 말의 SF3b4 단백질은, GenBank Accession No. XP_001488649.2 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 원숭이의 SF3b4 단백질은, GenBank Accession No. NP_001097793.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 침팬지의 SF3b4 단백질은, GenBank Accession No. XP_513768.2 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 돼지의 SF3b4 단백질은, GenBank Accession No. XP_001926524.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드된다.
본 발명에 있어서 발현이 요구되는, 목적물로서의 단백질을 코드하는 DNA 를, 단백질 발현계에 있어서 사용되는 세포에 대해 형질 전환하면, 그 DNA 로부터 전사된 mRNA (전구체) 는, 스플라이싱에 의해 아미노산의 유전 정보를 갖지 않는 인트론 부분이 제거되어, 성숙형 mRNA 로 변환된다. 그 과정은 스플라이세오솜이라고 하는 핵 내 저분자 RNA (snRNA)-단백질로 이루어지는 거대 복합체가 담당한다. 스플라이세오솜에는, 5 종의 저분자 리보핵단백질 복합체 (snRNP) 가 존재하고, SF3b4 단백질은 이 중 U2-snRNP 의 구성 성분이고, RNA 결합 도메인을 갖는다.
지금까지, SF3b4 단백질을 포함한 스플라이싱 인자가 단백질의 번역 레벨에서 어떠한 기능을 갖는다는 보고는 없었지만, 발명자들의 해석에 의해, SF3b4 단백질이 세포질 내의 소포체를 포함하는 막 획분에 유의하게 증가하고, 그것과 함께 mRNA 와 결합한 SF3b4 단백질이, p180 단백질의 coiled-coil 도메인과 상호작용함으로써, mRNA 의 소포체에의 국재화를 촉진시키고, 그 결과로서 배양 세포의 분비 기능을 상승시킬 수 있는 것을 밝혀냈다.
즉, 이와 같은 2 개의 단백질 중 어느 것 또는 그들 양방의 발현이 항진된 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하면, 목적물로서의 단백질을 코드하는 DNA 로부터 전사된 mRNA 가 세포 내에 있어서 발현된 SF3b4 단백질과 작용한 결과, 또는 p180 단백질과 상호작용한 결과, 혹은 목적물로서의 단백질을 코드하는 DNA 로부터 전사된 mRNA 가 SF3b4 단백질과 상호작용하고, 이어서 p180 단백질의 coiled-coil 도메인과 SF3b4 단백질이 상호작용한 결과, mRNA 의 소포체에의 국재화를 촉진시키고, 이 세포 내에 있어서 목적물로서의 단백질의 합성능 또는 분비능이 항진되는 것이 밝혀졌다.
여러 가지 조직이 장기간에 걸쳐 상해되어 섬유화되어 버리는 상태인 섬유증은, 모두 원인 및 상세한 발증 기서, 유효한 치료법이 불명이고, 예후 불량의 질환이다. 예를 들어 특발성 폐섬유증은 여러 가지 자극에 의해 생긴 폐포 상피의 상해에 대해, 그 수복을 위한 콜라겐 등이 증가해 이상 수복 반응이 일어나기 때문에 섬유화가 진행된다고 생각되고 있지만, 유효한 치료법은 확립되어 있지 않다. 이와 같은 병태에 있어서, 콜라겐의 이상 증가를 저지하기 위한 단서도 얻어져 있지 않았지만, 본 발명에 있어서 새롭게, 지금까지 스플라이싱 인자로서 기능한다고 생각되고 있던 SF3b4 단백질이, 콜라겐의 합성/분비에 불가결한 역할을 하는 것이 판명되고, SF3b4 를 기능 저해 또는 발현 억제함으로써 콜라겐 합성을 억제 가능한 것이 나타났다. SF3b4 의 발현 억제는 그 특이적 shRNA 등의 투여에 의해, 그 기능 저해는 스플라이싱 과정을 저해하는 각종 약제에 의해 가능하다고 생각되기 때문에, SF3b4 의 기능 저해 또는 발현 억제에 의해 섬유증에 있어서의 이상 콜라겐의 축적을 억제해 섬유증의 중증화를 방지할 수 있는 가능성이 나타났다.
본 발명에 있어서 재조합 세포를 제조하기 위해서 사용할 수 있는 세포는, 단백질 발현에 적절한 세포이면 어떠한 것이어도 되고, 예를 들어 기원이 되는 세포로는, CHO 세포, HEK293 세포, HeLa 세포 등의 포유 동물 유래의 세포를 사용할 수 있다. 이들 세포에 대해, 전술한 p180 단백질의 전체 길이 또는 그 부분 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을, 당해 기술 분야에 있어서 일반적으로 사용되고 있는 방법을 사용해 트랜스펙트하여, 이들 세포 내에 있어서 p180 단백질의 전체 길이 또는 그 부분 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을 양방 모두 발현시킬 수 있다.
전술한 p180 단백질의 전체 길이 또는 그 부분 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을, 이들 세포 내에 있어서 발현시키기 위해서는, 당해 기술 분야에 있어서 일반적으로 사용되고 있는 형질 전환 방법을 사용할 수 있다. 그 형질 전환을 실시하기 위해서는, p180 단백질의 전체 길이 또는 그 부분을 코드하는 DNA 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을 코드하는 DNA 를 각각, 예를 들어 pcDNA, pEGFP, pCAGGS 등의 발현 벡터 중에 편입시키고, 각각의 발현 벡터를 세포에 대해 형질 전환해 사용할 수 있다.
본 발명에 있어서는, p180 을 안정적으로 발현하는 재조합 세포로서, CHO 세포에서 유래하는 세포주 CHO 5g 세포, SF3b4 단백질을 안정적으로 발현하는 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 재조합 세포로서, CHO 세포에서 유래하는 세포주 CHO 3D5 세포, 그리고 이들 2 개의 단백질의 발현이 동시에 항진된 재조합 세포로서, CHO 세포에서 유래하는 세포, CHO YA7 세포를 제조하고 (후술하는 실시예 1 을 참조), 이들 세포주를 독립행정법인 제품 평가 기술 기반 기구의 특허 미생물 기탁 센터에 기탁하였다 (CHO 3D5 세포에 대해 수탁 번호 NITE BP-01753), CHO YA7 세포에 대해 수탁 번호 NITE BP-1535, 또는 CHO 1B2 세포에 대해서 수령 번호 NITE ABP-01811).
본 발명의 발명자들은 또, p180 단백질의 전체 길이 또는 그 부분의 발현 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분의 발현을 모두 항진시킨 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시킴으로써, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 방법을 제공할 수 있는 것을 나타냈다.
이 방법에 있어서, 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 목적물로서의 단백질은, 바이오 테크놀러지적 수법에 의해 산생하는 것을 목적으로 한 어느 단백질이어도 된다. 예를 들어, 목적물로서의 단백질로서, 당단백질을 들 수 있고, 그 예로서 항체, 콜라겐, 피브로넥틴, 라미닌 등을 선택할 수 있지만, 이들에는 한정되지 않는다.
본 발명의 발명자들은, 본 발명의 제 2 양태에 있어서, 목적물로서의 단백질을 발현하기 위한 발현 유닛 중, 프로모터의 하류이고 또한 목적물로서의 단백질을 코드하는 DNA 의 뉴클레오티드 배열의 개시 코돈의 상류에, cis-엘리먼트를 삽입함으로써, 발현계 세포 내에 있어서의 목적물로서의 단백질의 발현량을 증대시키는 방법을 제공한다. 상기 서술한 발현 유닛에 cis-엘리먼트의 배열을 삽입한다고 하는 경우, 예를 들어 목적물의 단백질의 발현 플라스미드 내에 있어서 프로모터의 하류이고 또한 목적물로서의 단백질을 코드하는 DNA 의 뉴클레오티드 배열의 개시 코돈의 상류에 cis-엘리먼트 배열을 삽입하는 경우 외에, 이미 세포 내에 프로모터 및 목적물이 유전자 도입되어 있는 경우에 프로모터의 하류이고 또한 목적 유전자의 ORF 개시 코돈의 상류에 cis-엘리먼트 배열을 부위 특이적으로 삽입하는 경우 등도 포함된다.
배경 기술의 항에 있어서도 기재한 바와 같이, 콜라겐 유전자 등의 일부 단백질의 mRNA 에는, 단백질 합성 장치인 리보솜이 복수 부착된 폴리솜이 형성되기 쉬운 성질을 구비하는 것이 분명해져 있다 (특허문헌 1, 비특허문헌 2). 그러나, 목적물로서의 단백질을 코드하는 DNA 로 트랜스펙트한 세포 내에 있어서, 목적물로서의 단백질을 코드하는 유전자 전사 산물이 고레벨로 발현하고 있는 것에 관계없이, 그 단백질의 합성/분비량이 낮은 문제가 생기는 경우가 종종 보이고, 이용되고 있는 세포에 있어서 mRNA 가 소포체막 상에서의 번역 장치에 이용하기 쉬운 형태로 제공되고 있지 않은 가능성이 추측되었다.
이와 같은 검토에 기초하여 해석을 진행시킨 결과, 콜라겐 유전자의 5' 비번역 영역에 존재하는 cis-엘리먼트가, 단백질의 발현량을 증대시키는 작용을 갖는 것을 알아냈다. 보다 구체적으로는, 성숙 mRNA 의 5' 비번역 영역에 있는 cis-엘리먼트 배열을 인식하는 RRM 단백질이 거기에 결합함으로써, 분비 단백질의 합성의 장인 소포체의 막 상에의 mRNA 의 수송/국재화를 증강시켜, 추가로 번역 효율을 상승시키는 기능이 있다고 생각되었다.
본 발명에 있어서 확인된 cis-엘리먼트는, 1 형 콜라겐 유전자의 해석의 결과로부터 밝혀진 것이고, 이 cis-엘리먼트의 뉴클레오티드 배열은, 1 형 콜라겐 유전자의 5' 비번역 영역에 존재하는 것이 분명해졌다. 따라서, 본 발명에 있어서는, 그와 같은 cis-엘리먼트의 뉴클레오티드 배열로서, 타입 I 콜라겐 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열을 들 수 있지만, 원하는 효과를 갖는 한에 있어서, 피브로넥틴 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 매트릭스 메탈로프로테아제 14 (MMP14) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A2 (P4HA2) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A1 (P4HA1) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열 등의 다른 유전자에서 유래하는 cis-엘리먼트를 사용할 수도 있다.
본 발명에 있어서 사용할 수 있는 cis-엘리먼트의 구조적인 특징으로는, 목적물의 단백질을 발현하기 위한 발현 플라스미드에 포함되는 유전자의 5' 비번역 영역 중에, 9 개 ∼ 12 개의 뉴클레오티드로 구성되는 모티프 「GAN1-(X)n-ACN2」(n = 3 ∼ 6) (N1 및 N2 는 독립적으로 A, T, C, G 중 어느 뉴클레오티드여도 된다) 를 1 또는 몇 개 포함하는 것에 의해 특징지어진다. 구체적인 모티프의 예로는, 천연의 cis-엘리먼트로서 존재하는 모티프를 들 수 있고, 이들은 N1 이 G 인 것, 그리고 N2 가 A 또는 G 또는 C 인 것을 특징으로 하고 있다. 더 상세하게는, 「GAG xxx ACV」(SEQ ID NO : 17), 「GAG xxxx ACV」(SEQ ID NO : 18), 「GAG xxxxx ACV」(SEQ ID NO : 19), 및 「GAG xxxxxx ACV」(SEQ ID NO : 20) (이들 배열에 있어서, V 는 A 또는 G 또는 C 를 나타낸다) 로 나타낼 수 있다. 예를 들어, 1 형 콜라겐 유전자의 경우에는, 그 5' 비번역 영역 중에 4 개의 모티프를 내포하고 있는 것을 알 수 있다.
I 형 콜라겐 유전자에서 유래하는 cis-엘리먼트를 이용하는 경우, cis-엘리먼트의 뉴클레오티드 배열을, SEQ ID NO : 5 의 전체 길이 또는 SEQ ID NO : 7 의 전체 길이 외, SEQ ID NO : 5 중 1 ∼ 102 번 뉴클레오티드, 1 ∼ 78 번 뉴클레오티드, 1 ∼ 60 번 뉴클레오티드, 61 ∼ 126 번 뉴클레오티드, 16 ∼ 57 번 뉴클레오티드, 79 ∼ 126 번 뉴클레오티드, 103 ∼ 126 번 뉴클레오티드, 58 ∼ 78 번 뉴클레오티드, 51 ∼ 78 번 뉴클레오티드, 1 ∼ 27 번 뉴클레오티드, 70 ∼ 78 번 뉴클레오티드 등으로 이루어지는 군에서 선택되는 어느 배열을 사용할 수 있다.
또, 피브로넥틴 유전자에서 유래하는 cis-엘리먼트를 이용하는 경우, cis-엘리먼트의 뉴클레오티드 배열을, SEQ ID NO : 6 의 전체 길이 및 SEQ ID NO : 8 의 전체 길이 외로 이루어지는 군에서 선택되는 어느 배열을 사용할 수 있다.
[표 3]
이와 같은 cis-엘리먼트를 포함하는 발현 플라스미드를, 손상되지 않은 숙주 세포뿐만 아니라, 본원 발명에 있어서 조제한, p180 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, 또는 이들 양방의 발현이 모두 항진된 세포에 있어서 사용할 수 있다.
본 명세서에 있어서는, 여기까지에 설명한 본 발명을 더 구체적으로 설명하는 것을 목적으로 해, 이하의 실시예를 기재하지만, 그러나 이하의 실시예의 기재는, 본 발명을 한정하는 것을 목적으로 한 것은 아니다.
실시예
실시예 1 : SF3b4 단백질, 또는 p180 단백질과 SF3b4 단백질을 공발현하는 세포주의 수립
플라스미드의 조제
SF3b4 단백질, 또는 p180 단백질과 SF3b4 단백질을 공발현하는 세포주의 수립은, p180 단백질을 코드하는 핵산을 포함하는 발현 플라스미드와 SF3b4 단백질을 코드하는 핵산을 포함하는 발현 플라스미드를 별개로 조제하고, CHO 세포에 대해 차례로 트랜스펙트함으로써, 실시하였다.
인간 p180 단백질 (GenBank Accession No. AB287347) 전체 길이를 코드하는 발현 플라스미드 pcDNA-p180/54R 은, 특허문헌 1 (일본 공개특허공보 2005-312409) 에 기재된 방법에 준해 조제하였다.
인간 SF3b4 단백질 전체 길이를 코드하는 발현 플라스미드 pEF-SF3b4 는, 이하의 방법에 따라 조제하였다. 즉, 인간 SF3b4 단백질 (GenBank Accession No. NP_005841.1) 전체 길이를 코드하는 cDNA 배열을 PCR 로 증폭 후, pEF1/Myc-His 벡터 (Life Technologies 사 제조) 의 KpnI-EcoRV 사이트에 삽입 연결해, 플라스미드 pEF-SF3b4 를 얻었다.
차이니즈 햄스터 SF3b4 단백질 전체 길이를 코드하는 발현 플라스미드 pEF-CHO-SF3b4 는, 이하의 방법에 따라 조제하였다. 즉, CHO 세포로부터 total RNA 를 추출하고, 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1) 전체 길이를 코드하는 cDNA 배열을 PCR 로 증폭하였다. 그 후 pEF1/Myc-His 벡터의 KpnI-EcoRV 사이트에 삽입 연결해, 플라스미드 pEF-CHO-SF3b4 를 얻었다.
인간 cis 엘리먼트의 배열 (예를 들어, cis-엘리먼트 #1 ∼ #11) 을 코드하는 발현 플라스미드 pEF-Cis 는, 이하의 방법에 따라 조제하였다. 즉, 인간 cis-엘리먼트 (예를 들어, cis-엘리먼트 #1 의 경우에는, SEQ ID NO : 5) 를 코드하는 핵산 배열을 PCR 로 증폭 후, pEGFP 벡터 (clontech 사 제조) 의 bglII-HindIII 사이트에 삽입 연결해, 플라스미드 prCMV-cis#-SEAP 를 얻었다. 각 cis-엘리먼트를 포함하는 발현 벡터의 자세한 것은 실시예 9 에 기재하였다.
p180 단백질을 안정적으로 발현하는 세포의 조제
인간 p180 단백질을 안정적으로 발현하는 CHO 세포의 수립은, 특허문헌 1 에 기재된 방법에 준해 실시하였다. 즉, CHO 세포에 인간 p180 단백질 발현 플라스미드 pcDNA-p180/54R 을 리포펙션법에 의해 트랜스펙션한 후, Zeocin 400 ㎍/㎖ 존재하에서 배양하고, 약제 선택을 실시하였다. 10 일간 배양 후, Zeocin 에 내성을 갖는 세포주의 콜로니를 분리하여, p180 단백질을 안정적으로 발현하는 세포주 CHO 5g 세포를 수립하였다.
SF3b4 단백질을 안정적으로 발현하는 세포의 조제
인간 SF3b4 단백질을 안정적으로 발현하는 CHO 세포를 조제하기 위해, CHO 세포에 인간 SF3b4 단백질 발현 플라스미드 pEF-SF3b4 를 리포펙션법에 의해 트랜스펙션한 후, G418 400 ㎍/㎖ 존재하에서 배양하고, 약제 선택을 실시하였다. 10 일간 배양 후, G418 에 내성을 갖는 세포주의 콜로니를 분리하여, SF3b4 단백질을 안정적으로 발현하는 세포주 CHO 3D5 세포를 수립하였다 (독립행정법인 제품 평가 기술 기반 기구 특허 미생물 기탁 센터 (NPMD), 치바현 키사라즈시 카즈사카마타리 2-5-8 (일본), 수탁 번호 NITE BP-01753, 수탁일 2013년 11월 21일).
p180 단백질과 SF3b4 단백질을 안정적으로 공발현하는 세포의 조제
다음으로, 인간 p180 단백질과 인간 SF3b4 단백질을 안정적으로 공발현하는 CHO 세포를 수립하기 위해, 세포주 CHO 5g 세포에 대해, SF3b4 단백질 발현 플라스미드 pEF-SF3b4 를 리포펙션법에 의해 트랜스펙션하였다. 그 후, G418 400 ㎍/㎖, Zeocin 100 ㎍/㎖ 존재하에서 배양하고, 약제 선택을 실시하였다. 14 일간 배양 후, G418 과 Zeocin 에 내성을 갖는 세포주의 콜로니를 분리하여, 인간 p180 단백질과 인간 SF3b4 단백질을 안정적으로 공발현하는 세포주 CHO YA7 세포를 수립하였다 (독립행정법인 제품 평가 기술 기반 기구 특허 미생물 기탁 센터 (NPMD), 치바현 키사라즈시 카즈사카마타리 2-5-8 (일본), 수탁 번호 NITE BP-1535, 수탁일 2013년 2월 13일).
다음으로 인간 p180 단백질과 차이니즈 햄스터 SF3b4 단백질을 안정적으로 공발현하는 CHO 세포를 수립하기 위해, CHO 세포에 인간 p180 및 차이니즈 햄스터 SF3b4 를 발현하는 플라스미드를 리포펙션법에 의해 트랜스펙션하였다. 그 후, Hygromycin 300 ㎍/㎖ 존재하에서 배양하고, 약제 선택을 실시하였다. 14 일간 배양 후, Hygromycin 에 내성을 갖는 세포주의 콜로니를 분리하여, 인간 p180 단백질과 차이니즈 햄스터 SF3b4 단백질을 안정적으로 공발현하는 세포주 CHO 1B2 세포를 수립하였다 (독립행정법인 제품 평가 기술 기반 기구 특허 미생물 기탁 센터 (NPMD), 치바현 키사라즈시 카즈사카마타리 2-5-8 (일본), 수령 번호 NITE ABP-01811, 수령일 2014년 3월 4일).
세포의 성상 확인
CHO 5g 세포가 p180 단백질을 안정적으로 발현하고 있는 것, CHO 3D5 세포가 SF3b4 단백질을 안정적으로 발현하고 있는 것, 그리고 CHO YA7 세포 및 CHO 1B2 세포가 p180 단백질과 SF3b4 단백질을 공발현하고 있는 것을 각각 확인하기 위해, CHO 5g 세포, CHO 3D5 세포, CHO YA7 세포, CHO 1B2 세포의 각각을, 5 % 소 태아 혈청을 포함하는 둘베코 개변 이글 배지 (DMEM) 중에서, 5 % CO2 존재하, 37 ℃ 에서 배양하였다. 컨트롤 세포로서, CHO 세포도 아울러 배양하였다.
40 시간 후, 트립신 처리에 의해 현탁한 각 세포 1 × 105 개를 원심에 의해 회수하고, 해석용 샘플로 하였다. 그 후, 세포 내에서 발현하는 p180 단백질에 대해서는 항p180 항체 (Ogawa-Goto, K. et.al., J. Virol., 76(2002) 2350-2362 참조) 를 사용하고, 그리고 SF3b4 단백질에 대해서는 항SF3b4 항체 (Santacruz 사 제조) 를 사용하여, 웨스턴 블롯법에 의해 각각 해석하였다.
도 1 에 나타내는 바와 같이, CHO 세포의 p180 발현량은 검출 한계 이하이고, 내재성의 SF3b4 단백질의 발현이 낮은 레벨로 확인되었다 (레인 1). CHO 3D5 세포는, p180 단백질의 발현량은 CHO 세포와 마찬가지로, 검출 한계 이하였지만, SF3B4 단백질을 고발현하고 있었다 (레인 2). CHO 5g 세포는, p180 단백질을 고발현하고, SF3b4 단백질은 내재성의 발현이 낮은 레벨로 확인되었다 (레인 3). CHO YA7 세포 및 CHO 1B2 세포는, p180 단백질과 SF3b4 단백질을 모두 고발현하고 있었다 (레인 4, 레인 6). 이들의 점에서, p180 단백질을 고발현하는 CHO 5g 세포, SF3b4 단백질을 고발현하는 CHO 3D5 세포, 그리고 p180 단백질과 SF3b4 단백질을 공발현하는 CHO 세포 유래의 세포주, CHO YA7 세포 및 CHO 1B2 세포를 수립할 수 있었던 것을 확인하였다.
실시예 2 : p180 단백질의 발현 및/또는 SF3b4 단백질의 발현에 의한 분비 활성화
실시예 1 에 있어서 제조한 p180 단백질을 발현하는 세포주 CHO 5g 세포, SF3b4 단백질을 발현하는 세포주 CHO 3D5 세포, 및 p180 단백질과 SF3b4 단백질을 공발현하는 세포주 CHO YA7 세포를 사용하여, p180 단백질의 발현 및/또는 SF3b4 단백질의 발현과, 단백질 분비의 활성화에 대해 조사하였다.
분비 마커인 인간 태반 유래 분비형 알칼리 포스파타아제 (SEAP) 의 발현 플라스미드를 이하의 방법에 따라 구축하였다. 즉, SEAP 단백질 (GenBank Accession No. NP_001623.3) 전체 길이를 코드하는 cDNA 프래그먼트를 포유 동물 세포용 발현 벡터 (pEGFP-C3, Clontech 사 제조) 의 NheI-XhoI 사이트에 삽입 연결하여, SEAP 단백질 발현 플라스미드 prCMV-SEAP 를 얻었다.
각각의 세포의 SEAP 단백질 분비능을 평가하기 위해, CHO 3D5 세포, CHO 5g 세포, CHO YA7 세포, 그리고 CHO 세포 각각에 대해, SEAP 발현 플라스미드와 내부 표준화용의 β-갈락토시다아제를 발현하는 플라스미드 pEF1-LacZ (Life technologies 사 제조) 를 Lipofectamine LTX 시약 (Life technologies 사 제조) 을 이용하여 코트랜스펙션하였다. 0.1 % 소 태아 혈청을 포함하는 DMEM 중에서 20 시간 배양한 후, 배양 상청과 p-Nitrophenyl phosphate (pNPP, Sigma 사 제조) 를 포함하는 기질 용액을 혼합하였다. 실온에서 30 분 반응 후, 파장 405 ㎚ 에 대한 흡광도를 흡광도계로 측정하였다. 세포 획분의 β-갈락토시다아제 활성은 β-Galactosidase Enzyme Assay System (promega 사 제조) 의 정법에 따라 측정하였다.
β-갈락토시다아제 측정값으로 표준화한 SEAP 활성을 도 2 에 나타낸다. p180 단백질을 단독 발현시킨 CHO 5g 세포 및 SF3b4 단백질을 단독 발현시킨 CHO 3D5 세포에 있어서는, 배양 상청 중의 SEAP 분비 활성은 CHO 와 비교해 1.7 ∼ 2.0 배로 유의하게 증가하였다 (도 2). CHO YA7 세포에 있어서의 p180 단백질과 SF3b4 단백질을 공발현시킨 경우에는, CHO 세포와 비교해 3.1 배로까지 SEAP 활성이 더 증가하였다. 이들 점에서, p180 단백질을 단독 발현시키는 경우 및 SF3b4 단백질을 단독 발현시키는 경우의 어느 것에 있어서도, CHO 세포의 경우와 비교해, SEAP 분비 활성이 유의하게 상승시킬 수 있었지만, p180 단백질과 SF3b4 단백질을 공발현시킴으로써, CHO 세포의 경우와 비교해, 세포의 분비능을 현저하게 상승시키는 것이 나타났다.
또 CHO 세포의 SEAP 활성을 1 로 했을 때의 CHO 1B2 세포의 SEAP 활성비는 3.1 배로, SEAP 활성이 현저하게 증가하였다. 이 점에서, 인간 SF3b4 와 높은 유사성을 갖는 차이니즈 햄스터 SF3b4 는, 인간 SF3b4 와 동등한 분비 증강 활성을 갖는 것이 나타났다.
실시예 3 : p180 단백질과 SF3b4 단백질의 공발현에 의한, mRNA 의 막 획분에의 국재화 촉진
실시예 1 에 있어서 제조한 p180 단백질을 발현하는 세포주 CHO 5g 세포, SF3b4 단백질을 발현하는 세포주 CHO 3D5 세포, 및 p180 단백질과 SF3b4 단백질을 공발현하는 세포주 CHO YA7 세포를 사용하여, p180 단백질의 발현 및/또는 SF3b4 단백질의 발현과, mRNA 의 막 획분에의 국재화 촉진의 관계에 대해 조사하였다.
CHO YA7 세포 및 컨트롤 세포에 상기 서술한 SEAP 발현 플라스미드를 lipofectamine LTX 를 이용하여 트랜스펙션하고, 40 시간 후, 세포질 획분과 막 획분으로 분획하였다. 분획 방법은 비특허문헌 1 (Ueno, et al., (2010) J Biol Chem 285, 29941-29950) 에 기재된 방법에 준해 실시했다. 각각의 획분으로부터 Trisol-LS 시약 (Life technologies 사 제조) 의 정법에 따라 RNA 를 추출하였다. 그 후, SEAP 특이적인 프라이머를 이용하여 정량적 PCR 법을 실시해, SEAP mRNA 량을 정량하였다 (도 3).
그 결과, CHO 3D5 세포, CHO 5g 세포, CHO YA7 세포, CHO 세포에서는, 세포질과 막 획분의 총합이 되는 전체 mRNA 량은 거의 동일 정도였다. 그러나, CHO 세포, CHO 3D5 세포, CHO 5g 세포에서는 전체의 약 3 할의 mRNA 가 막 획분에 존재하고 있던 것에 대해, CHO YA7 세포에서는 약 7 할이 막 획분에 국재화되어 있고, 세포질로부터 막 획분으로 mRNA 의 국재가 현저하게 시프트되어 있었다.
이들 점에서, p180 단백질과 SF3b4 단백질을 공발현하는 CHO YA7 세포는, 분비 단백질의 생합성 시에 mRNA 를 막 획분으로 적극적으로 국재화시키는 특성을 갖는 것이 나타났다.
실시예 4 : 분비형 알칼리 포스파타아제 발현 유닛 내에 각종 cis-엘리먼트를 삽입한 발현 벡터의 구축
본 실시예에 있어서는, 실시예 1 에 있어서 제작한 SF3b4 단백질을 발현하는 세포주 CHO 3D5 세포, 및 p180 단백질과 SF3b4 단백질을 공발현하는 세포주 CHO YA7 세포를 사용하여, 단백질의 발현 효율을 더 올리는 것을 목적으로 해, 발현 플라스미드의 구조를 검토하였다.
실시예 2 에서 나타낸 SEAP 발현 플라스미드 prCMV-SEAP 에 cis-엘리먼트를 삽입한 발현 벡터를 이하의 방법에 따라 구축하였다. 인간 선유아세포 유래의 RNA 를 비특허문헌 1 (Ueno, et al., (2010) J Biol Chem 285, 29941-29950) 에 기재된 방법에 준해 조제하고, 주형으로서 RT-PCR 을 실시하였다. 증폭 시에 5', 3' 측에 BglII 와 HindIII 인식 배열을 각각 부가한 프라이머 (SEQ ID NO : 15, SEQ ID NO : 16) 를 사용하여, 인간 유래의 I 형 콜라겐 α1 유래 cis-엘리먼트 #1 (SEQ ID NO : 5) 을 증폭하였다. prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 부위에, 증폭 단편을 BglII-HindIII 으로 처리한 후 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #1 을 삽입한 발현 플라스미드 prCMV-cis#1-SEAP 를 얻었다 (도 4A).
실시예 5 : cis-엘리먼트에 의한 단백질의 분비 활성화
실시예 4 에 있어서 제작한 cis-엘리먼트를 포함하는 발현 플라스미드에 의해, 발현 단백질의 분비에의 영향을 검토하였다. 실시예 4 에서 제조한 2 종의 발현 플라스미드, prCMV-cis#1-SEAP 및 prCMV-SEAP 를, LipofectamineLTX 시약 (Life technologies 사 제조) 을 이용하여 트랜스펙션하였다. 세포는 실시예 1 에서 제조한 4 종의 세포주를 사용하였다. 0.1 % FBS 를 포함하는 DMEM 중에서 20 시간 배양한 후, 배양 상청과 형광 기질 4-Methylumbelliferyl phosphate (4-MUP, Sigma 사 제조) 를 포함하는 기질 용액을 혼합하였다. 실온에서 30 분 반응 후, 형광 강도 (여기광 360 ㎚, 형광 440 ㎚) 를 형광 광도계로 측정하였다. 또 트랜스펙션 효율을 SEAP cDNA 총량으로 보정하기 위해, 세포 획분으로부터 Trizol 시약 (Lifetechnologies 사 제조) 을 이용하여 전체 mRNA 를 추출하고, SEAP 특이적인 프라이머를 이용하여 정량적 PCR 을 실시해, SEAP cDNA 량을 정량하였다. SEAP cDNA 량으로 보정한 prCMV-cis#1-SEAP 의 prCMV-SEAP 에 대한 SEAP 활성비를 도 4B, 도 4C 에 나타낸다.
그 결과, CHO 세포에 있어서 cis-엘리먼트 #1 의 삽입에 의해, SEAP 활성은 2.7 배로 증가하였다. CHO 3D5 세포, CHO 5g 세포, 그리고 CHO YA7 세포의 각 세포에 있어서도 cis-엘리먼트 #1 의 삽입에 의해, SEAP 활성은 모두 3.0 ∼ 3.2 배로 증가하였다. 이들 결과로부터, cis-엘리먼트 #1 을 발현 유닛 내에 삽입함으로써, 각종 CHO 세포에 있어서 전사 산물당 단백질 합성 및 분비량을 증가시킬 수 있는 것이 나타났다.
이상의 각 세포의 cis-엘리먼트 #1 의 삽입 후의 SEAP 활성비를, CHO 세포의 cis-엘리먼트 #1 의 미삽입 SEAP 활성과 비교하기 위해, CHO 세포에서의 prCMV-SEAP 도입 시의 SEAP 활성을 1 로 하고 각 세포에서의 prCMV-cis#1-SEAP 도입 시 활성을 구하였다 (도 4C). cis-엘리먼트 #1 을 사용한 경우의 CHO 3D5 세포, CHO 5g 세포의 SEAP 활성비는 각각, 컨트롤인 CHO 세포의 4.7, 6.3 배로 증가하였다. 또한 CHO YA7 세포에서는, 컨트롤인 CHO 세포의 9.4 배로, SEAP 의 분비 활성이 현저하게 증가해 있었다.
이상으로부터, cis-엘리먼트 #1 과 SF3b4 단백질이 공존함으로써, 혹은 cis-엘리먼트 #1 과 p180 단백질이 공존함으로써, 발현 플라스미드로부터 발현되는 단백질의 분비 활성이 상승하고, 또한 cis-엘리먼트 #1, SF3b4 단백질 및 p180 단백질의 3 인자가 공존함으로써, 세포의 단백질 분비 활성을 현저하게 증강시킬 수 있는 것이 나타났다.
실시예 6 : cis-엘리먼트 #1 에 의한 콜라겐의 분비 활성화
본 실시예에 있어서는, cis-엘리먼트를 포함하는 발현 플라스미드에 의해, 콜라겐 발현에의 영향을 검토하였다.
인간 I 형 콜라겐 α1 (COL1A1) 의 발현 플라스미드를 이하의 방법에 따라 구축하였다. 즉, COL1A1 (GenBank Accession No. NM_000088.3) 전체 길이를 코드하는 cDNA 프래그먼트를 포유 동물 세포용 발현 벡터 (pEGFP-C3, Clontech 사 제조) 의 NheI-XhoI 사이트에 삽입 연결하고, CMV 프로모터의 제어하에서 cis-엘리먼트 #1 을 포함한 COL1A1 (1 ∼ 5297) 을 발현하는 플라스미드 prCMV-COL1A1 을 얻었다. 또, COL1A1 유전자 전체 길이 대신에, COL1A1 ORF 전체 길이만을 코드하는 127 ∼ 4251, 및 127 ∼ 5297 까지의 유전자 단편을 동일하게 증폭하여, prCMV-COL1A1-ORF, 및 prCMV-COL1A1-ORF-UTR 을 구축하였다. 또 인간 II 형 콜라겐 α1 (COL2A1), 인간 III 형 콜라겐 α1 (COL3A1) 의 발현 플라스미드를 이하의 방법에 따라 구축하였다. 즉, COL2A1 (GenBank Accession No. NP_001835.3) 또는 COL3A1 (GenBank Accession No. NP_000081.1) 전체 길이를 코드하는 cDNA 프래그먼트를, 포유 동물 세포용 발현 벡터 (pcDNA, Invitrogen 사 제조) 에 cis-엘리먼트 #1 을 삽입한 pcDNA-cis#1 의 EcoRV-NotI 사이트에 삽입 연결하고, CMV 프로모터의 제어하에서 COL2A1 (1 ∼ 4464) 을 발현하는 플라스미드 pcDNA-cis#1-COL2A1, COL3A1 (1 ∼ 4401) 을 발현하는 플라스미드 pcDNA-cis#1-COL3A1 을 얻었다.
cis-엘리먼트 #1 의 프로콜라겐에 대한 분비 활성화능을 조사하기 위해, 실시예 1 에서 제작한 3 종의 세포주에, prCMV-COL1A1 을 리포펙션법으로 트랜스펙션하였다. 0.1 % 소 태아 혈청, 200 μM 아스코르브산을 포함하는 DMEM 중에서 40 시간 배양한 후, 배양 상청 중의 COL1A1 procollagen 량을 웨스턴 블롯법에 의해 해석하였다 (도 5A).
그 결과, 컨트롤인 CHO 세포의 프로콜라겐량을 1 로 하면 CHO YA7 세포에서는 약 20 배로 증가하였다. 또, cis-엘리먼트 #1 의 평가를 위해, 컨트롤 CHO 세포에, cis-엘리먼트 #1 을 포함하지 않는 prCMV-COL1A1-ORF, prCMV-COL1A1-ORF-UTR 도 동일하게 유전자 도입하였다. 이 경우에는, 배양 상청 중의 프로콜라겐량은 웨스턴 블롯법에 의한 검출 한계 이하였다.
또한, 호모트라이머를 형성한 콜라겐의 분비량을 조사하기 위해, 실시예 1 에서 제작한 3 종의 세포주에, pcDNA-cis#1-COL2A1, pcDNA-cis#1-COL3A1 또는 실시예 6 에서 제작한 prCMV-COL1A1 및 prCMV-COL1A1-ORF 를 리포펙션법으로 트랜스펙션하였다. 2 % 소 태아 혈청, 200 μM 아스코르브산을 포함하는 DMEM 중에서 72 시간 배양한 후, 배양 상청을 회수하고 0.1 N 이 되도록 HCl 을 첨가해 산성으로 하고, 0.5 ㎎/㎖ 가 되도록 펩신 (SIGMA 사 제조) 을 첨가하고 4 ℃ 에서 16 시간 소화 반응을 실시하였다. 이것에 1 M 이 되도록 NaCl 을 첨가해 빙상에서 3 시간 정치한 후, 원심분리를 실시하고, 얻어진 침전을 1 M NaCl 과 95 % 에탄올로 세정하였다. 이 콜라겐 정제 시료를 SDS-PAGE 로 영동하여 각 콜라겐의 밴드 강도를 비교하였다. 그 결과, 컨트롤 CHO 세포의 분비량을 1 로 했을 때, CHO YA7 세포에 있어서의 COL1A1, COL2A1, COL3A1 의 각 호모트라이머의 분비량은 각각 1.8, 1.9, 3.7 배로 유의하게 증가해 있었다 (도 5B ∼ 도 5D). cis-엘리먼트 #1 비존재하에 있어서도, CHO 3D5 세포, CHO YA7 세포에서는 컨트롤의 1.5 배, 2.1 배로 호모트라이머 분비량이 증가하였다.
이상으로부터, cis-엘리먼트 #1 은 각종 CHO 세포에 있어서 콜라겐 분자의 발현을 증강시켜, SF3b4 단백질 및/또는 p180 단백질의 존재하에서 cis-엘리먼트 #1 을 이용하면 3 중 나선 구조를 유지한 콜라겐 분비량이 더 증가하는 것이 나타났다.
실시예 7 : cis-엘리먼트에 의한 항체 분자의 발현 증강 효과
cis-엘리먼트에 의한 항체 발현에의 영향을 이하와 같이 검토하였다.
항체 중사슬 및 경사슬 전체 길이의 발현 플라스미드를 이하의 방법에 따라 구축하였다. 즉, 항IL-8 항체 발현 플라스미드 (p6G425V11N35A.choSD, ATCC 209552) 에 코드되는 항체 중사슬 (Heavy chain, HC) 및 경사슬 (Light chain, LC) 전체 길이 배열을 인공 유전자 합성 서비스 (MBL 사) 에 의해 합성하였다. 그 후, 중사슬 ORF 전체 길이는 pEF1/Myc-His 벡터의 NheI-SpeI 사이트에, 경사슬 ORF 전체 길이는 pEF1/Myc-His 벡터의 KpnI-EcoRV 사이트에 각각 삽입 연결하였다. 그 후, 경사슬 발현 카세트를 ClaI 로 잘라내고, 중사슬 발현 벡터의 ClaI 사이트에 삽입 연결하여, 항IL-8 항체 (중사슬, 경사슬) 공발현 플라스미드 pEF-HC-LC 를 구축하였다. 또한 이 플라스미드의 중사슬 및 경사슬 ORF 상류에 cis#1 을 삽입한 발현 플라스미드 pEF-cis#1-HC-LC 도 아울러 구축하였다.
실시예 1 에서 제작한 3 종의 세포주에, pEF-HC-LC, pEF-cis#1-HC-LC 를 리포펙션법으로 트랜스펙션하였다. 0.1 % 소 태아 혈청을 포함하는 DMEM 중에서 96 시간 배양한 후, 배양 상청 중의 항체 산생량을 Human IgG ELISA Quantitation Set (Bethyl 사) 를 사용하여 ELISA 법에 의해 정량하였다. 그 결과, CHO 세포에 있어서 cis-엘리먼트 #1 의 삽입에 의해, 항체 분비량은 2.7 배로 증가하였다. CHO 3D5 세포, CHO YA7 세포의 각 세포에 있어서도 cis-엘리먼트 #1 의 삽입에 의해, 항체 분비량은 각각 2.5, 1.8 배로 증가하였다 (도 6A). 이들 결과로부터, cis-엘리먼트 #1 을 발현 유닛 내에 삽입함으로써, 각종 CHO 세포에 있어서 항체 분비량을 증가시킬 수 있는 것이 나타났다.
도 6B 에 나타내는 바와 같이, CHO 세포에서의 pEF-HC-LC 도입 시의 항체 분비량을 1 로 한 경우 SF3b4 를 도입한 CHO 3D5 세포, SF3b4 및 p180 을 도입한 CHO YA7 세포의 항체 분비량은 2.5 배, 12.6 배로 증가하여, p180 단백질, 및/또는 SF3b4 의 도입에 의해 항체 분비량의 증가가 확인되었다. 이들 경향은, cis-엘리먼트 #1 을 사용하면 더 현저한 효과가 얻어지고, CHO 3D5 세포의 항체 분비량은, 컨트롤인 CHO 세포의 5.6 배로 증가하고, CHO YA7 세포에서는 21.3 배로 현저하게 증가해 있었다.
이상으로부터, cis-엘리먼트 #1 이 항체 생산에 유효하게 작용하는 것, 그 활성은 SF3b4 단백질 또는 p180 단백질의, 또는 그 양자의 존재하에 있어서 더 현저하게 작용하는 것이 나타났다.
실시예 8 : kozak 배열과 cis-엘리먼트 #1 의 분비 활성화 효과의 비교
본 실시예에 있어서는, 진핵 세포의 mRNA 중에 있어서 번역의 개시에 관여하는 공통 배열로서 알려진 kozak 배열이 나타내는 분비 활성화 효과와, cis-엘리먼트가 나타내는 분비 활성화 효과를 비교하는 것을 목적으로 해 실시했다. .
실시예 4 에 있어서 제조한 prCMV-SEAP 및 prCMV-cis#1-SEAP 의 개시 메티오닌 코돈 ATG 의 직전의 6 bp 의 배열 TCCTGC 를 GCCACC 로 치환한 발현 플라스미드 prCMV-SEAP-kozak, prCMV-cis#1-SEAP-kozak 을 이하의 방법에 의해 구축하였다. 즉, SEAP 특이적 프라이머를 이용하여 PCR 을 실시하고, ATG 의 직전에 GCCACC 를 부가한 SEAP 단편 (1 ∼ 132) 을 증폭하였다. 계속해서 prCMV-SEAP 및 prCMV-cis#1-SEAP 로부터 SEAP (1 ∼ 132) 영역을 HindIII-PstI 로 제거하고, HindIII-PstI 로 처리한 증폭 단편으로 치환함으로써, SEAP ORF 상류에 kozak 배열을 삽입한 SEAP 발현 플라스미드 prCMV-SEAP-kozak 과 prCMV-cis#1-SEAP-kozak 을 얻었다.
CHO 세포, CHO 3D5 세포 및 CHO YA7 세포에 prCMV-SEAP, prCMV-SEAP-kozak, prCMV-cis#1-SEAP, prCMV-cis#1-SEAP-kozak 을 트랜스펙션하고, 20 시간 후의 배양 상청 중의 SEAP 활성을 실시예 5 에 기재된 방법으로 측정하였다. 그 결과, prCMV-SEAP 에 비해, prCMV-cis#1-SEAP, prCMV-cis#1-SEAP-kozak 의 경우에는 CHO 세포의 SEAP 활성은 2 배 이상으로 증강하고 (도 7), 그 효과는 단백질 발현에 유효로서 알려진 코작 배열과 동등 이상을 나타내는 것이 확인되었다.
이 증가 경향은 CHO 3D5 세포나 CHO YA7 세포에 있어서도 강하게 관찰되고, cis-엘리먼트 #1 을 부가하면, SEAP 활성비가 3.3 ∼ 3.4 배로, kozak 배열과 cis-엘리먼트 #1 의 양자를 부가했을 때에는 3.3 ∼ 4.9 배로 증가하였다 (도 7).
이들로부터, CHO 세포, CHO 3D5 세포 및 CHO YA7 세포에 있어서 cis-엘리먼트 #1 에 의한 분비 활성화의 효과는 kozak 배열의 효과보다 높고, cis-엘리먼트 #1, SF3b4 단백질, 및 p180 단백질의 3 인자와 kozak 배열을 병용함으로써, 분비 활성능을 더 증강시킬 수 있는 것이 나타났다.
실시예 9 : cis-엘리먼트 부가에 의한 단백질 발현 증강 효과
실시예 1 에 있어서 제작한 세포에 대해, 각종 cis-엘리먼트를 포함하는 발현 플라스미드를 사용하여, 단백질 발현 증강 작용이 있는 cis-엘리먼트 배열의 상세를 검토하였다.
prCMV-SEAP 에 인간 유래의 피브로넥틴 유전자의 cis-엘리먼트 배열, cis-엘리먼트 #2 (SEQ ID NO : 6) 를 삽입한 발현 벡터 prCMV-cis#2-SEAP 는, 이하의 방법에 따라 구축하였다. 즉, 인간 선유아세포 유래의 RNA 를 비특허문헌 1 (Ueno, et al., (2010) J Biol Chem 285, 29941-29950) 에 기재된 방법에 준해 조제한 RNA 를 주형으로 해서 RT-PCR 을 실시하였다. 증폭 시에 5', 3' 측에 BglII 와 HindIII 인식 배열을 각각 부가한 프라이머 (SEQ ID NO : 13, SEQ ID NO : 14) 를 사용하여, cis-엘리먼트 #2 를 포함하는 단편을 증폭하였다. 증폭 단편을 BglII-HindIII 으로 처리한 후, prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #2 를 삽입한 발현 플라스미드를 얻었다.
prCMV-SEAP 에 대해, 인간 유래의 I 형 콜라겐 α1 유전자의 cis-엘리먼트 배열, cis-엘리먼트 #3, 및 인간 유래의 피브로넥틴 유전자의 cis-엘리먼트 배열, cis-엘리먼트 #4 를 삽입한 발현 벡터 prCMV-cis#3-SEAP 등은, 이하의 방법에 따라 구축하였다. 즉, cis-엘리먼트 #3 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 9, SEQ ID NO : 10) 혹은 cis-엘리먼트 #4 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 11, SEQ ID NO : 12) 를 95 ℃ 에서 10 분 열처리 후에 단계적으로 25 ℃ 까지 낮추고 2 개의 프라이머를 어닐링시킴으로써 각종 링커를 조제하였다. 각종 링커를 prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #3 (SEQ ID NO : 7), cis-엘리먼트 #4 (SEQ ID NO : 8) 를 삽입한 발현 플라스미드를 얻었다.
prCMV-SEAP 에 cis-엘리먼트 #5, #6 을 삽입한 발현 벡터 prCMV-cis#5-SEAP, prCMV-cis#6-SEAP 는, 이하의 방법에 따라 구축하였다. cis-엘리먼트 #1 의 부분 배열을 BglII 와 HindIII 인식 배열을 각각 부가한 프라이머 (SEQ ID NO : 28 및 29, SEQ ID NO : 30 및 31) 를 사용하여, cis-엘리먼트 #5 (1-60), cis-엘리먼트 #6 (61-126) 을 포함하는 단편을 증폭하였다. 증폭 단편을 BglII-HindIII 으로 처리한 후, prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #5, cis-엘리먼트 #6 을 삽입한 발현 플라스미드를 각각 얻었다.
prCMV-SEAP 에 cis-엘리먼트 #7 을 삽입한 발현 벡터 prCMV-cis#7-SEAP 는 이하의 방법에 따라 구축하였다. COL2A1 유전자 유래 배열을 합성 후, 말단에 부가한 BglII, HindIII 인식 배열을 이용하여 prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #7 을 삽입한 발현 플라스미드를 얻었다.
prCMV-SEAP 에 cis-엘리먼트 #2 유래 배열인 cis-엘리먼트 #8, #9, #10 을 삽입한 발현 벡터 prCMV-cis#8-SEAP, prCMV-cis#9-SEAP, prCMV-cis#10-SEAP 는, 이하의 방법에 따라 구축하였다. 즉, cis-엘리먼트 #8 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 32, SEQ ID NO : 33), cis-엘리먼트 #9 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 34, SEQ ID NO : 35), cis-엘리먼트 #10 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 36, SEQ ID NO : 37) 를 95 ℃ 에서 10 분 열처리 후에 단계적으로 25 ℃ 까지 낮추고 2 개의 프라이머를 어닐링시킴으로써 각종 링커를 조제하였다. 각종 링커를 prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #8 (SEQ ID NO : 24), cis-엘리먼트 #9 (SEQ ID NO : 25), cis-엘리먼트 #10 (SEQ ID NO : 26) 을 삽입한 발현 플라스미드를 얻었다.
prCMV-SEAP 에 cis-엘리먼트 #11 을 삽입한 발현 벡터 prCMV-cis#11-SEAP 는, 이하의 방법에 따라 구축하였다. cis-엘리먼트 #1 의 부분 배열을 BglII 와 HindIII 인식 배열을 각각 부가한 프라이머 (SEQ ID NO : 38, SEQ ID NO : 39) 를 사용하여, cis-엘리먼트 #11 (1-113) 을 포함하는 단편을 증폭하였다. 증폭 단편을 BglII-HindIII 으로 처리한 후, prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #11 (SEQ ID NO : 27) 을 삽입한 발현 플라스미드를 각각 얻었다.
[표 4]
CHO YA7 세포에, prCMV-cis#1-SEAP, prCMV-cis#2-SEAP, prCMV-cis#3-SEAP, prCMV-cis#4-SEAP, prCMV-cis#5-SEAP, prCMV-cis#6-SEAP, prCMV-cis#7-SEAP, prCMV-cis#8-SEAP, prCMV-cis#9-SEAP, prCMV-cis#10-SEAP, prCMV-cis#11-SEAP, prCMV-SEAP 를 트랜스펙션하였다. 20 시간 후의 배양 상청 중의 SEAP 활성을 실시예 5 에 기재된 방법으로 측정하였다. prCMV-SEAP 의 경우의 SEAP 활성을 1 로 하면, 사용한 모든 cis-엘리먼트는 약 2.0 ∼ 3.4 배로 SEAP 의 분비 활성비가 상승하였다 (도 8A). 이때 막 획분의 SF3b4 단백질량을 웨스턴 블롯법으로 해석하고, 덴시토메트리 처리에 의해 정량하면 cis-엘리먼트 #1, cis-엘리먼트 #2, cis-엘리먼트 #3, cis-엘리먼트 #4, cis-엘리먼트 #5, cis-엘리먼트 #6 각각의 막 획분 중의 SF3b4 단백질량은 컨트롤의 2.0 ∼ 3.6 배로 유의하게 증가해 있었다 (도 8B).
이상의 결과로부터, cis-엘리먼트 #1 ∼ #11 을 발현 유닛 내에 부가하면 단백질 발현 증강 효과가 있는 SF3b4 단백질을 소포체막 상에 국재화시키는 것이 가능해지고, 이것을 개재하여 세포의 분비능을 증강 가능한 것이 나타났다.
실시예 10 : 모티프 내 배열 사슬 길이의 효과
cis-엘리먼트 #1 에 동정된 모티프 배열 GAN1-(X)n-ACN2 에 대해, 유효한 사슬 길이수 n 의 검토를 이하와 같이 실시하였다. GAG-(X)n-ACV (V 는 A 또는 G 또는 C 를 나타낸다) 에 대해, n 을 1-9 mer 까지 변화시킨 cis-엘리먼트 #3 유래의 변이체를 실시예 8 과 동일한 방법으로 구축하였다 (도 9A). 또 모티프를 결실시킨 변이체 (motif delete) 도 아울러 구축하였다. 각 엘리먼트의 SEAP 분비 활성을 평가하기 위해, 실시예 5 에 기재된 방법에 따라, 각각의 분비 활성을 평가하였다. 그 결과, n = 3 ∼ 6 인 경우에, cis-엘리먼트 #3 과 동등한 활성이 얻어졌다 (도 9B). 이상의 결과로부터, 본 계에 있어서 분비 활성화에 중요해지는 cis-엘리먼트 내의 모티프는 GAN1-(X)n-ACN2 의 X 사슬 길이 n 이 3 ∼ 6 잔기인 것이 판명되었다.
실시예 11 : 모티프 배열의 염기 치환, 삽입에 의한 영향
모티프 내의 염기 치환 및 삽입에 의한 발현 증강 활성에의 영향을 검토하였다. Cis-엘리먼트 #3 내의 모티프 GAN1-(X)n-ACN2 에 대해, N1 및 N2 를 각각 A, G, C, T 로 한 cis-엘리먼트 #3 유래의 변이체를 실시예 8 과 동일한 방법으로 구축하였다 (도 10A). 또 polyA 배열, polyC 배열에 모티프를 삽입한 변이체와 컨트롤도 아울러 구축하였다 (도 10A). 실시예 5 에 기재된 방법에 따라, 각 엘리먼트의 분비 활성을 평가하였다. 그 결과, cis-엘리먼트 #3 의 N2 를 G 로부터 A, C, T 로 치환했을 때의 SEAP 활성은, 모두 cis-엘리먼트 #3 과 동등한 활성이 얻어졌다 (도 10B). cis-엘리먼트 #3 의 N1 을 G 로부터 A, C, T 로 치환했을 때의 SEAP 활성은, 모두 cis-엘리먼트 #3 과 동등한 활성을 나타냈다 (도 10B). 또 모티프를 삽입한 엘리먼트도 cis-엘리먼트 #3 과 동등한 활성을 가지고 있었다. 이상의 결과로부터, 높은 활성을 갖는 모티프로서 GAN1-(X)n-ACN2 (N1 및 N2 는 A, G, C, T 의 어느 염기라도 되고, n = 3 ∼ 6 의 정수) 라고 확인되었다.
실시예 12 : SF3b4 발현 억제에 수반하는 콜라겐 분비량의 저하
SF3b4 의 발현 억제에 수반한 콜라겐 분비량에의 영향을 검토하였다. 인간 태아 폐 유래 섬유아세포 (HEL) 에, Oligofectamine (Life technologies) 의 정법에 따라 SF3b4 에 대한 siRNA (Life technologies, human SF3b4 siRNA HSS115684) 를 트랜스펙션하였다. 0.1 % FBS-DMEM, 아스코르브산인산에스테르 200 μM 의 조건하에서 4 일간 배양하였다. 그 후, 배지를 회수하고, 배양 상청 중의 COL1A1 프로콜라겐량 그리고 세포 획분의 SF3b4 단백질량을 실시예 6 의 방법에 준해 해석하였다. 그 결과, 세포 내의 SF3b4 발현량이 컨트롤의 20 % 로 저하되었을 때, 분비된 COL1A1 프로콜라겐량은 10 % 로 저하하였다 (도 11). 이상의 결과로부터, SF3b4 의 발현 억제에 수반해 콜라겐의 산생이 현저하게 억제되는 것이 나타났다.
실시예 13 : p180/SF3b4 공발현 부유 세포주에 있어서의 콜라겐 분비에의 영향
인간 p180 단백질과 인간 SF3b4 를 안정 공발현하는 CHO-S 세포주를 이하의 방법에 의해 수립하였다. CHO-S 세포 (Life technologies 사) 에, pCDNA-p180/54R 을 리포펙션법에 의해 트랜스펙션하고, Zeocin 300 ㎍/㎖ 존재하에서 14 일간 배양해, 약제 선택을 실시하였다. Zeocin 내성 세포주의 콜로니를 분리하고 pEF-SF3b4 를 리포펙션법에 의해 트랜스펙션하고, Hygromycin 600 ㎍/㎖ 의 조건으로 약제 선택을 실시하였다. 14 일간 배양 후, Zeocin 및 Hygromycin 의 양자에 내성을 갖는 세포주의 콜로니를 분리해, 인간 p180 단백질과 인간 SF3b4 를 안정적으로 공발현하는 CHO-S 유래 세포주 54#160 을 수립하였다.
컨트롤로서 CHO-S 세포 및 제조한 54#160 세포에, prCMV-COL1A1, prCMV-COL1A1-ORF 를 각각 리포펙션법으로 트랜스펙션하였다. 무혈청, 8 mM L-글루타민을 포함하는 CD FortiCHO 배양액 (Life technologies 사) 중에서 96 시간 배양한 후, 배양 상청 중의 COL1A1 프로콜라겐량을 웨스턴 블롯법에 의해 해석하였다. cis-엘리먼트 #1 을 포함하는 prCMV-COL1A1 을 유전자 도입한 경우, 컨트롤인 CHO-S 세포의 프로콜라겐량을 1 로 하면 54#160 세포에서는 약 3.5 배로 증가하였다. 또, cis-엘리먼트 #1 을 포함하지 않는 prCMV-COL1A1-ORF 를 유전자 도입한 경우, 배양 상청 중의 프로콜라겐량은 웨스턴 블롯법에 의한 검출 한계 이하였다.
이상으로부터, 부유화 CHO-S 세포에 있어서 무혈청 조건하에서, cis-엘리먼트 #1 은, 거대 분자인 콜라겐의 합성/분비를 증강시킬 수 있고, 또한 cis-엘리먼트 #1, SF3b4 단백질 및 p180 단백질의 3 인자에 의해 부유화 CHO 세포의 분비 활성을 현저하게 증강 가능한 것이 나타났다.
실시예 14 : cis-엘리먼트 #1 에 의한 폴리솜 중 mRNA 의 중량화 시프트
CHO YA7 세포에 prCMV-COL1A1, prCMV-COL1A1-ORF 를 각각 리포펙션법으로 트랜스펙션하였다. 40 시간 후, 실시예 3 에 기재된 방법에 따라, 막 획분을 조제하였다. 얻어진 막 획분을 15 ∼ 50 % 의 자당 밀도 구배 원심분리에 제공하여, 폴리솜 획분을 분획하였다. 각 획분으로부터 실시예 5 에 기재된 방법에 준해 mRNA 를 추출하고, 정량적 PCR 에 의해 COL1A1 cDNA 량을 정량하였다. 또, 이때의 분비 프로콜라겐량을 실시예 6 에 기재된 방법으로 해석하였다. 그 결과, 폴리솜 획분 중의 COL1A1 cDNA 는, cis 엘리먼트를 포함하지 않는 prCMV-COL1A1-ORF 의 경우, 프랙션 24 를 피크로 하는 분포인 것에 대해, cis#1 을 포함하는 경우에는 프랙션 26 을 피크로 한 분포가 되어, 보다 고밀도의 획분으로 분포가 시프트해 있었다 (도 12). 또한 피크의 시프트에 수반해, 프로콜라겐의 분비량은 cis-엘리먼트 #1 존재하에서는 컨트롤의 4.9 배로 증가해 있었다. p180 및 SF3b4 존재하에 있어서 cis-엘리먼트 #1 은 mRNA 의 중량화 시프트를 일으키는 능력을 갖고, 이 중량화 시프트는 발현 증가와 상관하는 것이 확인되었다.
산업상 이용가능성
p180 단백질의 전체 길이 또는 그 부분의 발현, 그리고 SF3b4 단백질의 전체 길이 또는 그 부분의 발현이 항진된 본 발명의 재조합 세포는, 목적물로서의 단백질을 코드하는 DNA 를 형질 전환하면, 목적물로서의 단백질의 합성능 또는 분비능이, 비약적으로 증가하는 것이 밝혀졌다.
배열표 프리텍스트
SEQ ID NO : 1 : 인간 p180 을 코드하는 뉴클레오티드 배열
SEQ ID NO : 2 : 인간 p180 단백질의 아미노산 배열
SEQ ID NO : 3 : 인간 SF3b4 를 코드하는 뉴클레오티드 배열
SEQ ID NO : 4 : 인간 SF3b4 단백질의 아미노산 배열
SEQ ID NO : 5 : cis-엘리먼트 #1
SEQ ID NO : 6 : cis-엘리먼트 #2
SEQ ID NO : 7 : cis-엘리먼트 #3
SEQ ID NO : 8 : cis-엘리먼트 #4
SEQ ID NO : 9 : cis-엘리먼트 #3 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 10 : cis-엘리먼트 #3 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 11 : cis-엘리먼트 #4 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 12 : cis-엘리먼트 #4 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 13 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #2 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 14 : 3' 측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #2 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 15 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #1 을 증폭하기 위한 프라이머
SEQ ID NO : 16 : 3' 측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #1 을 증폭하기 위한 프라이머
SEQ ID NO : 17 : cis-엘리먼트의 모티프 (9 mer)
SEQ ID NO : 18 : cis-엘리먼트의 모티프 (10 mer)
SEQ ID NO : 19 : cis-엘리먼트의 모티프 (11 mer)
SEQ ID NO : 20 : cis-엘리먼트의 모티프 (12 mer)
SEQ ID NO : 21 : cis-엘리먼트 #5
SEQ ID NO : 22 : cis-엘리먼트 #6
SEQ ID NO : 23 : cis-엘리먼트 #7
SEQ ID NO : 24 : cis-엘리먼트 #8
SEQ ID NO : 25 : cis-엘리먼트 #9
SEQ ID NO : 26 : cis-엘리먼트 #10
SEQ ID NO : 27 : cis-엘리먼트 #11
SEQ ID NO : 28 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #5 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 29 : 3' 측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #5 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 30 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #6 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 31 : 3'측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #6 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 32 : cis-엘리먼트 #8 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 33 : cis-엘리먼트 #8 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 34 : cis-엘리먼트 #9 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 35 : cis-엘리먼트 #9 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 36 : cis-엘리먼트 #10 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 37 : cis-엘리먼트 #10 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 38 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #11 의 cis-엘리먼트를 포함하는 프라이머
SEQ ID NO : 39 : 3' 측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #11 의 cis-엘리먼트를 포함하는 프라이머
SEQUENCE LISTING
<110> NIPPI, INCORPORATED
<120> A method for producing a protein.
<130> FA1238-14040PCT
<150> JP2013-064357
<151> 2013-03-26
<150> JP2013-261178
<151> 2013-12-18
<160> 39
<170> PatentIn version 3.5
<210> 1
<211> 4623
<212> DNA
<213> Homo sapiens
<220>
<221> CDS
<222> (1)..(4623)
<400> 1
atg gat att tac gac act caa acc ttg ggg gtt gtg gtc ttt gga gga 48
Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly
1 5 10 15
ttc atg gtt gtt tct gcc att ggc atc ttc ctg gtg tcg act ttc tcc 96
Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser
20 25 30
atg aag gaa acg tca tat gaa gaa gcc cta gcc aac cag cgc aag gag 144
Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu
35 40 45
atg gcg aaa act cac cac cag aaa gtc gag aag aaa aag aag gag aaa 192
Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys
50 55 60
aca gtg gag aag aaa gga aag acc aag aaa aag gaa gag aaa cct aat 240
Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn
65 70 75 80
ggg aag ata cct gat cat gat cca gcc ccc aat gtg act gtc ctc ctt 288
Gly Lys Ile Pro Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu
85 90 95
cga gaa cca gtg cgg gct cct gct gtg gct gtg gct cca acc cca gtg 336
Arg Glu Pro Val Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val
100 105 110
cag ccc ccc att atc gtt gct cct gtc gcc aca gtt cca gcc atg ccc 384
Gln Pro Pro Ile Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro
115 120 125
cag gag aag ctg gcc tcc tcc ccc aag gac aaa aag aag aag gag aaa 432
Gln Glu Lys Leu Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys
130 135 140
aaa gtg gca aaa gtg gaa cca gct gtc agc tct gta gtg aat tcc atc 480
Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile
145 150 155 160
cag gtt ctc act tcg aag gct gcc atc ttg gaa act gct ccc aag gag 528
Gln Val Leu Thr Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu
165 170 175
gtg ccg atg gtg gtg gtg ccc cca gtg ggt gcc aag ggc aac aca cca 576
Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro
180 185 190
gcc act ggc act act cag ggc aaa aag gcg gag ggg act cag aat caa 624
Ala Thr Gly Thr Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln
195 200 205
agc aaa aag gct gaa gga gcc cca aac cag ggc aga aag gca gag gga 672
Ser Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly
210 215 220
acc cca aac cag ggc aaa aag aca gag gga acc cca aac caa ggg aaa 720
Thr Pro Asn Gln Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys
225 230 235 240
aag gca gag gga acc cca aac caa ggc aaa aag gca gaa gga acc cca 768
Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro
245 250 255
aac caa ggc aaa aag gcg gag ggg gcc cag aac cag ggt aaa aag gta 816
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val
260 265 270
gat aca acc cca aac cag ggg aaa aag gtg gag ggg gcc cca acc cag 864
Asp Thr Thr Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln
275 280 285
ggc aga aag gcc gag ggg gct cag aac cag gcc aaa aag gta gaa ggg 912
Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly
290 295 300
gcc cag aac cag ggc aaa aag gca gag ggg gcc cag aat cag ggc aaa 960
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
305 310 315 320
aag gga gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag 1008
Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
325 330 335
aat cag ggc aag aag gcc gag ggg gcc cag aat cag ggc aag aag gcc 1056
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
340 345 350
gag ggg gcc cag aat cag ggc aag aag gcc gag ggg gcc cag aat cag 1104
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
355 360 365
ggc aag aag gct gag ggg gct cag aac cag ggc aaa aag gcc gag ggg 1152
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
370 375 380
gct cag aac cag ggc aaa aaa gta gaa ggg gcc cag aac cag ggc aag 1200
Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys
385 390 395 400
aag gct gag ggt gcc cag aac cag ggc aaa aag gcc gag ggg gcc cag 1248
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
405 410 415
aat cag ggc aaa aag gcc gag ggg gcc cag aac cag ggc aag aag gca 1296
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
420 425 430
gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag 1344
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
435 440 445
gac aag aag gcc gag ggg gcc cag aac cag ggc agg aag gcc gag ggg 1392
Asp Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly
450 455 460
gcc cag aac cag ggc agg aag gcc gag ggg gcc cag aac cag ggc aag 1440
Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
465 470 475 480
aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg acc ccg 1488
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro
485 490 495
aac cag ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc 1536
Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala
500 505 510
gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag 1584
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
515 520 525
ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc gag ggg 1632
Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly
530 535 540
gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag 1680
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
545 550 555 560
aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag 1728
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
565 570 575
aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag aag gcc 1776
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
580 585 590
gag ggt gct cag aac cag ggc aaa aaa gta gaa ggg gcc cag aac cag 1824
Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln
595 600 605
ggc aag aag gct gag ggg gcc cag aac cag ggc aag aag gcc gag ggg 1872
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
610 615 620
gct cag aac cag ggc aaa aag gcc gag gga gcc cag aac cag ggc caa 1920
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Gln
625 630 635 640
aaa gga gag gga gcc cag aat cag ggt aaa aag aca gaa ggg gct cag 1968
Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr Glu Gly Ala Gln
645 650 655
ggc aaa aag gca gaa agg agt ccc aac caa ggc aaa aaa gga gag gga 2016
Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys Lys Gly Glu Gly
660 665 670
gct ccc atc cag ggc aaa aag gca gat tcg gtt gct aat cag ggc aca 2064
Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala Asn Gln Gly Thr
675 680 685
aag gta gag ggt att aca aac cag ggg aaa aaa gca gaa ggg tcc ccc 2112
Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala Glu Gly Ser Pro
690 695 700
agt gaa ggc aaa aag gca gaa ggg tcc ccc aac caa ggc aaa aag gca 2160
Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln Gly Lys Lys Ala
705 710 715 720
gac gca gct gcc aat cag ggt aaa aag aca gag tca gct tct gtc cag 2208
Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser Ala Ser Val Gln
725 730 735
ggc aga aat aca gat gtg gcc cag agc cca gag gca cca aag caa gag 2256
Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala Pro Lys Gln Glu
740 745 750
gct cct gcc aag aag aag tct ggt tca aag aaa aaa ggt gag cct ggg 2304
Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu Pro Gly
755 760 765
ccc cca gat gcc gac ggc cct ctc tac ctc ccc tac aag acg ctg gtc 2352
Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr Lys Thr Leu Val
770 775 780
tcc acg gtt ggg agc atg gtg ttc aac gag ggc gag gcc cag cgg ctc 2400
Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln Arg Leu
785 790 795 800
atc gag atc ctg tcc gag aag gct ggc atc att cag gac acc tgg cac 2448
Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln Asp Thr Trp His
805 810 815
aag gcc act cag aag ggt gac cct gtg gcg att ctg aaa cgc cag ctg 2496
Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg Gln Leu
820 825 830
gaa gag aag gaa aaa ctg ctg gcc aca gaa cag gaa gat gcg gct gtc 2544
Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala Ala Val
835 840 845
gcc aag agc aaa ctg agg gag ctc aac aag gag atg gca gca gaa aag 2592
Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met Ala Ala Glu Lys
850 855 860
gcc aaa gca gca gcc ggg gag gcc aaa gtg aaa aag cag ctg gtg gcc 2640
Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu Val Ala
865 870 875 880
cgg gag cag gag atc acg gct gtg cag gca cgc atg cag gcc agc tac 2688
Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met Gln Ala Ser Tyr
885 890 895
cgg gag cac gtg aag gag gtg cag cag ctg cag ggc aag atc cgg act 2736
Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile Arg Thr
900 905 910
ctt cag gag cag ctg gag aat ggc ccc aac acg cag ctg gcc cgc ctg 2784
Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala Arg Leu
915 920 925
cag cag gag aac tcc atc ctg cgg gat gcc ttg aac cag gcc acg agc 2832
Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala Thr Ser
930 935 940
cag gtg gag agc aag cag aac gca gag ctg gcc aag ctt cgg cag gag 2880
Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys Leu Arg Gln Glu
945 950 955 960
ctc agc aag gtc agc aaa gag ctg gtg gag aag tca gag gct gtg cgg 2928
Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala Val Arg
965 970 975
caa gat gag cag cag cgg aaa gct ctg gaa gcc aag gca gct gcc ttc 2976
Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys Ala Ala Ala Phe
980 985 990
gag aag cag gtc ctg cag ctg cag gcg tcc cac agg gag agt gag gag 3024
Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg Glu Ser Glu Glu
995 1000 1005
gcc ctg cag aag cgc ctg gac gag gtc agc cgg gag ctg tgc cac 3069
Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys His
1010 1015 1020
acg cag agc agc cac gcc agc ctc cgg gcg gat gcc gag aag gcc 3114
Thr Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala
1025 1030 1035
cag gag caa cag cag cag atg gcc gag ctg cac agc aag tta cag 3159
Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln
1040 1045 1050
tcc tcc gag gca gag gtg cgc agc aaa tgc gag gag ctg agt ggc 3204
Ser Ser Glu Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly
1055 1060 1065
ctc cac ggg cag ctc cag gag gcc agg gcg gag aac tcc cag ctc 3249
Leu His Gly Gln Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu
1070 1075 1080
aca gag aga atc cgt tcc att gag gcc ctg ctg gag gcg ggc cag 3294
Thr Glu Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln
1085 1090 1095
gcg cgg gat gcc cag gac gtc cag gcc agc cag gcg gag gct gac 3339
Ala Arg Asp Ala Gln Asp Val Gln Ala Ser Gln Ala Glu Ala Asp
1100 1105 1110
cag cag cag act cgc ctc aag gag ctg gag tcc cag gtg tcg ggt 3384
Gln Gln Gln Thr Arg Leu Lys Glu Leu Glu Ser Gln Val Ser Gly
1115 1120 1125
ctg gag aag gag gcc atc gag ctc agg gag gcc gtc gag cag cag 3429
Leu Glu Lys Glu Ala Ile Glu Leu Arg Glu Ala Val Glu Gln Gln
1130 1135 1140
aaa gtg aag aac aat gac ctc cgg gag aag aac tgg aag gcc atg 3474
Lys Val Lys Asn Asn Asp Leu Arg Glu Lys Asn Trp Lys Ala Met
1145 1150 1155
gag gca ctg gcc acg gcc gag cag gcc tgc aag gag aag ctg cac 3519
Glu Ala Leu Ala Thr Ala Glu Gln Ala Cys Lys Glu Lys Leu His
1160 1165 1170
tcc ctg acc cag gcc aag gag gaa tcg gag aag cag ctc tgt ctg 3564
Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys Gln Leu Cys Leu
1175 1180 1185
att gag gcg cag acc atg gag gcc ctg ctg gct ctg ctc cca gaa 3609
Ile Glu Ala Gln Thr Met Glu Ala Leu Leu Ala Leu Leu Pro Glu
1190 1195 1200
ctc tct gtc ttg gca caa cag aat tac acc gag tgg ctg cag gat 3654
Leu Ser Val Leu Ala Gln Gln Asn Tyr Thr Glu Trp Leu Gln Asp
1205 1210 1215
ctc aaa gag aaa ggc ccc acg ctg ctg aag cac ccg cca gct ccc 3699
Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys His Pro Pro Ala Pro
1220 1225 1230
gcg gag cct tcc tcg gac ctg gcc tcc aag ttg agg gag gcc gag 3744
Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu
1235 1240 1245
gag acg cag agc aca ctg cag gcc gag tgt gac cag tac cgc agc 3789
Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln Tyr Arg Ser
1250 1255 1260
atc ctg gcg gag acg gag ggc atg ctc aga gac ctg cag aag agc 3834
Ile Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln Lys Ser
1265 1270 1275
gtg gag gag gag gag cag gtg tgg agg gcc aag gtg ggc gcc gca 3879
Val Glu Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala Ala
1280 1285 1290
gag gag gag ctc cag aag tcc cgg gtc aca gtg aag cat ctc gaa 3924
Glu Glu Glu Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu
1295 1300 1305
gag att gta gag aag cta aaa gga gaa ctt gaa agt tcg gac cag 3969
Glu Ile Val Glu Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln
1310 1315 1320
gtg agg gag cac acg tcg cat ttg gag gca gag ctg gaa aag cac 4014
Val Arg Glu His Thr Ser His Leu Glu Ala Glu Leu Glu Lys His
1325 1330 1335
atg gcg gcc gcc agc gcc gag tgc cag aac tac gcc aag gag gtg 4059
Met Ala Ala Ala Ser Ala Glu Cys Gln Asn Tyr Ala Lys Glu Val
1340 1345 1350
gca ggg ctg agg caa ctt ctc cta gaa tct caa tct cag ctc gat 4104
Ala Gly Leu Arg Gln Leu Leu Leu Glu Ser Gln Ser Gln Leu Asp
1355 1360 1365
gcc gcc aag agc gaa gcc cag aaa cag agc gat gag ctt gcc ctg 4149
Ala Ala Lys Ser Glu Ala Gln Lys Gln Ser Asp Glu Leu Ala Leu
1370 1375 1380
gtc agg cag cag ttg agt gaa atg aag agc cac gta gag gat ggt 4194
Val Arg Gln Gln Leu Ser Glu Met Lys Ser His Val Glu Asp Gly
1385 1390 1395
gac att gct ggg gcc cca gct tcc tcc cca gag gcg ccc cca gcc 4239
Asp Ile Ala Gly Ala Pro Ala Ser Ser Pro Glu Ala Pro Pro Ala
1400 1405 1410
gag cag gac ccc gtt cag ctg aag acg cag ctg gag tgg aca gaa 4284
Glu Gln Asp Pro Val Gln Leu Lys Thr Gln Leu Glu Trp Thr Glu
1415 1420 1425
gcc atc ctg gag gat gag cag aca cag cgg cag aag ctc acg gcc 4329
Ala Ile Leu Glu Asp Glu Gln Thr Gln Arg Gln Lys Leu Thr Ala
1430 1435 1440
gag ttt gag gag gct cag acc tcg gca tgt cgg tta caa gaa gaa 4374
Glu Phe Glu Glu Ala Gln Thr Ser Ala Cys Arg Leu Gln Glu Glu
1445 1450 1455
ttg gag aag ctc cgc aca gcc ggc ccc cta gag tct tca gaa aca 4419
Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu Glu Ser Ser Glu Thr
1460 1465 1470
gag gag gcc tca cag ctg aag gag aga cta gaa aaa gag aag aag 4464
Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys
1475 1480 1485
tta aca agt gac ctg ggg cgc gcc gcc acg aga ctg cag gag ctt 4509
Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu Gln Glu Leu
1490 1495 1500
ctg aag acg acc cag gag cag ctg gca agg gag aag gac acg gtg 4554
Leu Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp Thr Val
1505 1510 1515
aag aag ctg cag gaa cag ctg gaa aag gca gag gac ggc agc agc 4599
Lys Lys Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser Ser
1520 1525 1530
tca aag gag ggc acc tct gtc tga 4623
Ser Lys Glu Gly Thr Ser Val
1535 1540
<210> 2
<211> 1540
<212> PRT
<213> Homo sapiens
<400> 2
Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly
1 5 10 15
Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser
20 25 30
Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu
35 40 45
Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys
50 55 60
Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn
65 70 75 80
Gly Lys Ile Pro Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu
85 90 95
Arg Glu Pro Val Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val
100 105 110
Gln Pro Pro Ile Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro
115 120 125
Gln Glu Lys Leu Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys
130 135 140
Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile
145 150 155 160
Gln Val Leu Thr Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu
165 170 175
Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro
180 185 190
Ala Thr Gly Thr Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln
195 200 205
Ser Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly
210 215 220
Thr Pro Asn Gln Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys
225 230 235 240
Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro
245 250 255
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val
260 265 270
Asp Thr Thr Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln
275 280 285
Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly
290 295 300
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
305 310 315 320
Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
325 330 335
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
340 345 350
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
355 360 365
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
370 375 380
Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys
385 390 395 400
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
405 410 415
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
420 425 430
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
435 440 445
Asp Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly
450 455 460
Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
465 470 475 480
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro
485 490 495
Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala
500 505 510
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
515 520 525
Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly
530 535 540
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
545 550 555 560
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
565 570 575
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
580 585 590
Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln
595 600 605
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
610 615 620
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Gln
625 630 635 640
Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr Glu Gly Ala Gln
645 650 655
Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys Lys Gly Glu Gly
660 665 670
Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala Asn Gln Gly Thr
675 680 685
Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala Glu Gly Ser Pro
690 695 700
Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln Gly Lys Lys Ala
705 710 715 720
Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser Ala Ser Val Gln
725 730 735
Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala Pro Lys Gln Glu
740 745 750
Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu Pro Gly
755 760 765
Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr Lys Thr Leu Val
770 775 780
Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln Arg Leu
785 790 795 800
Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln Asp Thr Trp His
805 810 815
Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg Gln Leu
820 825 830
Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala Ala Val
835 840 845
Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met Ala Ala Glu Lys
850 855 860
Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu Val Ala
865 870 875 880
Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met Gln Ala Ser Tyr
885 890 895
Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile Arg Thr
900 905 910
Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala Arg Leu
915 920 925
Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala Thr Ser
930 935 940
Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys Leu Arg Gln Glu
945 950 955 960
Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala Val Arg
965 970 975
Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys Ala Ala Ala Phe
980 985 990
Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg Glu Ser Glu Glu
995 1000 1005
Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys His
1010 1015 1020
Thr Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala
1025 1030 1035
Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln
1040 1045 1050
Ser Ser Glu Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly
1055 1060 1065
Leu His Gly Gln Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu
1070 1075 1080
Thr Glu Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln
1085 1090 1095
Ala Arg Asp Ala Gln Asp Val Gln Ala Ser Gln Ala Glu Ala Asp
1100 1105 1110
Gln Gln Gln Thr Arg Leu Lys Glu Leu Glu Ser Gln Val Ser Gly
1115 1120 1125
Leu Glu Lys Glu Ala Ile Glu Leu Arg Glu Ala Val Glu Gln Gln
1130 1135 1140
Lys Val Lys Asn Asn Asp Leu Arg Glu Lys Asn Trp Lys Ala Met
1145 1150 1155
Glu Ala Leu Ala Thr Ala Glu Gln Ala Cys Lys Glu Lys Leu His
1160 1165 1170
Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys Gln Leu Cys Leu
1175 1180 1185
Ile Glu Ala Gln Thr Met Glu Ala Leu Leu Ala Leu Leu Pro Glu
1190 1195 1200
Leu Ser Val Leu Ala Gln Gln Asn Tyr Thr Glu Trp Leu Gln Asp
1205 1210 1215
Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys His Pro Pro Ala Pro
1220 1225 1230
Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu
1235 1240 1245
Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln Tyr Arg Ser
1250 1255 1260
Ile Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln Lys Ser
1265 1270 1275
Val Glu Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala Ala
1280 1285 1290
Glu Glu Glu Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu
1295 1300 1305
Glu Ile Val Glu Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln
1310 1315 1320
Val Arg Glu His Thr Ser His Leu Glu Ala Glu Leu Glu Lys His
1325 1330 1335
Met Ala Ala Ala Ser Ala Glu Cys Gln Asn Tyr Ala Lys Glu Val
1340 1345 1350
Ala Gly Leu Arg Gln Leu Leu Leu Glu Ser Gln Ser Gln Leu Asp
1355 1360 1365
Ala Ala Lys Ser Glu Ala Gln Lys Gln Ser Asp Glu Leu Ala Leu
1370 1375 1380
Val Arg Gln Gln Leu Ser Glu Met Lys Ser His Val Glu Asp Gly
1385 1390 1395
Asp Ile Ala Gly Ala Pro Ala Ser Ser Pro Glu Ala Pro Pro Ala
1400 1405 1410
Glu Gln Asp Pro Val Gln Leu Lys Thr Gln Leu Glu Trp Thr Glu
1415 1420 1425
Ala Ile Leu Glu Asp Glu Gln Thr Gln Arg Gln Lys Leu Thr Ala
1430 1435 1440
Glu Phe Glu Glu Ala Gln Thr Ser Ala Cys Arg Leu Gln Glu Glu
1445 1450 1455
Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu Glu Ser Ser Glu Thr
1460 1465 1470
Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys
1475 1480 1485
Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu Gln Glu Leu
1490 1495 1500
Leu Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp Thr Val
1505 1510 1515
Lys Lys Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser Ser
1520 1525 1530
Ser Lys Glu Gly Thr Ser Val
1535 1540
<210> 3
<211> 1275
<212> DNA
<213> Homo sapiens
<220>
<221> CDS
<222> (1)..(1275)
<400> 3
atg gct gcc ggg ccg atc tcc gag cgg aat cag gat gcc act gtg tac 48
Met Ala Ala Gly Pro Ile Ser Glu Arg Asn Gln Asp Ala Thr Val Tyr
1 5 10 15
gtg ggg ggc ctg gat gag aag gtt agt gaa ccg ctg ctg tgg gaa ctg 96
Val Gly Gly Leu Asp Glu Lys Val Ser Glu Pro Leu Leu Trp Glu Leu
20 25 30
ttt ctc cag gct gga cca gta gtc aac acc cac atg cca aag gat aga 144
Phe Leu Gln Ala Gly Pro Val Val Asn Thr His Met Pro Lys Asp Arg
35 40 45
gtc act ggc cag cac caa ggc tat ggc ttt gtg gaa ttc ttg agt gag 192
Val Thr Gly Gln His Gln Gly Tyr Gly Phe Val Glu Phe Leu Ser Glu
50 55 60
gaa gat gct gac tat gcc att aag atc atg aac atg atc aaa ctc tat 240
Glu Asp Ala Asp Tyr Ala Ile Lys Ile Met Asn Met Ile Lys Leu Tyr
65 70 75 80
ggg aag cca ata cgg gtg aac aaa gca tca gct cac aac aaa aac ctg 288
Gly Lys Pro Ile Arg Val Asn Lys Ala Ser Ala His Asn Lys Asn Leu
85 90 95
gat gta ggg gcc aac att ttc att ggg aac ctg gac cct gag att gat 336
Asp Val Gly Ala Asn Ile Phe Ile Gly Asn Leu Asp Pro Glu Ile Asp
100 105 110
gag aag ttg ctt tat gat act ttc agc gcc ttt ggg gtc atc tta caa 384
Glu Lys Leu Leu Tyr Asp Thr Phe Ser Ala Phe Gly Val Ile Leu Gln
115 120 125
acc ccc aaa att atg cgg gac cct gac aca ggc aac tcc aaa ggt tat 432
Thr Pro Lys Ile Met Arg Asp Pro Asp Thr Gly Asn Ser Lys Gly Tyr
130 135 140
gcc ttt att aat ttt gct tca ttt gat gct tcg gat gca gca att gaa 480
Ala Phe Ile Asn Phe Ala Ser Phe Asp Ala Ser Asp Ala Ala Ile Glu
145 150 155 160
gcc atg aat ggg cag tac ctc tgt aac cgt cct atc acc gta tct tat 528
Ala Met Asn Gly Gln Tyr Leu Cys Asn Arg Pro Ile Thr Val Ser Tyr
165 170 175
gcc ttc aag aag gac tcc aag ggt gag cgc cat ggc tca gca gcc gaa 576
Ala Phe Lys Lys Asp Ser Lys Gly Glu Arg His Gly Ser Ala Ala Glu
180 185 190
cga ctt ctg gca gct cag aac ccg ctc tcc cag gct gat cgc cct cat 624
Arg Leu Leu Ala Ala Gln Asn Pro Leu Ser Gln Ala Asp Arg Pro His
195 200 205
cag ctg ttt gca gat gca cct cct cca ccc tct gct ccc aat cct gtg 672
Gln Leu Phe Ala Asp Ala Pro Pro Pro Pro Ser Ala Pro Asn Pro Val
210 215 220
gta tca tca ttg ggg tct ggg ctt cct cca cca ggc atg cct cct cct 720
Val Ser Ser Leu Gly Ser Gly Leu Pro Pro Pro Gly Met Pro Pro Pro
225 230 235 240
ggc tcc ttc cca ccc cca gtg cca cct cct gga gcc ctc cca cct ggg 768
Gly Ser Phe Pro Pro Pro Val Pro Pro Pro Gly Ala Leu Pro Pro Gly
245 250 255
ata ccc cca gcc atg ccc cca cca cct atg cct cct ggg gct gca gga 816
Ile Pro Pro Ala Met Pro Pro Pro Pro Met Pro Pro Gly Ala Ala Gly
260 265 270
cat ggc ccc cca tcg gca gga acc cca ggg gca gga cat cct ggt cat 864
His Gly Pro Pro Ser Ala Gly Thr Pro Gly Ala Gly His Pro Gly His
275 280 285
gga cac tca cat cct cac cca ttc cca ccg ggt ggg atg ccc cat cca 912
Gly His Ser His Pro His Pro Phe Pro Pro Gly Gly Met Pro His Pro
290 295 300
ggg atg tct cag atg cag ctt gca cac cat ggc cct cat ggc tta gga 960
Gly Met Ser Gln Met Gln Leu Ala His His Gly Pro His Gly Leu Gly
305 310 315 320
cat ccc cac gct gga ccc cca ggc tct ggg ggc cag cca ccg ccc cga 1008
His Pro His Ala Gly Pro Pro Gly Ser Gly Gly Gln Pro Pro Pro Arg
325 330 335
cca cca cct gga atg cct cat cct gga cct cct cca atg ggc atg ccc 1056
Pro Pro Pro Gly Met Pro His Pro Gly Pro Pro Pro Met Gly Met Pro
340 345 350
ccc cga ggg cct cca ttc gga tct ccc atg ggt cac cca ggt cct atg 1104
Pro Arg Gly Pro Pro Phe Gly Ser Pro Met Gly His Pro Gly Pro Met
355 360 365
cct ccg cat ggt atg cgt gga cct cct cca ctg atg ccc ccc cat gga 1152
Pro Pro His Gly Met Arg Gly Pro Pro Pro Leu Met Pro Pro His Gly
370 375 380
tac act ggc cct cca cga ccc cca ccc tat ggc tac cag cgg ggg cct 1200
Tyr Thr Gly Pro Pro Arg Pro Pro Pro Tyr Gly Tyr Gln Arg Gly Pro
385 390 395 400
ctc cct cca ccc aga ccc act ccc cgg cca cca gtt ccc cct cga ggc 1248
Leu Pro Pro Pro Arg Pro Thr Pro Arg Pro Pro Val Pro Pro Arg Gly
405 410 415
cca ctt cga ggc cct ctc cct cag taa 1275
Pro Leu Arg Gly Pro Leu Pro Gln
420
<210> 4
<211> 424
<212> PRT
<213> Homo sapiens
<400> 4
Met Ala Ala Gly Pro Ile Ser Glu Arg Asn Gln Asp Ala Thr Val Tyr
1 5 10 15
Val Gly Gly Leu Asp Glu Lys Val Ser Glu Pro Leu Leu Trp Glu Leu
20 25 30
Phe Leu Gln Ala Gly Pro Val Val Asn Thr His Met Pro Lys Asp Arg
35 40 45
Val Thr Gly Gln His Gln Gly Tyr Gly Phe Val Glu Phe Leu Ser Glu
50 55 60
Glu Asp Ala Asp Tyr Ala Ile Lys Ile Met Asn Met Ile Lys Leu Tyr
65 70 75 80
Gly Lys Pro Ile Arg Val Asn Lys Ala Ser Ala His Asn Lys Asn Leu
85 90 95
Asp Val Gly Ala Asn Ile Phe Ile Gly Asn Leu Asp Pro Glu Ile Asp
100 105 110
Glu Lys Leu Leu Tyr Asp Thr Phe Ser Ala Phe Gly Val Ile Leu Gln
115 120 125
Thr Pro Lys Ile Met Arg Asp Pro Asp Thr Gly Asn Ser Lys Gly Tyr
130 135 140
Ala Phe Ile Asn Phe Ala Ser Phe Asp Ala Ser Asp Ala Ala Ile Glu
145 150 155 160
Ala Met Asn Gly Gln Tyr Leu Cys Asn Arg Pro Ile Thr Val Ser Tyr
165 170 175
Ala Phe Lys Lys Asp Ser Lys Gly Glu Arg His Gly Ser Ala Ala Glu
180 185 190
Arg Leu Leu Ala Ala Gln Asn Pro Leu Ser Gln Ala Asp Arg Pro His
195 200 205
Gln Leu Phe Ala Asp Ala Pro Pro Pro Pro Ser Ala Pro Asn Pro Val
210 215 220
Val Ser Ser Leu Gly Ser Gly Leu Pro Pro Pro Gly Met Pro Pro Pro
225 230 235 240
Gly Ser Phe Pro Pro Pro Val Pro Pro Pro Gly Ala Leu Pro Pro Gly
245 250 255
Ile Pro Pro Ala Met Pro Pro Pro Pro Met Pro Pro Gly Ala Ala Gly
260 265 270
His Gly Pro Pro Ser Ala Gly Thr Pro Gly Ala Gly His Pro Gly His
275 280 285
Gly His Ser His Pro His Pro Phe Pro Pro Gly Gly Met Pro His Pro
290 295 300
Gly Met Ser Gln Met Gln Leu Ala His His Gly Pro His Gly Leu Gly
305 310 315 320
His Pro His Ala Gly Pro Pro Gly Ser Gly Gly Gln Pro Pro Pro Arg
325 330 335
Pro Pro Pro Gly Met Pro His Pro Gly Pro Pro Pro Met Gly Met Pro
340 345 350
Pro Arg Gly Pro Pro Phe Gly Ser Pro Met Gly His Pro Gly Pro Met
355 360 365
Pro Pro His Gly Met Arg Gly Pro Pro Pro Leu Met Pro Pro His Gly
370 375 380
Tyr Thr Gly Pro Pro Arg Pro Pro Pro Tyr Gly Tyr Gln Arg Gly Pro
385 390 395 400
Leu Pro Pro Pro Arg Pro Thr Pro Arg Pro Pro Val Pro Pro Arg Gly
405 410 415
Pro Leu Arg Gly Pro Leu Pro Gln
420
<210> 5
<211> 126
<212> DNA
<213> Homo sapiens
<400> 5
tcgtcggagc agacgggagt ttctcctcgg ggtcggagca ggaggcacgc ggagtgtgag 60
gccacgcatg agcggacgct aaccccctcc ccagccacaa agagtctaca tgtctagggt 120
ctagac 126
<210> 6
<211> 266
<212> DNA
<213> Homo sapiens
<400> 6
gcccgcgccg gctgtgctgc acagggggag gagagggaac cccaggcgcg agcgggaaga 60
ggggacctgc agccacaact tctctggtcc tctgcatccc ttctgtccct ccacccgtcc 120
ccttccccac cctctggccc ccaccttctt ggaggcgaca acccccggga ggcattagaa 180
ggatttttc ccgcaggttg cgaagggaag caaacttggt ggcaacttgc ctcccggtgc 240
gggcgtctct cccccaccgt ctcaac 266
<210> 7
<211> 27
<212> DNA
<213> Homo sapiens
<400> 7
tcgtcggagc agacgggagt ttctcct 27
<210> 8
<211> 32
<212> DNA
<213> Homo sapiens
<400> 8
ccaccttctt ggaggcgaca acccccggga gg 32
<210> 9
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#3.
<400> 9
gatcttcgtc ggagcagacg ggagtttctc cta 33
<210> 10
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#3.
<400> 10
agcttaggag aaactcccgt ctgctccgac gaa 33
<210> 11
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#4.
<400> 11
gatcttctgc atcccttctg tccctccaca 30
<210> 12
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#4.
<400> 12
agcttgtgga gggacagaag ggatgcagaa 30
<210> 13
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#2.
<400> 13
aaaaaaagat ctgcccgcgc cggctgt 27
<210> 14
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#2.
<400> 14
aaaaaaaagc ttgttgagac ggtggggga 29
<210> 15
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#1.
<400> 15
aaaaaaagat cttcgtcgga gcagacg 27
<210> 16
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#1.
<400> 16
aaaaaaaagc ttgtctagac cctagac 27
<210> 17
<211> 9
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (4)..(6)
<223> "n" is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(9)
<223> "v" is a or g or c.
<400> 17
gagnnnacv 9
<210> 18
<211> 10
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (4)..(7)
<223> "n" is a, c, g, or t
<220>
<221> misc_feature
<222> (10)..(10)
<223> "v" is a or g or c.
<400> 18
gagnnnnacv 10
<210> 19
<211> 11
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (4)..(8)
<223> "n" is a, c, g, or t
<220>
<221> misc_feature
<222> (11)..(11)
<223> "v" is a or g or c.
<400> 19
gagnnnnnac v 11
<210> 20
<211> 12
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (4)..(9)
<223> "n" is a, c, g, or t
<220>
<221> misc_feature
<222> (12)..(12)
<223> "r" is a or g
<220>
<221> misc_feature
<222> (12)..(12)
<223> "v" is a or g or c.
<400> 20
gagnnnnnna cv 12
<210> 21
<211> 60
<212> DNA
<213> Homo sapiens
<400> 21
tcgtcggagc agacgggagt ttctcctcgg ggtcggagca ggaggcacgc ggagtgtgag 60
<210> 22
<211> 66
<212> DNA
<213> Homo sapiens
<400> 22
gccacgcatg agcggacgct aaccccctcc ccagccacaa agagtctaca tgtctagggt 60
ctagac 66
<210> 23
<211> 181
<212> DNA
<213> Homo sapiens
<400> 23
aacgggcgcc gcggcgggga gaagacgcag agcgctgctg ggctgccggg tctcccgctt 60
ccccctcctg ctccaagggc ctcctgcatg agggcgcggt agagacccgg acccgcgccg 120
tgctcctgcc gtttcgctgc gctccgcccg ggcccggctc agccaggccc cgcggtgagc 180
c 181
<210> 24
<211> 30
<212> DNA
<213> Homo sapiens
<400> 24
cagggggagg agagggaacc ccaggcgcga 30
<210> 25
<211> 32
<212> DNA
<213> Homo sapiens
<400> 25
gagcgggaag aggggacctg cagccacaac tt 32
<210> 26
<211> 60
<212> DNA
<213> Homo sapiens
<400> 26
cagggggagg agagggaacc ccaggcgcga gcgggaagag gggacctgca gccacaactt 60
<210> 27
<211> 113
<212> DNA
<213> Homo sapiens
<400> 27
tcgtcggagc agacgggagt ttctcctcgg ggtcggagca ggaggcacgc ggagtgtgag 60
gccacgcatg agcggacgct aaccccctcc ccagccacaa agagtctaca tgt 113
<210> 28
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#5.
<400> 28
aaaaaaagat cttcgtcgga gcagacggga gt 32
<210> 29
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#5.
<400> 29
aaaaaaaagc ttctcacact ccgcgtgcct cc 32
<210> 30
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#6.
<400> 30
aaaaaaagat ctgccacgca tgagcggacg ct 32
<210> 31
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#6.
<400> 31
aaaaaaaagc ttgtctagac cctagacatg ta 32
<210> 32
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#8.
<400> 32
gatctcaggg ggaggagagg gaaccccagg cgcgaa 36
<210> 33
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#8.
<400> 33
agctttcgcg cctggggttc cctctcctcc ccctga 36
<210> 34
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#9.
<400> 34
gatctgagcg ggaagagggg acctgcagcc acaactta 38
<210> 35
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#9.
<400> 35
agcttaagtt gtggctgcag gtcccctctt cccgctca 38
<210> 36
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#10.
<400> 36
gatctcaggg ggaggagagg gaaccccagg cgcgagcggg aagaggggac ctgcagccac 60
aactta 66
<210> 37
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#10.
<400> 37
agcttaagtt gtggctgcag gtcccctctt cccgctcgcg cctggggttc cctctcctcc 60
ccctga 66
<210> 38
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#11.
<400> 38
aaaaaaagat cttcgtcgga gcagacggga gt 32
<210> 39
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> A primer for amprifying the portion of cis-element of cis-element
#11.
<400> 39
aaaaaaaagc ttacatgtag actctttgtg gc 32
Claims (30)
- 세포에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현, 또는 이들 양방의 발현이 모두 항진된, 세포 내에서의 목적물로서의 단백질의 합성능 또는 분비능이 항진된 재조합 세포.
- 제 1 항에 있어서,
p180 단백질이,
(a) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 과 적어도 70 % 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(b) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(c) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 적어도 70 % 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(d) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질, 및
(e) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질
로 이루어지는 군에서 선택되는, 재조합 세포. - 제 1 항 또는 제 2 항에 있어서,
p180 단백질이 포유 동물 유래의 것인, 재조합 세포. - 제 3 항에 있어서,
포유 동물의 p180 단백질의 전체 길이 또는 그 부분이, 인간 p180 단백질 (SEQ ID NO : 2), 마우스 p180 단백질 (GenBank Accession No. NP_077243), 래트 p180 단백질 (GenBank Accession No. XP_230637), 차이니즈 햄스터 p180 단백질 (GenBank Accession No. XM_003496471), 개 p180 단백질 (GenBank Accession No. NP_001003179), 말 p180 단백질 (GenBank Accession No. XP_001915027), 원숭이 p180 단백질 (GenBank Accession No. XP_002798281), 침팬지 p180 단백질 (GenBank Accession No. XP_514527), 돼지 p180 단백질 (GenBank Accession No. XP_001926148), 또는 그들의 부분인, 재조합 세포. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
p180 단백질의 부분이, SEQ ID NO : 2 로 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열, 945 ∼ 1540 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분에서 선택되는, 재조합 세포. - 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질이, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분 (SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 으로 이루어지는 군에서 선택되는, 재조합 세포. - 제 6 항에 있어서,
SF3b4 단백질이,
(i) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 과 적어도 70 % 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(ii) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(iii) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 적어도 70 % 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(iv) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(v) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질
로 이루어지는 군에서 선택되는, 재조합 세포. - 제 6 항 또는 제 7 항에 있어서,
SF3b4 단백질이 포유 동물 유래의 것인, 재조합 세포. - 제 8 항에 있어서,
포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분이, 인간 SF3b4 단백질 (SEQ ID NO : 4), 마우스 SF3b4 단백질 (GenBank Accession No. NP_694693.1), 래트 SF3b4 단백질 (GenBank Accession No. NP_001011951.1), 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1), 개 SF3b4 단백질 (GenBank Accession No. XP_540295.3), 말 SF3b4 단백질 (GenBank Accession No. XP_001488649.2), 원숭이 SF3b4 단백질 (GenBank Accession No. NP_001097793.1), 침팬지 SF3b4 단백질 (GenBank Accession No. XP_513768.2), 돼지 SF3b4 단백질 (GenBank Accession No. XP_001926524.1), 또는 그들의 부분인, 재조합 세포. - 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
목적물로서의 단백질의 합성능 또는 분비능이, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시킴으로써 항진된, 재조합 세포. - 수탁 번호 NITE BP-01753 (CHO 3D5), 수탁 번호 NITE BP-1535 (CHO YA7), 또는 수령 번호 NITE ABP-01811 (CHO 1B2) 에 의해 나타내는, 세포주.
- p180 단백질의 전체 길이 또는 그 부분의 발현을 항진시키고, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현을 항진시키고, 또는 이들 단백질 양방의 발현을 항진시킨 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시키는 것에 의한, 목적물로서의 단백질을 제조하는 방법.
- 제 12 항에 있어서,
p180 단백질이 포유 동물 유래의 것인, 방법. - 제 13 항에 있어서,
포유 동물의 p180 단백질의 전체 길이 또는 그 부분이, 인간 p180 단백질 (SEQ ID NO : 2), 마우스 p180 단백질 (GenBank Accession No. NP_077243), 래트 p180 단백질 (GenBank Accession No. XP_230637), 차이니즈 햄스터 p180 단백질 (GenBank Accession No. XM_003496471), 개 p180 단백질 (GenBank Accession No. NP_001003179), 말 p180 단백질 (GenBank Accession No. XP_001915027), 원숭이 p180 단백질 (GenBank Accession No. XP_002798281), 침팬지 p180 단백질 (GenBank Accession No. XP_514527), 돼지 p180 단백질 (GenBank Accession No. XP_001926148), 또는 그들의 부분인, 방법. - 제 13 항 또는 제 14 항에 있어서,
포유 동물의 p180 단백질의 부분이, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역을 포함하는 부분, 945 ∼ 1540 번 아미노산으로 이루어지는 영역을 포함하는 부분에서 선택되는, 방법. - 제 12 항 내지 제 15 항 중 어느 한 항에 있어서,
mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질이, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분 (SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 으로 이루어지는 군에서 선택되는, 방법. - 제 16 항에 있어서,
SF3b4 단백질이 포유 동물 유래의 것인, 방법. - 제 17 항에 있어서,
포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분이, 인간 SF3b4 단백질 (SEQ ID NO : 4), 마우스 SF3b4 단백질 (GenBank Accession No. NP_694693.1), 래트 SF3b4 단백질 (GenBank Accession No. NP_001011951.1), 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1), 개 SF3b4 단백질 (GenBank Accession No. XP_540295.3), 말 SF3b4 단백질 (GenBank Accession No. XP_001488649.2), 원숭이 SF3b4 단백질 (GenBank Accession No. NP_001097793.1), 침팬지 SF3b4 단백질 (GenBank Accession No. XP_513768.2), 돼지 SF3b4 단백질 (GenBank Accession No. XP_001926524.1), 또는 그들의 부분인, 방법. - 제 12 항 내지 제 18 항 중 어느 한 항에 있어서,
재조합 세포가, 수탁 번호 NITE BP-01753 (CHO 3D5), 수탁 번호 NITE BP-1535 (CHO YA7), 또는 수령 번호 NITE ABP-01811 (CHO 1B2) 에 의해 나타내는 세포주인, 방법. - 제 12 항 내지 제 19 항 중 어느 한 항에 있어서,
목적물로서의 단백질이, 당단백질인, 방법. - 제 20 항에 있어서,
목적물로서의 단백질이, 콜라겐, 피브로넥틴 또는 항체인, 방법. - 목적물로서의 단백질을 발현하기 위한 발현 유닛 중, 프로모터의 하류이고 또한 목적물로서의 단백질을 코드하는 DNA 의 뉴클레오티드 배열의 개시 코돈의 상류에, RNA 결합 단백질이 인식/결합 (혹은 상호작용) 하는 cis-엘리먼트를 삽입함으로써, 발현계 세포 내에 있어서의 목적물로서의 단백질의 발현량을 증대시키는 방법.
- 제 22 항에 있어서,
cis-엘리먼트가, RNA 인식 모티프 (RRM) 형 RNA 결합 단백질이 인식/결합 (혹은 상호작용) 하는 것인, 방법. - 제 23 항에 있어서,
cis-엘리먼트가, SF3b4 단백질의 RNA 인식 모티프 (RRM) 가 인식/결합 (혹은 상호작용) 하는 것인, 방법. - 제 22 항 내지 제 24 항 중 어느 한 항에 있어서,
cis-엘리먼트의 뉴클레오티드 배열이, 1 또는 몇 개의 9 mer ∼ 12 mer 의 배열 모티프 GAN1-(X)n-ACN2 (n = 3 ∼ 6) (N1 및 N2 는 독립적으로 A, T, C, G 의 어느 뉴클레오티드여도 된다) 를 포함하는 것인, 방법. - 제 25 항에 있어서,
cis-엘리먼트의 뉴클레오티드 배열이, 1 또는 몇 개의 9 mer ∼ 12 mer 의 배열 모티프 GAG-(X)n-ACV (n = 3 ∼ 6) (V 는 A 또는 G 또는 C 를 나타낸다), SEQ ID NO : 17 ∼ 20) 를 포함하는 것인, 방법. - 제 22 항 내지 제 26 항 중 어느 한 항에 있어서,
cis-엘리먼트의 뉴클레오티드 배열이, 타입 I 콜라겐 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 피브로넥틴 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 매트릭스 메탈로프로테아제 14 (MMP14) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A2 (P4HA2) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A1 (P4HA1) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열로 이루어지는 군에서 선택되는 배열인, 방법. - 제 22 항 내지 제 27 항 중 어느 한 항에 있어서,
cis-엘리먼트의 뉴클레오티드 배열이, SEQ ID NO : 5 의 전체 길이 또는 SEQ ID NO : 7 의 전체 길이 외, SEQ ID NO : 5 중 1 ∼ 102 번 뉴클레오티드, 1 ∼ 78 번 뉴클레오티드, 1 ∼ 60 번 뉴클레오티드, 61 ∼ 126 번 뉴클레오티드, 16 ∼ 57 번 뉴클레오티드, 79 ∼ 126 번 뉴클레오티드, 103 ∼ 126 번 뉴클레오티드, 58 ∼ 78 번 뉴클레오티드, 51 ∼ 78 번 뉴클레오티드, 1 ∼ 27 번 뉴클레오티드, 70 ∼ 78 번 뉴클레오티드로 이루어지는 군에서 선택되는 어느 배열인, 방법. - 제 22 항 내지 제 28 항 중 어느 한 항에 있어서,
발현계 세포가, 손상되지 않은 숙주 세포, p180 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, SF3b4 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, 또는 이들 양방의 발현이 모두 항진된 세포인, 방법. - SF3b4 를 기능 저해 또는 발현 억제함으로써, 콜라겐 합성을 억제하고, 이상 콜라겐에 의한 폐포 상피, 섬유증의 중증화를 방지하기 위한 의약 조성물.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013064357 | 2013-03-26 | ||
JPJP-P-2013-064357 | 2013-03-26 | ||
JP2013261178 | 2013-12-18 | ||
JPJP-P-2013-261178 | 2013-12-18 | ||
PCT/JP2014/058702 WO2014157429A1 (ja) | 2013-03-26 | 2014-03-26 | タンパク質の製造方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160002819A true KR20160002819A (ko) | 2016-01-08 |
KR101791770B1 KR101791770B1 (ko) | 2017-10-31 |
Family
ID=51624392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157030530A KR101791770B1 (ko) | 2013-03-26 | 2014-03-26 | 단백질의 제조 방법 |
Country Status (10)
Country | Link |
---|---|
US (2) | US9884897B2 (ko) |
EP (2) | EP3981877A1 (ko) |
JP (1) | JP5848853B2 (ko) |
KR (1) | KR101791770B1 (ko) |
CN (1) | CN105358682B (ko) |
AU (1) | AU2014245132B2 (ko) |
CA (1) | CA2908156C (ko) |
IL (1) | IL241779A (ko) |
SG (1) | SG11201507948UA (ko) |
WO (1) | WO2014157429A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200078193A (ko) * | 2018-12-21 | 2020-07-01 | 가톨릭대학교 산학협력단 | p40-EBI3의 복합체 및 이의 용도 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3981877A1 (en) * | 2013-03-26 | 2022-04-13 | Nippi, Incorporated | Method for producing protein |
EP3786181A1 (en) | 2014-07-18 | 2021-03-03 | Nippi, Incorporated | Polymeric iga-type recombinant antibody and use thereof |
RU2700649C2 (ru) * | 2017-12-25 | 2019-09-18 | Селл энд Джин Терапи Лтд | Генетическая конструкция на основе невирусной векторной плазмиды, включающей кДНК гена Р4НА2, для купирования проявлений состояний человеческого организма, связанных с уменьшением экспрессии гена Р4НА2 и/или уменьшением количества белка пролил 4-гидрокислаза альфа 2, способ получения и использования |
IL257269A (en) * | 2018-01-31 | 2018-04-09 | Olender Tsviya | Signaling is directed to the endoplasmic reticulum |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011227462A (ja) | 2010-03-31 | 2011-11-10 | Fujifilm Corp | 色調可変膜、その製造方法及び該製造方法により得られたエレクトロクロミック素子 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5593859A (en) * | 1991-10-23 | 1997-01-14 | Thomas Jefferson University | Synthesis of human procollagens and collagens in recombinant DNA systems |
EP0991774A4 (en) * | 1997-07-03 | 2005-04-06 | Univ California | METHOD FOR INCREASING SECRETION OF PROTEINS IN EUKARYOTIC HOST CELLS |
JP4299724B2 (ja) | 2003-05-16 | 2009-07-22 | 株式会社ニッピ | へルペスウイルス前初期遺伝子産物の検出方法 |
EP1794593A2 (en) * | 2004-09-21 | 2007-06-13 | Matritech, Inc. | Methods and compositions for detecting cancer using components of the u2 spliceosomal particle |
TWI294461B (en) * | 2004-12-28 | 2008-03-11 | Ind Tech Res Inst | Cell culture and method for screening for a compound useful in the treatment or prevention of hepatic cirrhosis |
ES2553162T3 (es) * | 2006-05-16 | 2015-12-04 | Daiichi Sankyo Company, Limited | Método de producción de alta secreción de proteínas |
JP2013128413A (ja) | 2010-03-11 | 2013-07-04 | Kyushu Univ | Pprモチーフを利用したrna結合性蛋白質の改変方法 |
JP2013085498A (ja) | 2011-10-14 | 2013-05-13 | Nippi:Kk | 細胞の分泌活性化方法 |
US20140065620A1 (en) * | 2011-12-29 | 2014-03-06 | Mayo Foundation For Medical Education And Research | Nucleic acids for detecting breast cancer |
EP3981877A1 (en) * | 2013-03-26 | 2022-04-13 | Nippi, Incorporated | Method for producing protein |
-
2014
- 2014-03-26 EP EP21196008.3A patent/EP3981877A1/en active Pending
- 2014-03-26 US US14/780,313 patent/US9884897B2/en active Active
- 2014-03-26 KR KR1020157030530A patent/KR101791770B1/ko active IP Right Grant
- 2014-03-26 CA CA2908156A patent/CA2908156C/en active Active
- 2014-03-26 WO PCT/JP2014/058702 patent/WO2014157429A1/ja active Application Filing
- 2014-03-26 CN CN201480018249.3A patent/CN105358682B/zh active Active
- 2014-03-26 SG SG11201507948UA patent/SG11201507948UA/en unknown
- 2014-03-26 JP JP2015508643A patent/JP5848853B2/ja active Active
- 2014-03-26 EP EP14776222.3A patent/EP2990476B1/en active Active
- 2014-03-26 AU AU2014245132A patent/AU2014245132B2/en active Active
-
2015
- 2015-09-21 IL IL241779A patent/IL241779A/en active IP Right Grant
-
2017
- 2017-08-24 US US15/685,053 patent/US10442843B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011227462A (ja) | 2010-03-31 | 2011-11-10 | Fujifilm Corp | 色調可変膜、その製造方法及び該製造方法により得られたエレクトロクロミック素子 |
Non-Patent Citations (2)
Title |
---|
Ueno, T., et al., (2010). J Biol Chem 285(39), 29941-50. |
Ueno, T., et al., (2012). Regulation of polysome assembly on the endoplasmic reticulum by a coiled-coil protein, p180. Nucleic Acids Res. |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200078193A (ko) * | 2018-12-21 | 2020-07-01 | 가톨릭대학교 산학협력단 | p40-EBI3의 복합체 및 이의 용도 |
Also Published As
Publication number | Publication date |
---|---|
AU2014245132B2 (en) | 2020-07-16 |
US10442843B2 (en) | 2019-10-15 |
US9884897B2 (en) | 2018-02-06 |
US20180118796A1 (en) | 2018-05-03 |
US20160075747A1 (en) | 2016-03-17 |
AU2014245132A1 (en) | 2015-10-15 |
IL241779A0 (en) | 2015-11-30 |
SG11201507948UA (en) | 2015-11-27 |
EP2990476B1 (en) | 2021-10-20 |
EP2990476A1 (en) | 2016-03-02 |
IL241779A (en) | 2017-07-31 |
AU2014245132A2 (en) | 2016-10-27 |
WO2014157429A1 (ja) | 2014-10-02 |
JP5848853B2 (ja) | 2016-01-27 |
KR101791770B1 (ko) | 2017-10-31 |
CA2908156A1 (en) | 2014-10-02 |
EP3981877A1 (en) | 2022-04-13 |
EP2990476A4 (en) | 2017-05-03 |
CN105358682A (zh) | 2016-02-24 |
CN105358682B (zh) | 2021-06-04 |
CA2908156C (en) | 2022-01-25 |
EP2990476A9 (en) | 2016-08-03 |
JPWO2014157429A1 (ja) | 2017-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
SHIBANUMA et al. | Cloning from a mouse osteoblastic cell line of a set of transforming‐growth‐factor‐β1‐regulated genes, one of which seems to encode a follistatin‐related polypeptide | |
Poulos et al. | Progressive impairment of muscle regeneration in muscleblind-like 3 isoform knockout mice | |
US10442843B2 (en) | Method for producing protein | |
JP2011019525A (ja) | 新規β−アクチンおよびRPS21プロモーター、ならびにこれらの使用方法 | |
Terenzi et al. | Conserved developmental alternative splicing of muscleblind-like (MBNL) transcripts regulates MBNL localization and activity | |
JP4411280B2 (ja) | 骨及び/又は関節疾患関連遺伝子 | |
KR20100099190A (ko) | Sm-단백질 기반의 분비 조작 | |
Kiktev et al. | The paradox of viable sup45 STOP mutations: A necessary equilibrium between translational readthrough, activity and stability of the protein | |
JPH10500311A (ja) | 核タンパク質と相互作用する因子 | |
JP2002517998A (ja) | p27(KIP1)のFKBP−12との相互作用 | |
JP4374454B2 (ja) | タンパク質の生産に用いることが可能なf9胚性腫瘍細胞、およびその利用 | |
WO2010010848A1 (ja) | 分子シャペロンを用いた、哺乳動物培養細胞における抗体の産生方法 | |
Rohwedel et al. | Evidence for posttranscriptional regulation of the multi K homology domain protein vigilin by a small peptide encoded in the 5′ leader sequence | |
WO2005049868A1 (en) | Methods and agents for screening for compounds capable of modulating her2 expression | |
EP4079839A1 (en) | Genetically modified recombinant cell lines | |
EP2140000A1 (en) | Method of enhancing migration of neural precursor cells | |
EP1315794A1 (en) | Genetic demonstration of requirement for nkx6.1, nkx2.2 and nkx6.2 in ventral neuron generation | |
JP4283531B2 (ja) | マスト細胞の細胞死誘発剤 | |
Boehm | Regulation of mitochondrial RNA expression by FASTK proteins | |
WO2005090580A1 (ja) | 非ヒト動物モデルにおける転写活性測定方法、細胞数の測定方法及び腫瘍体積の測定方法 | |
JP2003527860A (ja) | Brca−1制御因子およびその使用方法 | |
JP2006169200A (ja) | インスリン分泌促進薬のスクリーニング方法 | |
Cai | The specific regulation of type I collagen synthesis in fibrosis | |
Topf | Investigations on the functions ot" ten-1" during embryonic development in" Caenorhabditis" elegans | |
WO1998029544A9 (ko) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |