KR20210002575A - 단백질의 분비 생산법 - Google Patents
단백질의 분비 생산법 Download PDFInfo
- Publication number
- KR20210002575A KR20210002575A KR1020207033331A KR20207033331A KR20210002575A KR 20210002575 A KR20210002575 A KR 20210002575A KR 1020207033331 A KR1020207033331 A KR 1020207033331A KR 20207033331 A KR20207033331 A KR 20207033331A KR 20210002575 A KR20210002575 A KR 20210002575A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- gene
- amino acid
- ala
- acid sequence
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 1229
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 773
- 230000028327 secretion Effects 0.000 title claims abstract description 101
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 165
- 230000000694 effects Effects 0.000 claims abstract description 117
- 241000186031 Corynebacteriaceae Species 0.000 claims abstract description 91
- 241000186254 coryneform bacterium Species 0.000 claims abstract description 62
- 230000003247 decreasing effect Effects 0.000 claims abstract description 41
- 235000018102 proteins Nutrition 0.000 claims description 754
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 219
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 158
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 157
- 230000006870 function Effects 0.000 claims description 157
- 230000014509 gene expression Effects 0.000 claims description 143
- 125000000539 amino acid group Chemical group 0.000 claims description 89
- 210000004027 cell Anatomy 0.000 claims description 79
- 230000035772 mutation Effects 0.000 claims description 73
- 241000894006 Bacteria Species 0.000 claims description 72
- YGYAWVDWMABLBF-UHFFFAOYSA-N Phosgene Chemical compound ClC(Cl)=O YGYAWVDWMABLBF-UHFFFAOYSA-N 0.000 claims description 68
- 101150077181 regX3 gene Proteins 0.000 claims description 66
- 238000006467 substitution reaction Methods 0.000 claims description 52
- 101150114144 hrcA gene Proteins 0.000 claims description 47
- 238000012217 deletion Methods 0.000 claims description 46
- 230000037430 deletion Effects 0.000 claims description 46
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 38
- 235000001014 amino acid Nutrition 0.000 claims description 38
- 150000007523 nucleic acids Chemical group 0.000 claims description 38
- 229940024606 amino acid Drugs 0.000 claims description 37
- 108091000080 Phosphotransferase Proteins 0.000 claims description 34
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 230000007423 decrease Effects 0.000 claims description 34
- 238000003780 insertion Methods 0.000 claims description 33
- 230000037431 insertion Effects 0.000 claims description 33
- 102000020233 phosphotransferase Human genes 0.000 claims description 33
- 102000018697 Membrane Proteins Human genes 0.000 claims description 32
- 108010052285 Membrane Proteins Proteins 0.000 claims description 32
- 238000013518 transcription Methods 0.000 claims description 29
- 230000035897 transcription Effects 0.000 claims description 29
- -1 aromatic amino acid Chemical class 0.000 claims description 23
- 230000001419 dependent effect Effects 0.000 claims description 22
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 claims description 21
- 108020001507 fusion proteins Proteins 0.000 claims description 20
- 102000037865 fusion proteins Human genes 0.000 claims description 20
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 19
- 241000186216 Corynebacterium Species 0.000 claims description 17
- 108010004889 Heat-Shock Proteins Proteins 0.000 claims description 15
- 102000002812 Heat-Shock Proteins Human genes 0.000 claims description 15
- 239000003112 inhibitor Substances 0.000 claims description 13
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 11
- 238000003776 cleavage reaction Methods 0.000 claims description 11
- 230000007017 scission Effects 0.000 claims description 11
- 230000002255 enzymatic effect Effects 0.000 claims description 10
- 101150085086 tatA gene Proteins 0.000 claims description 10
- 101150019203 tatB gene Proteins 0.000 claims description 10
- 101150075675 tatC gene Proteins 0.000 claims description 10
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 claims description 10
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 claims description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical group C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 8
- 244000201986 Cassia tora Species 0.000 claims description 8
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 8
- NCAIGTHBQTXTLR-UHFFFAOYSA-N phentermine hydrochloride Chemical group [Cl-].CC(C)([NH3+])CC1=CC=CC=C1 NCAIGTHBQTXTLR-UHFFFAOYSA-N 0.000 claims description 8
- 101150073677 tatE gene Proteins 0.000 claims description 6
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 claims description 3
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 claims description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims description 2
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 2
- 230000003248 secreting effect Effects 0.000 abstract description 14
- 101100354149 Escherichia coli (strain K12) pstS gene Proteins 0.000 description 57
- 108020004414 DNA Proteins 0.000 description 50
- 230000001965 increasing effect Effects 0.000 description 47
- 239000002773 nucleotide Substances 0.000 description 45
- 125000003729 nucleotide group Chemical group 0.000 description 45
- 101710088599 Cold shock-like protein CspLB Proteins 0.000 description 43
- 210000000349 chromosome Anatomy 0.000 description 40
- 230000002829 reductive effect Effects 0.000 description 37
- 108010085895 Laminin Proteins 0.000 description 36
- 102000007547 Laminin Human genes 0.000 description 36
- 239000013598 vector Substances 0.000 description 33
- 230000004044 response Effects 0.000 description 31
- 150000001413 amino acids Chemical class 0.000 description 28
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 26
- 108020004705 Codon Proteins 0.000 description 25
- 239000012634 fragment Substances 0.000 description 25
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 24
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 24
- 239000002609 medium Substances 0.000 description 24
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 23
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 23
- 101150022503 phoR gene Proteins 0.000 description 23
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 21
- 238000012224 gene deletion Methods 0.000 description 19
- 238000002744 homologous recombination Methods 0.000 description 18
- 230000006801 homologous recombination Effects 0.000 description 18
- 238000010276 construction Methods 0.000 description 17
- 230000007812 deficiency Effects 0.000 description 17
- 239000013612 plasmid Substances 0.000 description 17
- 241000894007 species Species 0.000 description 17
- 239000002344 surface layer Substances 0.000 description 17
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 15
- 230000002950 deficient Effects 0.000 description 15
- 230000001976 improved effect Effects 0.000 description 15
- 238000013519 translation Methods 0.000 description 15
- 108091005804 Peptidases Proteins 0.000 description 14
- 102000035195 Peptidases Human genes 0.000 description 14
- 239000004365 Protease Substances 0.000 description 14
- 102100039175 Trefoil factor 1 Human genes 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 101710099182 S-layer protein Proteins 0.000 description 13
- 101710183296 Surface layer protein Proteins 0.000 description 13
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 13
- 150000003278 haem Chemical group 0.000 description 13
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 13
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 12
- 238000007792 addition Methods 0.000 description 12
- 230000001939 inductive effect Effects 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 108010044940 alanylglutamine Proteins 0.000 description 11
- 239000012228 culture supernatant Substances 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 11
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 10
- 101150049887 cspB gene Proteins 0.000 description 10
- 108010077515 glycylproline Proteins 0.000 description 10
- 108090000765 processed proteins & peptides Proteins 0.000 description 10
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 9
- 241000186146 Brevibacterium Species 0.000 description 9
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 9
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 9
- 108010092282 Trimethylamine dehydrogenase Proteins 0.000 description 9
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 230000006378 damage Effects 0.000 description 9
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 9
- 235000019419 proteases Nutrition 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 8
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 8
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 8
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 8
- 229910019142 PO4 Inorganic materials 0.000 description 8
- 108020005091 Replication Origin Proteins 0.000 description 8
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 239000010452 phosphate Substances 0.000 description 8
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 102100026745 Fatty acid-binding protein, liver Human genes 0.000 description 7
- 101710188974 Fatty acid-binding protein, liver Proteins 0.000 description 7
- 101710189565 Fatty acid-binding protein, liver-type Proteins 0.000 description 7
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 7
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- 102000040739 Secretory proteins Human genes 0.000 description 7
- 108091058545 Secretory proteins Proteins 0.000 description 7
- 238000009825 accumulation Methods 0.000 description 7
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 238000012790 confirmation Methods 0.000 description 7
- 239000013613 expression plasmid Substances 0.000 description 7
- 230000037433 frameshift Effects 0.000 description 7
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 7
- 101150006844 groES gene Proteins 0.000 description 7
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 6
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 6
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 6
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 6
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 6
- 241000424760 Corynebacterium crenatum Species 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- YJCZUTXLPXBNIO-BHYGNILZSA-N Gln-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)N)N)C(=O)O YJCZUTXLPXBNIO-BHYGNILZSA-N 0.000 description 6
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 6
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 6
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 6
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 6
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 6
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 6
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- 108091081024 Start codon Proteins 0.000 description 6
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 6
- 108010008355 arginyl-glutamine Proteins 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 108010090894 prolylleucine Proteins 0.000 description 6
- 230000004952 protein activity Effects 0.000 description 6
- 230000035939 shock Effects 0.000 description 6
- 238000010186 staining Methods 0.000 description 6
- 108700026220 vif Genes Proteins 0.000 description 6
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 5
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 5
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 5
- RIPMDCIXRYWXSH-KNXALSJPSA-N Ala-Trp-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N RIPMDCIXRYWXSH-KNXALSJPSA-N 0.000 description 5
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 5
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 5
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 5
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 5
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 5
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 108010074860 Factor Xa Proteins 0.000 description 5
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 5
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 5
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 5
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 5
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 5
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 5
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 5
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 5
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 5
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 5
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 5
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 5
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 5
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 5
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 5
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 5
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 5
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 5
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 5
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 5
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 5
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 5
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 5
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 5
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 5
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 5
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 5
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 5
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 5
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 5
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 108010077245 asparaginyl-proline Proteins 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 101150077981 groEL gene Proteins 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 101150091094 lipA gene Proteins 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 108010056582 methionylglutamic acid Proteins 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 230000009962 secretion pathway Effects 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- JDFUJAMTCCQARF-UHFFFAOYSA-N tatb Chemical compound NC1=C([N+]([O-])=O)C(N)=C([N+]([O-])=O)C(N)=C1[N+]([O-])=O JDFUJAMTCCQARF-UHFFFAOYSA-N 0.000 description 5
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 4
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 4
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 4
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 4
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 4
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 4
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 4
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 4
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 4
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 4
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 4
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 4
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 241000807905 Corynebacterium glutamicum ATCC 14067 Species 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 4
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 4
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 4
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 4
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 4
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 4
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 4
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 4
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 4
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 4
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 4
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 4
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 4
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 4
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 4
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 4
- 102000003982 Parathyroid hormone Human genes 0.000 description 4
- 108090000445 Parathyroid hormone Proteins 0.000 description 4
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 4
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 4
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 4
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 4
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 4
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 4
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 4
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 4
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 4
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 4
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 4
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 4
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 4
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 4
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 4
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 4
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 4
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 108010036533 arginylvaline Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 230000021615 conjugation Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 102000054767 gene variant Human genes 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 4
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 4
- 101150028210 groEL1 gene Proteins 0.000 description 4
- 101150086609 groEL2 gene Proteins 0.000 description 4
- 239000003102 growth factor Substances 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 210000004897 n-terminal region Anatomy 0.000 description 4
- 229960001319 parathyroid hormone Drugs 0.000 description 4
- 239000000199 parathyroid hormone Substances 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 230000004043 responsiveness Effects 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 102100024341 10 kDa heat shock protein, mitochondrial Human genes 0.000 description 3
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 description 3
- 241000186361 Actinobacteria <class> Species 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 3
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 3
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 3
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 3
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 3
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 3
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 3
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 3
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 3
- YQPSDMUGFKJZHR-QRTARXTBSA-N Asn-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)N)N YQPSDMUGFKJZHR-QRTARXTBSA-N 0.000 description 3
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 3
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 3
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 3
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- 108010059013 Chaperonin 10 Proteins 0.000 description 3
- 108010058432 Chaperonin 60 Proteins 0.000 description 3
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 3
- 241000337023 Corynebacterium thermoaminogenes Species 0.000 description 3
- 239000004470 DL Methionine Substances 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 101710088194 Dehydrogenase Proteins 0.000 description 3
- 241001646716 Escherichia coli K-12 Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 3
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 3
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 3
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 3
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 3
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 3
- 108010073324 Glutaminase Proteins 0.000 description 3
- 102000009127 Glutaminase Human genes 0.000 description 3
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 3
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 3
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 3
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 3
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 3
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 3
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 3
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 3
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 3
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 3
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 3
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108060008539 Transglutaminase Proteins 0.000 description 3
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 3
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 3
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 3
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 3
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 3
- 241000319304 [Brevibacterium] flavum Species 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 229910021529 ammonia Inorganic materials 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 229910000019 calcium carbonate Inorganic materials 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000001802 infusion Methods 0.000 description 3
- SURQXAFEQWPFPV-UHFFFAOYSA-L iron(2+) sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Fe+2].[O-]S([O-])(=O)=O SURQXAFEQWPFPV-UHFFFAOYSA-L 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 238000009630 liquid culture Methods 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 3
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 3
- SCVOEYLBXCPATR-UHFFFAOYSA-L manganese(II) sulfate pentahydrate Chemical compound O.O.O.O.O.[Mn+2].[O-]S([O-])(=O)=O SCVOEYLBXCPATR-UHFFFAOYSA-L 0.000 description 3
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- FFEARJCKVFRZRR-UHFFFAOYSA-N methionine Chemical compound CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 3
- 235000006109 methionine Nutrition 0.000 description 3
- MBABOKRGFJTBAE-UHFFFAOYSA-N methyl methanesulfonate Chemical compound COS(C)(=O)=O MBABOKRGFJTBAE-UHFFFAOYSA-N 0.000 description 3
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 3
- 235000019796 monopotassium phosphate Nutrition 0.000 description 3
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 230000001766 physiological effect Effects 0.000 description 3
- 230000002062 proliferating effect Effects 0.000 description 3
- 230000035755 proliferation Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 101150081333 senX3 gene Proteins 0.000 description 3
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 3
- 102000003601 transglutaminase Human genes 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 2
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 2
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 2
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 2
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 2
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 2
- 241001025270 Brevibacterium album Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 241000909293 Corynebacterium alkanolyticum Species 0.000 description 2
- 241000186248 Corynebacterium callunae Species 0.000 description 2
- 241001644925 Corynebacterium efficiens Species 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- 108050001049 Extracellular proteins Proteins 0.000 description 2
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 2
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 2
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 2
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 2
- 241001467578 Microbacterium Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 108010025020 Nerve Growth Factor Proteins 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- XNJVJEHDZPDPQL-BZSNNMDCSA-N Pro-Trp-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H]1CCCN1)C(O)=O XNJVJEHDZPDPQL-BZSNNMDCSA-N 0.000 description 2
- 102000001708 Protein Isoforms Human genes 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- 102000036693 Thrombopoietin Human genes 0.000 description 2
- 108010041111 Thrombopoietin Proteins 0.000 description 2
- 102000009618 Transforming Growth Factors Human genes 0.000 description 2
- 108010009583 Transforming Growth Factors Proteins 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 108010058153 Twin-Arginine-Translocation System Proteins 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 238000002679 ablation Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000000975 bioactive effect Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 102000028557 immunoglobulin binding proteins Human genes 0.000 description 2
- 108091009323 immunoglobulin binding proteins Proteins 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 229910001410 inorganic ion Inorganic materials 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229940053128 nerve growth factor Drugs 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004853 protein function Effects 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000035806 respiratory chain Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 108010033826 ribosomal protein S1 Proteins 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 2
- 239000013076 target substance Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 239000013638 trimer Substances 0.000 description 2
- 102000003390 tumor necrosis factor Human genes 0.000 description 2
- 108010087967 type I signal peptidase Proteins 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 239000002966 varnish Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- BITYXLXUCSKTJS-ZETCQYMHSA-N (2S)-2-isopropylmalic acid Chemical compound CC(C)[C@](O)(C(O)=O)CC(O)=O BITYXLXUCSKTJS-ZETCQYMHSA-N 0.000 description 1
- AUHDWARTFSKSAC-HEIFUQTGSA-N (2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-(6-oxo-1H-purin-9-yl)oxolane-2-carboxylic acid Chemical compound [C@]1([C@H](O)[C@H](O)[C@@H](CO)O1)(N1C=NC=2C(O)=NC=NC12)C(=O)O AUHDWARTFSKSAC-HEIFUQTGSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- RKNHJBVBFHDXGR-KEOHHSTQSA-N 1-(5-phospho-beta-D-ribosyl)-ATP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(N=CN([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(O)=O)O2)O)C2=N)=C2N=C1 RKNHJBVBFHDXGR-KEOHHSTQSA-N 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- DMSDCBKFWUBTKX-UHFFFAOYSA-N 2-methyl-1-nitrosoguanidine Chemical compound CN=C(N)NN=O DMSDCBKFWUBTKX-UHFFFAOYSA-N 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- PQGCEDQWHSBAJP-TXICZTDVSA-N 5-O-phosphono-alpha-D-ribofuranosyl diphosphate Chemical compound O[C@H]1[C@@H](O)[C@@H](O[P@](O)(=O)OP(O)(O)=O)O[C@@H]1COP(O)(O)=O PQGCEDQWHSBAJP-TXICZTDVSA-N 0.000 description 1
- 101150044182 8 gene Proteins 0.000 description 1
- 108010000700 Acetolactate synthase Proteins 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- MBWYUTNBYSSUIQ-HERUPUMHSA-N Ala-Asn-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N MBWYUTNBYSSUIQ-HERUPUMHSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 102100026376 Artemin Human genes 0.000 description 1
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 1
- RYKWOUUZJFSJOH-FXQIFTODSA-N Asp-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N RYKWOUUZJFSJOH-FXQIFTODSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- TZBJAXGYGSIUHQ-XUXIUFHCSA-N Asp-Leu-Leu-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O TZBJAXGYGSIUHQ-XUXIUFHCSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- KNOGLZBISUBTFW-QRTARXTBSA-N Asp-Trp-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O KNOGLZBISUBTFW-QRTARXTBSA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- 108010055400 Aspartate kinase Proteins 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101100162670 Bacillus subtilis (strain 168) amyE gene Proteins 0.000 description 1
- 101100242035 Bacillus subtilis (strain 168) pdhA gene Proteins 0.000 description 1
- 101100350224 Bacillus subtilis (strain 168) pdhB gene Proteins 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 102400000113 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 241000249126 Chryseobacterium proteolyticum Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 1
- 101100236536 Corynebacterium glutamicum (strain ATCC 13032 / DSM 20300 / BCRC 11384 / JCM 1318 / LMG 3730 / NCIMB 10025) glcB gene Proteins 0.000 description 1
- 241000133018 Corynebacterium melassecola Species 0.000 description 1
- 241000186308 Corynebacterium stationis Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 101710116957 D-alanyl-D-alanine carboxypeptidase Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102100033238 Elongation factor Tu, mitochondrial Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010011459 Exenatide Proteins 0.000 description 1
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 1
- 102000018389 Exopeptidases Human genes 0.000 description 1
- 108010091443 Exopeptidases Proteins 0.000 description 1
- 102000030914 Fatty Acid-Binding Human genes 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102100031706 Fibroblast growth factor 1 Human genes 0.000 description 1
- 102100028412 Fibroblast growth factor 10 Human genes 0.000 description 1
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 1
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 1
- 102100028071 Fibroblast growth factor 7 Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- XIJOPMSILDNVNJ-ZVZYQTTQSA-N Glu-Val-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIJOPMSILDNVNJ-ZVZYQTTQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- MFQVZYSPCIZFMR-MGHWNKPDSA-N His-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N MFQVZYSPCIZFMR-MGHWNKPDSA-N 0.000 description 1
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 1
- 101000917237 Homo sapiens Fibroblast growth factor 10 Proteins 0.000 description 1
- 101001052035 Homo sapiens Fibroblast growth factor 2 Proteins 0.000 description 1
- 101001060261 Homo sapiens Fibroblast growth factor 7 Proteins 0.000 description 1
- 101001078243 Homo sapiens Izumo sperm-egg fusion protein 1 Proteins 0.000 description 1
- 108010064711 Homoserine dehydrogenase Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- WSSGUVAKYCQSCT-XUXIUFHCSA-N Ile-Met-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)O)N WSSGUVAKYCQSCT-XUXIUFHCSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 108010093096 Immobilized Enzymes Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- GRSZFWQUAKGDAV-UHFFFAOYSA-N Inosinic acid Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(NC=NC2=O)=C2N=C1 GRSZFWQUAKGDAV-UHFFFAOYSA-N 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 102100025319 Izumo sperm-egg fusion protein 1 Human genes 0.000 description 1
- 101100001037 Komagataeibacter europaeus adhA gene Proteins 0.000 description 1
- 101100123255 Komagataeibacter xylinus aceC gene Proteins 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108010071324 Livagen Proteins 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 238000003820 Medium-pressure liquid chromatography Methods 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 1
- OBPCXINRFKHSRY-SDDRHHMPSA-N Met-Met-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N OBPCXINRFKHSRY-SDDRHHMPSA-N 0.000 description 1
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 1
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- KPVLLNDCBYXKNV-CYDGBPFRSA-N Met-Val-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KPVLLNDCBYXKNV-CYDGBPFRSA-N 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000144155 Microbacterium ammoniaphilum Species 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 101100162145 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) adhC2 gene Proteins 0.000 description 1
- 101100162144 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) adhc1 gene Proteins 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102000004264 Osteopontin Human genes 0.000 description 1
- 108010081689 Osteopontin Proteins 0.000 description 1
- 101150023107 PS2 gene Proteins 0.000 description 1
- 101100378791 Paenarthrobacter nicotinovorans aldh gene Proteins 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108700020474 Penicillin-Binding Proteins Proteins 0.000 description 1
- 108010049977 Peptide Elongation Factor Tu Proteins 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- ZZVUXQCQPXSUFH-JBACZVJFSA-N Phe-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ZZVUXQCQPXSUFH-JBACZVJFSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- UMIHVJQSXFWWMW-JBACZVJFSA-N Phe-Trp-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UMIHVJQSXFWWMW-JBACZVJFSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- BVTYXOFTHDXSNI-IHRRRGAJSA-N Pro-Tyr-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 BVTYXOFTHDXSNI-IHRRRGAJSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101100134871 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceE gene Proteins 0.000 description 1
- 101100406344 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceF gene Proteins 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101100490556 Schizosaccharomyces pombe (strain 972 / ATCC 24843) adh1 gene Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- HZNFKPJCGZXKIC-DCAQKATOSA-N Ser-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N HZNFKPJCGZXKIC-DCAQKATOSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 1
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 101000815632 Streptococcus suis (strain 05ZYH33) Rqc2 homolog RqcH Proteins 0.000 description 1
- 108010023197 Streptokinase Proteins 0.000 description 1
- 241000520730 Streptomyces cinnamoneus Species 0.000 description 1
- 241000499056 Streptomyces griseocarneus Species 0.000 description 1
- 241000218483 Streptomyces lydicus Species 0.000 description 1
- 241001495137 Streptomyces mobaraensis Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108010049264 Teriparatide Proteins 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 1
- NCGUQWSJUKYCIT-SZZJOZGLSA-N Thr-His-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NCGUQWSJUKYCIT-SZZJOZGLSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 1
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- POFQRHFHYPSCOI-FHWLQOOXSA-N Val-Trp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N POFQRHFHYPSCOI-FHWLQOOXSA-N 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 108010031318 Vitronectin Proteins 0.000 description 1
- 102100035140 Vitronectin Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 101150094017 aceA gene Proteins 0.000 description 1
- 101150036393 aceB gene Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 101150067366 adh gene Proteins 0.000 description 1
- 101150004356 adhC gene Proteins 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- SCJNCDSAIRBRIA-DOFZRALJSA-N arachidonyl-2'-chloroethylamide Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCCl SCJNCDSAIRBRIA-DOFZRALJSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 101150070136 axeA gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 229910001424 calcium ion Inorganic materials 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 101150041068 cspJ gene Proteins 0.000 description 1
- 101150010904 cspLB gene Proteins 0.000 description 1
- 101150063222 ctaD gene Proteins 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 108010007093 dispase Proteins 0.000 description 1
- 229960003638 dopamine Drugs 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 229960001519 exenatide Drugs 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 108091022862 fatty acid binding Proteins 0.000 description 1
- 102000036072 fibronectin binding proteins Human genes 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 101150005487 ftsI gene Proteins 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- ZXQYGBMAQZUVMI-GCMPRSNUSA-N gamma-cyhalothrin Chemical compound CC1(C)[C@@H](\C=C(/Cl)C(F)(F)F)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-GCMPRSNUSA-N 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 108010000320 glucan 1,6-alpha-isomaltosidase Proteins 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- ZDPUTNZENXVHJC-UUOKFMHZSA-N guanosine 3'-monophosphate Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](OP(O)(O)=O)[C@H]1O ZDPUTNZENXVHJC-UUOKFMHZSA-N 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 239000004226 guanylic acid Substances 0.000 description 1
- 101150042363 hemH gene Proteins 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 101150045402 hmuO gene Proteins 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 235000013902 inosinic acid Nutrition 0.000 description 1
- 239000004245 inosinic acid Substances 0.000 description 1
- 229940028843 inosinic acid Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 108010028309 kalinin Proteins 0.000 description 1
- 108010038862 laminin 10 Proteins 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 102000015478 lipoate synthase activity proteins Human genes 0.000 description 1
- 108010037535 lipoic acid synthase Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 239000011785 micronutrient Substances 0.000 description 1
- 235000013369 micronutrients Nutrition 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 230000001254 nonsecretory effect Effects 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 101150060462 pbpB gene Proteins 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 101150016348 phnC gene Proteins 0.000 description 1
- 101150048710 phoC gene Proteins 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229910001414 potassium ion Inorganic materials 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 101150108780 pta gene Proteins 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000026206 response to starvation Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 101150008822 rpsA gene Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N serine Chemical compound OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 229960005202 streptokinase Drugs 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- OGBMKVWORPGQRR-UMXFMPSGSA-N teriparatide Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 description 1
- 229960005460 teriparatide Drugs 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 210000002377 thylakoid Anatomy 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 101150047507 ushA gene Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 210000003556 vascular endothelial cell Anatomy 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/34—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
코리네형 세균에 의한 이종 단백질의 분비 생산을 향상시키는 신규의 기술을 개발하여, 이종 단백질의 분비 생산법을 제공한다. 이종 단백질을 분비 생산하는 능력을 갖고, 하기 성질 (A), (B), 및 (C)로부터 선택되는 2개 이상의 성질의 조합을 갖도록 개변된 코리네형 세균을 배양하여, 이종 단백질을 분비 생산한다: (A) RegX3 단백질의 활성이 비개변주와 비교하여 저하되는 성질; (B) HrrSA 시스템의 활성이 비개변주와 비교하여 저하되는 성질; (C) HrcA 단백질의 활성이 비개변주와 비교하여 저하되는 성질.
Description
본 발명은, 이종 단백질의 분비 생산법에 관한 것이다.
미생물에 의한 이종 단백질의 분비 생산으로서는, 지금까지 바실러스속 세균(비특허문헌 1), 메탄올 자화성 효모 피키아 파스토리스(Pichia pastoris) (비특허문헌 2), 및 아스퍼질루스속 사상균(비특허문헌 3, 4) 등에 의한 이종 단백질의 분비 생산이 보고되어 있다.
또한, 코리네형 세균에 의해 이종 단백질을 분비 생산하는 시도도 이루어지고 있다. 코리네형 세균에 의한 이종 단백질의 분비 생산에 대해서는, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)(이후, C. 글루타미쿰으로 약칭하는 경우가 있다)에 의한 뉴클레아제나 리파아제의 분비(특허문헌 1, 비특허문헌 5), 서브틸리신 등의 프로테아제의 분비(비특허문헌 6), 코리네형 세균의 세포 표층 단백질 PS1이나 PS2(CspB라고도 한다)의 신호 펩타이드를 이용한 단백질의 분비(특허문헌 2), PS2(CspB)의 신호 펩타이드를 이용한 피브로넥틴 결합 단백질의 분비(비특허문헌 7), PS2(CspB)나 SlpA(CspA라고도 한다)의 신호 펩타이드를 이용한 프로트랜스글루타미나아제의 분비(특허문헌 3), 변이형 분비 시스템을 이용한 단백질의 분비(특허문헌 4), 변이주에 의한 프로트랜스글루타미나아제의 분비(특허문헌 5) 등의 보고가 있다. 또한, 코리네형 세균에 의한 이종 단백질의 분비 생산량을 높이는 기술로서, 세포 표층 단백질의 활성을 저하시키는 것(특허문헌 6, 7), 페니실린 결합 단백질의 활성을 저하시키는 것(특허문헌 6), 메탈로펩티다아제를 코딩하는 유전자의 발현을 증강하는 것(특허문헌 7), 리보솜 단백질 S1 유전자에 변이를 도입하는 것(특허문헌 8), 신호 펩타이드와 이종 단백질 사이에 Gln-Glu-Thr을 포함하는 아미노산 서열을 삽입하여 이종 단백질을 발현시키는 것(특허문헌 9) 등이 알려져 있다.
일반적인 단백질 분비 경로는 원핵생물에서부터 진핵생물까지 널리 존재하는 Sec계라고 불리는 경로이지만, 최근, Sec계와는 전혀 다른 단백질 분비 경로가 식물 세포의 엽록체의 틸라코이드막에서 발견되었다(비특허문헌 8). 이 신규의 분비 경로는, 그에 의해 분비되는 단백질의 신호 서열에 아르기닌-아르기닌의 서열이 공통으로 존재하고 있기 때문에(비특허문헌 8), Tat계(트윈-아르기닌 전위 시스템, Twin-Arginine Translocation system)라고 명명되었다. Sec계에서는 단백질이 고차(高次) 구조를 형성하기 전의 상태로 분비되는 반면, Tat계에서는 단백질은 세포 내에서 고차 구조를 형성한 후에 세포막을 통과하여 분비되는 것으로 알려져 있다(비특허문헌 9). 코리네형 세균에서도 Tat계 의존성 신호 펩타이드를 이용한 단백질의 분비 생산의 보고가 있다(특허문헌 8, 10).
세균이 세포 내외의 다양한 환경 변화에 반응하는 시스템으로서, 「2성분 제어계」라고 불리는 신호 전달 경로가 알려져 있다. 2성분 제어계는, 환경 변화의 자극을 감지하는 역할의 센서 키나아제와, 센서 키나아제로부터 신호를 받아서 하류의 유전자의 발현을 제어하는 역할의 반응 조절인자의 2개의 성분으로 이루어지는 제어 시스템이다. 구체적으로는, 센서 키나아제가 자극을 감지하면 특정한 히스티딘 잔기가 자기 인산화되고, 그 인산기가 반응 조절인자의 특정한 아스파르트산 잔기로 전이함으로써 신호가 전달되고, 인산화에 의해 활성화된 반응 조절인자가 전사 인자로서 하류의 유전자 발현을 조절한다.
C. 글루타미쿰의 2성분 제어계에 관한 지견은 비특허문헌 10 등에 자세히 기재되어 있다. C. 글루타미쿰에 있어서는, 2성분 제어계로서 지금까지 적어도 13종류의 시스템이 알려져 있다. 2성분 제어계로서, 구체적으로는 PhoRS 시스템, SenX3-RegX3 시스템, HrrSA 시스템을 들 수 있다.
PhoRS 시스템은 센서 키나아제의 PhoS 단백질과, 반응 조절인자의 PhoR 단백질로 이루어진다. PhoRS 결손주의 분석에 의해, PhoRS 시스템은 환경 중의 인산 결핍을 감지하여 신호 전달을 행하는 제어계인 것이 밝혀져 있다(비특허문헌 11).
SenX3-RegX3 시스템은 센서 키나아제의 SenX3 단백질과, 반응 조절인자의 RegX3 단백질로 이루어진다. C. 글루타미쿰 ATCC 13032주에서의 RegX3 결손주는 취득 불가능하기 때문에, SenX3-RegX3 시스템은 ATCC 13032주에 있어서는 필수 시스템이라고 생각되고 있다(비특허문헌 10, 12). 한편, regX3 유전자 발현 저하주의 분석에 의해, SenX3-RegX3 시스템은, 무기 인산의 결핍에 반응하는 유전자의 발현이나 NAD+의 생합성에 관련된 유전자의 발현을 유도하는 것이 밝혀져 있다(비특허문헌 12).
그러나, RegX3-SenX3 시스템과, 이종 단백질의 분비 생산과의 관계는 지금까지 알려져 있지 않다.
HrrSA 시스템은 센서 키나아제인 HrrS 단백질과, 반응 조절인자인 HrrA 단백질로 이루어진다. HrrSA 결손주의 분석에 의해, HrrSA 시스템은 헴(haem)의 존재 하에, 헴의 분해에 관여하는 유전자나 호흡 사슬 중의 헴 함유 단백질을 코딩하는 유전자의 발현을 유도하고, 헴의 생합성에 관여하는 유전자의 발현을 억제하는 것이 밝혀져 있기 때문에, 헴의 항상성 유지에 관여하고 있다고 생각되고 있다(비특허문헌 13).
그러나, HrrSA 시스템과, 이종 단백질의 분비 생산과의 관계는 지금까지 알려져 있지 않다.
모든 생물은, 갑작스런 온도 상승(열 충격)에 반응하여 열 충격 단백질이라고 불리는 다양한 단백질을 발현한다. 열 충격 단백질에는, 단백질의 폴딩을 돕는 분자 샤프론이나 미스폴딩된 단백질을 분해하는 프로테아제 등이 포함된다. 분자 샤프론의 1종인 GroEL은, 보조 인자인 GroES와 함께 GroEL-GroES 복합체를 형성하고, 그 내부에서 단백질의 폴딩이 일어난다. 코리네박테리움 글루타미쿰의 유전체 (GenBank 등록번호 AP017557)에는, 2카피의 groEL 유전자, 즉 groEL1 유전자(NCBI locus_tag CGBL_0106870)와 groEL2 유전자(NCBI locus_tag CGBL_0126550), 및 1카피의 groES 유전자(NCBI locus_tag CGBL_0106860)가 존재한다. hrcA 유전자(NCBI locus_tag CGBL_0121890)에 코딩되는 전사 인자 HrcA는, groEL1, groEL2, 및 groES 유전자의 전사를 억제하고 있고, hrcA 유전자의 결손주에서는 groEL1, groEL2, 및 groES의 전사량이 증가하는 것으로 알려져 있다(비특허문헌 14). 또한, E. 콜라이에 있어서는, GroEL 및 GroES의 공발현에 의해, 다양한 이종 단백질의 수율이나 가용성이 상승하는 것이 확인되어 있다(비특허문헌 15).
그러나, HrcA나 GroEL 및 GroES와, 코리네형 세균에서의 이종 단백질의 분비 생산과의 관계는 지금까지 알려져 있지 않다.
비특허문헌 1: Microbiol. Rev., 57,109-137(1993)
비특허문헌 2: Biotechnol., 11, 905-910(1993)
비특허문헌 3: Biotechnol., 6, 1419-1422(1988)
비특허문헌 4: Biotechnol., 9, 976-981(1991)
비특허문헌 5: J. Bacteriol., 174, 1854-1861(1992)
비특허문헌 6: Appl. Environ. Microbiol., 61, 1610-1613(1995)
비특허문헌 7: Appl. Environ. Microbiol., 63, 4392-4400(1997)
비특허문헌 8: EMBO J., 14, 2715-2722(1995)
비특허문헌 9: J. Biol. Chem., 25; 273(52), 34868-74(1998)
비특허문헌 10: Appl. Microbiol. Biotechnol., 94, 1131-1150(2012)
비특허문헌 11: J. Bacteriol., 188, 724-732(2006)
비특허문헌 12: Han Min Woo, Regulatory and metabolic aspects of the phosphate starvation response of Corynebacterium glutamicum, URN (NBN): urn:nbn:de:hbz:061-20100825-090114-5, 뒤셀도르프 대학 박사 논문(2010)
비특허문헌 13: J. Bacteriol., 193, 1212-1221(2011)
비특허문헌 14: J. Bacteriol., 191, 2964-2072(2009)
비특허문헌 15: Microb. Cell. Fact., 8: 9(2009)
본 발명은, 코리네형 세균에 의한 이종 단백질의 분비 생산을 향상시키는 신규의 기술을 개발하고, 코리네형 세균에 의한 이종 단백질의 분비 생산법을 제공하는 것을 과제로 한다.
본 발명자들은, 상기 과제를 해결하기 위해서 예의 연구를 행한 결과, RegX3 단백질, HrrSA 시스템, 및 HrcA 단백질로부터 선택되는 2종 이상의 활성이 저하되도록 코리네형 세균을 개변함으로써, 코리네형 세균의 이종 단백질의 분비 생산능이 향상되는 것을 발견하여 본 발명을 완성시켰다.
즉, 본 발명은 이하와 같이 예시할 수 있다.
[1]
이종 단백질의 제조 방법으로서,
이종 단백질의 분비 발현용의 유전자 구축물을 갖는 코리네형 세균을 배양하는 단계, 및
분비 생산된 이종 단백질을 회수하는 단계를 포함하고,
상기 코리네형 세균이, 하기 성질 (A), (B), 및 (C):
(A) RegX3 단백질의 활성이 비개변주와 비교하여 저하되는 성질;
(B) HrrSA 시스템의 활성이 비개변주와 비교하여 저하되는 성질;
(C) HrcA 단백질의 활성이 비개변주와 비교하여 저하되는 성질로부터 선택되는 2개 이상의 성질의 조합을 갖도록 개변되어 있으며,
상기 유전자 구축물이, 5'에서 3'방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열, 및 이종 단백질을 코딩하는 핵산 서열을 포함하고,
상기 이종 단백질이, 상기 신호 펩타이드와의 융합 단백질로서 발현되는, 방법.
[2]
상기 성질 (A), (B) 및 (C)가 각각 하기 성질 (A1), (B1) 및 (C1)인, 상기 방법:
(A1) RegX3 단백질의 세포당 분자수가 비개변주와 비교하여 저하되는 성질;
(B1) HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 세포당 분자수가 비개변주와 비교하여 저하되는 성질;
(C1) HrcA 단백질의 세포당 분자수가 비개변주와 비교하여 저하되는 성질.
[3]
상기 코리네형 세균이 상기 성질 (A)와 (B)의 조합, 상기 성질 (A)와 (C)의 조합, 또는 상기 성질 (B)와 (C)의 조합을 갖는, 상기 방법.
[4]
상기 코리네형 세균이 상기 성질 (A)와 (B)와 (C)의 조합을 갖는, 상기 방법.
[5]
HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 활성을 저하시킴으로써, 상기 성질 (B)가 얻어진, 상기 방법.
[6]
적어도 HrrA 단백질의 활성을 저하시킴으로써, 상기 성질 (B)가 얻어진, 상기 방법.
[7]
HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 세포당 분자수를 저하시킴으로써, 상기 성질 (B)가 얻어진, 상기 방법.
[8]
적어도 HrrA 단백질의 세포당 분자수를 저하시킴으로써, 상기 성질 (B)가 얻어진, 상기 방법.
[9]
상기 RegX3 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:
(a) 서열번호 42에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 42에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 단백질;
(c) 서열번호 42에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 단백질.
[10]
상기 HrrS 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:
(a) 서열번호 44에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 44에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 단백질;
(c) 서열번호 44에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 단백질.
[11]
상기 HrrA 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:
(a) 서열번호 46에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 46에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 단백질;
(c) 서열번호 46에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 단백질.
[12]
상기 HrcA 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:
(a) 서열번호 48에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 48에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 단백질;
(c) 서열번호 48에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 단백질.
[13]
regX3 유전자의 발현을 저하시킴으로써, 또는 regX3 유전자를 파괴함으로써, 상기 성질 (A)가 얻어진;
hrrS 유전자 및/또는 hrrA 유전자의 발현을 저하시킴으로써, 또는 hrrS 유전자 및/또는 hrrA 유전자를 파괴함으로써, 상기 성질 (B)가 얻어진; 및/또는,
hrcA 유전자의 발현을 저하시킴으로써, 또는 hrcA 유전자를 파괴함으로써, 상기 성질 (C)가 얻어진, 상기 방법.
[14]
regX3 유전자의 결실에 의해, 상기 성질 (A)가 얻어지고;
hrrS 유전자 및/또는 hrrA 유전자의 결실에 의해, 상기 성질 (B)가 얻어지고; 및/또는,
hrcA 유전자의 결실에 의해, 상기 성질 (C)가 얻어진, 상기 방법.
[15]
상기 코리네형 세균이, 추가로, 변이형 PhoS 단백질을 코딩하는 phoS 유전자를 유지하도록 개변되어 있는, 상기 방법.
[16]
상기 변이가, 야생형 PhoS 단백질에 있어서, 서열번호 2의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기를 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환한 변이인, 상기 방법.
[17]
상기 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가, 라이신 잔기, 알라닌 잔기, 발린 잔기, 세린 잔기, 시스테인 잔기, 메티오닌 잔기, 아스파르트산 잔기, 또는 아스파라긴 잔기인, 상기 방법.
[18]
상기 야생형 PhoS 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:
(a) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 단백질;
(c) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 단백질.
[19]
상기 신호 펩타이드가 Tat계 의존성 신호 펩타이드인, 상기 방법.
[20]
상기 Tat계 의존성 신호 펩타이드가 TorA 신호 펩타이드, SufI 신호 펩타이드, PhoD 신호 펩타이드, LipA 신호 펩타이드, 및 IMD 신호 펩타이드로 이루어지는 그룹으로부터 선택되는 어느 하나의 신호 펩타이드인, 상기 방법.
[21]
상기 코리네형 세균이, 추가로 Tat계 분비 시스템을 코딩하는 유전자로부터 선택되는 1종 이상의 유전자의 발현이 비개변주와 비교하여 상승하도록 개변되어 있는, 상기 방법.
[22]
상기 Tat계 분비 시스템을 코딩하는 유전자가, tatA 유전자, tatB 유전자 tatC 유전자, 및 tatE 유전자로 이루어지는, 상기 방법.
[23]
상기 신호 펩타이드가 Sec계 의존성 신호 펩타이드인, 상기 방법.
[24]
상기 Sec계 의존성 신호 펩타이드가 PS1 신호 펩타이드, PS2 신호 펩타이드 및 SlpA 신호 펩타이드로 이루어지는 그룹으로부터 선택되는 어느 하나의 신호 펩타이드인, 상기 방법.
[25]
상기 유전자 구축물이, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열을 포함하는, 상기 방법.
[26]
상기 유전자 구축물이, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열을 포함하는, 상기 방법.
[27]
상기 코리네형 세균이 코리네박테리움속 세균인, 상기 방법.
[28]
상기 코리네형 세균이 코리네박테리움 글루타미쿰인, 상기 방법.
[29]
상기 코리네형 세균이, 코리네박테리움 글루타미쿰 AJ 12036(FERM BP-734)에서 유래하는 개변주 또는 코리네박테리움 글루타미쿰 ATCC 13869에서 유래하는 개변주인, 상기 방법.
[30]
상기 코리네형 세균이, 세포 표층 단백질의 세포당 분자수가 비개변주와 비교하여 저하되어 있는 코리네형 세균인, 상기 방법.
도 1은, C. 글루타미쿰 YDK010::phoS(W302C)주 및 그 유전자 결손주에서 VHH 항체 N15(CspA의 신호 펩타이드를 융합한 N15)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진이다.
도 2는, C. 글루타미쿰 YDK010::phoS(W302C)주 및 이 유전자 결손주에서 CspB6Xa-LFABP(CspB의 신호 펩타이드, 성숙 CspB의 N 말단 서열, 및 인자 Xa 프로테아제 인식 서열을 융합한 LFABP)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진이다.
도 3은, C. 글루타미쿰 YDK010::phoS(W302C)주 및 그 유전자 결손주에서 bFGF(TorA 신호 펩타이드를 융합한 bFGF)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진이다.
도 2는, C. 글루타미쿰 YDK010::phoS(W302C)주 및 이 유전자 결손주에서 CspB6Xa-LFABP(CspB의 신호 펩타이드, 성숙 CspB의 N 말단 서열, 및 인자 Xa 프로테아제 인식 서열을 융합한 LFABP)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진이다.
도 3은, C. 글루타미쿰 YDK010::phoS(W302C)주 및 그 유전자 결손주에서 bFGF(TorA 신호 펩타이드를 융합한 bFGF)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진이다.
이하, 본 발명을 상세하게 설명한다.
본 발명의 방법은, 이종 단백질의 분비 발현용의 유전자 구축물을 갖는 코리네형 세균을 배양하는 단계, 및 분비 생산된 이종 단백질을 회수하는 단계를 포함하는 이종 단백질의 제조 방법으로서, 상기 코리네형 세균이 특정한 성질을 갖도록 개변되어 있는, 방법이다.
<1> 본 발명의 방법에 사용되는 코리네형 세균
본 발명의 방법에 사용되는 코리네형 세균은, 이종 단백질의 분비 발현용의 유전자 구축물을 갖는 코리네형 세균이며, 또한, 특정한 성질을 갖도록 개변된 코리네형 세균이다. 또한, 본 발명의 방법에 사용되는 코리네형 세균을 「본 발명의 세균」 또는 「본 발명의 코리네형 세균」이라고도 한다. 또한, 본 발명의 세균이 갖는 이종 단백질의 분비 발현용의 유전자 구축물을 「본 발명에 사용되는 유전자 구축물」이라고도 한다.
<1-1> 이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균
본 발명의 코리네형 세균은, 이종 단백질의 분비 발현용의 유전자 구축물(본 발명에 사용되는 유전자 구축물)을 가짐으로써, 이종 단백질을 분비 생산하는 능력을 갖는다.
본 발명에 있어서, 단백질이 「분비」된다는 것은 단백질이 세균 균체 외(세포 외)로 이송되는 것을 말한다. 세균 균체 외(세포 외)로서는, 배지 중이나 균체 표층을 들 수 있다. 즉, 분비된 단백질 분자는, 예를 들면, 배지 중에 존재해 있어도 좋고, 균체 표층에 존재해 있어도 좋고, 배지 중과 균체 표층의 양쪽에 존재해 있어도 좋다. 즉, 단백질이 「분비」되는 것에는, 최종적으로 그 단백질의 모든 분자가 배지 중에 완전하게 유리(遊離) 상태에 놓이는 경우에 한정되지 않고, 예를 들면, 그 단백질의 모든 분자가 균체 표층에 존재하고 있는 경우나, 그 단백질의 일부의 분자가 배지 중에 존재하고, 나머지 분자가 균체 표층에 존재하고 있는 경우도 포함된다.
즉, 본 발명에 있어서, 「이종 단백질을 분비 생산하는 능력」이란, 본 발명의 세균을 배지 중에서 배양했을 때에, 배지 중 및/또는 균체 표층에 이종 단백질을 분비하고, 배지 중 및/또는 균체 표층으로부터 회수할 수 있는 정도로 축적하는 능력을 말한다. 축적량은, 예를 들면, 배지 중에서의 축적량으로서, 바람직하게는 10㎍/L 이상, 보다 바람직하게는 1mg/L 이상, 특히 바람직하게는 100mg/L 이상, 더욱 바람직하게는 1g/L 이상이라도 좋다. 또한, 축적량은, 예를 들면, 균체 표층에서의 축적량으로서, 균체 표층의 이종 단백질을 회수하여 배지와 동량의 액체에 현탁한 경우에 현탁액 중에서의 이종 단백질 농도가 바람직하게는 10㎍/L 이상, 보다 바람하게는 1mg/L 이상, 특히 바람직하게는 100mg/L 이상이 되는 양이라도 좋다. 또한, 본 발명에 있어서 분비 생산되는 「단백질」이란, 올리고펩타이드나 폴리펩타이드 등 펩타이드로 불리는 형태도 포함하는 개념이다.
본 발명에 있어서, 「이종 단백질」이란, 이 단백질을 발현 및 분비시키는 코리네형 세균에 있어서 외래성인 단백질을 말한다. 이종 단백질은, 예를 들면, 미생물 유래의 단백질이라도 좋고, 식물 유래의 단백질이라도 좋고, 동물 유래의 단백질이라도 좋고, 바이러스 유래의 단백질이라도 좋고, 또한 인공적으로 아미노산 서열을 디자인한 단백질이라도 좋다. 이종 단백질은, 특히, 인간 유래의 단백질이라도 좋다. 이종 단백질은 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 다량체 단백질이란, 2 이상의 서브유닛으로 이루어지는 다량체로서 존재할 수 있는 단백질을 말한다. 다량체에 있어서, 각 서브유닛은, 이황화 결합 등의 공유 결합으로 연결되어 있어도 좋고, 수소 결합이나 소수성 상호 작용 등의 비공유 결합으로 연결되어 있어도 좋고, 이들의 조합에 의해 연결되어 있어도 좋다. 다량체에 있어서는, 1 이상의 분자간 이황화 결합이 포함되는 것이 바람직하다. 다량체는, 단일 종류의 서브유닛으로 이루어지는 호모 다량체라도 좋고, 2 이상의 종류의 서브유닛으로 이루어지는 헤테로 다량체라도 좋다. 또한, 다량체 단백질이 헤테로 다량체인 경우에는, 다량체를 구성하는 서브유닛 중, 적어도 하나의 서브유닛이 이종 단백질이면 좋다. 즉, 모든 서브유닛이 이종 유래라도 좋고, 일부의 서브유닛만이 이종 유래라도 좋다. 이종 단백질은 천연이고 분비성인 단백질이라도 좋고, 천연이고 비분비성인 단백질이라도 좋지만, 천연이고 분비성인 단백질인 것이 바람직하다. 또한, 이종 단백질은 천연이고 Tat계 의존의 분비성 단백질이라도 좋고, 천연이고 Sec계 의존의 분비성 단백질이라도 좋다. 「이종 단백질」의 구체적인 예는 후술한다.
생산되는 이종 단백질은 1종류뿐이라도 좋고, 2 이상의 종류라도 좋다. 또한, 이종 단백질이 헤테로 다량체인 경우에는, 1종류의 서브유닛만 생산되어도 좋고, 2 이상의 종류의 서브유닛이 생산되어도 좋다. 즉, 「이종 단백질을 분비 생산한다」는 것에는, 목적의 이종 단백질을 구성하는 서브유닛들 중, 모든 서브유닛을 분비 생산하는 경우 이외에도, 일부의 서브유닛만을 분비 생산하는 경우도 포함된다.
코리네형 세균은 호기성의 그램양성 간균이다. 코리네형 세균으로서는, 코리네박테리움속 세균, 브레비박테리움(Brevibacterium)속 세균, 및 마이크로박테리움(Microbacterium)속 세균 등을 들 수 있다. 코리네형 세균을 사용하는 것의 이점으로서는, 종래 이종 단백질의 분비 생산에 이용되고 있는 사상균, 효모, 바실러스속 세균 등에 비해, 원래 균체 외에 분비되는 단백질이 매우 적어서, 이종 단백질을 분비 생산했을 경우의 정제 과정의 간략화나 생략화를 기대할 수 있는 것, 또한, 당, 암모니아, 및 무기염 등을 함유하는 단순 배지에서 잘 생육하기 때문에, 배지 비용이나 배양 방법, 배양 생산성에서 우수하다는 것 등을 들 수 있다.
코리네형 세균으로서는, 구체적으로는 하기와 같은 종을 들 수 있다.
코리네박테리움 아세토아시도필룸(Corynebacterium acetoacidophilum)
코리네박테리움 아세토글루타미쿰(Corynebacterium acetoglutamicum)
코리네박테리움 알카노리티쿰(Corynebacterium alkanolyticum)
코리네박테리움 칼루나에(Corynebacterium callunae)
코리네박테리움 크레나툼(Corynebacterium crenatum)
코리네박테리움 글루타미쿰
코리네박테리움 릴리움(Corynebacterium lilium)
코리네박테리움 멜라쎄콜라(Corynebacterium melassecola)
코리네박테리움 써모아미노게네스(코리네박테리움 에피시엔스)(Corynebacterium thermoaminogenes(Corynebacterium efficiens))
코리네박테리움 헤르쿨리스(Corynebacterium herculis)
브레비박테리움 디바리카룸(코리네박테리움 글루타미쿰)(Brevibacterium divaricatum)
브레비박테리움 플라붐(코리네박테리움 글루타미쿰)(Brevibacterium flavum)
브레비박테리움 임마리오필룸(Brevibacterium immariophilum)
브레비박테리움 락토페르멘툼(코리네박테리움 글루타미쿰)(Brevibacterium lactofermentum)
브레비박테리움 로세움(Brevibacterium roseum)
브레비박테리움 사카롤리티쿰(Brevibacterium saccharolyticum)
브레비박테리움 티오게니탈리스(Brevibacterium thiogenitalis)
코리네박테리움 암모니아게네스(코리네박테리움 스타티오니스)(Corynebacterium ammoniagenes(Corynebacterium stationis))
브레비박테리움 알붐(Brevibacterium album)
브레비박테리움 세리눔(Brevibacterium cerinum)
마이크로박테리움 암모니아필룸(Microbacterium ammoniaphilum)
코리네형 세균으로서는, 구체적으로는 하기와 같은 균주를 들 수 있다.
코리네박테리움 아세토아시도필룸 ATCC 13870
코리네박테리움 아세토글루타미쿰 ATCC 15806
코리네박테리움 알카노리티쿰 ATCC 21511
코리네박테리움 칼루나에 ATCC 15991
코리네박테리움 크레나툼 AS1.542
코리네박테리움 글루타미쿰 ATCC 13020, ATCC 13032, ATCC 13060, ATCC 13869, FERM BP-734
코리네박테리움 릴리움 ATCC 15990
코리네박테리움 멜라쎄콜라 ATCC 17965
코리네박테리움 써모아미노게네스 (코리네박테리움 에피시엔스) AJ 12340(FERM BP-1539)
코리네박테리움 헤르쿨리스 ATCC 13868
브레비박테리움 디바리카툼(코리네박테리움 글루타미쿰) ATCC 14020
브레비박테리움 플라붐(코리네박테리움 글루타미쿰) ATCC 13826, ATCC 14067, AJ 12418(FERM BP-2205)
브레비박테리움 임마리오필룸 ATCC 14068
브레비박테리움 락토퍼멘툼(코리네박테리움 글루타미쿰) ATCC 13869
브레비박테리움 로세움 ATCC 13825
브레비박테리움 사카롤리티쿰 ATCC 14066
브레비박테리움 티오게니탈리스 ATCC 19240
코리네박테리움 암모니아게네스(코리네박테리움 스타티오니스) ATCC 6871, ATCC 6872
브레비박테리움 알붐 ATCC 15111
브레비박테리움 세리눔 ATCC 15112
마이크로박테리움 암모니아필룸 ATCC 15354
또한, 코리네박테리움속 세균에는, 종래 브레비박테리움속으로 분류되어 있었지만, 현재 코리네박테리움속으로 통합된 세균(Int. J. Syst. Bacteriol., 41, 255(1991))도 포함된다. 또한, 코리네박테리움 스타티오니스에는, 종래 코리네박테리움 암모니아게네스로 분류되어 있었지만, 16S rRNA의 염기서열 분석 등에 의해 코리네박테리움 스타티오니스로 재분류된 세균도 포함된다(Int. J. Syst. Evol. Microbiol., 60, 874-879(2010)).
이들 균주는, 예를 들면, 미국세포균주은행(주소: 미국 버지니아주 20108 머내서스 사서함 1549 메리랜드 20852 락빌 파크론 드라이브 12301)에서 분양을 받을 수 있다. 즉, 각 균주에 대응하는 등록번호가 부여되어 있고, 이 등록번호를 이용하여 분양을 받을 수 있다(http://www.atcc.org/참조). 각 균주에 대응하는 등록번호는 미국세포균주은행의 카탈로그에 기재되어 있다. 또한, 이들 균주는, 예를 들면, 각 균주가 기탁된 기탁 기관에서 입수할 수 있다.
특히, 야생주 C. 글루타미쿰 ATCC 13869로부터 스트렙토마이신(Sm) 내성 변이주로서 분리된 C. 글루타미쿰 AJ 12036(FERM BP-734)은, 그 친주(야생주)에 비해, 단백질의 분비에 관한 기능을 담당하는 유전자에 변이가 존재하는 것으로 예측되고, 단백질의 분비 생산능이 최적 배양 조건하에서의 축적량으로서 약 2 내지 3배로 매우 높고, 숙주균으로서 적합하다(WO02/081694). AJ 12036은, 1984년 3월 26일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁센터, 우편번호: 292-0818, 주소: 니혼 치바켄 키사라즈시 카즈사카마타리 2-5-8 120호실)에 국제기탁으로서 원기탁되어, 수탁번호 FERM BP-734가 부여되어 있다.
또한, 코리네박테리움 써모아미노게네스 AJ 12340(FERM BP-1539)은, 1987년 3월 13일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁센터, 우편번호: 292-0818, 주소: 니혼 치바켄 키사라즈시 카즈사카마타리 2-5-8 120호실)에 국제기탁으로서 원기탁되어, 수탁번호 FERM BP-1539가 부여되어 있다. 또한, 브레비박테리움 플라붐 AJ 12418(FERM BP-2205)은, 1988년 12월 24일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁센터, 우편번호: 292-0818, 주소: 니혼 치바켄 키사라즈시 카즈사카마타리 2-5-8 120호실)에 국제기탁으로서 원기탁되어, 수탁번호 FERM BP-2205가 부여되어 있다.
또한, 상술한 바와 같은 코리네형 세균을 친주로서, 돌연변이법이나 유전자 재조합법을 이용하여 단백질의 분비 생산능이 높아진 주(株)를 선발하여, 숙주로서 이용해도 좋다. 예를 들면, 자외선 조사 또는 N-메틸-N'-니트로소구아니딘 등의 화학 변이제에 의한 처리를 행한 후, 단백질의 분비 생산능이 높아진 주를 선발할 수 있다.
또한, 이러한 균주로부터 세포 표층 단백질을 생산하지 않도록 개변한 균주를 숙주로서 사용하면, 배지 중 또는 균체 표층에 분비된 이종 단백질의 정제가 용이해져, 특히 바람직하다. 이러한 개변은, 돌연변이법 또는 유전자 재조합법에 의해 염색체 위의 세포 표층 단백질의 코딩 영역 또는 그 발현 조절 영역에 변이를 도입함으로써 행할 수 있다. 세포 표층 단백질을 생산하지 않도록 개변된 코리네형 세균으로서는, C. 글루타미쿰 AJ 12036(FERM BP-734)의 세포 표층 단백질 PS2의 결손주인 C. 글루타미쿰 YDK010주(WO2004/029254)를 들 수 있다.
이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균은, 상술한 바와 같은 코리네형 세균에, 본 발명에 사용되는 유전자 구축물을 도입하여 유지시킴으로써 얻을 수 있다. 즉, 본 발명의 세균은, 예를 들면, 상술한 바와 같은 코리네형 세균에서 유래하는 개변주라도 좋다. 본 발명의 세균은, 구체적으로는, 예를 들면, C. 글루타미쿰 AJ 12036(FERM BP-734)에서 유래하는 개변주 또는 C. 글루타미쿰 ATCC 13869에서 유래하는 개변주라도 좋다. 또한, C. 글루타미쿰 AJ 12036(FERM BP-734)에서 유래하는 개변주는, C. 글루타미쿰 ATCC 13869에서 유래하는 개변주에도 해당한다. 본 발명에 사용되는 유전자 구축물이나 그 도입법에 대해서는 후술한다.
<1-2> 특정한 성질
본 발명의 세균은 특정한 성질을 갖도록 개변되어 있다. 특정한 성질을 갖도록 코리네형 세균을 개변함으로써, 이 세균의 이종 단백질을 분비 생산하는 능력을 향상시킬 수 있는, 즉, 이 세균에 의한 이종 단백질의 분비 생산을 증대시킬 수 있다.
본 발명의 세균은, 이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균을, 특정한 성질을 갖도록 개변함으로써 얻을 수 있다. 또한, 본 발명의 세균은, 특정한 성질을 갖도록 코리네형 세균을 개변한 후에, 이종 단백질을 분비 생산하는 능력을 부여함으로써도 얻을 수 있다. 본 발명에 있어서, 본 발명의 세균을 구축하기 위한 개변은 임의의 순서로 행할 수 있다. 또한, 본 발명의 세균의 구축에 사용되는, 특정한 성질을 갖도록 개변되기 전의 주는, 이종 단백질의 분비 발현용의 유전자 구축물을 갖는다고 가정한 경우에, 이종 단백질을 분비 생산할 수 있어도 좋고, 할 수 없어도 좋다. 즉, 본 발명의 세균은, 예를 들면, 특정한 성질을 갖도록 개변됨으로써 이종 단백질을 분비 생산하는 능력을 획득한 것이라도 좋다. 구체적으로는, 예를 들면, 본 발명의 세균은, 특정한 성질을 갖도록 개변되기 전에는 이종 단백질의 분비 발현용의 유전자 구축물을 갖고 있어도 이종 단백질을 분비 생산할 수 없었던 주로부터 얻어진 것으로서, 특정한 성질을 갖도록 개변됨으로써 이종 단백질을 분비 생산할 수 있게 된 것이라도 좋다.
「특정한 성질」이란, 하기 (A), (B), 및 (C)로부터 선택되는 2개 이상의 성질의 조합이다:
(A) RegX3 단백질의 활성이 저하되는 성질;
(B) HrrSA 시스템의 활성이 저하되는 성질;
(C) HrcA 단백질의 활성이 저하되는 성질.
상기 성질 (A) 내지 (C)에 있어서, 활성은 모두 비개변주에 비해 저하된다.
「특정한 성질」은, 구체적으로는, 상기 성질 (A)와 (B)의 조합, 상기 성질 (A)와 (C)의 조합, 상기 성질 (B)와 (C)의 조합, 또는 상기 성질 (A)와 (B)와 (C)의 조합이라도 좋다. 즉, 본 발명의 세균은, 예를 들면, 상기 성질 (A)와 (B)의 조합, 상기 성질 (A)와 (C)의 조합, 또는 상기 성질 (B)와 (C)의 조합을 갖고 있어도 좋다. 또한, 본 발명의 세균은, 예를 들면, 상기 성질 (A)와 (B)와 (C)의 조합을 갖고 있어도 좋다. 바꿔 말하면, 본 발명의 세균은 상기 성질 (A)와 (B)의 조합을 갖고 있어도 좋고, 추가로, 상기 성질 (C)를 갖고 있어도 좋다. 또한, 본 발명의 세균은 상기 성질 (A)와 (C)의 조합을 갖고 있어도 좋고, 추가로, 상기 성질 (B)를 갖고 있어도 좋다. 또한, 본 발명의 세균은 상기 성질 (B)와 (C)의 조합을 갖고 있어도 좋고, 추가로, 상기 성질 (A)를 갖고 있어도 좋다.
<1-2-1> RegX3 단백질의 활성 저하
이하, RegX3 단백질 및 이를 코딩하는 regX3 유전자에 대하여 설명한다. RegX3 단백질은 SenX3-RegX3 시스템의 반응 조절인자이다. SenX3-RegX3 시스템은 2성분 제어계 중 하나이며, 환경 중의 자극에 대한 반응을 유도한다. SenX3-RegX3 시스템은, senX3 유전자에 코딩되는 센서 키나아제 SenX3과, regX3 유전자에 코딩되는 반응 조절인자 RegX3으로 이루어진다.
코리네형 세균이 갖는 regX3 유전자의 염기서열 및 이들에 코딩되는 RegX3 단백질의 아미노산 서열은, 예를 들면, NCBI(미국 국립 생물공학 정보센터) 등의 공개 데이터 베이스로부터 취득할 수 있다. C. 글루타미쿰 ATCC 13869의 regX3 유전자의 염기서열, 및 이 유전자가 코딩하는 RegX3 단백질의 아미노산 서열을, 각각 서열번호 41 및 42에 나타낸다. 즉, regX3 유전자는, 예를 들면, 서열번호 41에 나타낸 염기서열을 갖는 유전자라도 좋다. 또한, RegX3 단백질은, 예를 들면, 서열번호 42에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 「(아미노산 또는 염기)서열을 갖는다」라는 표현은 특별히 기재하지 않는 한, 당해 「(아미노산 또는 염기)서열을 포함한다」는 것을 의미하고, 당해 「(아미노산 또는 염기)서열로 이루어진다」는 경우도 포함한다.
regX3 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 regX3 유전자(예를 들면 서열번호 41에 나타낸 염기서열을 갖는 유전자)의 변이체라도 좋다. 마찬가지로, RegX3 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 RegX3 단백질(예를 들면 서열번호 42에 나타낸 아미노산 서열을 갖는 단백질)의 변이체라도 좋다. 이러한 원래의 기능이 유지된 변이체를 「보존적 변이체」라고 하는 경우가 있다. 본 발명에 있어서, 「regX3 유전자」라는 용어는 상기 예시한 regX3 유전자에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. 마찬가지로, 「RegX3 단백질」이라는 용어는 상기 예시한 RegX3 단백질에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. 보존적 변이체로서는, 예를 들면, 상기 예시한 regX3 유전자나 RegX3 단백질의 동족체나 인위적인 개변체를 들 수 있다.
「원래의 기능이 유지되고 있다」란, 유전자 또는 단백질의 변이체가, 원래의 유전자 또는 단백질의 기능(예를 들면 활성이나 성질)에 대응하는 기능(예를 들면 활성이나 성질)을 갖는 것을 말한다. 즉, 「원래의 기능이 유지되고 있다」란, regX3 유전자에 있어서는, 유전자의 변이체가, 원래의 기능이 유지된 단백질(즉 RegX3 단백질)을 코딩하는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, RegX3 단백질에 있어서는, 단백질의 변이체가, RegX3 단백질로서의 기능(예를 들면, 서열번호 42에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, RegX3 단백질에 있어서는, 단백질의 변이체가, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 것이라도 좋다. 즉, 「RegX3 단백질로서의 기능」이란, 구체적으로는, SenX3-RegX3 시스템의 반응 조절인자로서의 기능이라도 좋다. 「SenX3-RegX3 시스템의 반응 조절인자로서의 기능」이란, 구체적으로는, 센서 키나아제인 SenX3 단백질과 함께 환경 중의 자극에 대한 반응을 유도하는 기능이라도 좋다. 「SenX3-RegX3 시스템의 반응 조절인자로서의 기능」이란, 더 구체적으로는, 환경 중의 자극을 감지하여 자기 인산화된 SenX3 단백질로부터의 인산기 전이에 의해 활성화되고, 유전자의 발현을 제어(예를 들면, 유도 또는 억제)하는 기능이라도 좋다. SenX3 단백질로서는, 본 발명의 세균이 본래적으로 갖는 SenX3 단백질을 들 수 있다. C. 글루타미쿰 ATCC 13869의 senX3 유전자의 염기서열, 및 이 유전자가 코딩하는 SenX3 단백질의 아미노산 서열을, 각각 서열번호 39 및 40에 나타낸다. SenX3-RegX3 시스템에 의해 발현이 유도되는 유전자로서는, 무기 인산의 결핍에 반응하는 유전자(예를 들면, pstSCAB, ugpAEBC, phoC, 및 ushA 유전자)나 NAD+의 생합성에 관여하는 유전자(예를 들면, ndnR-nadA-nadC-nadS 오페론 유전자)를 들 수 있다.
RegX3 단백질의 변이체가 SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체의 활성을 코리네형 세균에 있어서 저하시키고, SenX3-RegX3 시스템에 의해 발현이 유도되는 유전자의 발현이 저하되는지 여부를 확인함으로써 확인할 수 있다. 또한, RegX3 단백질의 변이체가 SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 regX3 유전자의 결손주에 도입하고, SenX3-RegX3 시스템에 의해 발현이 유도되는 유전자의 발현이 증대하는지 여부를 확인함으로써 확인할 수 있다. 코리네형 세균의 regX3 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 regX3 유전자 결손주를 사용할 수 있다.
이하, 보존적 변이체에 대해서 예시한다.
regX3 유전자의 동족체 또는 RegX3 단백질의 동족체는, 예를 들면, 상기 예시한 regX3 유전자의 염기서열 또는 상기 예시한 RegX3 단백질의 아미노산 서열을 질의 서열로서 사용한 BLAST 검색이나 FASTA 검색에 의해 공개 데이터 베이스로부터 용이하게 취득할 수 있다. 또한, regX3 유전자의 동족체는, 예를 들면, 코리네형 세균의 염색체를 주형으로 하여, 이들 공지된 regX3 유전자의 염기서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로서 사용하는 PCR에 의해 취득할 수 있다.
regX3 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 RegX3 단백질의 아미노산 서열(예를 들면, 서열번호 42에 나타낸 아미노산 서열)에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한 상기 「1개 또는 여러 개」란, 아미노산 잔기의 단백질의 입체 구조에서의 위치나 아미노산 잔기의 종류에 따라서도 다르지만, 구체적으로는, 예를 들면, 1 내지 50개, 1 내지 40개, 1 내지 30개, 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더 바람직하게는 1 내지 5개, 특히 바람직하게는 1 내지 3개를 의미한다.
상기의 1개 또는 여러 개의 아미노산의 치환, 결실, 삽입 및/또는 부가는, 단백질의 기능이 정상적으로 유지되는 보존적 변이이다. 보존적 변이의 대표적인 것은 보존적 치환이다. 보존적 치환이란, 치환 부위가 방향족 아미노산인 경우에는 Phe, Trp, Tyr 사이에서, 치환 부위가 소수성 아미노산인 경우에는 Leu, Ile, Val 사이에서, 극성 아미노산인 경우에는 Gln, Asn 사이에서, 염기성 아미노산인 경우에는 Lys, Arg, His 사이에서, 산성 아미노산인 경우에는 Asp, Glu 사이에서, 하이드록실기를 갖는 아미노산인 경우에는 Ser, Thr 사이에서 서로 치환하는 변이이다. 보존적 치환으로 간주되는 치환으로서는, 구체적으로는, Ala로부터 Ser 또는 Thr로의 치환, Arg로부터 Gln, His 또는 Lys로의 치환, Asn으로부터 Glu, Gln, Lys, His 또는 Asp로의 치환, Asp로부터 Asn, Glu 또는 Gln으로의 치환, Cys로부터 Ser 또는 Ala로의 치환, Gln으로부터 Asn, Glu, Lys, His, Asp 또는 Arg로의 치환, Glu로부터 Gly, Asn, Gln, Lys 또는 Asp로의 치환, Gly로부터 Pro로의 치환, His로부터 Asn, Lys, Gln, Arg 또는 Tyr로의 치환, Ile로부터 Leu, Met, Val 또는 Phe로의 치환, Leu로부터 Ile, Met, Val 또는 Phe로의 치환, Lys로부터 Asn, Glu, Gln, His 또는 Arg로의 치환, Met로부터 Ile, Leu, Val 또는 Phe로의 치환, Phe로부터 Trp, Tyr, Met, Ile 또는 Leu로의 치환, Ser로부터 Thr 또는 Ala로의 치환, Thr로부터 Ser 또는 Ala로의 치환, Trp로부터 Phe 또는 Tyr로의 치환, Tyr로부터 His, Phe 또는 Trp로의 치환, 및 Val로부터 Met, Ile 또는 Leu로의 치환을 들 수 있다. 또한, 상기한 바와 같은 아미노산의 치환, 결실, 삽입, 또는 부가에는, 유전자가 유래하는 세균의 개체 차이, 종의 차이에 근거한 경우 등 천연에서 발생하는 변이(mutant 또는 variant)에 의해 발생하는 것도 포함된다.
또한, regX3 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 RegX3 단백질의 아미노산 서열(예를 들면, 서열번호 42에 나타낸 아미노산 서열) 전체에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다.
또한, regX3 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 regX3 유전자의 염기서열(예를 들면, 서열번호 41에 나타낸 염기서열)의 상보 서열 또는 이 상보 서열로 제조될 수 있는 프로브와 엄격한 조건하에서 하이브리드화하는 DNA라도 좋다. 「엄격한 조건」이란, 소위 특이적인 하이브리드가 형성되고, 비특이적인 하이브리드가 형성되지 않는 조건을 말한다. 일례를 게시하면, 동일성이 높은 DNA끼리, 예를 들면, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 DNA끼리 하이브리드화하고, 이보다 동일성이 낮은 DNA끼리 하이브리드화하지 않는 조건, 또는 통상의 서던 하이브리드화의 세정 조건인 60℃, 1×SSC, 0.1% SDS, 바람직하게는 60℃, 0.1×SSC, 0.1% SDS, 보다 바람직하게는 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서 1회, 바람직하게는 2 내지 3회 세정하는 조건을 들 수 있다.
상기 프로브는, 예를 들면, 유전자의 상보 서열의 일부라도 좋다. 이러한 프로브는, 공지된 유전자의 염기서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로 하고, 이들 염기서열을 포함하는 DNA 단편을 주형으로 하는 PCR에 의해 제작할 수 있다. 프로브로서는, 예를 들면, 300bp 정도 길이의 DNA 단편을 사용할 수 있다. 이 경우, 하이브리드화의 세정 조건으로서는 50℃, 2×SSC, 0.1% SDS를 들 수 있다.
또한, regX3 유전자는, 상기 예시한 regX3 유전자 또는 그 보존적 변이체의 염기서열에 있어서, 임의의 코돈을 그것과 등가의 코돈으로 치환한 염기서열을 갖는 것이라도 좋다.
또한, 아미노산 서열간의 「동일성」이란, blastp에 의해 디폴트 설정의 점수 파라미터 (행렬: BLOSUM62; 갭 비용: 기존 = 11, 확장 = 1; 조합 조정: 조건부 조합 점수 행렬조정)를 사용하여 산출되는 아미노산 서열간의 동일성을 의미한다. 또한, 염기서열간의 「동일성」이란, blastn에 의해 디폴트 설정의 점수 파라미터 (정합/부정합 점수 = 1,-2; 갭 비용 = 선형)를 사용하여 산출되는 염기서열간의 동일성을 의미한다.
또한, 상기의 유전자나 단백질의 변이체에 관한 기재는 SenX3 단백질, HrrSA 단백질, HrcA 단백질, PhoRS 단백질, 세포 표층 단백질, Tat계 분비 시스템, 본 발명에 있어서 분비 생산되는 이종 단백질 등의 임의의 단백질, 및 이들을 코딩하는 유전자에도 준용할 수 있다.
「RegX3 단백질의 활성이 저하된다」란, SenX3-RegX3 시스템의 반응 조절인자의 기능이 저하되는 것을 의미해도 좋다. 따라서, RegX3 단백질의 활성의 저하는, 구체적으로는, 예를 들면, SenX3-RegX3 시스템에 의해 발현이 유도되는 유전자의 발현의 저하를 지표로서 측정할 수 있다. 또한, 「RegX3 단백질의 활성이 저하된다」란, 특히, RegX3 단백질의 세포당 분자수가 저하되는 것을 의미해도 좋다. RegX3 단백질 등의 단백질의 활성을 저하시키는 방법에 대해서는 후술한다. RegX3 단백질의 활성은, 예를 들면, 이 단백질을 코딩하는 유전자(regX3 유전자)의 발현을 저하시킴으로써, 또는 regX3 유전자를 파괴함으로써 저하시킬 수 있다. 또한, 2성분 제어계에 있어서는, 센서 키나아제가 자극을 감지하면 특정한 히스티딘 잔기가 자기 인산화되고, 그 인산기가 반응 조절인자의 특정한 아스파르트산 잔기로 전이함으로써 신호가 전달된다. 따라서, RegX3 단백질의 활성은, 예를 들면, SenX3 단백질의 자기 인산화된 히스티딘 잔기로부터 인산기가 전이하는, RegX3 단백질의 아스파르트산 잔기를 치환 또는 결실함으로써도 저하시킬 수 있다. 당해 아스파르트산 잔기는, RegX3 단백질의 52 위치의 아스파르트산 잔기(D52)이다. 「RegX3 단백질의 D52」란, 구체적으로는, 서열번호 42의 D52에 상당하는 아스파르트산 잔기를 의미한다. 임의의 RegX3 단백질에서의 「RegX3 단백질의 D52」의 위치에 대해서는, 후술하는 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」의 위치에 관한 설명을 준용할 수 있다. 당해 아스파르트산 잔기는, 예를 들면, 단독으로, 또는 그 주변의 영역과 함께 치환 또는 결실되어도 좋다. 즉, 예를 들면, 당해 아스파르트산 잔기만 치환 또는 결실되어도 좋고, 당해 아스파르트산 잔기를 포함하는 영역이 치환 또는 결실되어도 좋다.
또한, 코리네형 세균의 종류에 따라서는, RegX3 단백질은 필수적일 수 있다. 예를 들면, C. 글루타미쿰 ATCC 13032에 있어서, RegX3 단백질은 필수인 것이 시사되어 있다. 본 발명의 세균에 있어서 RegX3 단백질이 필수인 경우에는, 적절히 RegX3 단백질의 활성을 잔존시킬 수 있다. 예를 들면, 본 발명의 세균이 본래적으로 갖는 RegX3 단백질의 활성의 일부를 잔존시켜도 좋다. 또한, 예를 들면, 본 발명의 세균이 본래적으로 갖는 RegX3 단백질의 활성을 완전하게 소실시키고, 별도로 본 발명의 세균이 본래적으로 갖는 RegX3 단백질의 활성보다도 낮은 수준으로 RegX3 단백질의 활성을 부여해도 좋다. RegX3 단백질의 활성은, 예를 들면, 비개변주와 비교하여, 1% 이상, 5% 이상, 10% 이상, 15% 이상, 20% 이상, 30% 이상, 또는 50% 이상의 수준으로 잔존해도 좋다. 마찬가지로, regX3 유전자의 발현량은, 예를 들면, 비개변주와 비교하여, 1% 이상, 5% 이상, 10% 이상, 15% 이상, 20% 이상, 30% 이상, 또는 50% 이상의 수준으로 잔존해도 좋다. 마찬가지로, RegX3 단백질의 양(예를 들면, 세포당 분자수)은, 예를 들면, 비개변주와 비교하여, 1% 이상, 5% 이상, 10% 이상, 15% 이상, 20% 이상, 30% 이상, 또는 50% 이상의 수준으로 잔존해도 좋다.
<1-2-2> HrrSA 시스템의 활성 저하
이하, HrrSA 시스템 및 이를 코딩하는 유전자에 대하여 설명한다. HrrSA 시스템은 2성분 제어계의 하나이며, 환경 중의 자극(예를 들면 헴의 존재)에 대한 반응을 유도한다. HrrSA 시스템은, hrrS 유전자에 코딩되는 센서 키나아제 HrrS와, hrrA 유전자에 코딩되는 반응 조절인자 HrrA로 이루어진다. hrrS 유전자 및 hrrA 유전자를 총칭하여 「hrrSA 유전자」라고도 한다. HrrS(HrrS 단백질) 및 HrrA(HrrA 단백질)을 총칭하여 「HrrSA 단백질」이라고도 한다.
코리네형 세균이 갖는 hrrSA 유전자의 염기서열 및 이들에 코딩되는 HrrSA 단백질의 아미노산 서열은, 예를 들면, NCBI(미국 국립 생물공학 정보센터) 등의 공개 데이터 베이스로부터 취득할 수 있다. C. 글루타미쿰 ATCC 13869의 hrrS 유전자의 염기서열, 및 이 유전자가 코딩하는 HrrS 단백질의 아미노산 서열을, 각각 서열번호 43 및 44에 나타낸다. C. 글루타미쿰 ATCC 13869의 hrrA 유전자의 염기서열, 및 이 유전자가 코딩하는 HrrA 단백질의 아미노산 서열을, 각각 서열번호 45 및 46에 나타낸다. 즉, hrrSA 유전자는, 예를 들면, 각각 서열번호 43 및 45에 나타낸 염기서열을 갖는 유전자라도 좋다. 또한, HrrSA 단백질은, 예를 들면, 각각 서열번호 44 및 46에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다.
hrrSA 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 hrrSA 유전자(예를 들면 서열번호 43 또는 45에 나타낸 염기서열을 갖는 유전자)의 변이체라도 좋다. 마찬가지로, HrrSA 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 HrrSA 단백질(예를 들면 서열번호 44 또는 46에 나타낸 아미노산 서열을 갖는 단백질)의 변이체라도 좋다. 즉, 「hrrSA 유전자」라는 용어는 상기 예시한 hrrSA 유전자에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. 마찬가지로, 「HrrSA 단백질」이라는 용어는 상기 예시한 HrrSA 단백질에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. HrrSA 단백질 및 hrrSA 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, hrrSA 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다.
또한, 「원래의 기능이 유지되고 있다」란, hrrSA 유전자에 있어서는, 유전자의 변이체가, 원래의 기능이 유지된 단백질(즉 HrrSA 단백질)을 코딩하는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrrSA 단백질에 있어서는, 단백질의 변이체가, HrrSA 단백질로서의 기능(예를 들면, 서열번호 44 또는 46에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrrS 단백질에 있어서는, 단백질의 변이체가, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrrA 단백질에 있어서는, 단백질의 변이체가, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 것이라도 좋다. 즉, 「HrrSA 단백질로서의 기능」이란, 구체적으로는, 각각, HrrSA 시스템의 센서 키나아제로서의 기능 및 HrrSA 시스템의 반응 조절인자로서의 기능이라도 좋다. 「HrrSA 시스템의 센서 키나아제로서의 기능」이란, 구체적으로는, 반응 조절인자인 HrrA 단백질과 함께 환경 중의 자극에 대한 반응을 유도하는 기능이라도 좋다. 「HrrSA 시스템의 센서 키나아제로서의 기능」이란, 더 구체적으로는, 환경 중의 자극을 감지하여 자기 인산화되고, 인산기 전이에 의해 HrrA 단백질을 활성화시키는 기능이라도 좋다. 「HrrSA 시스템의 반응 조절인자로서의 기능」이란, 구체적으로는, 센서 키나아제인 HrrS 단백질과 함께 환경 중의 자극에 대한 반응을 유도하는 기능이라도 좋다. 「HrrSA 시스템의 반응 조절인자로서의 기능」이란, 더 구체적으로는, 환경 중의 자극을 감지하여 자기 인산화된 HrrS 단백질로부터의 인산기 전이에 의해 활성화되고, 유전자의 발현을 제어(예를 들면, 유도 또는 억제)하는 기능이라도 좋다. HrrSA 시스템에 의해 발현이 유도되는 유전자로서는, 헴의 분해에 관여하는 유전자(예를 들면, hmuO 유전자)나 호흡 사슬 중의 헴 함유 단백질을 코딩하는 유전자(예를 들면, ctaE-qcrCAB 오페론 유전자나 ctaD 유전자)를 들 수 있다. HrrSA 시스템에 의해 발현이 억제되는 유전자로서는, 헴의 생합성에 관여하는 유전자(예를 들면, hemE-hemY-hemL-cg0519-ccsX-ccdA-resB-resC 오페론 유전자, hemA-hemC 오페론 유전자, 및 hemH 유전자)를 들 수 있다.
HrrSA 단백질의 변이체가 HrrSA 시스템의 센서 키나아제 또는 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체의 활성을 코리네형 세균에 있어서 저하시켜, HrrSA 시스템에 의해 발현이 유도 또는 억제되는 유전자의 발현이 헴의 존재 하에서 저하 또는 증대하는지 여부를 확인함으로써 확인할 수 있다. 또한, HrrS 단백질의 변이체가 HrrSA 시스템의 센서 키나아제로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 hrrS 유전자의 결손주에 도입하여, HrrSA 시스템에 의해 발현이 유도 또는 억제되는 유전자의 발현이 헴의 존재 하에서 증대 또는 저하되는지 여부를 확인함으로써 확인할 수 있다. 또한, HrrA 단백질의 변이체가 HrrSA 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 hrrA 유전자의 결손주에 도입하여, HrrSA 시스템에 의해 발현이 유도 또는 억제되는 유전자의 발현이 헴의 존재 하에서 증대 또는 저하되는지 여부를 확인함으로써 확인할 수 있다. 코리네형 세균의 hrrS 유전자 또는 hrrA 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 hrrS 유전자 또는 hrrA 유전자의 결손주나, C. 글루타미쿰 ATCC 13032주의 hrrS 유전자 또는 hrrA 유전자의 결손주를 사용할 수 있다.
「HrrSA 시스템의 활성이 저하된다」란, 환경 중의 자극에 대한 HrrSA 시스템을 통해 유도되는 반응의 정도가 저하되는 것을 의미해도 좋다. HrrSA 시스템의 활성은, 예를 들면, HrrS 단백질 및/또는 HrrA 단백질(즉 HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽)의 활성을 저하시킴으로써 저하시킬 수 있다. 즉, 「HrrSA 시스템의 활성이 저하된다」란, HrrS 단백질 및/또는 HrrA 단백질의 활성이 저하되는 것을 의미해도 좋다. 본 발명에 있어서는, 예를 들면, 적어도 HrrA 단백질의 활성이 저하되어도 좋다. 「HrrS 단백질의 활성이 저하된다」란, HrrSA 시스템의 센서 키나아제의 기능이 저하되는 것을 의미해도 좋다. 「HrrA 단백질의 활성이 저하된다」란, HrrSA 시스템의 반응 조절인자의 기능이 저하되는 것을 의미해도 좋다. 따라서, HrrSA 시스템, HrrS 단백질, 또는 HrrA 단백질의 활성의 저하는, 구체적으로는, 예를 들면, 헴의 존재 하에서의, HrrSA 시스템에 의해 발현이 유도 또는 억제되는 유전자의 발현의 저하 또는 증대를 지표로서 측정할 수 있다. 또한, 「HrrSA 시스템의 활성이 저하된다」란, 특히, HrrSA 시스템의 세포당 분자수가 저하되는 것을 의미해도 좋다. 마찬가지로, 「HrrS 단백질 및/또는 HrrA 단백질의 활성이 저하된다」란, 특히, HrrS 단백질 및/또는 HrrA 단백질의 세포당 분자수가 저하되는 것을 의미해도 좋다. HrrSA 단백질 등의 단백질의 활성을 저하시키는 방법에 대해서는 후술한다. HrrSA 단백질의 활성은, 예를 들면, 이 단백질을 코딩하는 유전자(hrrSA 유전자)의 발현을 저하시킴으로써, 또는 hrrSA 유전자를 파괴함으로써 저하시킬 수 있다. 또한, 2성분 제어계에 있어서는, 센서 키나아제가 자극을 감지하면 특정한 히스티딘 잔기가 자기 인산화되고, 그 인산기가 반응 조절인자의 특정한 아스파르트산 잔기로 전이함으로써 신호가 전달된다. 따라서, HrrSA 시스템의 활성, 구체적으로 HrrS 단백질의 활성은, 예를 들면, HrrS 단백질의 자기 인산화되는 히스티딘 잔기를 치환 또는 결실함으로써도 저하시킬 수 있다. 또한, HrrSA 시스템의 활성, 구체적으로 HrrA 단백질의 활성은, 예를 들면, HrrS 단백질의 자기 인산화된 히스티딘 잔기로부터 인산기가 전이하는, HrrA 단백질의 아스파르트산 잔기를 치환 또는 결실함으로써도 저하시킬 수 있다. 당해 히스티딘 잔기는, HrrS 단백질의 217 위치의 히스티딘 잔기(H217)이다. 「HrrS 단백질의 H217」이란, 구체적으로는, 서열번호 44의 H217에 상당하는 히스티딘 잔기를 의미한다. 당해 아스파르트산 잔기는, HrrA 단백질의 54 위치의 아스파르트산 잔기(D54)이다. 「HrrA 단백질의 D54」란, 구체적으로는, 서열번호 44의 D54에 상당하는 아스파르트산 잔기를 의미한다. 임의의 HrrSA 단백질에서의 「HrrS 단백질의 H217」 또는 「HrrA 단백질의 D54」의 위치에 대해서는, 후술하는 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」의 위치에 관한 설명을 준용할 수 있다. 당해 히스티딘 잔기 또는 아스파르트산 잔기는, 예를 들면, 단독으로, 또는 그 주변의 영역과 함께 치환 또는 결실되어도 좋다. 즉, 예를 들면, 당해 히스티딘 잔기 또는 아스파르트산 잔기만 치환 또는 결실되어도 좋고, 당해 히스티딘 잔기 또는 아스파르트산 잔기를 포함하는 영역이 치환 또는 결실되어도 좋다.
<1-2-3> HrcA 단백질의 활성 저하
이하, HrcA 단백질 및 이를 코딩하는 hrcA 유전자에 대하여 설명한다. HrcA 단백질은 열 충격 단백질의 전사 억제자이다.
코리네형 세균이 갖는 hrcA 유전자의 염기서열 및 이들에 코딩되는 HrcA 단백질의 아미노산 서열은, 예를 들면, NCBI(미국 국립 생물공학 정보센터) 등의 공개 데이터 베이스로부터 취득할 수 있다. C. 글루타미쿰 ATCC 13869의 hrcA 유전자의 염기서열, 및 이 유전자가 코딩하는 HrcA 단백질의 아미노산 서열을, 각각 서열번호 47 및 48에 나타낸다. 즉, hrcA 유전자는, 예를 들면, 서열번호 47에 나타낸 염기서열을 갖는 유전자라도 좋다. 또한, HrcA 단백질은, 예를 들면, 서열번호 48에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다.
hrcA 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 hrcA 유전자(예를 들면 서열번호 47에 나타낸 염기서열을 갖는 유전자)의 변이체라도 좋다. 마찬가지로, HrcA 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 HrcA 단백질(예를 들면 서열번호 48에 나타낸 아미노산 서열을 갖는 단백질)의 변이체라도 좋다. 즉, 「hrcA 유전자」라는 용어는 상기 예시한 hrcA 유전자에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. 마찬가지로, 「HrcA 단백질」이라는 용어는 상기 예시한 HrcA 단백질에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. HrcA 단백질 및 hrcA 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, hrcA 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다.
또한, 「원래의 기능이 유지되고 있다」란, hrcA 유전자에 있어서는, 유전자의 변이체가, 원래의 기능이 유지된 단백질(즉 HrcA 단백질)을 코딩하는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrcA 단백질에 있어서는, 단백질의 변이체가, HrcA 단백질로서의 기능(예를 들면, 서열번호 48에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrcA 단백질에 있어서는, 단백질의 변이체가, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 것이라도 좋다. 즉, 「HrcA 단백질로서의 기능」이란, 구체적으로는, 열 충격 단백질의 전사 억제자로서의 기능이라도 좋다. 「열 충격 단백질의 전사 억제자로서의 기능」이란, 구체적으로는, 열 충격 단백질을 코딩하는 유전자(열 충격 유전자)의 전사를 억제하는 기능이라도 좋다. HrcA 단백질에 의해 전사가 억제되는 열 충격 유전자로서는, groEL1 유전자나 groEL2 유전자 등의 groEL 유전자나, groES 유전자를 들 수 있다.
HrcA 단백질의 변이체가 열 충격 단백질의 전사 억제자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체의 활성을 코리네형 세균에 있어서 저하시켜, groEL 유전자나 groES 유전자 등의 열 충격 유전자의 전사(발현)가 증대하는지 여부를 확인함으로써 확인할 수 있다. 또한, HrcA 단백질의 변이체가 열 충격 단백질의 전사 억제자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 hrcA 유전자의 결손주에 도입하여, groEL 유전자나 groES 유전자 등의 열 충격 유전자의 전사(발현)가 저하되는지 여부를 확인함으로써 확인할 수 있다. 코리네형 세균의 hrcA 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 hrcA 유전자 결손주를 사용할 수 있다.
「HrcA 단백질의 활성이 저하된다」란, 열 충격 단백질의 전사 억제자의 기능이 저하되는 것을 의미해도 좋다. 따라서, HrcA 단백질의 활성의 저하는, 구체적으로는, 예를 들면, groEL 유전자나 groES 유전자 등의 열 충격 유전자의 전사(발현)의 증대를 지표로서 측정할 수 있다. 또한, 「HrcA 단백질의 활성이 저하된다」란, 특히, HrcA 단백질의 세포당 분자수가 저하되는 것을 의미해도 좋다. HrcA 단백질 등의 단백질의 활성을 저하시키는 방법에 대해서는 후술한다. HrcA 단백질의 활성은, 예를 들면, 이 단백질을 코딩하는 유전자(hrcA 유전자)의 발현을 저하시킴으로써, 또는 hrcA 유전자를 파괴함으로써 저하시킬 수 있다.
<1-3> 그 외의 성질
본 발명의 세균은 이종 단백질을 분비 생산할 수 있는 한, 원하는 성질을 갖고 있어도 좋다. 예를 들면, 본 발명의 세균은, 세포 표층 단백질의 활성이 저하되어 있어도 좋다(WO2013/065869, WO2013/065772, WO2013/118544, WO2013/062029). 예를 들면, 본 발명의 세균은, 페니실린 결합 단백질의 활성이 저하되도록 개변되어 있어도 좋다(WO2013/065869). 예를 들면, 본 발명의 세균은, 메탈로펩티다아제를 코딩하는 유전자의 발현이 상승하도록 개변되어 있어도 좋다(WO2013/065772). 예를 들면, 본 발명의 세균은, 변이형 리보솜 단백질 S1 유전자(변이형 rpsA 유전자)를 갖도록 개변되어 있어도 좋다(WO2013/118544). 예를 들면, 본 발명의 세균은, 변이형 phoS 유전자를 갖도록 개변되어 있어도 좋다(WO2016/171224). 예를 들면, 본 발명의 세균은, Tat계 분비 시스템이 증강되어 있어도 좋다. 이들의 성질 또는 개변은 단독으로, 또는 적절히 조합하여 이용할 수 있다.
<1-3-1> 변이형 phoS 유전자의 도입
본 발명의 세균은, 변이형 phoS 유전자를 유지하도록 개변되어 있어도 좋다. 「변이형 phoS 유전자를 유지한다」는 것을, 「변이형 phoS 유전자를 갖는다」 또는 「phoS 유전자에 변이를 갖는다」라고도 한다. 또한, 「변이형 phoS 유전자를 유지한다」는 것을, 「변이형 PhoS 단백질을 갖는다」 또는 「PhoS 단백질에 변이를 갖는다」라고도 한다.
이하, phoS 유전자 및 PhoS 단백질에 대하여 설명한다. phoS 유전자는, PhoRS 시스템의 센서 키나아제인 PhoS 단백질을 코딩하는 유전자이다. PhoRS 시스템은 2성분 제어계의 하나이며, 환경 중의 인산 결핍에 대한 반응을 유도한다. PhoRS 시스템은, phoS 유전자에 코딩되는 센서 키나아제 PhoS와, phoR 유전자에 코딩되는 반응 조절인자 PhoR로 이루어진다.
본 발명에 있어서, 「특정한 변이」를 갖는 PhoS 단백질을 「변이형 PhoS 단백질」, 이를 코딩하는 유전자를 「변이형 phoS 유전자」라고도 한다. 「변이형 phoS 유전자」는, 바꿔 말하면, 「특정한 변이」를 갖는 phoS 유전자이다. 또한, 본 발명에 있어서, 「특정한 변이」를 갖지 않는 PhoS 단백질을 「야생형 PhoS 단백질」, 이를 코딩하는 유전자를 「야생형 phoS 유전자」라고도 한다. 「야생형 phoS 유전자」는, 바꿔 말하면, 「특정한 변이」를 갖지 않는 phoS 유전자이다. 또한, 여기서 말하는 「야생형」이란, 「변이형」과 구별하기 위한 편의상의 기재이며, 「특정한 변이」를 갖지 않는 한, 천연에서 얻어지는 것에만 한정되지 않는다. 「특정한 변이」에 대해서는 후술한다.
야생형 phoS 유전자로서는, 예를 들면, 코리네형 세균의 phoS 유전자를 들 수 있다. 코리네형 세균의 phoS 유전자로서, 구체적으로는, 예를 들면, C. 글루타미쿰 YDK010주, C. 글루타미쿰 ATCC 13032주, C. 글루타미쿰 ATCC 14067주, C. 칼루나에, C. 크레나툼 및 C. 에피시엔스의 phoS 유전자를 들 수 있다. C. 글루타미쿰 YDK010주의 phoS 유전자의 염기서열을 서열번호 1에 나타낸다. 또한, 이들 phoS 유전자가 코딩하는 야생형 PhoS 단백질의 아미노산 서열을, 각각 서열번호 2 내지 7에 나타낸다.
야생형 phoS 유전자는 「특정한 변이」를 갖지 않으며, 또한, 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 phoS 유전자의 변이체라도 좋다. 마찬가지로, 야생형 PhoS 단백질은 「특정한 변이」를 갖지 않으며, 또한, 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 PhoS 단백질의 변이체라도 좋다. 즉, 「야생형 phoS 유전자」라는 용어는 상기 예시한 야생형 phoS 유전자에만 한정되지 않고, 그 보존적 변이체로서 「특정한 변이」를 갖지 않는 것도 포함하는 것으로 한다. 마찬가지로, 「야생형 PhoS 단백질」이라는 용어는 상기 예시한 야생형 PhoS 단백질에만 한정되지 않고, 그 보존적 변이체로서 「특정한 변이」를 갖지 않는 것도 포함하는 것으로 한다. 야생형 PhoS 단백질 및 야생형 phoS 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, 야생형 phoS 유전자는 「특정한 변이」를 갖지 않으며, 또한, 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다.
또한, 「원래의 기능이 유지되고 있다」란, 야생형 PhoS 단백질에 있어서는, 단백질의 변이체가, PhoS 단백질로서의 기능(예를 들면, 서열번호 2 내지 7에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, 야생형 PhoS 단백질에 있어서는, 단백질의 변이체가, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 것이라도 좋다. 즉, 「PhoS 단백질로서의 기능」이란, 구체적으로는, PhoRS 시스템의 센서 키나아제로서의 기능이라도 좋다. 「PhoRS 시스템의 센서 키나아제로서의 기능」이란, 구체적으로는, 반응 조절인자인 PhoR 단백질과 함께 환경 중의 인산 결핍에 대한 반응을 유도하는 기능이라도 좋다. 「PhoRS 시스템의 센서 키나아제로서의 기능」이란, 더 구체적으로는, 환경 중의 인산 결핍을 감지하여 자기 인산화되고, 인산기 전이에 의해 PhoR 단백질을 활성화시키는 기능이라도 좋다.
PhoS 단백질의 변이체가 PhoRS 시스템의 센서 키나아제로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 phoS 유전자의 결손주에 도입하여, 인산 결핍에 대한 반응성이 보완되는지 여부를 확인함으로써 확인할 수 있다. 인산 결핍에 대한 반응성의 보완은, 예를 들면, 인산 결핍 조건에서의 생육의 향상으로서, 또는 인산 결핍 조건에서 발현이 유도되는 것으로 알려져 있는 유전자의 발현의 유도로서 검출할 수 있다(J. Bacteriol., 188, 724-732(2006)). 코리네형 세균의 phoS 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 phoS 유전자 결손주나, C. 글루타미쿰 ATCC 13032주의 phoS 유전자 결손주를 사용할 수 있다.
야생형 PhoS 단백질에 있어서는, 자기 인산화되는 히스티딘 잔기가 보존되어 있는 것이 바람직하다. 즉, 보존적 변이는, 자기 인산화되는 히스티딘 잔기 이외의 아미노산 잔기에서 발생하는 것이 바람직하다. 「자기 인산화되는 히스티딘 잔기」란, 야생형 PhoS 단백질의 276 위치의 히스티딘 잔기를 가리킨다. 또한, 야생형 PhoS 단백질은, 예를 들면, 상기 예시한 야생형 PhoS 단백질의 보존 서열을 갖는 것이 바람직하다. 즉, 보존적 변이는, 예를 들면, 상기 예시한 야생형 PhoS 단백질에 있어서 보존되고 있지 않은 아미노산 잔기에서 발생하는 것이 바람직하다.
변이형 PhoS 단백질은, 상술한 바와 같은 야생형 PhoS 단백질의 아미노산 서열에 있어서, 「특정한 변이」를 갖는다.
즉, 바꿔 말하면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에는, 상기 예시한 야생형 PhoS 단백질이나 그 보존적 변이체와 동일해도 좋다. 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에, 서열번호 2 내지 7에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에, 서열번호 2 내지 7에 나타낸 아미노산 서열에 있어서, 1개 또는 여러 개의 아미노산의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에, 서열번호 2 내지 7에 나타낸 아미노산 서열에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 보다 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 아미노산 서열을 갖는 단백질이라도 좋다.
즉, 바꿔 말하면, 변이형 PhoS 단백질은 상기 예시한 야생형 PhoS 단백질에 있어서, 「특정한 변이」를 갖고, 또한, 당해 「특정한 변이」 이외의 개소에 추가로 보존적 변이를 포함하는 변이체라도 좋다. 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 서열번호 2 내지 7에 나타낸 아미노산 서열에 있어서, 「특정한 변이」를 갖고, 또한, 당해 「특정한 변이」 이외의 개소에 추가로 1개 또는 여러 개의 아미노산의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 갖는 단백질이라도 좋다.
변이형 phoS 유전자는, 상기와 같은 변이형 PhoS 단백질을 코딩하는 한, 특별히 제한되지 않는다.
이하, 변이형 PhoS 단백질이 갖는 「특정한 변이」에 대하여 설명한다.
「특정한 변이」는, 상술한 바와 같은 야생형 PhoS 단백질의 아미노산 서열이 변화되는 것이며, 또한, 이종 단백질의 분비 생산에 유효한 것이면 특별히 제한되지 않는다.
「특정한 변이」는, 이종 단백질의 분비 생산량을 향상시키는 변이인 것이 바람직하다. 「이종 단백질의 분비 생산량을 향상시킨다」란, 변이형 phoS 유전자를 갖도록 개변된 코리네형 세균(개변주)이, 비개변주보다도 많은 양의 이종 단백질을 분비 생산할 수 있는 것을 말한다. 「비개변주」란, phoS 유전자에 변이를 갖지 않는 대조주, 즉 변이형 phoS 유전자를 갖지 않는 대조주를 말하고, 예를 들면, 야생주 또는 친주라도 좋다. 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 이종 단백질의 분비 생산량이 비개변주와 비교하여 증대하는 한 특별히 제한되지 않지만, 예를 들면, 배지 중 및/또는 균체 표층에서의 축적량으로서, 비개변주의, 바람직하게는 1.1배 이상, 보다 바람직하게는 1.2배 이상, 더 바람직하게는 1.3배 이상, 더 바람직하게는 2배 이상, 특히 바람직하게는 5배 이상의 양의 이종 단백질을 분비 생산하는 것이라도 좋다. 또한, 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 농축되어 있지 않은 비개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 없지만, 농축되어 있지 않은 개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 있는 것이라도 좋다. 또한, 「이종 단백질의 분비 생산량을 향상시킨다」란, 모든 이종 단백질의 분비 생산량이 향상될 필요는 없고, 분비 생산의 타겟으로서 설정한 이종 단백질의 분비 생산량이 향상되면 충분하다. 「이종 단백질의 분비 생산량을 향상시킨다」란, 구체적으로는, 예를 들면, 실시예에 기재된 이종 단백질의 분비 생산량을 향상시키는 것을 의미해도 좋다.
어떤 변이가 이종 단백질의 분비 생산량을 향상시키는 변이인지 여부는, 예를 들면, 코리네형 세균에 속하는 균주를 기초로 당해 변이를 갖는 PhoS 단백질을 코딩하는 유전자를 갖도록 개변된 주를 제작하고, 당해 개변주를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양을 정량하여, 개변 전의 주(비개변주)를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양과 비교함으로써 확인할 수 있다.
아미노산 서열의 변화로서는 아미노산 잔기의 치환이 바람직하다. 즉, 「특정한 변이」는, 야생형 PhoS 단백질 중 어느 하나의 아미노산 잔기가 다른 아미노산 잔기로 치환되는 것인 것이 바람직하다. 「특정한 변이」에 의해 치환이 발생하는 아미노산 잔기는 1잔기라도 좋고, 2잔기 또는 그 이상의 조합이라도 좋다. 「특정한 변이」에 의해 치환이 발생하는 아미노산 잔기는, 바람직하게는 자기 인산화되는 히스티딘 잔기 이외의 아미노산 잔기라도 좋다. 「특정한 변이」에 의해 치환이 발생하는 아미노산 잔기는, 보다 바람직하게는 자기 인산화되는 히스티딘 잔기 이외의 HisKA 도메인의 아미노산 잔기라도 좋다. 「자기 인산화되는 히스티딘 잔기」란, 야생형 PhoS 단백질의 276 위치의 히스티딘 잔기를 가리킨다. 「HisKA 도메인」이란, 야생형 PhoS 단백질의 266 내지 330 위치의 아미노산 잔기로 이루어지는 영역을 가리킨다. 「특정한 변이」에 의해 치환이 발생하는 아미노산 잔기는, 특히 바람직하게는 야생형 PhoS 단백질의 302 위치의 트립토판 잔기(W302)라도 좋다.
상기 변이에 있어서, 치환 후의 아미노산 잔기로서는, K(Lys), R(Arg), H(His), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), F(Phe), W(Trp), Y(Tyr), C(Cys), M(Met), D(Asp), E(Glu), N(Asn), Q(Gln) 중, 원래의 아미노산 잔기 이외의 것을 들 수 있다. 치환 후의 아미노산 잔기로서는, 예를 들면, 이종 단백질의 분비 생산량이 향상되는 것을 선택할 수 있다.
W302가 치환될 경우, 치환 후의 아미노산 잔기로서는, 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기를 들 수 있다. 「방향족 아미노산 및 히스티딘 이외의 아미노산 잔기」로서, 구체적으로는, K(Lys), R(Arg), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), C(Cys), M(Met), D(Asp), E(Glu), N(Asn), Q(Gln)을 들 수 있다. 「방향족 아미노산 및 히스티딘 이외의 아미노산 잔기」로서, 더 구체적으로는, K(Lys), A(Ala), V(Val), S(Ser), C(Cys), M(Met), D(Asp), N(Asn)을 들 수 있다.
또한, phoS 유전자에서의 「특정한 변이」란, 코딩하는 PhoS 단백질에 상기와 같은 「특정한 변이」를 발생시키는 염기서열상의 변이를 의미한다.
본 발명에 있어서, 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」란, 서열번호 2의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기를 의미한다. 예를 들면, 「W302」란, 서열번호 2의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기를 의미한다. 상기 아미노산 잔기의 위치는 상대적인 위치를 나타내는 것으로서, 아미노산의 결실, 삽입, 부가 등에 의해 그 절대적인 위치는 전후(前後)하는 경우가 있다. 예를 들면, 서열번호 2에 나타낸 아미노산 서열로 이루어지는 야생형 PhoS 단백질에 있어서, X 위치보다도 N 말단측의 위치에서 1 아미노산 잔기가 결실된, 또는 삽입된 경우, 원래의 X 위치의 아미노산 잔기는, 각각, N 말단으로부터 세어 X-1번째 또는 X+1번째의 아미노산 잔기가 되지만, 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」로 간주된다. 구체적으로는, 예를 들면, 서열번호 2 내지 7에 나타낸 야생형 PhoS 단백질의 아미노산 서열에 있어서, 「W302」는 각각 302 위치, 302 위치, 302 위치, 321 위치, 275 위치, 및 286 위치의 트립토판 잔기를 가리킨다. 또한, 서열번호 2 내지 7에 나타낸 야생형 PhoS 단백질의 아미노산 서열에 있어서, 「야생형 PhoS 단백질의 276 위치의 히스티딘 잔기(자기 인산화되는 히스티딘 잔기)」는 각각 276 위치, 276 위치, 276 위치, 295 위치, 249 위치, 및 260 위치의 히스티딘 잔기를 가리킨다. 또한, 서열번호 2 내지 7에 나타낸 야생형 PhoS 단백질의 아미노산 서열에 있어서, 「야생형 PhoS 단백질의 266 내지 330 위치의 아미노산 잔기로 이루어지는 영역(HisKA 도메인)」은 각각 266 내지 330 위치, 266 내지 330 위치, 266 내지 330 위치, 285 내지 349 위치, 239 내지 303 위치, 및 250 내지 314 위치의 아미노산 잔기로 이루어지는 영역을 가리킨다.
또한, 여기서 말하는 「W302」는 통상 트립토판 잔기이지만, 트립토판 잔기가 아니어도 좋다. 즉, 야생형 PhoS 단백질이 서열번호 2 내지 7에 나타낸 아미노산 서열 이외의 아미노산 서열을 갖는 경우에는, 「W302」는 트립토판 잔기가 아닌 경우가 있을 수 있다. 따라서, 예를 들면, 「W302가 시스테인 잔기로 치환되는 변이」에는, 「W302」가 트립토판 잔기인 경우에 당해 트립토판 잔기가 시스테인 잔기로 치환되는 변이에 한정되지 않고, 「W302」가 K(Lys), R(Arg), H(His), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), F(Phe), Y(Tyr), M(Met), D(Asp), E (Glu), N(Asn), 또는 Q(Gln)인 경우에 당해 아미노산 잔기가 시스테인 잔기로 치환되는 변이도 포함된다. 다른 변이에 대해서도 마찬가지이다.
임의의 PhoS 단백질의 아미노산 서열에 있어서, 어느 아미노산 잔기가 「서열번호 2에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기」인지는, 당해 임의의 PhoS 단백질의 아미노산 서열과 서열번호 2의 아미노산 서열과 정렬을 행함으로써 결정할 수 있다. 정렬은, 예를 들면, 공지된 유전자 분석 소프트웨어를 이용하여 행할 수 있다. 구체적인 소프트웨어로서는, 히타치 솔루션즈 제조의 DNASIS나, 제네틱스 제조의 GENETYX 등을 들 수 있다(Elizabeth C. Tyler et al., Computers and Biomedical Research, 24(1), 72-96, 1991; Barton GJ et al., Journal of molecular biology, 198(2), 327-37. 1987).
변이형 phoS 유전자는, 예를 들면, 야생형 phoS 유전자를, 코딩되는 PhoS 단백질이 상기한 「특정한 변이」를 갖도록 개변함으로써 취득할 수 있다. 개변시킬 야생형 phoS 유전자는, 예를 들면, 야생형 phoS 유전자를 갖는 생물로부터의 클로닝에 의해, 또는 화학 합성에 의해 취득할 수 있다. 또한, 변이형 phoS 유전자는 야생형 phoS 유전자를 사용하지 않고 취득할 수도 있다. 예를 들면, 화학 합성에 의해 변이형 phoS 유전자를 직접 취득해도 좋다. 취득한 변이형 phoS 유전자를 추가로 개변하여 이용해도 좋다.
유전자의 개변은 공지된 수법에 의해 행할 수 있다. 예를 들면, 부위 특이적 변이법에 의해, DNA의 목적의 부위에 목적의 변이를 도입할 수 있다. 부위 특이적 변이법으로서는, PCR을 사용하는 방법(Higuchi, R., 61, in PCR technology, Erlich, H. A. Eds., Stockton press(1989); Carter, P., Meth. in Enzymol., 154, 382(1987))이나, 파지(phage)를 사용하는 방법(Kramer, W. and Frits, H. J., Meth. in Enzymol., 154, 350(1987); Kunkel, T. A. et al., Meth. in Enzymol., 154, 367(1987))을 들 수 있다.
이하, 변이형 phoS 유전자를 갖도록 코리네형 세균을 개변하는 수법에 대하여 설명한다.
변이형 phoS 유전자를 갖도록 코리네형 세균을 개변하는 것은, 변이형 phoS 유전자를 코리네형 세균에 도입함으로써 달성할 수 있다. 또한, 변이형 phoS 유전자를 갖도록 코리네형 세균을 개변하는 것은, 코리네형 세균의 염색체상의 phoS 유전자에 상기한 「특정한 변이」를 도입함으로써도 달성할 수 있다. 염색체상의 유전자로의 변이 도입은 자연 변이, 변이유발 처리, 또는 유전자 공학적 수법에 의해 달성할 수 있다.
변이형 phoS 유전자를 코리네형 세균에 도입하는 수법은 특별히 제한되지 않는다. 본 발명의 세균에 있어서, 변이형 phoS 유전자는, 코리네형 세균에서 기능하는 프로모터의 제어 하에서 발현 가능하게 유지되어 있으면 좋다. 프로모터는 숙주 유래의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 phoS 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 본 발명의 세균에 있어서, 변이형 phoS 유전자는, 플라스미드와 같이 염색체 외에서 자율 증식하는 벡터 위에 존재하고 있어도 좋고, 염색체 위에 편입되어 있어도 좋다. 본 발명의 세균은, 변이형 phoS 유전자를 1카피만 갖고 있어도 좋고, 2 이상의 카피를 갖고 있어도 좋다. 본 발명의 세균은 1종류의 변이형 phoS 유전자만 갖고 있어도 좋고, 2 이상의 종류의 변이형 phoS 유전자를 갖고 있어도 좋다. 변이형 phoS 유전자의 도입은, 예를 들면, 후술하는, 유전자의 발현을 상승시키는 수법에서의 유전자의 도입이나, 본 발명에 사용되는 유전자 구축물의 도입과 마찬가지로 행할 수 있다.
본 발명의 세균은 야생형 phoS 유전자를 갖고 있어도 좋고, 갖고 있지 않아도 좋지만, 갖고 있지 않은 것이 바람직하다.
야생형 phoS 유전자를 갖지 않는 코리네형 세균은, 염색체상의 야생형 phoS 유전자를 파괴함으로써 취득할 수 있다. 야생형 phoS 유전자의 파괴는 공지된 수법에 의해 행할 수 있다. 구체적으로는, 예를 들면, 야생형 phoS 유전자의 프로모터 영역 및/또는 코딩 영역의 일부 또는 전부를 결손시킴으로써 야생형 phoS 유전자를 파괴할 수 있다.
또한, 염색체상의 야생형 phoS 유전자를 변이형 phoS 유전자로 치환함으로써, 야생형 phoS 유전자를 갖지 않고, 또한, 변이형 phoS 유전자를 갖도록 개변된 코리네형 세균을 취득할 수 있다. 이러한 유전자 치환을 행하는 방법으로서는, 예를 들면, 「Red 구동형 통합(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97: 6640-6645(2000)), Red 구동형 통합법과 λ파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203(2002))을 조합한 방법(WO2005/010175호 참조) 등의 직쇄상 DNA를 사용하는 방법이나, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터를 사용하는 방법 등을 들 수 있다(미국특허 제6303383호, 일본 공개특허공보 특개평05-007491호).
PhoS 단백질은 반응 조절인자인 PhoR 단백질과 함께 기능하는, 즉 환경 중의 인산 결핍에 대한 반응을 유도한다. 따라서, 본 발명의 세균은, 변이형 PhoS 단백질이 기능하도록 phoR 유전자를 갖는다. phoR 유전자는, PhoRS 시스템의 반응 조절인자인 PhoR 단백질을 코딩하는 유전자이다. 「phoR 유전자를 갖는다」는 것을, 「PhoR 단백질을 갖는다」라고도 한다. 통상, 본 발명의 세균이 본래적으로 갖는 PhoR 단백질이 변이형 PhoS 단백질과 함께 기능하면 충분하다. 한편, 본 발명의 세균에는, 본 발명의 세균이 본래적으로 갖는 phoR 유전자 이외에, 또는 그를 대신하여, 적당한 phoR 유전자가 도입되어 있어도 좋다. 도입되는 phoR 유전자는, 변이형 PhoS 단백질과 함께 기능하는 PhoR 단백질을 코딩하는 것이면 특별히 제한되지 않는다.
phoR 유전자로서는, 예를 들면, 코리네형 세균의 phoR 유전자를 들 수 있다. 코리네형 세균의 phoR 유전자로서, 구체적으로는, 예를 들면, C. 글루타미쿰 YDK010주, C. 글루타미쿰 ATCC 13032주, C. 글루타미쿰 ATCC 14067주, C. 칼루나에, C. 크레나툼, 및 C. 에피시엔스의 phoR 유전자를 들 수 있다. C. 글루타미쿰 ATCC 13032주의 phoR 유전자의 염기서열 및 PhoR 단백질의 아미노산 서열을, 각각, 서열번호 8 및 9에 나타낸다.
phoR 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 phoR 유전자의 변이체라도 좋다. 마찬가지로, PhoR 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 PhoR 단백질의 변이체라도 좋다. 즉, 「phoR 유전자」라는 용어에는, 상기 예시한 phoR 유전자 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. 마찬가지로, 「PhoR 단백질」이라는 용어에는 상기 예시한 PhoR 단백질 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. PhoR 단백질 및 phoR 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, phoR 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, PhoR 단백질에 있어서는, 단백질의 변이체가, PhoR 단백질로서의 기능(예를 들면, 서열번호 9에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, PhoR 단백질에 있어서는, 단백질의 변이체가, PhoRS 시스템의 반응 조절인자로서의 기능을 갖는 것이라도 좋다. 즉, 「PhoR 단백질로서의 기능」이란, 구체적으로는, PhoRS 시스템의 반응 조절인자로서의 기능이라도 좋다. 「PhoRS 시스템의 반응 조절인자로서의 기능」이란, 구체적으로는, 센서 키나아제인 PhoS 단백질과 함께 환경 중의 인산 결핍에 대한 반응을 유도하는 기능이라도 좋다. 「PhoRS 시스템의 반응 조절인자로서의 기능」이란, 더 구체적으로는, 환경 중의 인산 결핍을 감지하여 자기 인산화된 PhoS 단백질로부터의 인산기 전이에 의해 활성화되고, 환경 중의 인산 결핍에 반응하는 유전자의 발현을 제어하는 기능이라도 좋다.
PhoR 단백질의 변이체가 PhoRS 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 phoR 유전자의 결손주에 도입하고, 인산 결핍에 대한 반응성이 보완되는지 여부를 확인함으로써 확인할 수 있다. 인산 결핍에 대한 반응성의 보완은, 예를 들면, 인산 결핍 조건에서의 생육의 향상으로서, 또는 인산 결핍 조건에서 발현이 유도되는 것으로 알려져 있는 유전자의 발현의 유도로서 검출할 수 있다(J. Bacteriol., 188, 724-732(2006)). 코리네형 세균의 phoR 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 phoR 유전자 결손주나, C. 글루타미쿰 ATCC 13032주의 phoR 유전자 결손주를 사용할 수 있다.
<1-3-2> 세포 표층 단백질의 활성 저하
본 발명의 세균은 세포 표층 단백질의 활성이 저하되어 있는 것이라도 좋다. 본 발명의 세균은, 구체적으로는, 세포 표층 단백질의 활성이 비개변주와 비교하여 저하되어 있는 것이라도 좋다. 「세포 표층 단백질의 활성이 저하된다」란, 특히, 세포 표층 단백질의 세포당 분자수가 저하되는 것을 의미해도 좋다. 이하에, 세포 표층 단백질 및 이를 코딩하는 유전자에 대하여 설명한다.
세포 표층 단백질은, 세균이나 고세균의 세포 표층(S층)을 구성하는 단백질이다. 코리네형 세균의 세포 표층 단백질로서는, C. 글루타미쿰의 PS1 및 PS2(CspB)(일본 공개특허공보 특표평6-502548), 및 C. 스타티오니스의 SlpA(CspA)(일본 공개특허공보 특개평10-108675)를 들 수 있다. 이들 중에서는, PS2 단백질의 활성을 저하시키는 것이 바람직하다.
C. 글루타미쿰 ATCC 13869의 cspB 유전자의 염기서열 및 이 유전자가 코딩하는 PS2 단백질(CspB 단백질)의 아미노산 서열을 각각 서열번호 10 및 11에 나타낸다.
또한, 예를 들면, 28주의 C. 글루타미쿰에 대하여, CspB 동족체의 아미노산 서열이 보고되어 있다(J Biotechnol., 112, 177-193(2004)). 이들 28주의 C. 글루타미쿰과 cspB 유전자 동족체의 NCBI 데이터 베이스의 GenBank 등록번호를 이하에 예시한다(괄호 안이 GenBank 등록번호를 나타낸다).
C. 글루타미쿰 ATCC 13058(AY524990)
C. 글루타미쿰 ATCC 13744(AY524991)
C. 글루타미쿰 ATCC 13745(AY524992)
C. 글루타미쿰 ATCC 14017(AY524993)
C. 글루타미쿰 ATCC 14020(AY525009)
C. 글루타미쿰 ATCC 14067(AY524994)
C. 글루타미쿰 ATCC 14068(AY525010)
C. 글루타미쿰 ATCC 14747(AY525011)
C. 글루타미쿰 ATCC 14751(AY524995)
C. 글루타미쿰 ATCC 14752(AY524996)
C. 글루타미쿰 ATCC 14915(AY524997)
C. 글루타미쿰 ATCC 15243(AY524998)
C. 글루타미쿰 ATCC 15354(AY524999)
C. 글루타미쿰 ATCC 17965(AY525000)
C. 글루타미쿰 ATCC 17966(AY525001)
C. 글루타미쿰 ATCC 19223(AY525002)
C. 글루타미쿰 ATCC 19240(AY525012)
C. 글루타미쿰 ATCC21341(AY525003)
C. 글루타미쿰 ATCC21645(AY525004)
C. 글루타미쿰 ATCC31808(AY525013)
C. 글루타미쿰 ATCC31830(AY525007)
C. 글루타미쿰 ATCC31832(AY525008)
C. 글루타미쿰 LP-6(AY525014)
C. 글루타미쿰 DSM20137(AY525015)
C. 글루타미쿰 DSM20598(AY525016)
C. 글루타미쿰 DSM46307(AY525017)
C. 글루타미쿰 22220(AY525005)
C. 글루타미쿰 22243(AY525006)
코리네형 세균이 속하는 종 또는 균주에 의해, 세포 표층 단백질을 코딩하는 유전자의 염기서열에 차이가 존재하는 경우가 있기 때문에, 세포 표층 단백질을 코딩하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 세포 표층 단백질을 코딩하는 유전자의 변이체라도 좋다. 마찬가지로, 세포 표층 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 세포 표층 단백질의 변이체라도 좋다. 즉, 예를 들면, 「cspB 유전자」라는 용어에는 상기 예시한 cspB 유전자 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. 마찬가지로, 「CspB 단백질」이라는 용어에는 상기 예시한 CspB 단백질 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. 세포 표층 단백질 및 이를 코딩하는 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, 세포 표층 단백질을 코딩하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, 세포 표층 단백질에 있어서는, 예를 들면, 코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질을 갖는 것이라도 좋다.
「코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질」이란, 코리네형 세균에서 활성을 저하시켰을 때에 비개변주보다도 많은 양의 이종 단백질을 분비 생산하는 능력을 코리네형 세균에 부여하는 성질을 말한다. 「비개변주」란, 세포 표층 단백질의 활성이 저하되어 있지 않은 대조주를 말하고, 예를 들면, 야생주 또는 친주라도 좋다. 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 이종 단백질의 분비 생산량이 비개변주와 비교하여 증대하는 한 특별히 제한되지 않지만, 예를 들면, 배지 중 및/또는 균체 표층에서의 축적량으로서, 비개변주의, 바람직하게는 1.1배 이상, 보다 바람직하게는 1.2배 이상, 더 바람직하게는 1.3배 이상, 특히 바람직하게는 2배 이상의 양의 이종 단백질을 분비 생산하는 것이라도 좋다. 또한, 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 농축되어 있지 않은 비개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 없지만, 농축되어 있지 않은 개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 있는 것이라도 좋다.
어떤 단백질이 코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질을 갖는지 여부는, 코리네형 세균에 속하는 균주를 기초로 그 단백질의 활성이 저하되도록 개변된 주를 제작하고, 당해 개변주를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양을 정량하여, 개변 전의 주(비개변주)를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양과 비교함으로써 확인할 수 있다.
본 발명에 있어서, 「세포 표층 단백질의 활성이 저하되어 있다」는 것에는, 세포 표층 단백질의 활성이 저하되도록 코리네형 세균이 개변된 경우, 및 코리네형 세균에 있어서 원래 세포 표층 단백질의 활성이 저하되어 있는 경우가 포함된다. 「코리네형 세균에 있어서 원래 세포 표층 단백질의 활성이 저하되어 있는 경우」에는, 코리네형 세균이 원래 세포 표층 단백질을 갖지 않는 경우가 포함된다. 즉, 세포 표층 단백질의 활성이 저하되어 있는 코리네형 세균으로서는, 예를 들면, 원래 세포 표층 단백질을 갖지 않는 코리네형 세균을 들 수 있다. 「코리네형 세균이 원래 세포 표층 단백질을 갖지 않는 경우」로서는, 예를 들면, 코리네형 세균이 원래 세포 표층 단백질을 코딩하는 유전자를 갖지 않는 경우를 들 수 있다. 또한, 「코리네형 세균이 원래 세포 표층 단백질을 갖지 않는다」란, 코리네형 세균이, 당해 코리네형 세균이 속하는 종의 다른 주에서 발견되는 세포 표층 단백질로부터 선택되는 1 이상의 단백질을 원래 갖지 않는 것이라도 좋다. 예를 들면, 「C. 글루타미쿰이 원래 세포 표층 단백질을 갖지 않는다」란, C. 글루타미쿰주가, 다른 C. 글루타미쿰주에서 발견되는 세포 표층 단백질로부터 선택되는 1 이상의 단백질, 즉, 예를 들면 PS1 및/또는 PS2(CspB)를 원래 갖지 않는 것이라도 좋다. 원래 세포 표층 단백질을 갖지 않는 코리네형 세균으로서는, 예를 들면, 원래 cspB 유전자를 갖지 않는 C. 글루타미쿰 ATCC 13032를 들 수 있다.
<1-3-3> 단백질의 분비계
본 발명의 세균은 단백질의 분비계를 갖는다. 단백질의 분비계는 목적의 이종 단백질을 분비할 수 있는 것이면 특별히 제한되지 않는다. 단백질의 분비계로서는, Sec계(Sec계 분비 시스템)나 Tat계(Tat계 분비 시스템)를 들 수 있다. 본 발명의 세균은 단백질의 분비계가 증강되어 있어도 좋다. 예를 들면, 본 발명의 세균은, Tat계 분비 시스템을 코딩하는 유전자로부터 선택되는 1 이상의 유전자의 발현이 상승하도록 개변되어 있어도 좋다. 본 발명에 있어서, 이러한 개변을 「Tat계 분비 시스템의 증강」이라고도 한다. Tat계 분비 시스템의 증강은, 특히, Tat계 의존성 신호 펩타이드를 이용하여 이종 단백질을 분비 생산하는 경우에 적합하다. Tat계 분비 시스템을 코딩하는 유전자의 발현을 상승시키는 수법에 대해서는 일본 특허 제4730302호에 기재되어 있다.
Tat계 분비 시스템을 코딩하는 유전자로서는 tatA 유전자, tatB 유전자, tatC 유전자, 및 tatE 유전자를 들 수 있다.
Tat계 분비 시스템을 코딩하는 유전자로서, 구체적으로는, C. 글루타미쿰의 tatA 유전자, tatB 유전자, 및 tatC 유전자를 들 수 있다. C. 글루타미쿰 ATCC 13032의 tatA 유전자, tatB 유전자, 및 tatC 유전자는, 각각, NCBI 데이터 베이스에 GenBank 등록번호 NC_003450(버전 NC_003450.3 GI:58036263)으로서 등록되어 있는 유전체 서열 중, 1571065 내지 1571382 위치의 서열의 상보 서열, 1167110 내지 1167580 위치의 서열, 및 1569929 내지 1570873 위치의 서열의 상보 서열에 상당한다. 또한, C. 글루타미쿰 ATCC 13032의 TatA 단백질, TatB 단백질, 및 TatC 단백질은, 각각, GenBank 등록번호 NP_600707(버전 NP_600707.1 GI:19552705, locus_tag="NCgl1434"), GenBank 등록번호 NP_600350(버전 NP_600350.1 GI:19552348, locus_tag="NCgl1077"), 및 GenBank 등록번호 NP_600706(버전 NP_600706.1 GI:19552704, locus_tag="NCgl1433")으로서 등록되어 있다. C. 글루타미쿰 ATCC 13032의 tatA 유전자, tatB 유전자, 및 tatC 유전자의 염기서열 및 TatA 단백질, TatB 단백질, 및 TatC 단백질의 아미노산 서열을 서열번호 12 내지 17에 나타낸다.
또한, Tat계 분비 시스템을 코딩하는 유전자로서, 구체적으로는, E. 콜라이의 tatA 유전자, tatB 유전자, tatC 유전자, 및 tatE 유전자를 들 수 있다. E. 콜라이 K-12 MG1655의 tatA 유전자, tatB 유전자, tatC 유전자, 및 tatE 유전자는, 각각, NCBI 데이터 베이스에 GenBank 등록번호 NC_000913(버전 NC_000913.2 GI:49175990)으로서 등록되어 있는 유전체 서열 중, 4019968 내지 4020237 위치의 서열, 4020241 내지 4020756 위치의 서열, 4020759 내지 4021535 위치의 서열, 658170 내지 658373 위치의 서열에 상당한다. 또한, E. 콜라이 K-12 MG1655의 TatA 단백질, TatB 단백질, TatC 단백질, 및 TatE 단백질은, 각각, GenBank 등록번호 NP_418280(버전 NP_418280.4 GI:90111653, locus_tag="b3836"), GenBank 등록번호 YP_026270(버전 YP_026270.1 GI:49176428, locus_tag="b3838"), GenBank 등록번호 NP_418282(버전 NP_418282.1 GI:16131687, locus_tag="b3839"), 및 GenBank 등록번호 NP_415160(버전 NP_415160.1 GI:16128610, locus_tag="b0627")으로서 등록되어 있다.
Tat계 분비 시스템을 코딩하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 분비 시스템을 코딩하는 유전자의 변이체라도 좋다. 마찬가지로, Tat계 분비 시스템은 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 분비 시스템의 변이체라도 좋다. 즉, 예를 들면, 「tatA 유전자」, 「tatB 유전자」, 「tatC 유전자」, 및 「tatE 유전자」라는 용어에는, 각각, 상기 예시한 tatA 유전자, tatB 유전자, tatC 유전자, 및 tatE 유전자 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. 마찬가지로, 「TatA 단백질」, 「TatB 단백질」, 「TatC 단백질」, 및 「TatE 단백질」이라는 용어에는, 각각, 상기 예시한 TatA 단백질, TatB 단백질, TatC 단백질, 및 TatE 단백질 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. Tat계 분비 시스템 및 이를 코딩하는 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, Tat계 분비 시스템을 코딩하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, Tat계 분비 시스템에 있어서는, Tat계 의존성 신호 펩타이드가 N 말단에 부가된 단백질을 세포 외로 분비하는 기능을 갖는 것이라도 좋다.
<1-4> 단백질의 활성을 저하시키는 수법
이하에, RegX3 단백질, HrrSA 단백질, 및 HrcA 단백질 등의 단백질의 활성을 저하시키는 수법에 대하여 설명한다. 또한, 이하에 기재하는 단백질의 활성을 저하시키는 수법은, 야생형 PhoS 단백질의 파괴에도 이용할 수 있다.
「단백질의 활성이 저하된다」란, 이 단백질의 활성이 비개변주와 비교하여 저하되는 것을 의미한다. 「단백질의 활성이 저하된다」란, 구체적으로는, 이 단백질의 세포당 활성이 비개변주와 비교하여 저하되는 것을 의미한다. 여기서 말하는 「비개변주」란, 표적의 단백질의 활성이 저하되도록 개변되어 있지 않은 대조주를 의미한다. 비개변주로서는 야생주나 친주를 들 수 있다. 비개변주로서, 구체적으로는, 각 세균종의 기준주(type strain)를 들 수 있다. 또한, 비개변주로서, 구체적으로는, 코리네형 세균의 설명에서 예시한 균주도 들 수 있다. 즉, 일 양태에 있어서, 단백질의 활성은 기준주(즉 본 발명의 세균이 속하는 종의 기준주)와 비교하여 저하되어도 좋다. 또한, 다른 양태에 있어서, 단백질의 활성은 C. 글루타미쿰 ATCC 13032와 비교하여 저하되어도 좋다. 또한, 다른 양태에 있어서, 단백질의 활성은 C. 글루타미쿰 ATCC 13869와 비교하여 저하되어도 좋다. 또한, 다른 양태에 있어서, 단백질의 활성은 C. 글루타미쿰 AJ 12036(FERM BP-734)과 비교하여 저하되어도 좋다. 또한, 다른 양태에 있어서, 단백질의 활성은 C. 글루타미쿰 YDK010주와 비교하여 저하되어도 좋다. 또한, 「단백질의 활성이 저하된다」는 것에는, 이 단백질의 활성이 완전하게 소실되어 있는 경우도 포함된다. 「단백질의 활성이 저하된다」란, 더 구체적으로는, 비개변주와 비교하여, 이 단백질의 세포당 분자수가 저하되어 있는 것, 및/또는, 이 단백질의 분자당 기능이 저하되어 있는 것을 의미해도 좋다. 즉, 「단백질의 활성이 저하된다」고 하는 경우의 「활성」이란, 단백질의 촉매 활성에 한정되지 않고, 단백질을 코딩하는 유전자의 전사량(mRNA량) 또는 번역량(단백질의 양)을 의미해도 좋다. 「단백질의 세포당 분자수」란, 이 단백질의 분자수의 세포당 평균값을 의미해도 좋다. 또한, 「단백질의 세포당 분자수가 저하되어 있다」는 것에는, 이 단백질이 전혀 존재하고 있지 않은 경우도 포함된다. 또한, 「단백질의 각 분자의 기능이 저하되어 있다」는 것에는, 이 단백질의 각 분자의 기능이 완전하게 소실되어 있는 경우도 포함된다. 단백질의 활성의 저하의 정도는, 단백질의 활성이 비개변주와 비교하여 저하되어 있으면 특별히 제한되지 않는다. 단백질의 활성은, 예를 들면, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
단백질의 활성이 저하되는 개변은, 예를 들면, 이 단백질을 코딩하는 유전자의 발현을 저하시킴으로써 달성할 수 있다. 「유전자의 발현이 저하된다」란, 이 유전자의 발현이 비개변주와 비교하여 저하되는 것을 의미한다. 「유전자의 발현이 저하된다」란, 구체적으로는, 이 유전자의 세포당 발현량이 비개변주와 비교하여 저하되는 것을 의미한다. 「유전자의 세포당 발현량」이란, 이 유전자의 발현량의 세포당 평균값을 의미해도 좋다. 「유전자의 발현이 저하된다」란, 더 구체적으로는, 유전자의 전사량(mRNA량)이 저하되는 것, 및/또는, 유전자의 번역량(유전자로부터 발현되는 단백질의 양)이 저하되는 것을 의미해도 좋다. 「유전자의 발현이 저하된다」는 것에는, 이 유전자가 전혀 발현되고 있지 않은 경우도 포함된다. 또한, 「유전자의 발현이 저하된다」는 것을, 「유전자의 발현이 약화된다」고도 한다. 유전자의 발현은, 예를 들면, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
유전자의 발현의 저하는, 예를 들면, 전사 효율의 저하에 의한 것이라도 좋고, 번역 효율의 저하에 의한 것이라도 좋고, 이들의 조합에 의한 것이라도 좋다. 유전자의 발현의 저하는, 예를 들면, 유전자의 프로모터, 샤인-달가노(SD, Shine-Dalgarno) 서열(리보솜 결합 부위(RBS)라고도 한다), RBS와 개시 코돈 사이의 스페이서 영역 등의 발현 조절 서열을 개변함으로써 달성할 수 있다. 발현 조절 서열을 개변하는 경우에는, 발현 조절 서열은, 바람직하게는 1염기 이상, 보다 바람직하게는 2염기 이상, 특히 바람직하게는 3염기 이상이 개변된다. 유전자의 전사 효율의 저하는, 예를 들면, 염색체상의 유전자의 프로모터를 보다 약한 프로모터로 치환함으로써 달성할 수 있다. 「보다 약한 프로모터」란, 유전자의 전사가, 원래 존재하고 있는 야생형의 프로모터보다도 약화되는 프로모터를 의미한다. 보다 약한 프로모터로서는, 예를 들면, 유도형의 프로모터를 들 수 있다. 즉, 유도형의 프로모터는, 비유도 조건 하(예를 들면, 유도 물질의 비존재 하)에서 보다 약한 프로모터로서 기능할 수 있다. 또한, 발현 조절 서열의 일부 또는 전부를 결실시켜도 좋다. 또한, 유전자의 발현의 저하는, 예를 들면, 발현 제어에 관한 인자를 조작함으로써도 달성할 수 있다. 발현 제어에 관한 인자로서는, 전사나 번역 제어에 관한 저분자(유도 물질, 저해 물질 등), 단백질(전사 인자 등), 핵산(siRNA 등) 등을 들 수 있다. 또한, 유전자의 발현의 저하는, 예를 들면, 유전자의 코딩 영역에 유전자의 발현이 저하되는 변이를 도입함으로써도 달성할 수 있다. 예를 들면, 유전자의 코딩 영역의 코돈을, 숙주에서 보다 저빈도로 이용되는 동의(同義) 코돈으로 치환함으로써, 유전자의 발현을 저하시킬 수 있다. 또한, 예를 들면, 후술하는 바와 같은 유전자의 파괴에 의해, 유전자의 발현 자체가 저하될 수 있다.
또한, 단백질의 활성이 저하되는 개변은, 예를 들면, 이 단백질을 코딩하는 유전자를 파괴함으로써 달성할 수 있다. 「유전자가 파괴된다」란, 정상적으로 기능하는 단백질을 생산하지 않도록 이 유전자가 개변되는 것을 의미한다. 「정상적으로 기능하는 단백질을 생산하지 않는다」는 것에는, 이 유전자로부터 단백질이 전혀 생산되지 않는 경우나, 이 유전자로부터 분자당 기능(예를 들면 활성이나 성질)이 저하 또는 소실된 단백질이 생산되는 경우가 포함된다.
유전자의 파괴는, 예를 들면, 염색체상의 유전자를 결실(결손)시킴으로써 달성할 수 있다. 「유전자의 결실」이란, 유전자의 코딩 영역의 일부 또는 전부의 영역의 결실을 말한다. 또한, 염색체상의 유전자의 코딩 영역의 전후의 서열을 포함하여, 유전자 전체를 결실시켜도 좋다. 유전자의 코딩 영역의 전후의 서열에는, 예를 들면, 유전자의 발현 조절 서열이 포함되어도 좋다. 단백질의 활성의 저하를 달성할 수 있는 한, 결실시키는 영역은 N 말단 영역(단백질의 N 말단측을 코딩하는 영역), 내부 영역, C 말단 영역(단백질의 C 말단측을 코딩하는 영역) 등 중 어느 영역이라도 좋다. 통상, 결실시키는 영역은 긴 쪽이 확실하게 유전자를 불활화할 수 있다. 결실시키는 영역은, 예를 들면, 유전자의 코딩 영역 전체 길이의 10% 이상, 20% 이상, 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상의 길이의 영역이라도 좋다. 또한, 결실시키는 영역의 전후의 서열은 리딩 프레임이 일치하지 않는 것이 바람직하다. 리딩 프레임의 불일치에 의해, 결실시키는 영역의 하류에서 프레임 시프트가 발생할 수 있다.
또한, 유전자의 파괴는, 예를 들면, 염색체상의 유전자의 코딩 영역에 아미노산 치환(미스센스 변이)을 도입하는 것, 중지 코돈(넌센스 변이)을 도입하는 것, 또는 1 내지 2염기의 부가 또는 결실(프레임 시프트 변이)을 도입하는 것 등에 의해서도 달성할 수 있다(Journal of Biological Chemistry 272: 8611-8617(1997), Proceedings of the National Academy of Sciences, USA 955511-5515(1998), Journal of Biological Chemistry 26116, 20833-20839(1991)).
또한, 유전자의 파괴는, 예를 들면, 염색체상의 유전자의 코딩 영역에 다른 염기서열을 삽입함으로써도 달성할 수 있다. 삽입 부위는 유전자 중 어느 영역이라도 좋지만, 삽입하는 염기서열은 긴 쪽이 확실하게 유전자를 불활화할 수 있다. 또한, 삽입 부위의 전후의 서열은 리딩 프레임이 일치하지 않는 것이 바람직하다. 리딩 프레임의 불일치에 의해, 삽입 부위의 하류에서 프레임 시프트가 발생할 수 있다. 다른 염기서열로서는, 코딩되는 단백질의 활성을 저하 또는 소실시키는 것이면 특별히 제한되지 않지만, 예를 들면, 항생 물질 내성 유전자 등의 마커 유전자나 목적 물질의 생산에 유용한 유전자를 들 수 있다.
유전자의 파괴는, 특히, 코딩되는 단백질의 아미노산 서열이 결실(결손)되도록 실시해도 좋다. 바꿔 말하면, 단백질의 활성이 저하되는 개변은, 예를 들면, 단백질의 아미노산 서열을 결실시킴으로써, 구체적으로는, 아미노산 서열이 결실되는 단백질을 코딩하도록 유전자를 개변함으로써 달성할 수 있다. 또한, 「단백질의 아미노산 서열의 결실」이란, 단백질의 아미노산 서열의 일부 또는 전부의 영역의 결실을 말한다. 또한, 「단백질의 아미노산 서열의 결실」이란, 단백질에 있어서 원래의 아미노산 서열이 존재하지 않게 되는 것을 말하고, 원래의 아미노산 서열이 다른 아미노산 서열로 변화되는 경우도 포함된다. 즉, 예를 들면, 프레임 시프트에 의해 다른 아미노산 서열로 변화된 영역은 결실된 영역으로 간주해도 좋다. 아미노산 서열의 결실에 의해, 전형적으로는 단백질의 전체 길이가 단축되지만, 단백질의 전체 길이가 변화되지 않거나, 또는 연장되는 경우도 있을 수 있다. 예를 들면, 유전자의 코딩 영역의 일부 또는 전부의 영역의 결실에 의해, 코딩되는 단백질의 아미노산 서열에 있어서, 당해 결실된 영역이 코딩하는 영역을 결실시킬 수 있다. 또한, 예를 들면, 유전자의 코딩 영역에의 중지 코돈의 도입에 의해, 코딩되는 단백질의 아미노산 서열에 있어서, 당해 도입 부위보다 하류의 영역이 코딩하는 영역을 결실시킬 수 있다. 또한, 예를 들면, 유전자의 코딩 영역에서의 프레임 시프트에 의해, 당해 프레임 시프트 부위가 코딩하는 영역을 결실시킬 수 있다. 아미노산 서열의 결실에서의 결실시키는 영역의 위치 및 길이에 대해서는, 유전자의 결실에서의 결실시키는 영역의 위치 및 길이의 설명을 준용할 수 있다.
염색체상의 유전자를 상기한 바와 같이 개변하는 것은, 예를 들면, 정상적으로 기능하는 단백질을 생산하지 않도록 개변한 파괴형 유전자를 제작하고, 당해 파괴형 유전자를 포함하는 재조합 DNA로 숙주를 형질 전환하여, 파괴형 유전자와 염색체상의 야생형 유전자로 상동 재조합을 일으키게 함으로써, 염색체상의 야생형 유전자를 파괴형 유전자로 치환하여 달성할 수 있다. 이때, 재조합 DNA에는 숙주의 영양 요구성 등의 형질에 따라, 마커 유전자를 포함시켜 두면 조작하기 쉽다. 파괴형 유전자로서는, 유전자의 코딩 영역의 일부 또는 전부의 영역을 결실한 유전자, 미스센스 변이를 도입한 유전자, 넌센스 변이를 도입한 유전자, 프레임 시프트 변이를 도입한 유전자, 트랜스포존이나 마커 유전자 등의 삽입 서열을 삽입한 유전자를 들 수 있다. 상동 재조합에 사용하는 재조합 DNA의 구조는, 원하는 형태로 상동 재조합이 일어나는 것이면 특별히 제한되지 않는다. 예를 들면, 파괴형 유전자를 포함하는 선상 DNA로서, 양단에 염색체상의 야생형 유전자의 상류 및 하류의 서열을 각각 구비한 선상 DNA로 숙주를 형질 전환하여, 야생형 유전자의 상류 및 하류에서 각각 상동 재조합을 일으키게 함으로써, 한 단계로 야생형 유전자를 파괴형 유전자로 치환할 수 있다. 파괴형 유전자에 의해 코딩되는 단백질은 생성했다 하더라도 야생형 단백질과는 다른 입체 구조를 갖고, 기능이 저하 또는 소실된다. 이러한 상동 재조합을 이용한 유전자 치환에 의한 유전자 파괴는 이미 확립되어 있고, 「Red 구동형 통합(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97: 6640-6645(2000)), Red 구동형 통합법과 λ파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203(2002))을 조합한 방법(WO2005/010175호 참조) 등의 직쇄상 DNA를 사용하는 방법이나, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터를 사용하는 방법 등이 있다(미국특허 제6,303,383호, 일본 공개특허공보 특개평05-007491호).
또한, 단백질의 활성이 저하되는 개변은, 예를 들면, 돌연변이 처리에 의해 행하여도 좋다. 돌연변이 처리로서는, X선의 조사, 자외선의 조사, 및 N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), 메틸메탄설포네이트(EMS), 및 메틸메탄설포네이트(MMS) 등의 변이제에 의한 처리를 들 수 있다.
상기와 같은 단백질의 활성을 저하시키는 수법은 단독으로 사용해도 좋고, 임의의 조합으로 사용해도 좋다.
단백질의 활성이 저하된 것은, 이 단백질의 활성을 측정함으로써 확인할 수 있다.
단백질의 활성이 저하된 것은, 이 단백질을 코딩하는 유전자의 발현이 저하된 것을 확인함으로써도 확인할 수 있다. 유전자의 발현이 저하된 것은, 이 유전자의 전사량이 저하된 것을 확인하는 것이나, 이 유전자로부터 발현되는 단백질의 양이 저하된 것을 확인함으로써 확인할 수 있다.
유전자의 전사량이 저하된 것의 확인은, 이 유전자로부터 전사되는 mRNA의 양을 비개변주와 비교함으로써 행할 수 있다. mRNA의 양을 평가하는 방법으로서는, 노던 하이브리드화, RT-PCR, 마이크로어레이, RNA-Seq 등을 들 수 있다(Molecular cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). mRNA의 양은, 예를 들면, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
단백질의 양이 저하된 것의 확인은, SDS-PAGE를 행하여 분리된 단백질 밴드의 강도를 확인함으로써 행할 수 있다. 또한, 단백질의 양이 저하된 것의 확인은, 항체를 사용하여 웨스턴 블롯팅에 의해 행할 수 있다(Molecular cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). 단백질의 양(예를 들면, 세포당 분자수)은, 예를 들면, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
유전자가 파괴된 것은, 파괴에 사용한 수단에 따라 이 유전자의 일부 또는 전부의 염기서열, 제한 효소 지도, 또는 전체 길이 등을 결정함으로써 확인할 수 있다.
<1-5> 유전자의 발현을 상승시키는 수법
이하에, Tat계 분비 시스템을 코딩하는 유전자 등의 유전자의 발현을 상승시키는 수법에 대하여 설명한다.
「유전자의 발현이 상승한다」란, 이 유전자의 발현이 비개변주와 비교하여 상승하고 있는 것을 의미한다. 「유전자의 발현이 상승한다」란, 구체적으로는, 이 유전자의 세포당 발현량이 비개변주와 비교하여 상승하고 있는 것을 의미한다. 「유전자의 세포당 발현량」이란, 이 유전자의 발현량의 세포당 평균값을 의미해도 좋다. 여기서 말하는 「비개변주」란, 표적의 유전자의 발현이 상승하도록 개변되어 있지 않은 대조주를 의미한다. 비개변주로서는 야생주나 친주를 들 수 있다. 비개변주로서, 구체적으로는, 각 세균종의 기준주(type strain)를 들 수 있다. 또한, 비개변주로서, 구체적으로는, 코리네형 세균의 설명에서 예시한 균주도 들 수 있다. 즉, 일 양태에 있어서, 유전자의 발현은 기준주(즉 본 발명의 세균이 속하는 종의 기준주)와 비교하여 상승해도 좋다. 또한, 다른 양태에 있어서, 유전자의 발현은 C. 글루타미쿰 ATCC 13032와 비교하여 상승해도 좋다. 또한, 다른 양태에 있어서, 유전자의 발현은 C. 글루타미쿰 ATCC 13869와 비교하여 상승해도 좋다. 또한, 다른 양태에 있어서, 유전자의 발현은 C. 글루타미쿰 AJ 12036(FERM BP-734)과 비교하여 상승해도 좋다. 또한, 다른 양태에 있어서, 유전자의 발현은 C. 글루타미쿰 YDK010주와 비교하여 상승해도 좋다. 「유전자의 발현이 상승한다」란, 더 구체적으로는, 유전자의 전사량(mRNA량)이 증대하는 것, 및/또는, 유전자의 번역량(유전자로부터 발현된 단백질의 양)이 증대하는 것을 의미해도 좋다. 또한, 「유전자의 발현이 상승한다」는 것을, 「유전자의 발현이 증강된다」라고도 한다. 유전자의 발현의 상승 정도는, 유전자의 발현이 비개변주와 비교하여 상승하고 있으면 특별히 제한되지 않는다. 유전자의 발현은, 비개변주의, 바람직하게는 1.5배 이상, 보다 바람직하게는 2배 이상, 더 바람직하게는 3배 이상으로 상승해도 좋다. 또한, 「유전자의 발현이 상승한다」는 것에는, 원래 표적의 유전자가 발현되고 있는 균주에 있어서 이 유전자의 발현량을 상승시키는 것뿐만 아니라, 원래 표적의 유전자가 발현되고 있지 않은 균주에 있어서 이 유전자를 발현시키는 것도 포함된다. 즉, 「유전자의 발현이 상승한다」는 것에는, 예를 들면, 표적의 유전자를 유지하지 않은 균주에 이 유전자를 도입하여, 이 유전자를 발현시키는 것도 포함된다.
유전자의 발현의 상승은, 예를 들면, 유전자의 카피수를 증가시킴으로써 달성할 수 있다.
유전자의 카피수의 증가는, 숙주의 염색체에 해당 유전자를 도입함으로써 달성할 수 있다. 염색체로의 유전자의 도입은, 예를 들면, 상동 재조합을 이용하여 행할 수 있다(Miller, J. H. Experiments in Molecular Genetics, 1972, Cold Spring Harbor Laboratory). 상동 재조합을 이용하는 유전자 도입법으로서는, 예를 들면, Red 구동형 통합(Red-driven integration)법 (Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97: 6640-6645(2000)) 등의 직쇄상 DNA를 사용하는 방법, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터를 사용하는 방법, 파지를 사용한 형질도입법을 들 수 있다. 상동 재조합에 사용하는 재조합 DNA의 구조는, 원하는 형태로 상동 재조합이 일어나는 것이면 특별히 제한되지 않는다. 구체적으로는, 예를 들면, 표적 유전자를 포함하는 선상 DNA로서, 양단에 염색체상의 치환 대상 부위의 상류 및 하류의 서열을 각각 구비한 선상 DNA로 코리네형 세균을 형질 전환하여, 치환 대상 부위의 상류 및 하류에서 각각 상동 재조합을 일으키게 함으로써, 치환 대상 부위를 표적 유전자로 치환할 수 있다. 상동 재조합에 사용하는 재조합 DNA는, 형질 전환체를 선택하기 위한 마커 유전자를 구비하고 있어도 좋다. 유전자는 1카피만 도입되어도 좋고, 2카피 또는 그 이상 도입되어도 좋다. 예를 들면, 염색체 위에 다수의 카피가 존재하는 서열을 표적으로서 상동 재조합을 행함으로써 염색체에 유전자의 다수의 카피를 도입할 수 있다. 염색체 위에 다수의 카피가 존재하는 서열로서는, 반복 DNA 서열, 트랜스포존의 양단에 존재하는 역위 반복 서열을 들 수 있다. 또한, 목적 물질의 생산에 불필요한 유전자 등의 염색체상의 적당한 서열을 표적으로서 상동 재조합을 행하여도 좋다. 또한, 유전자는, 트랜스포존이나 Mini-Mu를 사용하여 염색체 위에 랜덤으로 도입할 수도 있다(일본 공개특허공보 특개평2-109985호, US5,882,888, EP0805867B1). 트랜스포존으로서는, 인공 트랜스포존을 이용해도 좋다(일본 공개특허공보 특개평9-70291).
염색체 위에 표적 유전자가 도입된 것의 확인은, 이 유전자의 전부 또는 일부와 상보적인 서열을 갖는 프로브를 사용한 서던 하이브리드화, 또는 이 유전자의 서열에 기초하여 작성한 프라이머를 사용한 PCR 등에 의해 확인할 수 있다.
또한, 유전자의 카피수의 증가는, 이 유전자를 포함하는 벡터를 숙주에 도입함으로써도 달성할 수 있다. 예를 들면, 표적 유전자를 포함하는 DNA 단편을, 숙주에서 기능하는 벡터와 연결하여 이 유전자의 발현 벡터를 구축하고, 당해 발현 벡터로 숙주를 형질 전환함으로써 이 유전자의 카피수를 증가시킬 수 있다. 표적 유전자를 포함하는 DNA 단편은, 예를 들면, 표적 유전자를 갖는 미생물의 유전체 DNA를 주형으로 하는 PCR에 의해 취득할 수 있다. 벡터로서는, 숙주의 세포 내에서 자율 복제 가능한 벡터를 사용할 수 있다. 벡터는 멀티 카피 벡터인 것이 바람직하다. 또한, 형질 전환체를 선택하기 위해서, 벡터는 항생 물질 내성 유전자 등의 마커를 갖는 것이 바람직하다. 또한, 벡터는, 삽입된 유전자를 발현하기 위한 프로모터나 종결자를 구비하고 있어도 좋다. 벡터는, 예를 들면, 세균 플라스미드 유래의 벡터, 효모 플라스미드 유래의 벡터, 박테리오파지 유래의 벡터, 코스미드, 또는 파지미드 등이라도 좋다. 코리네형 세균에서 자율 복제 가능한 벡터로서, 구체적으로는, 예를 들면, pHM1519(Agric. Biol. Chem., 48, 2901-2903(1984)); pAM330(Agric. Biol. Chem., 48, 2901-2903(1984)); 이들을 개량한 약제 내성 유전자를 갖는 플라스미드; 플라스미드 pCRY30(일본 공개특허공보 특개평3-210184); 플라스미드 pCRY21, pCRY2KE, pCRY2KX, pCRY31, pCRY3KE, 및 pCRY3KX(일본 공개특허공보 특개평2-72876, 미국특허 제5,185,262호); 플라스미드 pCRY2 및 pCRY3(일본 공개특허공보 특개평1-191686); pAJ655, pAJ611, 및 pAJ1844(일본 공개특허공보 특개소58-192900); pCG1(일본 공개특허공보 특개소57-134500); pCG2(일본 공개특허공보 특개소58-35197); pCG4 및 pCG11(일본 공개특허공보 특개소57-183799); pVK7(일본 공개특허공보 특개평10-215883); pVK9(US2006-0141588); pVC7(일본 공개특허공보 특개평9-070291); pVS7(WO2013/069634)을 들 수 있다.
유전자를 도입할 경우, 유전자는 발현 가능하게 숙주에 유지되어 있으면 좋다. 구체적으로는, 유전자는 숙주에서 기능하는 프로모터 서열에 의한 제어를 받아 발현하도록 유지되어 있으면 좋다. 프로모터는 숙주에서 기능하는 것이면 특별히 제한되지 않는다. 「숙주에서 기능하는 프로모터」란, 숙주에서 프로모터 활성을 갖는 프로모터를 말한다. 프로모터는 숙주 유래의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 도입하는 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 프로모터로서는, 후술하는 바와 같은 코리네형 세균에서 기능하는 프로모터를 이용할 수 있다.
유전자의 하류에는, 전사 종료를 위한 종결자를 배치할 수 있다. 종결자는 숙주에서 기능하는 것이면 특별히 제한되지 않는다. 종결자는 숙주 유래의 종결자라도 좋고, 이종 유래의 종결자라도 좋다. 종결자는 도입하는 유전자 고유의 종결자라도 좋고, 다른 유전자의 종결자라도 좋다.
각종 미생물에 있어서 이용 가능한 벡터, 프로모터, 종결자에 관해서는, 예를 들면 「미생물학 기초강좌 8 유전자공학, 공립 출판, 1987년」에 상세하게 기재되어 있고, 이들을 이용하는 것이 가능하다.
또한, 2 이상의 유전자를 도입할 경우, 각 유전자가 발현 가능하게 숙주에 유지되어 있으면 좋다. 예를 들면, 각 유전자는 모두가 단일의 발현 벡터 위에 유지되어 있어도 좋고, 모두가 염색체 위에 유지되어 있어도 좋다. 또한, 각 유전자는 복수의 발현 벡터 위에 각각 유지되어 있어도 좋고, 단일 또는 복수의 발현 벡터 위와 염색체 위에 각각 유지되어 있어도 좋다. 또한, 2 이상의 유전자로 오페론을 구성하여 도입해도 좋다.
도입되는 유전자는, 숙주에서 기능하는 단백질을 코딩하는 것이면 특별히 제한되지 않는다. 도입되는 유전자는 숙주 유래의 유전자라도 좋고, 이종 유래의 유전자라도 좋다. 도입되는 유전자는, 예를 들면, 이 유전자의 염기서열에 기초하여 설계한 프라이머를 사용하고, 이 유전자를 갖는 생물의 유전체 DNA나 이 유전자를 탑재하는 플라스미드 등을 주형으로 하는, PCR에 의해 취득할 수 있다. 또한, 도입되는 유전자는, 예를 들면, 이 유전자의 염기서열에 기초하여 전체 합성해도 좋다(Gene, 60(1), 115-127(1987)). 취득한 유전자는 그대로, 또는 적절히 개변하여 이용할 수 있다. 유전자의 개변은 공지된 수법에 의해 행할 수 있다. 예를 들면, 부위 특이적 변이법에 의해, DNA의 목적의 부위에 목적의 변이를 도입할 수 있다. 즉, 예를 들면, 부위 특이적 변이법에 의해, 코딩되는 단백질이 특정한 부위에서 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하도록, 유전자의 코딩 영역을 개변할 수 있다.
또한, 유전자의 발현의 상승은, 유전자의 전사 효율을 향상시킴으로써 달성할 수 있다. 또한, 유전자의 발현의 상승은, 유전자의 번역 효율을 향상시킴으로써 달성할 수 있다. 유전자의 전사 효율이나 번역 효율의 향상은, 예를 들면, 발현 조절 서열의 개변에 의해 달성할 수 있다. 「발현 조절 서열」이란, 유전자의 발현에 영향을 주는 부위의 총칭이다. 발현 조절 서열로서는, 예를 들면, 프로모터, 샤인-달가노(SD) 서열(리보솜 결합 부위(RBS)라고도 한다), 및 RBS와 개시 코돈 사이의 스페이서 영역을 들 수 있다. 발현 조절 서열은, 프로모터 검색 벡터나 GENETYX 등의 유전자 분석 소프트웨어를 사용하여 결정할 수 있다. 이들 발현 조절 서열의 개변은, 예를 들면, 상동 재조합을 이용하여 행할 수 있다. 상동 재조합을 이용한 개변 수법으로서는, 온도 감수성 벡터를 사용한 방법이나, Red 구동형 통합법(WO2005/010175)을 들 수 있다.
유전자의 전사 효율의 향상은, 예를 들면, 염색체상의 유전자의 프로모터를 보다 강력한 프로모터로 치환함으로써 달성할 수 있다. 「보다 강력한 프로모터」란, 유전자의 전사가, 원래 존재하고 있는 야생형의 프로모터보다도 향상되는 프로모터를 의미한다. 코리네형 세균에서 이용할 수 있는 보다 강력한 프로모터로서는, 인위적으로 설계 변경된 P54-6 프로모터(Appl. Microbiol. Biotechnol., 53, 674-679(2000)), 코리네형 세균 내에서 아세트산, 에탄올, 피루브산 등으로 유도할 수 있는 pta, aceA, aceB, adh, amyE 프로모터, 코리네형 세균 내에서 발현량이 많은 강력한 프로모터인 cspB, SOD, tuf(EF-Tu) 프로모터(Journal of Biotechnology, 104(2003) 311-323, Appl. Environ. Microbiol., 2005 Dec; 71(12): 8587-96.), lac 프로모터, tac 프로모터, trc 프로모터를 들 수 있다. 또한, 보다 강력한 프로모터로서는, 각종 리포터 유전자를 사용함으로써 기존 프로모터의 고활성형인 것을 취득해도 좋다. 예를 들면, 프로모터 영역 내의 -35, -10 영역을 콘센서스 서열에 가까이 함으로써, 프로모터의 활성을 높일 수 있다(국제공개 제00/18935호). 프로모터의 강도의 평가법 및 강력한 프로모터의 예는, 골드슈타인(Goldstein) 등의 논문(Prokaryotic Promoters in Biotechnology. Biotechnol. Annu. Rev., 1, 105-128(1995)) 등에 기재되어 있다.
유전자의 번역 효율의 향상은, 예를 들면, 염색체상의 유전자의 샤인-달가노(SD) 서열(리보솜 결합 부위(RBS)라고도 한다)을 보다 강력한 SD 서열로 치환함으로써 달성할 수 있다. 「보다 강력한 SD 서열」이란, mRNA의 번역이, 원래 존재하고 있는 야생형의 SD 서열보다도 향상되는 SD 서열을 의미한다. 보다 강력한 SD 서열로서는, 예를 들면, 파지 T7 유래의 유전자 10의 RBS를 들 수 있다(Olins P. O. et al, Gene, 1988, 73, 227-235). 또한, RBS와 개시 코돈 사이의 스페이서 영역, 특히 개시 코돈의 바로 상류의 서열(5'-UTR)에서의 여러 개의 뉴클레오티드의 치환, 또는 삽입, 또는 결실이 mRNA의 안정성 및 번역 효율에 상당히 영향을 끼치는 것으로 알려져 있어, 이들을 개변함으로써도 유전자의 번역 효율을 향상시킬 수 있다.
유전자의 번역 효율의 향상은, 예를 들면, 코돈의 개변에 의해서도 달성할 수 있다. 예를 들면, 유전자 중에 존재하는 희귀 코돈을, 보다 고빈도로 이용되는 동의 코돈으로 치환함으로써 유전자의 번역 효율을 향상시킬 수 있다. 즉, 도입되는 유전자는, 예를 들면, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변되어도 좋다. 코돈의 치환은, 예를 들면, 부위 특이적 변이법에 의해 행할 수 있다. 또한, 코돈이 치환된 유전자 단편을 전체 합성해도 좋다. 다양한 생물에서의 코돈의 사용 빈도는, 「코돈 사용 데이터 베이스」(http://www.kazusa.or.jp/codon; Nakamura, Y. et al, Nucl. Acids Res., 28, 292(2000))에 개시되어 있다.
또한, 유전자의 발현의 상승은, 표적 유전자의 발현을 상승시키는 조절인자를 증폭하는 것, 또는, 표적 유전자의 발현을 저하시키는 조절인자를 결실 또는 약화시킴으로써도 달성할 수 있다.
상기와 같은 유전자의 발현을 상승시키는 수법은 단독으로 사용해도 좋고, 임의의 조합으로 사용해도 좋다.
형질 전환의 방법은 특별히 한정되지 않고, 종래 알려진 방법을 사용할 수 있다. 예를 들면, 에쉐리키아·콜라이 K-12에 대하여 보고되어 있는 바와 같은, 수용균 세포를 염화칼슘으로 처리하여 DNA의 투과성을 증대시키는 방법(Mandel, M. and Higa, A.,J. Mol. Biol. 1970, 53, 159-162)이나, 바실러스 서브틸리스에 대하여 보고되어 있는 바와 같은, 증식 단계의 세포로부터 컴피턴트 세포를 조제하여 DNA를 도입하는 방법(Duncan, C. H., Wilson, G. A. and Young, F. E..,1977. Gene 1: 153-167)을 사용할 수 있다. 또는, 바실러스 서브틸리스, 방선균류, 및 효모에 대하여 알려져 있는 바와 같은, DNA 수용균의 세포를, 재조합 DNA를 용이하게 받아들이는 원형질체 또는 스페로플라스트(spheroplast)의 상태로 하여 재조합 DNA를 DNA 수용균에 도입하는 방법(Chang, S. and Choen, S. N., 1979. Mol. Gen. Genet., 168: 111-115; Bibb, M. J., Ward, J. M. and Hopwood, O.A., 1978. Nature 274: 398-400; Hinnen, A., Hicks, J. B. and Fink, G. R. 1978. Proc. Natl. Acad. Sci. USA 75: 1929-1933)도 응용할 수 있다. 코리네형 세균의 형질 전환은, 구체적으로는, 예를 들면, 원형질법(Gene, 39, 281-286(1985)), 전기천공법(Bio/Technology, 7, 1067-1070(1989)), 전기 펄스법(일본 공개특허공보 특개평2-207791호) 등에 의해 행할 수 있다.
유전자의 발현이 상승한 것은, 예를 들면, 이 유전자로부터 발현되는 단백질의 활성이 상승한 것을 확인함으로써 확인할 수 있다. 단백질의 활성이 상승한 것은 이 단백질의 활성을 측정함으로써 확인할 수 있다. 예를 들면, Tat계 분비 시스템의 활성이 상승한 것은, 예를 들면, Tat계 의존성 신호 펩타이드가 N 말단에 부가된 단백질의 분비 생산량이 증대한 것을 확인함으로써 확인할 수 있다. 이 경우, Tat계 의존성 신호 펩타이드가 N 말단에 부가된 단백질의 분비 생산량은, 예를 들면, 비개변주의, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승하고 있는 것이 바람직하다.
또한, 유전자의 발현이 상승한 것은, 예를 들면, 이 유전자의 전사량이 상승한 것을 확인하는 것이나, 이 유전자로부터 발현되는 단백질의 양이 상승한 것을 확인함으로써 확인할 수 있다.
유전자의 전사량이 상승한 것의 확인은, 이 유전자로부터 전사되는 mRNA의 양을 야생주 또는 친주 등의 비개변주와 비교함으로써 행할 수 있다. mRNA의 양을 평가하는 방법으로서는 노던 하이브리드화, RT-PCR, 마이크로어레이, RNA-Seq 등을 들 수 있다(Sambrook, J., et al., Molecular Cloning A Laboratory Manual/Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). mRNA의 양은, 예를 들면, 비개변주의, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승해도 좋다.
단백질의 양이 상승한 것의 확인은, SDS-PAGE를 행하여 분리된 단백질 밴드의 강도를 확인함으로써 행할 수 있다. 또한, 단백질의 양이 상승한 것의 확인은, 항체를 사용하여 웨스턴 블롯팅에 의해 행할 수 있다(Molecular cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). 단백질의 양(예를 들면, 세포당 분자수)은, 예를 들면, 비개변주의, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승해도 좋다.
<1-6> 이종 단백질의 분비 발현용의 유전자 구축물과 그 도입
분비성 단백질은, 일반적으로, 프레단백질(preprotein, 프레펩타이드라고도 한다) 또는 프레프로단백질(preproprotein, 프레프로펩타이드라고도 한다)로서 번역되고, 그 후, 프로세싱에 의해 성숙 단백질이 되는 것으로 알려져 있다. 구체적으로는, 분비성 단백질은 일반적으로, 프레단백질 또는 프레프로단백질로서 번역된 후, 프레 부분인 신호 펩타이드가 프로테아제(일반적으로 신호 펩티다아제라고 불린다)에 의해 절단되어 성숙 단백질 또는 프로단백질로 변환되고, 프로단백질은 프로테아제에 의해 더욱 프로 부분이 절단되어 성숙 단백질이 된다. 따라서, 본 발명의 방법에 있어서는, 이종 단백질의 분비 생산에 신호 펩타이드를 이용한다. 또한, 본 발명에 있어서, 분비형 단백질의 프레단백질 및 프레프로단백질을 총칭하여 「분비형 단백질 전구체」라고 하는 경우가 있다. 본 발명에 있어서, 「신호 펩타이드」(「신호 서열」이라고도 한다)란, 분비성 단백질 전구체의 N 말단에 존재하며, 통상, 천연의 성숙 단백질에는 존재하지 않는 아미노산 서열을 말한다.
본 발명에 사용되는 유전자 구축물은, 5'에서 3' 방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열, 및 이종 단백질을 코딩하는 핵산 서열을 포함한다. 신호 펩타이드를 코딩하는 핵산 서열은 프로모터 서열의 하류에, 이 프로모터에 의한 제어를 받아 신호 펩타이드가 발현되도록 연결되어 있으면 좋다. 이종 단백질을 코딩하는 핵산 서열은 신호 펩타이드를 코딩하는 핵산 서열의 하류에, 이 신호 펩타이드와의 융합 단백질로서 이종 단백질이 발현되도록 연결되어 있으면 좋다. 당해 융합 단백질을 「본 발명의 융합 단백질」이라고도 한다. 또한, 본 발명의 융합 단백질에 있어서, 신호 펩타이드와 이종 단백질은 인접해 있어도 좋고, 인접해 있지 않아도 좋다. 즉, 「이종 단백질이 신호 펩타이드와의 융합 단백질로서 발현된다」란, 이종 단백질이 신호 펩타이드에 인접하여 이 신호 펩타이드와의 융합 단백질로서 발현되는 경우에 한정되지 않고, 이종 단백질이 다른 아미노산 서열을 통하여 신호 펩타이드와의 융합 단백질로서 발현되는 경우도 포함된다. 예를 들면, 후술하는 바와 같이, 본 발명의 융합 단백질에 있어서, 신호 펩타이드와 이종 단백질 사이에는, Gln-Glu-Thr을 포함하는 아미노산 서열이나 효소적 절단에 사용되는 아미노산 서열 등의 삽입 서열이 포함될 수 있다. 또한, 후술하는 바와 같이, 최종적으로 얻어지는 이종 단백질은 신호 펩타이드를 갖고 있지 않아도 좋다. 즉, 「이종 단백질이 신호 펩타이드와의 융합 단백질로서 발현된다」란, 이종 단백질이 발현시에 신호 펩타이드와의 융합 단백질을 구성하고 있으면 충분하고, 최종적으로 얻어지는 이종 단백질이 신호 펩타이드와의 융합 단백질을 구성하고 있을 것을 필요로 하지 않는다. 핵산 서열은 「유전자」라고 바꿔 말할 수 있다. 예를 들면, 이종 단백질을 코딩하는 핵산 서열을 「이종 단백질을 코딩하는 유전자」 또는 「이종 단백질 유전자」라고도 한다. 핵산 서열로서는 DNA를 들 수 있다. 또한, 본 발명에 사용되는 유전자 구축물은, 코리네형 세균에서 본 발명의 융합 단백질을 발현시키기 위해서 유효한 조절 서열(오퍼레이터, SD 서열, 종결자 등)을, 이들이 기능할 수 있도록 적절한 위치에 갖고 있어도 좋다.
본 발명에서 사용되는 프로모터는, 코리네형 세균에서 기능하는 프로모터인 한 특별히 제한되지 않는다. 프로모터는 코리네형 세균 유래(예를 들면 숙주 유래)의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 이종 단백질 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 「코리네형 세균에서 기능하는 프로모터」란, 코리네형 세균에 있어서 프로모터 활성을 갖는 프로모터를 말한다.
이종 유래의 프로모터로서, 구체적으로는, 예를 들면, tac 프로모터, lac 프로모터, trp 프로모터, 및 araBAD 프로모터 등의 E. 콜라이 유래의 프로모터를 들 수 있다. 이 중에서도, tac 프로모터 등의 강력한 프로모터나, araBAD 프로모터 등의 유도형 프로모터가 바람직하다.
코리네형 세균 유래의 프로모터로서는, 예를 들면, 세포 표층 단백질인 PS1, PS2(CspB라고도 한다), SlpA(CspA라고도 한다)의 유전자의 프로모터, 각종 아미노산 생합성계 유전자의 프로모터를 들 수 있다. 각종 아미노산 생합성계 유전자의 프로모터로서, 구체적으로는, 예를 들면, 글루타민산 생합성계의 글루타민산 탈수소효소 유전자, 글루타민 합성계의 글루타민 합성효소 유전자, 라이신 생합성계의 아스파르토키나아제 유전자, 트레오닌 생합성계의 호모세린 탈수소효소 유전자, 이소류신 및 발린 생합성계의 아세토하이드록시산 합성효소 유전자, 류신 생합성계의 2-이소프로필말산 합성효소 유전자, 프롤린 및 아르기닌 생합성계의 글루타민산 키나아제 유전자, 히스티딘 생합성계의 포스포리보실-ATP 피로포스포릴라아제 유전자, 트립토판, 티로신 및 페닐알라닌 등의 방향족 아미노산 생합성계의 데옥시아라비노헵투론산 인산(DAHP) 합성효소 유전자, 이노신산 및 구아닐산과 같은 핵산 생합성계에서의 포스포리보실 피로포스페이트(PRPP) 아미도트랜스퍼라제 유전자, 이노신산 탈수소효소 유전자, 및 구아닐산 합성효소 유전자의 프로모터를 들 수 있다.
또한, 코리네형 세균에서 기능하는 프로모터로서는, 상술한 바와 같은, 코리네형 세균에서 이용할 수 있는 보다 강력한 프로모터를 들 수 있다. 또한, 프로모터로서는, 각종 리포터 유전자를 사용함으로써 기존 프로모터의 고활성형인 것을 취득하여 이용해도 좋다. 예를 들면, 프로모터 영역 내의 -35, -10 영역을 콘센서스 서열에 가까이 함으로써, 프로모터의 활성을 높일 수 있다(국제공개 제00/18935호). 프로모터 강도의 평가법 및 강력한 프로모터의 예는, 골드슈타인 등의 논문(Prokaryotic promoters in biotechnology. Biotechnol. Annu. Rev., 1, 105-128(1995)) 등에 기재되어 있다. 또한, 리보솜 결합 부위(RBS)와 개시 코돈 사이의 스페이서 영역, 특히 개시 코돈의 바로 상류의 서열(5'-UTR)에서의 여러 개의 뉴클레오티드의 치환, 또는 삽입, 또는 결실이 mRNA의 안정성 및 번역 효율에 상당히 영향을 끼치는 것으로 알려져 있어, 이들을 개변하는 것도 가능하다.
본 발명에서 사용되는 신호 펩타이드는, 코리네형 세균에서 기능하는 신호 펩타이드인 한 특별히 제한되지 않는다. 신호 펩타이드는 코리네형 세균 유래(예를 들면 숙주 유래)의 신호 펩타이드라도 좋고, 이종 유래의 신호 펩타이드라도 좋다. 신호 펩타이드는 이종 단백질 고유의 신호 펩타이드라도 좋고, 다른 단백질의 신호 펩타이드라도 좋다. 「코리네형 세균에서 기능하는 신호 펩타이드」란, 목적의 단백질의 N 말단에 연결했을 때에, 코리네형 세균이 당해 단백질을 분비할 수 있는 펩타이드를 말한다. 어떤 신호 펩타이드가 코리네형 세균에서 기능하는지 여부는, 예를 들면, 목적의 단백질을 당해 신호 펩타이드와 융합시켜 발현시켜, 당해 단백질이 분비되는지를 확인함으로써 확인할 수 있다.
신호 펩타이드로서는, Tat계 의존성 신호 펩타이드나 Sec계 의존성 신호 펩타이드를 들 수 있다.
「Tat계 의존성 신호 펩타이드」란, Tat계에 의해 인식되는 신호 펩타이드를 말한다. 「Tat계 의존성 신호 펩타이드」란, 구체적으로는, 목적의 단백질의 N 말단에 연결했을 때에, Tat계 분비 시스템에 의해 당해 단백질이 분비되는 펩타이드라도 좋다.
Tat계 의존성 신호 펩타이드로서는, 예를 들면, E. 콜라이의 TorA 단백질(트리메틸아민-N-산화환원효소)의 신호 펩타이드, E. 콜라이의 SufI 단백질(ftsI의 억제자)의 신호 펩타이드, 바실러스 서브틸리스의 PhoD 단백질(포스포디에스테라아제)의 신호 펩타이드, 바실러스 서브틸리스의 LipA 단백질(리포산 신타아제)의 신호 펩타이드, 아르트로박터 글로비포르미스의 IMD 단백질(이소말토덱스트라나아제)의 신호 펩타이드를 들 수 있다. 이들 신호 펩타이드의 아미노산 서열은 이하와 같다.
TorA 신호 펩타이드: MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATA(서열번호 18)
SufI 신호 펩타이드: MSLSRRQFIQASGIALCAGAVPLKASA(서열번호 19)
PhoD 신호 펩타이드: MAYDSRFDEWVQKLKEESFQNNTFDRRKFIQGAGKIAGLSLGLTIAQS(서열번호 20)
LipA 신호 펩타이드: MKFVKRRTTALVTTLMLSVTSLFALQPSAKAAEH(서열번호 21)
IMD 신호 펩타이드: MMNLSRRTLLTTGSAATLAYALGMAGSAQA(서열번호 22)
Tat계 의존성 신호 펩타이드는 트윈-아르기닌 모티프를 갖는다. 트윈-아르기닌 모티프로서는, 예를 들면, S/T-R-R-X-F-L-K(서열번호 23)나 R-R-X-#-#(#: 소수성 잔기)(서열번호 24)을 들 수 있다.
「Sec계 의존성 신호 펩타이드」란, Sec계에 의해 인식되는 신호 펩타이드를 말한다. 「Sec계 의존성 신호 펩타이드」란, 구체적으로는, 목적의 단백질의 N 말단에 연결했을 때에, Sec계 분비 시스템에 의해 당해 단백질이 분비되는 펩타이드라도 좋다.
Sec계 의존성 신호 펩타이드로서는, 예를 들면, 코리네형 세균의 세포 표층 단백질의 신호 펩타이드를 들 수 있다. 코리네형 세균의 세포 표층 단백질에 대해서는 상술한 바와 같다. 코리네형 세균의 세포 표층 단백질로서는, C. 글루타미쿰에서 유래하는 PS1 및 PS2(CspB)(일본 공개특허공보 특표평6-502548) 및 C. 스타티오니스에서 유래하는 SlpA(CspA)(일본 공개특허공보 특개평10-108675)를 들 수 있다. C. 글루타미쿰의 PS1의 신호 펩타이드(PS1 신호 펩타이드)의 아미노산 서열을 서열번호 25에, C. 글루타미쿰의 PS2(CspB)의 신호 펩타이드(PS2 신호 펩타이드)의 아미노산 서열을 서열번호 26에, C. 스타티오니스의 SlpA(CspA)의 신호 펩타이드(SlpA 신호 펩타이드)의 아미노산 서열을 서열번호 27에 나타낸다.
Tat계 의존성 신호 펩타이드는 트윈-아르기닌 모티프를 갖고, 또한, 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 의존성 신호 펩타이드의 변이체라도 좋다. 또한, Sec계 의존성 신호 펩타이드는 원래의 기능이 유지되고 있는 한, 상기 예시한 Sec계 의존성 신호 펩타이드의 변이체라도 좋다. 신호 펩타이드 및 이를 코딩하는 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, 신호 펩타이드는, 상기 예시한 신호 펩타이드의 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 펩타이드라도 좋다. 또한, 신호 펩타이드의 변이체에서의 상기 「1개 또는 여러 개」란, 구체적으로는, 바람직하게는 1 내지 7개, 보다 바람직하게는 1 내지 5개, 더 바람직하게는 1 내지 3개, 특히 바람직하게는 1 내지 2개를 의미한다. 또한, 본 발명에 있어서, 「TorA 신호 펩타이드」, 「SufI 신호 펩타이드」, 「PhoD 신호 펩타이드」, 「LipA 신호 펩타이드」, 「IMD 신호 펩타이드」, 「PS1 신호 펩타이드」, 「PS2 신호 펩타이드」, 및 「SlpA 신호 펩타이드」라는 용어에는, 각각, 서열번호 18 내지 27에 기재된 펩타이드 이외에도, 그 보존적 변이체도 포함되는 것으로 한다.
Tat계 의존성 신호 펩타이드에 대한 「원래의 기능이 유지되고 있다」란, Tat계에 의해 인식되는 것을 말하고, 구체적으로는, 목적의 단백질의 N 말단에 연결했을 때에, Tat계 분비 시스템에 의해 당해 단백질이 분비되는 기능을 갖는 것이라도 좋다. 어떤 펩타이드가 Tat계 의존성 신호 펩타이드로서의 기능을 갖는지 여부는, 예를 들면, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Tat계 분비 시스템의 증강에 의해 증대하는 것을 확인하는 것이나, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Tat계 분비 시스템의 결손에 의해 감소하는 것을 확인함으로써 확인할 수 있다.
Sec계 의존성 신호 펩타이드에 대한 「원래의 기능이 유지되고 있다」란, Sec계에 의해 인식되는 것을 말하고, 구체적으로는, 목적의 단백질의 N 말단에 연결했을 때에, Sec계 분비 시스템에 의해 당해 단백질이 분비되는 기능을 갖는 것이라도 좋다. 어떤 펩타이드가 Sec계 의존성 신호 펩타이드로서의 기능을 갖는지 여부는, 예를 들면, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Sec계 분비 시스템의 증강에 의해 증대하는 것을 확인하는 것이나, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Sec계 분비 시스템의 결손에 의해 감소하는 것을 확인함으로써 확인할 수 있다.
신호 펩타이드는, 일반적으로, 번역 산물이 균체 외로 분비될 때에 신호 펩티다아제에 의해 절단된다. 즉, 최종적으로 얻어지는 이종 단백질은 신호 펩타이드를 갖고 있지 않아도 좋다. 또한, 신호 펩타이드를 코딩하는 유전자는 천연형 그대로도 사용할 수 있지만, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변해도 좋다.
본 발명에서 사용되는 유전자 구축물에 있어서는, 신호 펩타이드를 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열이 삽입되어 있어도 좋다(WO2013/062029). 또한, 당해 「Gln-Glu-Thr을 포함하는 아미노산 서열」을 「본 발명에서 사용되는 삽입 서열」이라고도 한다. 본 발명에서 사용되는 삽입 서열로서는, WO2013/062029에 기재된 Gln-Glu-Thr을 포함하는 아미노산 서열을 들 수 있다. 본 발명에서 사용되는 삽입 서열은, 특히, Sec계 의존성 신호 펩타이드와 조합하여 적합하게 사용할 수 있다.
본 발명에서 사용되는 삽입 서열은, 코리네형 세균의 세포 표층 단백질 CspB의 성숙 단백질(이하, 「성숙 CspB」 또는 「CspB 성숙 단백질」이라고도 한다)의 N 말단으로부터의 3 아미노산 잔기 또는 그 이상으로 이루어지는 서열인 것이 바람직하다. 「N 말단으로부터의 3 아미노산 잔기 또는 그 이상으로 이루어지는 서열」이란, N 말단의 1 위치의 아미노산 잔기로부터, 3 위치 또는 그 이상의 아미노산 잔기까지의 아미노산 서열을 말한다.
코리네형 세균의 세포 표층 단백질 CspB에 대해서는 상술한 바와 같다. CspB로서, 구체적으로는, 예를 들면, C. 글루타미쿰 ATCC 13869의 CspB나 상기 예시한 28주의 C. 글루타미쿰의 CspB, 및 이들의 변이체를 들 수 있다. 서열번호 11에 나타낸 C. 글루타미쿰 ATCC 13869의 CspB의 아미노산 서열 중, 1 내지 30 위치의 아미노산 잔기가 신호 펩타이드에 상당하고, 31 내지 499 위치의 아미노산 잔기가 CspB 성숙 단백질에 상당한다. 신호 펩타이드 부분 30 아미노산 잔기를 제외한, C. 글루타미쿰 ATCC 13869의 CspB 성숙 단백질의 아미노산 서열을 서열번호 28에 나타낸다. 또한, C. 글루타미쿰 ATCC 13869의 성숙 CspB에 있어서, N 말단의 1 내지 3 위치의 아미노산 잔기가 Gln-Glu-Thr에 상당한다.
본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터, 3 내지 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 바람직하다. 본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터, 3 내지 8, 17, 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 보다 바람직하다. 본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터, 4, 6, 17, 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 특히 바람직하다.
본 발명에서 사용되는 삽입 서열은, 예를 들면, 하기 (A) 내지 (H)의 아미노산 서열로 이루어지는 그룹으로부터 선택되는 아미노산 서열인 것이 바람직하다.
(A) Gln-Glu-Thr
(B) Gln-Glu-Thr-Xaa1(서열번호 29)
(C) Gln-Glu-Thr-Xaa1-Xaa2(서열번호 30)
(D) Gln-Glu-Thr-Xaa1-Xaa2-Xaa3(서열번호 31)
(E) 성숙 CspB의 4 내지 7 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어지는 아미노산 서열
(F) 성숙 CspB의 4 내지 8 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어지는 아미노산 서열
(G) 성숙 CspB의 4 내지 17 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어지는 아미노산 서열
(H) 성숙 CspB의 4 내지 50 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어지는 아미노산 서열
(A) 내지 (H)의 아미노산 서열에 있어서, Xaa1은 Asn, Gly, Thr, Pro, 또는 Ala이며, Xaa2는 Pro, Thr, 또는 Val이며, Xaa3은 Thr 또는 Tyr이다. 또한, (A) 내지 (H)의 아미노산 서열에 있어서, 「성숙 CspB의 4 내지 X 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr」이란, Gln-Glu-Thr의 Thr에 성숙 CspB의 N 말단의 4 위치로부터 X 위치까지의 아미노산 잔기가 융합되어 있는 것을 의미한다. 또한, 통상, 성숙 CspB의 N 말단의 1 내지 3번째의 아미노산 잔기는 Gln-Glu-Thr이며, 이 경우, 「성숙 CspB의 4 내지 X 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어진 아미노산 서열」이란, 성숙 CspB의 1 내지 X 위치의 아미노산 잔기로 이루어지는 아미노산 서열과 같은 뜻이다.
또한, 본 발명에서 사용되는 삽입 서열은, 구체적으로는, 예를 들면, Gln-Glu-Thr-Asn-Pro-Thr(서열번호 32), Gln-Glu-Thr-Gly-Thr-Tyr(서열번호 33), Gln-Glu-Thr-Thr-Val-Thr(서열번호 34), Gln-Glu-Thr-Pro-Val-Thr(서열번호 35), 및 Gln-Glu-Thr-Ala-Val-Thr(서열번호 36)로 이루어지는 그룹으로부터 선택되는 아미노산 서열인 것이 바람직하다.
본 발명에 있어서, 「성숙 CspB의 X 위치의 아미노산 잔기」란, 서열번호 28에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기를 의미한다. 임의의 성숙 CspB의 아미노산 서열에 있어서, 어느 아미노산 잔기가 「서열번호 28에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기」인지는, 당해 임의의 성숙 CspB의 아미노산 서열과 서열번호 28의 아미노산 서열과 정렬을 행함으로써 결정할 수 있다.
본 발명의 방법에 의해 분비 생산되는 이종 단백질로서는, 예를 들면, 생리활성 단백질, 수용체 단백질, 백신으로서 사용되는 항원 단백질, 효소, 그 외 임의의 단백질을 들 수 있다.
효소로서는, 예를 들면, 트랜스글루타미나아제, 프로테인 글루타미나아제, 이소말토덱스트라나아제, 프로테아제, 엔도펩티다아제, 엑소펩티다아제, 아미노펩티다아제, 카르복시펩티다아제, 콜라게나아제, 및 키티나아제 등을 들 수 있다. 트랜스글루타미나아제로서는, 예를 들면, 스트렙토버티실리움 모바렌세(Streptoverticillium mobaraense) IFO 13819(WO01/23591), 스트렙토버티실리움 시나모네움(Streptoverticillium cinnamoneum) IFO 12852, 스트렙토버티실리움 그리세오카르네움 (Streptoverticillium griseocarneum) IFO 12776, 스트렙토마이세스 리디쿠스(Streptomyces lydicus) (WO96/06931) 등의 방선균이나, Oomycetes(WO96/22366) 등의 사상균의 분비형 트랜스글루타미나아제를 들 수 있다. 프로테인 글루타미나아제로서는, 예를 들면, 크리세오박테리움 프로테오리티쿰(Chryseobacterium proteolyticum)의 프로테인 글루타미나아제를 들 수 있다(WO2005/103278). 이소말토덱스트라나아제로서는, 예를 들면, 아트로박터 글로비포르미스의 이소말토덱스트라나아제를 들 수 있다(WO2005/103278).
생리활성 단백질로서는, 예를 들면, 성장 인자(증식 인자), 호르몬, 사이토카인, 항체 관련 분자를 들 수 있다.
성장 인자(증식 인자)로서, 구체적으로는, 예를 들면, 표피 성장 인자(EGF), 인슐린 성장 인자-1(IGF-1), 형질전환 성장 인자(TGF), 신경 성장 인자(NGF), 뇌 유래 신경영양 인자(BDNF), 혈관 내피세포 증식 인자(VEGF), 과립구 콜로니 자극 인자(G-CSF), 과립구 마크로파지 콜로니 자극 인자(GM-CSF), 혈소판 유래 성장 인자(PDGF), 에리트로포이에틴(EPO), 트롬보포이에틴(TPO), 산성 섬유아세포 증식 인자(aFGF 또는 FGF1), 염기성 섬유아세포 증식 인자(bFGF 또는 FGF2), 각질세포 증식 인자(KGF-1 또는 FGF7, KGF-2 또는 FGF10), 간세포 증식 인자(HGF)를 들 수 있다.
호르몬으로서, 구체적으로는, 예를 들면, 인슐린, 글루카곤, 소마토스타틴, 인간 성장 호르몬(hGH), 부갑상선 호르몬(PTH), 칼시토닌, 엑세나타이드를 들 수 있다.
사이토카인으로서, 구체적으로는, 예를 들면, 인터루킨, 인터페론, 종양 괴사 인자(TNF)를 들 수 있다.
또한, 성장 인자(증식 인자), 호르몬, 및 사이토카인은 서로 엄밀하게 구별되지 않아도 좋다. 예를 들면, 생리활성 단백질은 성장 인자(증식 인자), 호르몬, 및 사이토카인으로부터 선택되는 어느 하나의 그룹에 속하는 것이라도 좋고, 이들로부터 선택되는 복수의 그룹에 속하는 것이라도 좋다.
또한, 생리활성 단백질은 단백질 전체라도 좋고, 그 일부라도 좋다. 단백질의 일부로서는, 예를 들면, 생리활성을 갖는 부분을 들 수 있다. 생리활성을 갖는 부분으로서, 구체적으로는, 예를 들면, 부갑상선 호르몬(PTH) 성숙체의 N 말단 34 아미노산 잔기로 이루어지는 생리활성 펩타이드 테리파라타이드를 들 수 있다.
「항체 관련 분자」란, 완전 항체를 구성하는 도메인으로부터 선택되는 단일의 도메인 또는 2 혹은 그 이상의 도메인의 조합으로 이루어지는 분자종을 포함하는 단백질을 말한다. 완전 항체를 구성하는 도메인으로서는, 중쇄의 도메인인 VH, CH1, CH2, 및 CH3, 및 경쇄의 도메인인 VL 및 CL을 들 수 있다. 항체 관련 분자는 상기의 분자종을 포함하는 한, 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 또한, 항체 관련 분자가 다량체 단백질인 경우에는, 단일 종류의 서브유닛으로 이루어지는 호모 다량체라도 좋고, 2 이상의 종류의 서브유닛으로 이루어지는 헤테로 다량체라도 좋다. 항체 관련 분자로서, 구체적으로는, 예를 들면, 완전 항체, Fab, F(ab')、F(ab')2, Fc, 중쇄(H쇄)와 경쇄(L쇄)로 이루어지는 2량체, Fc 융합 단백질, 중쇄(H쇄), 경쇄(L쇄), 단쇄 Fv(scFv), sc(Fv)2, 이황화 결합 Fv(sdFv), 이원항체, VHH 단편(Nanobody(등록상표))를 들 수 있다. 항체 관련 분자로서, 더 구체적으로는, 예를 들면, 트라스투주맙을 들 수 있다.
수용체 단백질은 특별히 제한되지 않고, 예를 들면, 생리활성 단백질이나 그 밖의 생리활성 물질에 대한 수용체 단백질이라도 좋다. 그 밖의 생리활성 물질로서는, 예를 들면, 도파민 등의 신경전달물질을 들 수 있다. 또한, 수용체 단백질은, 대응하는 리간드가 알려져 있지 않은 희귀 수용체라도 좋다.
백신으로서 사용되는 항원 단백질은 면역 반응을 유도할 수 있는 것이면 특별히 제한되지 않고, 상정하는 면역 반응의 대상에 따라 적절히 선택하면 좋다.
또한, 그 밖의 단백질로서, 간형 지방산 결합 단백질(Liver-type fatty acid-binding protein, LFABP), 형광 단백질, 면역글로블린 결합 단백질, 알부민, 세포 외 단백질을 들 수 있다. 형광 단백질로서는 녹색 형광 단백질(GFP)을 들 수 있다. 면역글로블린 결합 단백질로서는 단백질 A, 단백질 G, 단백질 L을 들 수 있다. 알부민으로서는 인간 혈청 알부민을 들 수 있다.
세포 외 단백질로서는, 피브로넥틴, 비트로넥틴, 콜라겐, 오스테오폰틴, 라미닌, 이들의 부분 서열을 들 수 있다. 라미닌은 α쇄, β쇄, 및 γ쇄로 이루어지는 헤테로 3량체 구조를 갖는 단백질이다. 라미닌으로서는, 포유류의 라미닌을 들 수 있다. 포유류로서는, 인간, 원숭이, 침팬지 등의 영장류, 마우스, 쥐, 햄스터, 모르모트 등의 설치류, 토끼, 말, 소, 양, 염소, 돼지, 개, 고양이 등 그 밖의 각종 포유류를 들 수 있다. 포유류로서는, 특히 인간을 들 수 있다. 라미닌의 서브유닛쇄(즉, α쇄, β쇄, 및 γ쇄)로서는, 5종의 α쇄(α1 내지 α5), 3종의 β쇄(β1 내지 β3), 3종의 γ쇄(γ1 내지 γ3)를 들 수 있다. 라미닌은 이들 서브유닛쇄의 조합에 의해 다양한 동형들을 구성한다. 라미닌으로서, 구체적으로는, 예를 들면, 라미닌 111, 라미닌 121, 라미닌 211, 라미닌 213, 라미닌 221, 라미닌 311, 라미닌 321, 라미닌 332, 라미닌 411, 라미닌 421, 라미닌 423, 라미닌 511, 라미닌 521, 라미닌 523을 들 수 있다. 라미닌의 부분 서열로서는, 라미닌의 E8 단편인 라미닌 E8을 들 수 있다. 라미닌 E8은, 구체적으로는, α쇄의 E8 단편(α쇄 E8), β쇄의 E8 단편(β쇄 E8), 및 γ쇄의 E8 단편(γ쇄 E8)으로 이루어지는 헤테로 3량체 구조를 갖는 단백질이다. 라미닌 E8의 서브유닛쇄(즉, α쇄 E8, β쇄 E8, 및 γ쇄 E8)를 총칭하여 「E8 서브유닛쇄」이라고도 한다. E8 서브유닛쇄로서는, 상기 예시한 라미닌 서브유닛쇄의 E8 단편을 들 수 있다. 라미닌 E8은 이들 E8 서브유닛쇄의 조합에 의해 다양한 동형들을 구성한다. 라미닌 E8로서, 구체적으로는, 예를 들면, 라미닌 111E8, 라미닌 121E8, 라미닌 211E8, 라미닌 221E8, 라미닌 332E8, 라미닌 421E8, 라미닌 411E8, 라미닌 511E8, 라미닌 521E8을 들 수 있다.
이들 단백질 등의 이종 단백질을 코딩하는 유전자는 그대로, 또는 적절히 개변하여 이용할 수 있다. 이종 단백질을 코딩하는 유전자는, 예를 들면, 사용하는 숙주에 따라, 및/또는 원하는 활성을 얻기 위해 개변할 수 있다. 예를 들면, 이종 단백질을 코딩하는 유전자는, 코딩되는 이종 단백질의 아미노산 서열에 1개 또는 여러 개의 아미노산의 치환, 결실, 삽입 및/또는 부가가 포함되도록 개변되어도 좋다. 상기한 RegX3 단백질 및 regX3 유전자의 변이체에 관한 기재는, 본 발명의 방법에 의해 분비 생산되는 이종 단백질 및 이를 코딩하는 유전자에도 준용할 수 있다. 또한, 유래하는 생물종으로 특정되는 단백질은, 당해 생물종에서 발견되는 단백질 자체에 한정되지 않고, 당해 생물종에서 발견되는 단백질의 아미노산 서열을 갖는 단백질 및 이들의 변이체도 포함하는 것으로 한다. 이들 변이체는 당해 생물종에서 발견되어도 좋고, 발견되지 않아도 좋다. 즉, 예를 들면, 「인간 유래 단백질」이란, 인간에게서 발견되는 단백질 자체에 한정되지 않고, 인간에게서 발견되는 단백질의 아미노산 서열을 갖는 단백질 및 이들의 변이체를 포함하는 것으로 한다. 또한, 이종 단백질을 코딩하는 유전자는, 임의의 코돈을 그것과 등가의 코돈으로 치환한 것이라도 좋다. 예를 들면, 이종 단백질을 코딩하는 유전자는, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변되어도 좋다.
본 발명의 유전자 구축물은, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열을 포함하고 있어도 좋다. 효소적 절단에 사용되는 아미노산 서열을 본 발명의 융합 단백질에 삽입함으로써, 발현된 융합 단백질을 효소적으로 절단하여 목적의 이종 단백질을 얻을 수 있다.
효소적 절단에 사용되는 아미노산 서열은, 펩타이드 결합을 가수분해하는 효소에 의해 인식되고 절단되는 서열이면 특별히 제한되지 않고, 목적의 이종 단백질의 아미노산 서열에 따라 사용 가능한 서열을 적절히 선택하면 좋다. 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열은, 이 아미노산 서열에 기초하여 적절히 설계할 수 있다. 예를 들면, 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열은, 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 설계할 수 있다.
효소적 절단에 사용되는 아미노산 서열은, 기질 특이성이 높은 프로테아제의 인식 서열인 것이 바람직하다. 이러한 아미노산 서열로서, 구체적으로는, 예를 들면, 인자 Xa 프로테아제의 인식 서열이나 proTEV 프로테아제의 인식 서열을 들 수 있다. 인자 Xa 프로테아제는 단백질 중의 Ile-Glu-Gly-Arg(=IEGR, 서열번호 37)의 아미노산 서열을, proTEV 프로테아제는 단백질 중의 Glu-Asn-Leu-Tyr-Phe-Gln(=ENLYFQ, 서열번호 38)의 아미노산 서열을 인식하고, 각 서열의 C 말단측을 특이적으로 절단한다.
본 발명의 방법에 의해 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 동일해도 좋고, 천연의 단백질과 동일하지 않아도 좋다. 예를 들면, 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 비교하여, 1개 또는 여러 개의 아미노산을 여분으로 부가된, 또은 결실된 것이라도 좋다. 또한 상기 「1개 또는 여러 개」란, 목적의 이종 단백질의 전체 길이나 구조 등에 따라서도 다르지만, 구체적으로는 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더 바람직하게는 1 내지 5개, 특히 바람직하게는 1 내지 3개를 의미한다.
또한, 분비 생산되는 이종 단백질은 프로 구조부가 부가된 단백질(프로단백질)이라도 좋다. 분비 생산되는 이종 단백질이 프로단백질인 경우, 최종적으로 얻어지는 이종 단백질은 프로단백질이라도 좋고, 그렇지 않아도 좋다. 즉, 프로단백질은 프로 구조부를 절단하여 성숙 단백질이 되어도 좋다. 절단은, 예를 들면, 프로테아제에 의해 행할 수 있다. 프로테아제를 사용하는 경우에는, 최종적으로 얻어지는 단백질의 활성이라는 관점에서, 프로단백질은 일반적으로는 천연의 단백질과 거의 같은 위치에서 절단되는 것이 바람직하고, 천연의 단백질과 완전하게 같은 위치에서 절단되어 천연의 것과 동일한 성숙 단백질이 얻어지는 것이 보다 바람직하다. 따라서, 일반적으로는, 천연에서 생기는 성숙 단백질과 동일한 단백질이 생기는 위치에서 프로단백질을 절단하는 특이적 프로테아제가 가장 바람직하다. 그러나, 상술한 바와 같이, 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 동일하지 않아도 좋다. 예를 들면, 생산되는 이종 단백질의 종류나 사용 목적 등에 따라서는, 천연의 단백질에 비해 N 말단이 아미노산 잔기 1 내지 여러 개분으로 길거나 짧은 단백질이 보다 적절한 활성을 갖는 경우가 있다. 본 발명에서 사용할 수 있는 프로테아제에는, 디스파제(Dispase, 베링거 만하임사 제조)과 같은 상업적으로 입수할 수 있는 것 이외에, 미생물의 배양액, 예를 들면 방선균의 배양액 등으로부터 얻어지는 것이 포함된다. 이러한 프로테아제는 미정제 상태에서 사용할 수도 있고, 필요에 따라 적당한 순도까지 정제한 후에 사용해도 좋다. 또한, 프로 구조부를 절단하여 성숙 단백질을 얻는 경우에는, 삽입한 Gln-Glu-Thr을 포함하는 아미노산 서열은 프로 구조부와 함께 절단 제거되기 때문에, Gln-Glu-Thr을 포함하는 아미노산 서열 후에 효소적 절단에 사용되는 아미노산 서열을 제공하지 않아도 목적의 단백질을 얻을 수 있다.
본 발명에 사용되는 유전자 구축물을 코리네형 세균에 도입하는 수법은 특별히 제한되지 않는다. 「본 발명에 사용되는 유전자 구축물의 도입」이란, 이 유전자 구축물을 숙주에 유지시키는 것을 말한다. 「본 발명에 사용되는 유전자 구축물의 도입」에는, 미리 구축한 이 유전자 구축물을 숙주에 일괄하여 도입하는 경우에 한정되지 않고, 적어도 이종 단백질 유전자가 숙주에 도입되고, 숙주 내에서 이 유전자 구축물이 구축되는 경우도 포함된다. 본 발명의 세균에 있어서, 본 발명에 사용되는 유전자 구축물은, 플라스미드와 같이 염색체 외에서 자율 증식하는 벡터 위에 존재해 있어도 좋고, 염색체 위에 편입되어 있어도 좋다. 본 발명에 사용되는 유전자 구축물의 도입은, 예를 들면, 상기한 유전자의 발현을 상승시키는 수법에서의 유전자의 도입과 마찬가지로 행할 수 있다. 또한, 본 발명의 세균을 구축함에 있어서, 본 발명에 사용되는 유전적 구축물의 도입, 특정한 성질의 부여, 및 그 외의 개변은 임의의 순서로 행할 수 있다.
본 발명에 사용되는 유전자 구축물은, 예를 들면, 이 유전자 구축물을 포함하는 벡터를 사용하여 숙주에 도입할 수 있다. 예를 들면, 본 발명에 사용되는 유전자 구축물을 벡터와 연결하여 이 유전자 구축물의 발현 벡터를 구축하고, 당해 발현 벡터로 숙주를 형질 전환함으로써, 이 유전자 구축물을 숙주에 도입할 수 있다. 또한, 예를 들면, 벡터가 코리네형 세균에서 기능하는 프로모터를 구비할 경우, 당해 프로모터의 하류에 본 발명의 융합 단백질을 코딩하는 염기서열을 연결함으로써도, 본 발명에 사용되는 유전자 구축물의 발현 벡터를 구축할 수 있다. 벡터는, 코리네형 세균에서 자율 복제 가능한 것이면 특별히 제한되지 않는다. 코리네형 세균에서 이용할 수 있는 벡터에 대해서는 상술한 바와 같다.
또한, 본 발명에 사용되는 유전자 구축물은, 예를 들면, 인공 트랜스포존 등의 트랜스포존을 사용하여 숙주의 염색체 위에 도입할 수 있다. 트랜스포존이 사용되는 경우에는, 상동 재조합 또는 그 자신의 전이능에 의해 본 발명에 사용되는 유전자 구축물이 염색체 위에 도입된다. 또한, 본 발명에 사용되는 유전자 구축물은 그 외에, 상동 재조합을 이용하는 도입법에 의해 숙주의 염색체 위에 도입할 수 있다. 상동 재조합을 이용하는 도입법으로서는, 예를 들면, 직쇄상 DNA, 온도 감수성 복제 기점을 포함하는 플라스미드, 접합 전달 가능한 플라스미드, 또는 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터 등을 사용하는 방법을 들 수 있다. 또한, 적어도 이종 단백질 유전자를 염색체 위에 도입하고, 본 발명에 사용되는 유전자 구축물을 염색체 위에 구축해도 좋다. 이 경우, 이종 단백질 유전자 이외의, 본 발명에 사용되는 유전자 구축물의 구성 요소의 일부 또는 전부는 숙주의 염색체 위에 원래 존재하는 것이라도 좋다. 구체적으로는, 예를 들면, 숙주의 염색체 위에 원래 존재하는 프로모터 서열과 이 프로모터 서열의 하류에 접속된 신호 펩타이드를 코딩하는 핵산 서열을 그대로 이용하고, 이 신호 펩타이드를 코딩하는 핵산 서열의 하류에 접속된 유전자만을 목적의 이종 단백질 유전자로 치환함으로써도, 염색체 위에 본 발명에 사용되는 유전자 구축물이 구축되고, 본 발명의 세균을 구축할 수 있다. 이종 단백질 유전자 등의, 본 발명에 사용되는 유전자 구축물의 일부의 염색체로의 도입은, 본 발명에 사용되는 유전자 구축물의 염색체로의 도입과 마찬가지로 행할 수 있다.
본 발명에 사용되는 유전자 구축물이나 그 구성 요소(프로모터 서열, 신호 펩타이드를 코딩하는 핵산 서열, 이종 단백질을 코딩하는 핵산 서열 등)는, 예를 들면, 클로닝에 의해 취득할 수 있다. 구체적으로는, 예를 들면, 목적의 이종 단백질을 갖는 생물로부터의 클로닝에 의해 이종 단백질 유전자를 취득하고, 신호 펩타이드를 코딩하는 염기서열의 도입이나 프로모터 서열의 도입 등의 개변을 행하여, 본 발명에 사용되는 유전자 구축물을 취득할 수 있다. 또한, 본 발명에 사용되는 유전자 구축물이나 그 구성 요소는 화학 합성에 의해서도 취득할 수 있다(Gene, 60(1), 115-127(1987)). 취득한 유전자 구축물이나 그 구성 요소는 그대로, 또는 적절히 개변하여 이용할 수 있다.
또한, 2 이상의 종류의 단백질이 발현되는 경우, 각 단백질의 분비 발현용의 유전자 구축물은, 목적의 이종 단백질의 분비 발현을 달성할 수 있도록 본 발명의 세균에 유지되어 있으면 좋다. 구체적으로는, 예를 들면, 각 단백질의 분비 발현용의 유전자 구축물은, 모두가 단일의 발현 벡터 위에 유지되어 있어도 좋고, 모두가 염색체 위에 유지되어 있어도 좋다. 또한, 각 단백질의 분비 발현용의 유전자 구축물은, 복수의 발현 벡터 위에 각각 유지되어 있어도 좋고, 단일 또는 복수의 발현 벡터 위와 염색체 위에 각각 유지되어 있어도 좋다. 「2 이상의 종류의 단백질이 발현되는 경우」란, 예를 들면, 2 이상의 종류의 이종 단백질이 분비 생산되는 경우나, 헤테로 다량체 단백질이 분비 생산되는 경우를 말한다.
본 발명에 사용되는 유전자 구축물의 코리네형 세균으로의 도입 방법은 특별히 한정되지 않고, 일반적으로 사용되는 방법, 예를 들면, 원형질법 (Gene, 39, 281-286(1985)), 전기천공법(Bio/Technology, 7, 1067-1070(1989)), 전기 펄스법(일본 공개특허공보 특개평2-207791호) 등을 사용할 수 있다.
<2> 이종 단백질의 제조 방법
상기한 바와 같이 하여 얻어지는 본 발명의 세균을 배양하고, 이종 단백질을 발현시킴으로써, 균체 외에 분비된 다량의 이종 단백질이 얻어진다.
본 발명의 세균은 통상 사용되는 방법 및 조건에 따라 배양할 수 있다. 예를 들면, 본 발명의 세균은 탄소원, 질소원, 무기 이온을 함유하는 통상의 배지에서 배양할 수 있다. 또한 높은 증식을 얻기 위해서, 비타민, 아미노산 등의 유기 미량 영양소를 필요에 따라 첨가할 수도 있다.
탄소원으로서는 글루코스 및 수크로스와 같은 탄수화물, 아세트산과 같은 유기산, 알코올류, 그 외를 사용할 수 있다. 질소원으로서는 암모니아 가스, 암모니아수, 암모늄염, 그 외를 사용할 수 있다. 무기 이온으로서는 칼슘 이온, 마그네슘 이온, 인산 이온, 칼륨 이온, 철 이온 등을 필요에 따라 적절히 사용한다. 배양은 pH 5.0 내지 8.5, 15℃ 내지 37℃의 적절한 범위로 호기적 조건 하에서 행하고, 1 내지 7일간 정도 배양한다. 또한, 코리네형 세균의 L-아미노산 생산에서의 배양 조건이나, 그 외 Sec계 의존, Tat계 의존의 신호 펩타이드를 사용한 단백질의 제조법에 기재된 조건을 사용할 수 있다(WO01/23591, WO2005/103278 참조). 또한, 이종 단백질의 발현을 위해 유도형 프로모터를 사용한 경우에는, 배지에 프로모터 유도제를 첨가하여 배양을 행할 수도 있다. 이러한 조건 하에서 본 발명의 세균을 배양함으로써, 목적 단백질은 균체 내에서 다량으로 생산되어 효율적으로 균체 외에 분비된다. 또한, 본 발명의 방법에 의하면, 생산된 이종 단백질은 균체 외에 분비되기 때문에, 예를 들면 트랜스글루타미나아제 등의 미생물의 균체 내에서 다량으로 축적되면 일반적으로 치사적인 단백질도, 치사적 영향을 받지 않고 연속적으로 생산할 수 있다.
본 발명의 방법에 의해 배지 중에 분비된 단백질은, 당업자에게 잘 알려진 방법에 따라 배양 후의 배지로부터 분리 정제할 수 있다. 예를 들면, 균체를 원심분리 등에 의해 제거한 후, 염석, 에탄올 침전, 한외 여과, 겔 여과 크로마토그래피, 이온 교환 컬럼 크로마토그래피, 친화성 크로마토그래피, 중고압 액체 크로마토그래피, 역상 크로마토그래피, 소수성 크로마토그래피 등 알려진 적절한 방법, 또는 이들을 조합함으로써 분리 정제할 수 있다. 또한, 어떤 경우에는, 배양물이나 배양 상청을 그대로 사용해도 좋다. 본 발명의 방법에 의해 균체 표층에 분비된 단백질도 당업자에게 잘 알려진 방법, 예를 들면 염 농도의 상승, 계면활성제의 사용 등에 의해 가용화한 후에, 배지 중에 분비된 경우와 마찬가지로 하여 분리 정제할 수 있다. 또한, 어떤 경우에는, 균체 표층에 분비된 단백질을 가용화하지 않고, 예를 들면 고정화 효소로서 사용해도 좋다.
목적의 이종 단백질이 분비 생산된 것은, 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로 하여 SDS-PAGE를 행하여, 분리된 단백질 밴드의 분자량을 확인함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 분비 생산된 것은, 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로 하여, 항체를 사용한 웨스턴 블롯팅에 의해 확인할 수 있다(Molecular cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). 또한, 목적의 이종 단백질이 분비 생산된 것은, 단백질 서열분석기를 사용하여 목적 단백질의 N 말단 아미노산 서열을 검출함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 분비 생산된 것은, 질량 분석계를 사용하여 목적 단백질의 질량을 결정함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 효소나 어떤 측정 가능한 생리활성을 갖는 것인 경우에는, 목적의 이종 단백질이 분비 생산된 것은, 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로 하여, 목적의 이종 단백질의 효소활성 또는 생리활성을 측정함으로써 확인할 수 있다.
실시예
이하, 실시예를 참조하여 본 발명을 더 구체적으로 설명하지만, 본 발명은 이들 실시예에 한정되는 것은 아니다.
실시예 1: regX3 유전자를 결손시킨 코리네박테리움 글루타미쿰의 구축
(1) regX3 유전자 결손용 벡터 pBS5TΔregX3의 구축
C. 글루타미쿰 ATCC 13869주의 유전체 서열 및 2성분 제어계 SenX3-RegX3의 반응 조절인자 RegX3을 코딩하는 regX3 유전자의 염기서열은 이미 결정되어 있다(GenBank 등록번호 AP017557, NCBI locus_tag CGBL_0104880).
PurEluteTM 유전체 DNA 키트(EdgeBio)를 사용하여 조제한 C. 글루타미쿰 ATCC 13869주의 염색체 DNA를 주형으로 하여, 서열번호 49와 서열번호 50의 프라이머를 사용하여 regX3 유전자의 5'측 상류 약 1 kbp를, 서열번호 51과 서열번호 52의 프라이머를 사용하여 regX3 유전자의 3'측 하류 약 1 kbp의 영역을, 각각 PCR법에 의해 증폭하였다. 다음에, 증폭된 양 DNA 단편을 주형으로, 서열번호 49와 서열번호 52에 나타낸 DNA를 프라이머로서 사용한 PCR법에 의해 양 DNA 단편이 융합된 약 2 kbp의 DNA 단편을 얻었다. PCR에는 Pyrobest® DNA 폴리머라제(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편을 WO2006/057450에 기재된 pBS5T의 SmaI 부위에 삽입함으로써, regX3 유전자 결손용의 벡터 pBS5TΔregX3을 얻었다. 결찰 반응에는 DNA 결찰 키트<Mighty Mix>(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.
(2) YDK010::phoS(W302C)주의 regX3 유전자 결손주의 구축
실시예 1(1)에서 구축한 pBS5TΔregX3으로, WO2016/171224에 기재된YDK010::phoS(W302C)주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, regX3 유전자가 결손된 YDK010::phoS(W302C)ΔregX3주를 얻었다.
실시예 2: hrrA 유전자를 결손시킨 코리네박테리움 글루타미쿰의 구축
(1) hrrA 유전자 결손용 벡터 pBS5TΔhrrA의 구축
C. 글루타미쿰 ATCC 13869주의 유전체 서열 및 2성분 제어계 HrrSA의 반응 조절인자 HrrA를 코딩하는 hrrA 유전자의 염기서열은 이미 결정되어 있다(GenBank 등록번호 AP017557, NCBI locus_tag CGBL_0128750).
PurEluteTM 유전체 DNA 키트(EdgeBio)를 사용하여 조제한 C. 글루타미쿰 ATCC 13869주의 염색체 DNA를 주형으로 하여, 서열번호 53과 서열번호 54의 프라이머를 사용하여 hrrA 유전자의 5'측 상류 약 1 kbp를, 서열번호 55와 서열번호 56의 프라이머를 사용하여 hrrA 유전자의 3'측 하류 약 1 kbp의 영역을, 각각 PCR법에 의해 증폭하였다. PCR에는 Pyrobest® DNA 폴리머라제(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 증폭된 각각 약 1 kbp의 DNA 단편을 아가로스 겔 전기영동 후, 목적의 밴드를 잘라내고, Wizard® SV 겔 및 PCR 클린업 시스템(Promega)을 사용하여 겔에서 회수하였다. 회수한 2개의 DNA 단편을, 인퓨전 반응에 의해 WO2006/057450에 기재된 pBS5T의 SmaI 부위에 삽입함으로써, hrrA 유전자 결손용 벡터 pBS5TΔhrrA를 얻었다. 인퓨전 반응에는 인퓨전® HD 클로닝 키트(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.
(2) YDK010::phoS(W302C)주의 hrrA 유전자 결손주의 구축
실시예 2(1)에서 구축한 pBS5TΔhrrA로, WO2016/171224에 기재된YDK010::phoS(W302C)주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, hrrA 유전자가 결손된 YDK010::phoS(W302C)ΔhrrA주를 얻었다.
실시예 3: hrcA 유전자를 결손시킨 코리네박테리움 글루타미쿰의 구축
(1) hrrA 유전자 결손용 벡터 pBS5TΔhrcA의 구축
C. 글루타미쿰 ATCC 13869주의 유전체 서열 및 열 충격 단백질의 전사 제어 인자 HrcA를 코딩하는 hrcA 유전자의 염기서열은 이미 결정되어 있다(GenBank 등록번호 AP017557, NCBI locus_tag CGBL_0121890).
PurEluteTM 유전체 DNA 키트(EdgeBio)를 사용하여 조제한 C. 글루타미쿰 ATCC 13869주의 염색체 DNA를 주형으로 하여, 서열번호 57과 서열번호 58의 프라이머를 사용하여 hrcA 유전자의 5'측 상류 약 1 kbp를, 서열번호 59와 서열번호 60의 프라이머를 사용하여 hrcA 유전자의 3'측 하류 약 1 kbp의 영역을, 각각 PCR법에 의해 증폭하였다. 다음에, 증폭된 양 DNA 단편을 주형으로, 서열번호 57과 서열번호 60에 나타낸 DNA를 프라이머로서 사용한 PCR법으로 의해 양 DNA 단편이 융합된 약 2 kbp의 DNA 단편을 얻었다. PCR에는 Pyrobest® DNA 폴리머라제(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편을 WO2006/057450에 기재된 pBS5T의 SmaI 부위에 삽입함으로써, hrcA 유전자 결손용의 벡터 pBS5TΔhrcA를 얻었다. 결찰 반응에는 DNA 결찰 키트<Mighty Mix>(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.
(2) YDK010::phoS(W302C)주의 hrcA 유전자 결손주의 구축
실시예 3(1)에서 구축한 pBS5TΔhrcA로, WO2016/171224에 기재된YDK010::phoS(W302C)주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, hrcA 유전자가 결손된 YDK010::phoS(W302C)ΔhrcA주를 얻었다.
실시예 4: regX3 및 hrcA 유전자를 2중 결손시킨 코리네박테리움 글루타미쿰의 구축
실시예 3(1)에서 구축한 pBS5TΔhrcA로, 실시예 1(2)에서 구축한 YDK010::phoS(W302C)ΔregX3주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, regX3 유전자와 hrcA 유전자가 2중 결손된 YDK010::phoS(W302C)ΔregX3ΔhrcA주를 얻었다.
실시예 5: hrrA 및 hrcA 유전자를 2중 결손시킨 코리네박테리움 글루타미쿰의 구축
실시예 3(1)에서 구축한 pBS5TΔhrcA로, 실시예 2(2)에서 구축한 YDK010::phoS(W302C)ΔhrrA주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, hrrA 유전자와 hrcA 유전자가 2중 결손된 YDK010::phoS(W302C)ΔhrrAΔhrcA주를 얻었다.
실시예 6: regX3 및 hrrA 유전자를 2중 결손시킨 코리네박테리움 글루타미쿰의 구축
실시예 2(1)에서 구축한 pBS5TΔhrrA로, 실시예 1(2)에서 구축한 YDK010::phoS(W302C)ΔregX3주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, regX3 유전자와 hrrA 유전자가 2중 결손된 YDK010::phoS(W302C)ΔregX3ΔhrrA주를 얻었다.
실시예 7: regX3, hrrA, 및 hrcA 유전자를 3중 결손시킨 코리네박테리움 글루타미쿰의 구축
실시예 2(1)에서 구축한 pBS5TΔhrrA로, 실시예 4(2)에서 구축한 YDK010::phoS(W302C)ΔregX3ΔhrcA주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, regX3 유전자와 hrrA 유전자와 hrcA 유전자가 3중 결손된 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA주를 얻었다.
실시예 8: regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 VHH 항체 N15의 분비 발현
(1) VHH 항체 N15의 분비 발현 플라스미드의 구축
단백질 IZUMO1의 N 말단 도메인에 대한 VHH 항체 N15의 아미노산 서열은 이미 결정되어 있다(DDBJ 등록번호: AB926006). 이 아미노산 서열을 <서열번호 61>에 나타내었다. C. 글루타미쿰의 코돈 사용 빈도를 고려하여, N15를 코딩하는 염기서열을 디자인하였다. 디자인한 염기서열을 <서열번호 62>에 나타낸다. 다음에, C. 글루타미쿰 ATCC 13869주 유래의 cspB 유전자의 프로모터의 하류에 C. 암모니아게네스 ATCC 6872주 유래의 CspA(SlpA라고도 한다; GenBank 등록번호 BAB62413)의 신호 펩타이드 25 아미노산 잔기를 코딩하는 DNA 및 <서열번호 62>에 기재된 DNA를 연결하고, 또한 5'-측에 KpnI 부위를, 3'-측에 BamHI 부위를 부가한 신호 펩타이드와 N15와의 융합 단백질(이하, 단지 N15로 표기한다)의 발현 카세트를 전부 합성하였다. 전부 합성한 DNA 단편을 제한 효소 KpnI 및 BamHI로 처리한 후에, 일본 공개특허공보 특개평9-322774에 기재된 pPK4의 KpnI-BamHI 부위에 삽입함으로써, N15의 분비 발현 플라스미드인 pPK4_CspAss_N15를 구축하였다. 삽입 단편의 염기서열 결정의 결과, 설계대로의 N15를 코딩하는 유전자가 구축되어 있는 것을 확인하였다. 염기서열의 결정은 BigDye® 터미네이터(v3.1) 사이클 시퀀싱 키트 (Applied Biosystems)와 3130 유전자 분석기 (Applied Biosystems)를 사용하여 행하였다.
(2) regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 VHH 항체 N15의 분비 발현
실시예 8(1)에서 얻어진 N15의 분비 발현 플라스미드 pPK4_CspAss_N15를 사용하여, C. 글루타미쿰 YDK010::phoS(W302C)주, 실시예 4에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrcA주, 실시예 5에서 얻어진 YDK010::phoS(W302C)ΔhrrAΔhrcA주, 실시예 6에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrA주, 및 실시예 7에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA주를 각각 형질전환하고, YDK010::phoS(W302C)/pPK4_CspAss_N15주, YDK010::phoS(W302C)ΔregX3ΔhrcA/pPK4_CspAss_N15주, YDK010::phoS(W302C)ΔhrrAΔhrcA/pPK4_CspAss_N15주, YDK010::phoS(W302C)ΔregX3ΔhrrA/pPK4_CspAss_N15주, 및 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA/pPK4_CspAss_N15주를 얻었다.
얻어진 각 형질 전환체를, 25mg/L의 카나마이신을 포함하는 MMTG 액체 배양지(글루코스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, HCl로 수득한 대두염산 가수분해액 0.2g(총 질소량), 탄산칼슘 50g, 물로 1L로 하여 pH 7.0으로 조정)에서 각각 30℃, 72시간 배양하였다.
배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 6.5μL을 환원 SDS-PAGE에 제공하고나서 SYPRO 오렌지(Life technologies)로 염색을 행하였다. 그 결과, 각종 결손주에서는, YDK010::phoS(W302C)주와 비교하여, N15 분비량이 현저하게 향상되어 있었다(도 1).
염색 후, 화상 분석 소프트웨어인 Multi Gauge(FUJIFILM)를 사용하여 N15의 밴드 강도의 수치화를 행하고, 각종 결손주에서 N15를 발현시켰을 때의 밴드 강도를, YDK010::phoS(W302C)주에서 N15를 발현시켰을 때의 밴드 강도를 1.00으로 했을 때의 상대값으로서 산출하였다. 그 결과, 각종 결손주에서는, 2.49배 내지 4.70배의 범위에서 N15의 분비량이 향상되고 있는 것을 확인하였다(표 1).
이러한 사실로부터, regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자 결손은, YDK010::phoS(W302C)주에서의 N15 분비 생산에 있어서, 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다.
실시예 9: regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 간형 지방산 결합 단백질(LFABP)의 분비 발현
WO2016/171224에 기재된 pPK4_CspB6Xa-LFABP를 사용하여, C. 글루타미쿰 YDK010::phoS(W302C)주, 실시예 4에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrcA주, 실시예 5에서 얻어진 YDK010::phoS(W302C)ΔhrrAΔhrcA주, 실시예 6에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrA주, 및 실시예 7에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA주를 각각 형질전환하고, YDK010::phoS(W302C)/pPK4_CspB6Xa-LFABP주, YDK010::phoS(W302C)ΔregX3ΔhrcA/pPK4_CspB6Xa-LFABP주, YDK010::phoS(W302C)ΔhrrAΔhrcA/pPK4_CspB6Xa-LFABP주, YDK010::phoS(W302C)ΔregX3ΔhrrA/pPK4_CspB6Xa-LFABP주, 및 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA/pPK4_CspB6Xa-LFABP주를 얻었다. pPK4_CspB6Xa-LFABP는, 인간의 간형 지방산 결합 단백질(이하, LFABP라고 표기한다)의 분비 발현 플라스미드이다. pPK4_CspB6Xa-LFABP는, C. 글루타미쿰 ATCC 13869주 유래의 cspB 유전자(PS2 유전자)의 프로모터, 및 이 프로모터의 하류에 발현 가능하게 연결된 C. 글루타미쿰 ATCC 13869주 유래의 CspB의 신호 펩타이드 30 아미노산 잔기, 이 주(株) 유래의 CspB 성숙 단백질의 N 말단 6 아미노산 잔기, 인자 Xa 프로테아제의 인식 서열 IEGR, 및 LFABP의 융합 단백질(이하, CspB6Xa-LFABP라고 표기한다)을 코딩하는 유전자를 갖는다.
얻어진 각 형질 전환체를, 25mg/L의 카나마이신을 포함하는 MMTG 액체 배양지(글루코스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, HCl로 수득한 대두염산 가수분해액 0.2g(총 질소량), 탄산칼슘 50g, 물로 1L로 하여 pH 7.0으로 조정)에서 각각 30℃, 72시간 배양하였다.
배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 2.0μL을 환원 SDS-PAGE에 제공하고나서 SYPRO 오렌지(Life technologies)로 염색을 행하였다. 그 결과, 각종 결손주에서는 YDK010::phoS(W302C)주와 비교하여, CspB6Xa-LFABP 분비량이 현저하게 향상되어 있었다(도 2).
염색 후, 화상 분석 소프트웨어인 Multi Gauge(FUJIFILM)를 사용하여 CspB6Xa-LFABP의 밴드 강도의 수치화를 행하고, 각종 결손주에서 CspB6Xa-LFABP를 발현시켰을 때의 밴드 강도를, YDK010::phoS(W302C)주에서 CspB6Xa-LFABP를 발현시켰을 때의 밴드 강도를 1.00으로 했을 때의 상대값으로서 산출하였다. 그 결과, 각종 결손주에서는, 2.04배 내지 5.13배의 범위에서 CspB6Xa-LFABP의 분비량이 향상되고 있는 것을 확인하였다(표 2).
이러한 사실로부터, regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자 결손은, YDK010::phoS(W302C)주에서의 CspB6Xa-LFABP 분비 생산에 있어서도, 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다.
실시예 10: regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 염기성 섬유아세포 성장인자(bFGF)의 분비 발현
(1) Tat계 분비 시스템을 코딩하는 tatABC 유전자와 TorA 신호 서열이 부가된 염기성 섬유아세포 성장인자(bFGF)을 코딩하는 유전자의 공발현 플라스미드의 구축
인간의 염기성 섬유아세포 성장인자(bFGF)의 아미노산 서열은 이미 결정되어 있다(DDBJ 등록번호: E61144). 이 아미노산 서열을 <서열번호 63>에 나타내었다. C. 글루타미쿰의 코돈 사용 빈도를 고려하여, bFGF 을 코딩하는 염기서열을 디자인하였다. 디자인한 염기서열을 <서열번호 64>에 나타내었다.
다음에, C. 글루타미쿰 ATCC 13869주 유래의 cspB 유전자의 프로모터의 하류에 E. 콜라이 유래의 TorA 단백질(UniProt 등록번호: P33225)의 신호 펩타이드 39 아미노산 잔기를 코딩하는 DNA 및 <서열번호 64>에 기재된 DNA를 연결하고, 또한 5'-측과 3'-측 양쪽에 KpnI 부위를 부가한 신호 펩타이드와 bFGF와의 융합 단백질(이하, 단지 bFGF라고 표기한다)의 발현 카세트를 전부 합성하였다. 전부 합성한 DNA 단편을 제한 효소 KpnI로 처리한 후에, WO2016/171224에 기재된 pPK6의 KpnI 부위에 삽입함으로써, bFGF의 분비 발현 플라스미드인 pPK6_T_bFGF를 구축하였다. 삽입 단편의 염기서열 결정의 결과, 설계대로의 bFGF를 코딩하는 유전자가 구축되어 있는 것을 확인하였다. 염기서열의 결정은 BigDye® 터미네이터(v3.1) 사이클 시퀀싱 키트 (Applied Biosystems)와 3130 유전자 분석기 (Applied Biosystems)를 사용하여 행하였다.
(2) regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 염기성 섬유아세포 성장인자(bFGF)의 분비 발현
실시예 10(1)에서 얻어진 bFGF의 분비 발현 플라스미드 pPK6_T_bFGF를 사용하여, C. 글루타미쿰 YDK010::phoS(W302C)주, 실시예 4에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrcA주, 실시예 5에서 얻어진 YDK010::phoS(W302C)ΔhrrAΔhrcA주, 실시예 6에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrA주, 및 실시예 7에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA주를 각각 형질전환하고, YDK010::phoS(W302C)/pPK6_T_bFGF주, YDK010::phoS(W302C)ΔregX3ΔhrcA/pPK6_T_bFGF주, YDK010::phoS(W302C)ΔhrrAΔhrcA/pPK6_T_bFGF주, YDK010::phoS(W302C)ΔregX3ΔhrrA/pPK6_T_bFGF주, 및 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA/pPK6_T_bFGF주를 얻었다.
얻어진 각 형질 전환체를, 25mg/L의 카나마이신을 포함하는 MMTG 액체 배양지(글루코스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, HCl로 수득한 대두염산 가수분해액 0.2g(총 질소량), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 각각 30℃, 72시간 배양하였다.
배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 1.0μL을 환원 SDS-PAGE에 제공하고나서 SYPRO 오렌지(Life technologies)로 염색을 행하였다. 그 결과, 각종 결손주에서는 YDK010::phoS(W302C)주와 비교하여, bFGF 분비량이 현저하게 향상되어 있었다(도 3).
염색 후, 화상 분석 소프트웨어인 Multi Gauge(FUJIFILM)를 사용하여 bFGF의 밴드 강도의 수치화를 행하고, 각종 결손주에서 bFGF를 발현시켰을 때의 밴드 강도를, YDK010::phoS(W302C)주에서 bFGF를 발현시켰을 때의 밴드 강도를 1.00으로 했을 때의 상대값으로서 산출하였다. 그 결과, 각종 결손주에서는, 1.69배 내지 3.08배의 범위에서 bFGF의 분비량이 향상되고 있는 것을 확인하였다(표 3).
이러한 사실로부터, regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자 결손은, YDK010::phoS(W302C)주에서의 TorA 신호 서열을 사용한 bFGF분비 생산에 있어서도, 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다. 즉, regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자 결손은 Sec계 분비 경로에 한정되지 않고, Tat계 분비 경로에서도, 이종 단백질 분비량을 유의적으로 향상시킬 수 있는 변이인 것을 알았다.
[산업상의 이용 가능성]
본 발명에 의해 이종 단백질을 효율적으로 분비 생산할 수 있다.
〔서열표의 설명〕
서열번호 1: C. 글루타미쿰 YDK010의 phoS 유전자의 염기서열
서열번호 2: C. 글루타미쿰 YDK010의 PhoS 단백질의 아미노산 서열
서열번호 3: C. 글루타미쿰 ATCC 13032의 PhoS 단백질의 아미노산 서열
서열번호 4: C. 글루타미쿰 ATCC 14067의 PhoS 단백질의 아미노산 서열
서열번호 5: C. 칼루나에의 PhoS 단백질의 아미노산 서열
서열번호 6: C. 크레나툼의 PhoS 단백질의 아미노산 서열
서열번호 7: C. 에피시엔스의 PhoS 단백질의 아미노산 서열
서열번호 8: C. 글루타미쿰 ATCC 13032의 phoR 유전자의 염기서열
서열번호 9: C. 글루타미쿰 ATCC 13032의 PhoR 단백질의 아미노산 서열
서열번호 10: C. 글루타미쿰 ATCC 13869의 cspB 유전자의 염기서열
서열번호 11: C. 글루타미쿰 ATCC 13869의 CspB 단백질의 아미노산 서열
서열번호 12: C. 글루타미쿰 ATCC 13032의 tatA 유전자의 염기서열
서열번호 13: C. 글루타미쿰 ATCC 13032의 TatA 단백질의 아미노산 서열
서열번호 14: C. 글루타미쿰 ATCC 13032의 tatB 유전자의 염기서열
서열번호 15: C. 글루타미쿰 ATCC 13032의 TatB 단백질의 아미노산 서열
서열번호 16: C. 글루타미쿰 ATCC 13032의 tatC 유전자의 염기서열
서열번호 17: C. 글루타미쿰 ATCC 13032의 TatC 단백질의 아미노산 서열
서열번호 18: TorA 신호 펩타이드의 아미노산 서열
서열번호 19: SufI 신호 펩타이드의 아미노산 서열
서열번호 20: PhoD 신호 펩타이드의 아미노산 서열
서열번호 21: LipA 신호 펩타이드의 아미노산 서열
서열번호 22: IMD 신호 펩타이드의 아미노산 서열
서열번호 23, 24: 트윈-아르기닌 모티프의 아미노산 서열
서열번호 25: PS1 신호 펩타이드의 아미노산 서열
서열번호 26: PS2 신호 펩타이드의 아미노산 서열
서열번호 27: SlpA 신호 펩타이드의 아미노산 서열
서열번호 28: C. 글루타미쿰 ATCC 13869의 CspB 성숙 단백질의 아미노산 서열
서열번호 29 내지 36: 본 발명에서 사용되는 삽입 서열의 일 양태의 아미노산 서열
서열번호 37: 인자 Xa 프로테아제의 인식 서열
서열번호 38: ProTEV 프로테아제의 인식 서열
서열번호 39: C. 글루타미쿰 ATCC 13869의 senX3 유전자의 염기서열
서열번호 40: C. 글루타미쿰 ATCC 13869의 SenX3 단백질의 아미노산 서열
서열번호 41: C. 글루타미쿰 ATCC 13869의 regX3 유전자의 염기서열
서열번호 42: C. 글루타미쿰 ATCC 13869의 RegX3 단백질의 아미노산 서열
서열번호 43: C. 글루타미쿰 ATCC 13869의 hrrS 유전자의 염기서열
서열번호 44: C. 글루타미쿰 ATCC 13869의 HrrS 단백질의 아미노산 서열
서열번호 45: C. 글루타미쿰 ATCC 13869의 hrrA 유전자의 염기서열
서열번호 46: C. 글루타미쿰 ATCC 13869의 HrrA 단백질의 아미노산 서열
서열번호 47: C. 글루타미쿰 ATCC 13869의 hrcA 유전자의 염기서열
서열번호 48: C. 글루타미쿰 ATCC 13869의 HrcA 단백질의 아미노산 서열
서열번호 49 내지 60: 프라이머
서열번호 61: VHH 항체 N15를 코딩하는 염기서열
서열번호 62: VHH 항체 N15의 아미노산 서열
서열번호 63: bFGF를 코딩하는 염기서열
서열번호 64: bFGF의 아미노산 서열
<110> Ajinomoto Co., Inc.
<120> METHOD FOR SECRETORY PRODUCTION OF PROTEIN
<130> E090-19068
<150> JP2018-081138
<151> 2018-04-20
<160> 64
<170> KoPatentIn 3.0
<210> 1
<211> 1458
<212> DNA
<213> Corynebacterium glutamicum
<400> 1
atggaaaacc cttatgtcgc tgcgctcgat gacgataaaa aagaagtcgg cgcaataaaa 60
gaagcagaaa aagaacctga aataggtccc atcagagctg ccggacgagc cataccgctg 120
cgcacccgca tcattttgat cgtggtgggt atcgccgggc ttggtttgct ggtcaacgcg 180
attgctgttt ccagcctcat gcgtgaagtt tcctataccc gcatggatca agagctagag 240
acctcgatgg ggacgtgggc gcataacgtt gagctgttta atttcgatgg cgtccgccaa 300
gggccaccca gcgattatta tgtggccaag gtttttcctg atggatccag cattattttc 360
aacgatgcac aatcggcacc caatctagct gaaaccacca tcggtactgg tccacacact 420
gtggatgctg ctagcggttc tgcctccaac actccgtggc gtgtgatggc ggaaaagaac 480
ggtgacatta tcaccgtggt gggtaaaagc atggggcgtg aaacaaacct gctgtaccga 540
ttggtgatgg tgcagatgat catcggcgcg ctgattctgg ttgctatttt gattacttca 600
ctcttcctag tcagacgctc gttgcggccg ttgagagaag ttgaagagac cgccaccagg 660
attgcgggcg gtgatttgga tcgacgtgtc ccgcagtggc caatgaccac agaagtcgga 720
cagctgtcga atgccctcaa tatcatgttg gagcagctcc aagcctcaat tctgaccgcc 780
cagcaaaaag aagctcagat gcgccgattc gttggcgacg cctcccacga gctccgcaca 840
ccactgacct ctgtgaaggg cttcaccgag ctgtattcat caggtgcaac agatgatgcc 900
aactgggtca tgtccaagat cggtggcgaa gcccaacgca tgagtgtgct tgtggaagac 960
ctcctgtcac tgacgcgtgc cgaaggccag caaatggaga agcaccgcgt tgacgtgctg 1020
gaactcgcat tggcagtacg cggatccatg cgagcagcct ggccagatcg caccgtcaac 1080
gtgtccaata aagccgagtc cattccagtt gttgaaggcg acccaacccg cctccaccaa 1140
gttctcacca acctggttgc caacggactc aaccacggcg gaccggacgc ggaagtcagc 1200
attgagatca acaccgatgg gcaaaacgtg aggattctcg tggcagacaa cggtgtcgga 1260
atgtctgaag aagatgccca gcatatcttc gagcgtttct accgcgccga ttcctcccgc 1320
tcacgcgcat ccggcggatc gggcctcggc cttgcgatca cgaaatccct ggtcgaaggc 1380
cacggcggca cagtcaccgt cgacagcgtg caaggcgaag gcacggtgtt cacgatcacc 1440
ttgccggcgg tttcttaa 1458
<210> 2
<211> 485
<212> PRT
<213> Corynebacterium glutamicum
<400> 2
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Asp Lys Lys Glu Val
1 5 10 15
Gly Ala Ile Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asn
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 3
<211> 485
<212> PRT
<213> Corynebacterium glutamicum
<400> 3
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val
1 5 10 15
Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Lys Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 4
<211> 485
<212> PRT
<213> Corynebacterium glutamicum
<400> 4
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val
1 5 10 15
Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Val Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 5
<211> 504
<212> PRT
<213> Corynebacterium callunae
<400> 5
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Lys Asn Ser Asn Phe Gly
1 5 10 15
Ala Lys Asp Thr Asp Ser Ala Val Ser Asp Ser Thr Glu Val Ser Gln
20 25 30
Asn Asn Asp Gly Ile Gly Thr Pro Ala Thr Ala Glu Pro Lys Val Gly
35 40 45
Pro Ile Arg Thr Ala Gly Arg Ala Met Pro Leu Arg Thr Arg Ile Ile
50 55 60
Leu Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Val
65 70 75 80
Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln
85 90 95
Asp Leu Glu Ser Ala Met Gly Thr Trp Val Arg Asn Val Glu Leu Phe
100 105 110
Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala
115 120 125
Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Glu Ser
130 135 140
Ala Pro Asp Leu Gly Gln Thr Thr Ile Gly Thr Gly Pro His Thr Val
145 150 155 160
Glu Ala Ala Glu Gly Ser Ala Ser Ser Thr His Trp Arg Val Met Ala
165 170 175
Ala Lys Asn Gly Asp Val Ile Thr Val Val Gly Lys Ser Met Gly Arg
180 185 190
Glu Ser Thr Leu Leu Tyr Arg Leu Val Val Val Gln Met Val Ile Gly
195 200 205
Val Leu Ile Leu Ile Ala Ile Leu Ile Gly Ser Phe Phe Leu Val Arg
210 215 220
Arg Ser Leu Lys Pro Leu Arg Glu Val Glu Glu Thr Ala Ser Arg Ile
225 230 235 240
Ala Gly Gly Glu Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr
245 250 255
Glu Val Gly Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu
260 265 270
Gln Thr Ser Ile Met Asn Ala Gln Gln Lys Glu Ala Gln Met Arg Arg
275 280 285
Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val
290 295 300
Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Gln Asp Ala Asp
305 310 315 320
Trp Val Leu Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu
325 330 335
Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu
340 345 350
Lys His Arg Val Asp Met Leu Glu Leu Ala Leu Ala Val Arg Gly Ser
355 360 365
Leu Lys Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ala Asn Arg Ser
370 375 380
Glu Asn Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val
385 390 395 400
Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Glu Ala
405 410 415
Glu Val Asn Ile Gln Val Glu Thr Ala Asp Asp Lys Val Lys Ile Leu
420 425 430
Val Ile Asp Asn Gly Val Gly Met Ser Lys Glu Asp Ala Glu His Ile
435 440 445
Phe Glu Arg Phe Tyr Arg Ala Asp Thr Ser Arg Ser Arg Ala Ser Gly
450 455 460
Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His
465 470 475 480
Gly Gly Thr Ile Thr Val Asp Ser Glu Leu Gly Lys Gly Thr Val Phe
485 490 495
Ser Ile Ile Leu Pro Ala Ala Glu
500
<210> 6
<211> 458
<212> PRT
<213> Corynebacterium crenatum
<400> 6
Ile Gly Pro Ile Arg Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg
1 5 10 15
Ile Ile Leu Ile Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn
20 25 30
Ala Ile Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met
35 40 45
Asp Gln Glu Leu Glu Thr Ser Met Gly Thr Trp Ala His Asn Val Glu
50 55 60
Leu Phe Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr
65 70 75 80
Val Ala Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala
85 90 95
Gln Ser Ala Pro Asp Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His
100 105 110
Thr Val Asp Ala Ala Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val
115 120 125
Met Ala Glu Lys Asn Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met
130 135 140
Gly Arg Glu Thr Asn Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile
145 150 155 160
Ile Gly Ala Leu Ile Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu
165 170 175
Val Arg Arg Ser Leu Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr
180 185 190
Arg Ile Ala Gly Gly Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met
195 200 205
Thr Thr Glu Val Gly Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu
210 215 220
Gln Leu Gln Ala Ser Ile Leu Ser Ala Gln Gln Lys Glu Ala Gln Met
225 230 235 240
Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr
245 250 255
Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp
260 265 270
Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser
275 280 285
Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln
290 295 300
Met Glu Lys His Arg Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg
305 310 315 320
Gly Ser Met Arg Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn
325 330 335
Lys Ala Ala Ser Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His
340 345 350
Gln Val Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro
355 360 365
Asp Ala Glu Val Ser Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg
370 375 380
Ile Leu Val Ala Asp Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln
385 390 395 400
His Ile Phe Glu Arg Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala
405 410 415
Ser Gly Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu
420 425 430
Gly His Gly Gly Thr Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr
435 440 445
Val Phe Thr Ile Thr Leu Pro Ala Val Ser
450 455
<210> 7
<211> 471
<212> PRT
<213> Corynebacterium efficiens
<400> 7
Met Thr Ala Pro Glu Asn Pro His Ala Gln Val Thr Pro Val Gly Arg
1 5 10 15
Phe Arg Gln Ala Ala Arg Gly Val Pro Leu Arg Thr Arg Ile Ile Leu
20 25 30
Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala
35 40 45
Val Ser Ser Leu Met Arg Glu Val Ser Tyr Ser Arg Met Asp Gln Glu
50 55 60
Leu Glu Ser Ala Met Asn Ser Trp Ala Gln Thr Ala Glu Leu Phe Gly
65 70 75 80
Ser Ile Thr Leu Gly Pro Pro Ser Asp Tyr Tyr Val Val Arg Ile Phe
85 90 95
Pro Asp Gly Ser His Met Val Phe Asn Gln Ser Asp Ser Ala Pro Asp
100 105 110
Leu Gly Glu Thr Thr Ile Gly Ile Gly Pro His Thr Ala Ser Ala Ala
115 120 125
Pro Gly Ser Ser Ser Ser Val Pro Trp Arg Val Ile Ala Ile Ser Asp
130 135 140
Asn Gly Thr Ile Thr Val Val Gly Lys Ser Leu Ala Pro Glu Ser Met
145 150 155 160
Leu Leu Tyr Arg Leu Val Ile Val Gln Leu Val Ile Gly Met Leu Ile
165 170 175
Val Val Ala Ile Leu Leu Ser Ser Leu Tyr Leu Val Asn Arg Ser Leu
180 185 190
Arg Pro Leu Arg Glu Val Glu Lys Thr Ala Lys Ser Ile Ala Gly Gly
195 200 205
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
210 215 220
Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
225 230 235 240
Ile Leu Ser Ala Gln Glu Lys Glu Ser Gln Met Arg Arg Phe Val Gly
245 250 255
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Tyr
260 265 270
Ser Glu Leu Tyr His Ser Gly Ala Thr Arg Asp Ala Asp Trp Val Leu
275 280 285
Ser Lys Ile Ser Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
290 295 300
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys Arg Pro
305 310 315 320
Val Asp Val Leu Glu Leu Ser Leu Ser Val Ala Ser Ser Met Arg Ala
325 330 335
Ala Trp Pro Glu Arg Ser Ile Thr Val Val Asn Lys Thr Gly Ser Leu
340 345 350
Pro Val Val Glu Gly Asp Ala Thr Arg Leu His Gln Val Leu Thr Asn
355 360 365
Leu Val Asn Asn Gly Leu Asn His Gly Gly Pro Asp Ala Ser Val Glu
370 375 380
Ile Glu Ile Ser Ala Glu Gly Gly Ser Val Leu Val Arg Val Val Asp
385 390 395 400
Asp Gly Val Gly Met Thr Ala Glu Asp Ala Gln His Ile Phe Glu Arg
405 410 415
Phe Tyr Arg Thr Asp Thr Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
420 425 430
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Arg Gly Thr
435 440 445
Ile Thr Val Asp Ser Glu Val Gly Glu Gly Thr Val Phe Thr Ile Thr
450 455 460
Leu Pro Ser Arg Met Glu Asp
465 470
<210> 8
<211> 708
<212> DNA
<213> Corynebacterium glutamicum
<400> 8
atggacaacc agtctgacgg acaaatccgc gtactcgtcg ttgatgacga gccaaacatc 60
gtcgagctgc tcaccgtaag ccttaaattc caaggcttcg cagtgatgac cgccaacgat 120
ggcaatgaag ccctgaagat tgctcgtgag ttccgtccag acgcatacat cctcgatgtc 180
atgatgccag gaatggacgg cttcgagctg ctgaccaagc tgcgcggcga aggccttgac 240
agcccagttc tgtacctcac cgcaaaggat gccgtggagc accgcatcca cggcctgacc 300
atcggcgctg acgactacgt gaccaagcct ttctccctgg aagaagtaat cacccgcctg 360
cgcgtgattc ttcgtcgcgg tggagcagtt gaagaagaca cctcaacttc cctgcagtac 420
gcagacctca ccctcaacga tgaaacccac gaggtcacca aggctggcga actgatcgat 480
ctttccccaa ctgaattcaa cctcctgcgc tacctcatgc tcaacgctga agtggtgctg 540
tccaaggcaa agatcctgga taacgtgtgg cactacgatt ttggtggcga cggcaacgtc 600
gtggaatcct acatctccta cctgcgccgc aaggtggaca cccaggatcc gcagctaatt 660
cagactgttc gtggcgttgg atatgttctg cgcaccccac gtagctaa 708
<210> 9
<211> 235
<212> PRT
<213> Corynebacterium glutamicum
<400> 9
Met Asp Asn Gln Ser Asp Gly Gln Ile Arg Val Leu Val Val Asp Asp
1 5 10 15
Glu Pro Asn Ile Val Glu Leu Leu Thr Val Ser Leu Lys Phe Gln Gly
20 25 30
Phe Ala Val Met Thr Ala Asn Asp Gly Asn Glu Ala Leu Lys Ile Ala
35 40 45
Arg Glu Phe Arg Pro Asp Ala Tyr Ile Leu Asp Val Met Met Pro Gly
50 55 60
Met Asp Gly Phe Glu Leu Leu Thr Lys Leu Arg Gly Glu Gly Leu Asp
65 70 75 80
Ser Pro Val Leu Tyr Leu Thr Ala Lys Asp Ala Val Glu His Arg Ile
85 90 95
His Gly Leu Thr Ile Gly Ala Asp Asp Tyr Val Thr Lys Pro Phe Ser
100 105 110
Leu Glu Glu Val Ile Thr Arg Leu Arg Val Ile Leu Arg Arg Gly Gly
115 120 125
Ala Val Glu Glu Asp Thr Ser Thr Ser Leu Gln Tyr Ala Asp Leu Thr
130 135 140
Leu Asn Asp Glu Thr His Glu Val Thr Lys Ala Gly Glu Leu Ile Asp
145 150 155 160
Leu Ser Pro Thr Glu Phe Asn Leu Leu Arg Tyr Leu Met Leu Asn Ala
165 170 175
Glu Val Val Leu Ser Lys Ala Lys Ile Leu Asp Asn Val Trp His Tyr
180 185 190
Asp Phe Gly Gly Asp Gly Asn Val Val Glu Ser Tyr Ile Ser Tyr Leu
195 200 205
Arg Arg Lys Val Asp Thr Gln Asp Pro Gln Leu Ile Gln Thr Val Arg
210 215 220
Gly Val Gly Tyr Val Leu Arg Thr Pro Arg Ser
225 230 235
<210> 10
<211> 1500
<212> DNA
<213> Corynebacterium glutamicum
<400> 10
atgtttaaca accgtatccg cactgcagct ctcgctggtg caatcgcaat ctccaccgca 60
gcttccggcg tagctatccc agcattcgct caggagacca acccaacctt caacatcaac 120
aacggcttca acgatgctga tggatccacc atccagccag ttgagccagt taaccacacc 180
gaggaaaccc tccgcgacct gactgactcc accggcgctt acctggaaga gttccagtac 240
ggcaacgttg aggaaatcgt tgaagcatac ctgcaggttc aggcttccgc agacggattc 300
gatccttctg agcaggctgc ttacgaggct ttcgaggctg ctcgcgttcg tgcatcccag 360
gagctcgcgg cttccgctga gaccatcact aagacccgcg agtccgttgc ttacgcactc 420
aaggctgacc gcgaagctac cgcagctttc gaggcttacc tcagcgctct tcgtcaggtt 480
tcagtcatca acgatctgat cgctgatgct aacgccaaga acaagactga ctttgcagag 540
atcgagctct acgatgttct ttacaccgac gccgacatct ctggcgatgc tccacttctt 600
gctcctgcat acaaggagct gaaggacctt caggctgagg ttgacgcaga cttcgagtgg 660
ttgggcgagt tcgcaattga taacaatgaa gacaactacg tcattcgtac tcacatccct 720
gctgtagagg cactcaaggc agcgatcgat tcactggtcg acaccgttga gccacttcgt 780
gcagacgcta tcgctaagaa catcgaggct cagaagtctg acgttctggt tccccagctc 840
ttcctcgagc gtgcaactgc acagcgcgac accctgcgtg ttgtagaggc aatcttctct 900
acctctgctc gttacgttga actctacgag aacgtcgaga acgttaacgt tgagaacaag 960
acccttcgcc agcactactc ttccctgatc cctaacctct tcatcgcagc ggttggcaac 1020
atcaacgagc tcaacaatgc agatcaggct gcacgtgagc tcttcctcga ttgggacacc 1080
gacctcacca ccaacgatga ggacgaagct tactaccagg ctaagctcga cttcgctatc 1140
gagacctacg caaagatcct gatcaacggt gaagtttggc aggagccact cgcttacgtc 1200
cagaacctgg atgcaggcgc acgtcaggaa gcagctgacc gcgaagcaga gcgcgcagct 1260
gacgcagcat accgcgctga gcagctccgc atcgctcagg aagcagctga cgctcagaag 1320
gctctcgctg aggctcttgc taatgcaggc aacaacgaca acggtggcga caactcctcc 1380
gacgacaagg gaaccggttc ttccgacatc ggaacctggg gacctttcgc agcaattgca 1440
gctatcatcg cagcaatcgc agctatcttc ccattcctct ccggtatcgt taagttctaa 1500
<210> 11
<211> 499
<212> PRT
<213> Corynebacterium glutamicum
<400> 11
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala Gln Glu
20 25 30
Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala Asp Gly
35 40 45
Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu Thr Leu
50 55 60
Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe Gln Tyr
65 70 75 80
Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln Ala Ser
85 90 95
Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala Phe Glu
100 105 110
Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala Glu Thr
115 120 125
Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala Asp Arg
130 135 140
Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg Gln Val
145 150 155 160
Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn Lys Thr
165 170 175
Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp Ala Asp
180 185 190
Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu Leu Lys
195 200 205
Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly Glu Phe
210 215 220
Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His Ile Pro
225 230 235 240
Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp Thr Val
245 250 255
Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala Gln Lys
260 265 270
Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr Ala Gln
275 280 285
Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser Ala Arg
290 295 300
Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu Asn Lys
305 310 315 320
Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe Ile Ala
325 330 335
Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala Ala Arg
340 345 350
Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp Glu Asp
355 360 365
Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr Tyr Ala
370 375 380
Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala Tyr Val
385 390 395 400
Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg Glu Ala
405 410 415
Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg Ile Ala
420 425 430
Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu Ala Asn
435 440 445
Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp Lys Gly
450 455 460
Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala Ile Ala
465 470 475 480
Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser Gly Ile
485 490 495
Val Lys Phe
<210> 12
<211> 318
<212> DNA
<213> Corynebacterium glutamicum
<400> 12
atgtccctcg gaccatggga aattggaatc attgtcctgc tgatcatcgt gctgttcggc 60
gcgaagaagc tgcctgatgc agctcgttcc atcggccgtt ccatgcgcat cttcaagtct 120
gaagtcaaag aaatgaacaa ggacggcgat accccagaac aacagcagca gcctcagcag 180
cagattgcgc ccaaccagat cgaggctcct cagccaaact ttgagcagca ctaccaggga 240
cagcaggttc agcagcctca gaaccctcag acccctgact accgtcagaa ctacgaggat 300
ccaaaccgca cctcttaa 318
<210> 13
<211> 105
<212> PRT
<213> Corynebacterium glutamicum
<400> 13
Met Ser Leu Gly Pro Trp Glu Ile Gly Ile Ile Val Leu Leu Ile Ile
1 5 10 15
Val Leu Phe Gly Ala Lys Lys Leu Pro Asp Ala Ala Arg Ser Ile Gly
20 25 30
Arg Ser Met Arg Ile Phe Lys Ser Glu Val Lys Glu Met Asn Lys Asp
35 40 45
Gly Asp Thr Pro Glu Gln Gln Gln Gln Pro Gln Gln Gln Ile Ala Pro
50 55 60
Asn Gln Ile Glu Ala Pro Gln Pro Asn Phe Glu Gln His Tyr Gln Gly
65 70 75 80
Gln Gln Val Gln Gln Pro Gln Asn Pro Gln Thr Pro Asp Tyr Arg Gln
85 90 95
Asn Tyr Glu Asp Pro Asn Arg Thr Ser
100 105
<210> 14
<211> 471
<212> DNA
<213> Corynebacterium glutamicum
<400> 14
atgttttcta gcgtgggttg gggagagatc ttcctcttag tcgttgtggg ccttgttgtc 60
atcggcccgg aacggttgcc tcgtttgatc caggacgcac gcgctgcgct gctcgctgca 120
cgtaccgcta tcgacaatgc aaagcagtcg ttggacagtg attttggttc ggaatttgat 180
gaaatccgaa agccactaac ccaggttgca cagtacagcc ggatgagccc caagacggcc 240
atcactaagg cgttatttga taatgattcc tcgttcctgg atgactttga tccaaagaag 300
atcatggccg aaggaacaga aggcgaagct cagcgcaaca agcaggcagc tgacaacaat 360
gcgaatgtgg tggaacgtcc agctgatggt tccaccgcac gcccaacgca aaacgatcca 420
aaagacggcc cgaattactc aggtggcgtc tcttggaccg atattattta g 471
<210> 15
<211> 156
<212> PRT
<213> Corynebacterium glutamicum
<400> 15
Met Phe Ser Ser Val Gly Trp Gly Glu Ile Phe Leu Leu Val Val Val
1 5 10 15
Gly Leu Val Val Ile Gly Pro Glu Arg Leu Pro Arg Leu Ile Gln Asp
20 25 30
Ala Arg Ala Ala Leu Leu Ala Ala Arg Thr Ala Ile Asp Asn Ala Lys
35 40 45
Gln Ser Leu Asp Ser Asp Phe Gly Ser Glu Phe Asp Glu Ile Arg Lys
50 55 60
Pro Leu Thr Gln Val Ala Gln Tyr Ser Arg Met Ser Pro Lys Thr Ala
65 70 75 80
Ile Thr Lys Ala Leu Phe Asp Asn Asp Ser Ser Phe Leu Asp Asp Phe
85 90 95
Asp Pro Lys Lys Ile Met Ala Glu Gly Thr Glu Gly Glu Ala Gln Arg
100 105 110
Asn Lys Gln Ala Ala Asp Asn Asn Ala Asn Val Val Glu Arg Pro Ala
115 120 125
Asp Gly Ser Thr Ala Arg Pro Thr Gln Asn Asp Pro Lys Asp Gly Pro
130 135 140
Asn Tyr Ser Gly Gly Val Ser Trp Thr Asp Ile Ile
145 150 155
<210> 16
<211> 945
<212> DNA
<213> Corynebacterium glutamicum
<400> 16
atgtccattg ttgagcacat caaagagttt cgacgccgac ttcttatcgc tctggcgggc 60
atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120
actttgggcg agctgctgag ggatccgtac tgttctctgc ctgctgaatc ccgctgggcc 180
atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240
cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300
ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360
gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420
tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480
gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540
ccactggtga tcggcatgct caacattgtg ggtatcttgc cttacgatgc cattaaagat 600
aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660
gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtaga gcttgccctg 720
cagttctgtc gtttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780
gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840
gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900
ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945
<210> 17
<211> 314
<212> PRT
<213> Corynebacterium glutamicum
<400> 17
Met Ser Ile Val Glu His Ile Lys Glu Phe Arg Arg Arg Leu Leu Ile
1 5 10 15
Ala Leu Ala Gly Ile Leu Val Gly Thr Ile Ile Gly Phe Ile Trp Tyr
20 25 30
Asp Phe Ser Phe Trp Gln Ile Pro Thr Leu Gly Glu Leu Leu Arg Asp
35 40 45
Pro Tyr Cys Ser Leu Pro Ala Glu Ser Arg Trp Ala Met Ser Asp Ser
50 55 60
Glu Glu Cys Arg Leu Leu Ala Thr Gly Pro Phe Asp Pro Phe Met Leu
65 70 75 80
Arg Leu Lys Val Ala Ala Leu Val Gly Met Val Leu Gly Ser Pro Val
85 90 95
Trp Leu Ser Gln Leu Trp Gly Phe Ile Thr Pro Gly Leu Met Lys Asn
100 105 110
Glu Arg Arg Tyr Thr Ala Ile Phe Val Thr Ile Ala Val Val Leu Phe
115 120 125
Val Gly Gly Ala Val Leu Ala Tyr Phe Val Val Ala Tyr Gly Leu Glu
130 135 140
Phe Leu Leu Thr Ile Gly Gly Asp Thr Gln Ala Ala Ala Leu Thr Gly
145 150 155 160
Asp Lys Tyr Phe Gly Phe Leu Leu Ala Leu Leu Ala Ile Phe Gly Val
165 170 175
Ser Phe Glu Val Pro Leu Val Ile Gly Met Leu Asn Ile Val Gly Ile
180 185 190
Leu Pro Tyr Asp Ala Ile Lys Asp Lys Arg Arg Met Ile Ile Met Ile
195 200 205
Leu Phe Val Phe Ala Ala Phe Met Thr Pro Gly Gln Asp Pro Phe Thr
210 215 220
Met Leu Val Leu Ala Leu Ser Leu Thr Val Leu Val Glu Leu Ala Leu
225 230 235 240
Gln Phe Cys Arg Phe Asn Asp Lys Arg Arg Asp Lys Lys Arg Pro Glu
245 250 255
Trp Leu Asp Gly Asp Asp Leu Ser Ala Ser Pro Leu Asp Thr Ser Ala
260 265 270
Gly Gly Glu Asp Ala Pro Ser Pro Val Glu Thr Pro Glu Ala Val Glu
275 280 285
Pro Ser Arg Met Leu Asn Pro Ser Gly Glu Ala Ser Ile Ser Tyr Lys
290 295 300
Pro Gly Arg Ala Asp Phe Gly Asp Val Leu
305 310
<210> 18
<211> 39
<212> PRT
<213> Escherichia coli
<400> 18
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala
35
<210> 19
<211> 27
<212> PRT
<213> Escherichia coli
<400> 19
Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu
1 5 10 15
Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala
20 25
<210> 20
<211> 48
<212> PRT
<213> Bacillus subtilis
<400> 20
Met Ala Tyr Asp Ser Arg Phe Asp Glu Trp Val Gln Lys Leu Lys Glu
1 5 10 15
Glu Ser Phe Gln Asn Asn Thr Phe Asp Arg Arg Lys Phe Ile Gln Gly
20 25 30
Ala Gly Lys Ile Ala Gly Leu Ser Leu Gly Leu Thr Ile Ala Gln Ser
35 40 45
<210> 21
<211> 34
<212> PRT
<213> Bacillus subtilis
<400> 21
Met Lys Phe Val Lys Arg Arg Thr Thr Ala Leu Val Thr Thr Leu Met
1 5 10 15
Leu Ser Val Thr Ser Leu Phe Ala Leu Gln Pro Ser Ala Lys Ala Ala
20 25 30
Glu His
<210> 22
<211> 30
<212> PRT
<213> Arthrobacter globiformis
<400> 22
Met Met Asn Leu Ser Arg Arg Thr Leu Leu Thr Thr Gly Ser Ala Ala
1 5 10 15
Thr Leu Ala Tyr Ala Leu Gly Met Ala Gly Ser Ala Gln Ala
20 25 30
<210> 23
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Twin-Arginine Motif
<220>
<221> misc_feature
<222> (1)..(1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 23
Xaa Arg Arg Xaa Phe Leu Lys
1 5
<210> 24
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Twin-Arginine Motif
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(5)
<223> Xaa can be any hydrophobic amino acid
<400> 24
Arg Arg Xaa Xaa Xaa
1 5
<210> 25
<211> 43
<212> PRT
<213> Corynebacterium glutamicum
<400> 25
Met Arg Asp Thr Ala Phe Arg Ser Ile Lys Ala Lys Ala Gln Ala Lys
1 5 10 15
Arg Arg Ser Leu Trp Ile Ala Ala Gly Ala Val Pro Thr Ala Ile Ala
20 25 30
Leu Thr Met Ser Leu Ala Pro Met Ala Ser Ala
35 40
<210> 26
<211> 30
<212> PRT
<213> Corynebacterium glutamicum
<400> 26
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala
20 25 30
<210> 27
<211> 25
<212> PRT
<213> Corynebacterium stationis
<400> 27
Met Lys Arg Met Lys Ser Leu Ala Ala Ala Leu Thr Val Ala Gly Ala
1 5 10 15
Met Leu Ala Ala Pro Val Ala Thr Ala
20 25
<210> 28
<211> 469
<212> PRT
<213> Corynebacterium glutamicum
<400> 28
Gln Glu Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala
1 5 10 15
Asp Gly Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu
20 25 30
Thr Leu Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe
35 40 45
Gln Tyr Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln
50 55 60
Ala Ser Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala
65 70 75 80
Phe Glu Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala
85 90 95
Glu Thr Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala
100 105 110
Asp Arg Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg
115 120 125
Gln Val Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn
130 135 140
Lys Thr Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp
145 150 155 160
Ala Asp Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu
165 170 175
Leu Lys Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly
180 185 190
Glu Phe Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His
195 200 205
Ile Pro Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp
210 215 220
Thr Val Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala
225 230 235 240
Gln Lys Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr
245 250 255
Ala Gln Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser
260 265 270
Ala Arg Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu
275 280 285
Asn Lys Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe
290 295 300
Ile Ala Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala
305 310 315 320
Ala Arg Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp
325 330 335
Glu Asp Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr
340 345 350
Tyr Ala Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala
355 360 365
Tyr Val Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg
370 375 380
Glu Ala Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg
385 390 395 400
Ile Ala Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu
405 410 415
Ala Asn Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp
420 425 430
Lys Gly Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala
435 440 445
Ile Ala Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser
450 455 460
Gly Ile Val Lys Phe
465
<210> 29
<211> 4
<212> PRT
<213> Corynebacterium glutamicum
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Asn, Gly, Thr, Pro, or Ala
<400> 29
Gln Glu Thr Xaa
1
<210> 30
<211> 5
<212> PRT
<213> Corynebacterium glutamicum
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Asn, Gly, Thr, Pro, or Ala
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa is Pro, Thr, or Val
<400> 30
Gln Glu Thr Xaa Xaa
1 5
<210> 31
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Asn, Gly, Thr, Pro, or Ala
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa is Pro, Thr, or Val
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa is Thr or Tyr
<400> 31
Gln Glu Thr Xaa Xaa Xaa
1 5
<210> 32
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 32
Gln Glu Thr Asn Pro Thr
1 5
<210> 33
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 33
Gln Glu Thr Gly Thr Tyr
1 5
<210> 34
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 34
Gln Glu Thr Thr Val Thr
1 5
<210> 35
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 35
Gln Glu Thr Pro Val Thr
1 5
<210> 36
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 36
Gln Glu Thr Ala Val Thr
1 5
<210> 37
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Factor Xa
<400> 37
Ile Glu Gly Arg
1
<210> 38
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> ProTEV
<400> 38
Glu Asn Leu Tyr Phe Gln
1 5
<210> 39
<211> 1161
<212> DNA
<213> Corynebacterium glutamicum
<400> 39
atgcgtcgcc acaagtccgc ggtcaccctg tccgaaaatc aggtcaccac ggtggggcag 60
gtcctccact tggcgattca aggctcccca acgggaatca cggttgtcga tcgcaccggc 120
gacgtcatct tatccaacgg ccgcgcccac gaattgggca tcgtccacga aagatccgtc 180
gacggcaacg tttggcgcgt cgcccaggaa gccttccaag accaagaaac ccactcactc 240
gacgtccacc cagaccgcaa tccgcggcgc ccgggtagtc gcatcaccgc agtgcaggca 300
gtggtcaagc ctttaacgct tatcgacgat cgtttcgtga tcatctatgc ctccgacgaa 360
tccgaaaacg tgcgcatgga atcggcacgc cgagacttcg tcgcaaacgt ctcccacgaa 420
ctgaaaaccc ccgtcggcgg catggcactc ctcgcggaag ccctcatgga atcctccgac 480
gacccagaac aagtcgaata cttcggatcc aggctccacc gcgaagccca ccgcatggcc 540
gacatgatca acgaactgat ctccctttcc aaacttcagg gcgccgaacg actccctgat 600
atggaacccg tccaggctga cgacatcatc agcgaagcca tcgaacgcac ccaactcgcc 660
gccgacaacg ccaacatcga aatcattcgc ggcgaccgca ccggcgtttg ggtagaagcc 720
gatcgatccc tgctggtcac agccctggcg aacctgatca gcaatgcaat caactactca 780
ccaaaatcag tccccgtctc cgtttcacaa agcatccgaa acgacgtggt catgatccga 840
gtaaccgacc gcggcattgg catcgcaccc gaagaccaag gccgagtttt cgaaagattc 900
ttccgcgtcg acaaagcccg ctcccgccaa accggcggaa ctggccttgg cctcgcgata 960
gtcaaacatg tcatggccaa ccatggcggt agtattagtt tgtggtcacg tcctggaaca 1020
ggctccacat tcacacttga actccccgtt tatcacccag agtccaagga accggcagga 1080
tctaagcagg gacctagttt ggattcacct attcgtacga ctgcgtccaa agcatctggg 1140
cgccgaaagg aaaaatcatg a 1161
<210> 40
<211> 386
<212> PRT
<213> Corynebacterium glutamicum
<400> 40
Met Arg Arg His Lys Ser Ala Val Thr Leu Ser Glu Asn Gln Val Thr
1 5 10 15
Thr Val Gly Gln Val Leu His Leu Ala Ile Gln Gly Ser Pro Thr Gly
20 25 30
Ile Thr Val Val Asp Arg Thr Gly Asp Val Ile Leu Ser Asn Gly Arg
35 40 45
Ala His Glu Leu Gly Ile Val His Glu Arg Ser Val Asp Gly Asn Val
50 55 60
Trp Arg Val Ala Gln Glu Ala Phe Gln Asp Gln Glu Thr His Ser Leu
65 70 75 80
Asp Val His Pro Asp Arg Asn Pro Arg Arg Pro Gly Ser Arg Ile Thr
85 90 95
Ala Val Gln Ala Val Val Lys Pro Leu Thr Leu Ile Asp Asp Arg Phe
100 105 110
Val Ile Ile Tyr Ala Ser Asp Glu Ser Glu Asn Val Arg Met Glu Ser
115 120 125
Ala Arg Arg Asp Phe Val Ala Asn Val Ser His Glu Leu Lys Thr Pro
130 135 140
Val Gly Gly Met Ala Leu Leu Ala Glu Ala Leu Met Glu Ser Ser Asp
145 150 155 160
Asp Pro Glu Gln Val Glu Tyr Phe Gly Ser Arg Leu His Arg Glu Ala
165 170 175
His Arg Met Ala Asp Met Ile Asn Glu Leu Ile Ser Leu Ser Lys Leu
180 185 190
Gln Gly Ala Glu Arg Leu Pro Asp Met Glu Pro Val Gln Ala Asp Asp
195 200 205
Ile Ile Ser Glu Ala Ile Glu Arg Thr Gln Leu Ala Ala Asp Asn Ala
210 215 220
Asn Ile Glu Ile Ile Arg Gly Asp Arg Thr Gly Val Trp Val Glu Ala
225 230 235 240
Asp Arg Ser Leu Leu Val Thr Ala Leu Ala Asn Leu Ile Ser Asn Ala
245 250 255
Ile Asn Tyr Ser Pro Lys Ser Val Pro Val Ser Val Ser Gln Ser Ile
260 265 270
Arg Asn Asp Val Val Met Ile Arg Val Thr Asp Arg Gly Ile Gly Ile
275 280 285
Ala Pro Glu Asp Gln Gly Arg Val Phe Glu Arg Phe Phe Arg Val Asp
290 295 300
Lys Ala Arg Ser Arg Gln Thr Gly Gly Thr Gly Leu Gly Leu Ala Ile
305 310 315 320
Val Lys His Val Met Ala Asn His Gly Gly Ser Ile Ser Leu Trp Ser
325 330 335
Arg Pro Gly Thr Gly Ser Thr Phe Thr Leu Glu Leu Pro Val Tyr His
340 345 350
Pro Glu Ser Lys Glu Pro Ala Gly Ser Lys Gln Gly Pro Ser Leu Asp
355 360 365
Ser Pro Ile Arg Thr Thr Ala Ser Lys Ala Ser Gly Arg Arg Lys Glu
370 375 380
Lys Ser
385
<210> 41
<211> 699
<212> DNA
<213> Corynebacterium glutamicum
<400> 41
atgacgacaa tcctgatcgt tgaagatgag gaatcgttag cagatccttt ggcctttctt 60
cttcgcaaag aaggttttga caccatcatc gccggtgatg gcccaaccgc acttgtggag 120
ttcagtcgca acgaaatcga catcgtcctc ttagacctca tgctcccagg catgtctggc 180
accgacgtat gcaaagaact ccgcagcgta tccactgttc ccgtcatcat ggtcaccgcc 240
cgcgactccg agatcgacaa agttgttggc ctcgaactcg gcgccgatga ttatgtaacc 300
aagccatatt cttcccgcga actcatcgcc cgcatccgcg ctgtcctgcg ccgacgcgga 360
gttactgaaa ccgaagccga agaattacca cttgacgatc aaatcctcga aggcggccgc 420
gtccgcatgg acgtcgattc ccacaccgtc accgtcggtg gcgaaccagt gagcatgcca 480
ctgaaggaat tcgaccttct ggagtacctc ctccgcaacg ccggccgagt cctcacccgc 540
ggacagctca tcgaccgaat ttggggcgca gattacgtcg gcgacaccaa aaccctcgac 600
gttcatgtca aaaggttgcg ttccaagatc gaagaagagc catctcgacc tcgttacctc 660
gtgaccgtgc gtggattggg ctacaaattc gagctgtag 699
<210> 42
<211> 232
<212> PRT
<213> Corynebacterium glutamicum
<400> 42
Met Thr Thr Ile Leu Ile Val Glu Asp Glu Glu Ser Leu Ala Asp Pro
1 5 10 15
Leu Ala Phe Leu Leu Arg Lys Glu Gly Phe Asp Thr Ile Ile Ala Gly
20 25 30
Asp Gly Pro Thr Ala Leu Val Glu Phe Ser Arg Asn Glu Ile Asp Ile
35 40 45
Val Leu Leu Asp Leu Met Leu Pro Gly Met Ser Gly Thr Asp Val Cys
50 55 60
Lys Glu Leu Arg Ser Val Ser Thr Val Pro Val Ile Met Val Thr Ala
65 70 75 80
Arg Asp Ser Glu Ile Asp Lys Val Val Gly Leu Glu Leu Gly Ala Asp
85 90 95
Asp Tyr Val Thr Lys Pro Tyr Ser Ser Arg Glu Leu Ile Ala Arg Ile
100 105 110
Arg Ala Val Leu Arg Arg Arg Gly Val Thr Glu Thr Glu Ala Glu Glu
115 120 125
Leu Pro Leu Asp Asp Gln Ile Leu Glu Gly Gly Arg Val Arg Met Asp
130 135 140
Val Asp Ser His Thr Val Thr Val Gly Gly Glu Pro Val Ser Met Pro
145 150 155 160
Leu Lys Glu Phe Asp Leu Leu Glu Tyr Leu Leu Arg Asn Ala Gly Arg
165 170 175
Val Leu Thr Arg Gly Gln Leu Ile Asp Arg Ile Trp Gly Ala Asp Tyr
180 185 190
Val Gly Asp Thr Lys Thr Leu Asp Val His Val Lys Arg Leu Arg Ser
195 200 205
Lys Ile Glu Glu Glu Pro Ser Arg Pro Arg Tyr Leu Val Thr Val Arg
210 215 220
Gly Leu Gly Tyr Lys Phe Glu Leu
225 230
<210> 43
<211> 1335
<212> DNA
<213> Corynebacterium glutamicum
<400> 43
atgcagtcaa gcctagatcg tgtgtcggaa accggacgca atgagctcga tgttgaaacc 60
cttgtgaaga aggggaatca accgggcgcg atgagctatc gcaacagtat ccacattttg 120
acagcctcgc tgctggtcgt ggggttggga gcttccgccc gcctgacgct gccgatgttt 180
gcgctgtcgt gcgtgctgtt gtttgtgtgg ggttttctgt acttctatgg atcaaccaaa 240
cgcgtagatt tgagccacgg catgcagctg ggctggctgt ttgtgctgac gctggtgtgg 300
atttttatgg tgccgatcgt gcccgtgtcc atttatctgc tgttcccgct gtttttcctc 360
tatctacagg tgatgcctga cgtgagaggc attattgcga ttttgggtgc gacagcgatt 420
gcgattgcca gccagtattc cgtggggttg acctttggtg gtgtgatggg tccggtggtc 480
tctgcgatcg tgaccgtggc tattgattac gcgttccgca cgttgtggcg ggtgaataat 540
gaaaagcagg aattgattga tcagttgatt gaaactcgct cccagctggc ggtgacggaa 600
cgaaatgcgg gtatcgctgc ggaacgtcaa cgtattgcgc atgaaattca cgacacggtc 660
gcccagggac tctcctccat tcaaatgctg ctgcatgtct ctgaacagga gattctcgtt 720
gctgagatgg aagagaagcc aaaggaggcg atcgtgaaga agatgcgcct tgcccgacaa 780
acagcctccg acaatctcag tgaggctcgc gcgatgattg cggcgttgca accagcagcg 840
ctgtctaaaa cctccttgga agcagcactt caccgcgtca cagaaccgtt gttgggtatt 900
aattttgtga tttctgtcga cggtgatgtt cgccaactgc ccatgaaaac tgaagccacc 960
cttctgcgaa ttgctcaagg tgcgatcgga aatgtggcga aacattcaga ggcgaaaaac 1020
tgccacgtga cactaaccta cgaagacaca gaagtacgcc ttgatgtggt tgatgacggt 1080
gtgggttttg agccttcgga agtgtccagt acccccgctg gccttggcca tatcggctta 1140
accgcattgc agcagcgcgc gatggaattg cacggcgaag ttatagtgga atctgcatat 1200
gggcagggta ctgcggtatc tgcagcattg ccggtggagc caccagaggg gtttgtcggg 1260
gcgccggttt tggcagattc ggactcaagt gctacaggcg aggttgaact aagttctcca 1320
actgacgatg agtaa 1335
<210> 44
<211> 444
<212> PRT
<213> Corynebacterium glutamicum
<400> 44
Met Gln Ser Ser Leu Asp Arg Val Ser Glu Thr Gly Arg Asn Glu Leu
1 5 10 15
Asp Val Glu Thr Leu Val Lys Lys Gly Asn Gln Pro Gly Ala Met Ser
20 25 30
Tyr Arg Asn Ser Ile His Ile Leu Thr Ala Ser Leu Leu Val Val Gly
35 40 45
Leu Gly Ala Ser Ala Arg Leu Thr Leu Pro Met Phe Ala Leu Ser Cys
50 55 60
Val Leu Leu Phe Val Trp Gly Phe Leu Tyr Phe Tyr Gly Ser Thr Lys
65 70 75 80
Arg Val Asp Leu Ser His Gly Met Gln Leu Gly Trp Leu Phe Val Leu
85 90 95
Thr Leu Val Trp Ile Phe Met Val Pro Ile Val Pro Val Ser Ile Tyr
100 105 110
Leu Leu Phe Pro Leu Phe Phe Leu Tyr Leu Gln Val Met Pro Asp Val
115 120 125
Arg Gly Ile Ile Ala Ile Leu Gly Ala Thr Ala Ile Ala Ile Ala Ser
130 135 140
Gln Tyr Ser Val Gly Leu Thr Phe Gly Gly Val Met Gly Pro Val Val
145 150 155 160
Ser Ala Ile Val Thr Val Ala Ile Asp Tyr Ala Phe Arg Thr Leu Trp
165 170 175
Arg Val Asn Asn Glu Lys Gln Glu Leu Ile Asp Gln Leu Ile Glu Thr
180 185 190
Arg Ser Gln Leu Ala Val Thr Glu Arg Asn Ala Gly Ile Ala Ala Glu
195 200 205
Arg Gln Arg Ile Ala His Glu Ile His Asp Thr Val Ala Gln Gly Leu
210 215 220
Ser Ser Ile Gln Met Leu Leu His Val Ser Glu Gln Glu Ile Leu Val
225 230 235 240
Ala Glu Met Glu Glu Lys Pro Lys Glu Ala Ile Val Lys Lys Met Arg
245 250 255
Leu Ala Arg Gln Thr Ala Ser Asp Asn Leu Ser Glu Ala Arg Ala Met
260 265 270
Ile Ala Ala Leu Gln Pro Ala Ala Leu Ser Lys Thr Ser Leu Glu Ala
275 280 285
Ala Leu His Arg Val Thr Glu Pro Leu Leu Gly Ile Asn Phe Val Ile
290 295 300
Ser Val Asp Gly Asp Val Arg Gln Leu Pro Met Lys Thr Glu Ala Thr
305 310 315 320
Leu Leu Arg Ile Ala Gln Gly Ala Ile Gly Asn Val Ala Lys His Ser
325 330 335
Glu Ala Lys Asn Cys His Val Thr Leu Thr Tyr Glu Asp Thr Glu Val
340 345 350
Arg Leu Asp Val Val Asp Asp Gly Val Gly Phe Glu Pro Ser Glu Val
355 360 365
Ser Ser Thr Pro Ala Gly Leu Gly His Ile Gly Leu Thr Ala Leu Gln
370 375 380
Gln Arg Ala Met Glu Leu His Gly Glu Val Ile Val Glu Ser Ala Tyr
385 390 395 400
Gly Gln Gly Thr Ala Val Ser Ala Ala Leu Pro Val Glu Pro Pro Glu
405 410 415
Gly Phe Val Gly Ala Pro Val Leu Ala Asp Ser Asp Ser Ser Ala Thr
420 425 430
Gly Glu Val Glu Leu Ser Ser Pro Thr Asp Asp Glu
435 440
<210> 45
<211> 639
<212> DNA
<213> Corynebacterium glutamicum
<400> 45
atgattcgcg tgctgcttgc tgatgaccac gaaatcgtga ggctcggact ccgggctgtg 60
ctggaaagcg ccgaggacat tgaagtggtg ggcgaagtct ccaccgccga aggtgcggtg 120
caggcagccc gagaaggcgg aatcgacgtc atcttgatgg acctccgatt cggccccggc 180
gtccaaggaa cccaggtatc caccggcgca gacgccaccg cagccatcaa gcgaaacatc 240
gataacccgc caaaagtcct ggttgtgacc aactacgaca ccgacacaga catcctcggc 300
gcaatcgaag ccggcgcact gggctacctg ctcaaagacg ccccaccgag cgaactcctg 360
gcagcagtac gatccgcagc agaaggtgac tccacactgt cacccatggt tgctaaccgc 420
ctgatgactc gcgtgcgaac ccccaaaacc tcactcaccc cacgcgagct ggaggttctc 480
aaactggtcg ccggcggttc ctccaaccgc gacattggcc gtatcctctt cctctcagaa 540
gccacggtga aatcccacct cgtgcacatc tacgacaagc tcggcgtgcg gtcacgtacc 600
tccgctgtcg cagccgcacg tgagcagggg ctgctgtag 639
<210> 46
<211> 212
<212> PRT
<213> Corynebacterium glutamicum
<400> 46
Met Ile Arg Val Leu Leu Ala Asp Asp His Glu Ile Val Arg Leu Gly
1 5 10 15
Leu Arg Ala Val Leu Glu Ser Ala Glu Asp Ile Glu Val Val Gly Glu
20 25 30
Val Ser Thr Ala Glu Gly Ala Val Gln Ala Ala Arg Glu Gly Gly Ile
35 40 45
Asp Val Ile Leu Met Asp Leu Arg Phe Gly Pro Gly Val Gln Gly Thr
50 55 60
Gln Val Ser Thr Gly Ala Asp Ala Thr Ala Ala Ile Lys Arg Asn Ile
65 70 75 80
Asp Asn Pro Pro Lys Val Leu Val Val Thr Asn Tyr Asp Thr Asp Thr
85 90 95
Asp Ile Leu Gly Ala Ile Glu Ala Gly Ala Leu Gly Tyr Leu Leu Lys
100 105 110
Asp Ala Pro Pro Ser Glu Leu Leu Ala Ala Val Arg Ser Ala Ala Glu
115 120 125
Gly Asp Ser Thr Leu Ser Pro Met Val Ala Asn Arg Leu Met Thr Arg
130 135 140
Val Arg Thr Pro Lys Thr Ser Leu Thr Pro Arg Glu Leu Glu Val Leu
145 150 155 160
Lys Leu Val Ala Gly Gly Ser Ser Asn Arg Asp Ile Gly Arg Ile Leu
165 170 175
Phe Leu Ser Glu Ala Thr Val Lys Ser His Leu Val His Ile Tyr Asp
180 185 190
Lys Leu Gly Val Arg Ser Arg Thr Ser Ala Val Ala Ala Ala Arg Glu
195 200 205
Gln Gly Leu Leu
210
<210> 47
<211> 1026
<212> DNA
<213> Corynebacterium glutamicum
<400> 47
gtgagtgcaa cagagaaacg tagatacgaa gtgttgcggg ccatcgtcgc tgattacatt 60
gcgtctcagg aacctgtcgg atcgaagtca ctcctcgagc gccataagct caacgtgagt 120
tctgcgacga tccgcaacga tatgtcggtg ctggaatccg atggctttat cgtccaggag 180
catgcaagtt ctggccgggt accaaccgaa aagggttacc gcctttttgt tgattccatc 240
catgacatca agccgctgtc gctggcggaa cggcgcgcta ttttgggctt ccttgaaggg 300
ggagtggact tagaggacgt gctgcgcagg tctgtgcagc tgttgtctca gctcacccat 360
caggctgccg tggtgcagct gcccaccttg aaaacagcgc gcgtgaagca ctgcgaggtg 420
gtgccgctgt cgccgatgcg cttgctgctg gtgctcatta ccgatactgg ccgtgtagat 480
cagcgcaacg tggaacttga ggaaccgctg gcggcggaag aagttaatgt gctgcgcgat 540
ctgctcaacg gcgcgctagg ggagaaaacg ctgacggctg catcagatgc gctggaggag 600
ttggctcagc aagccccaac cgatattcgt gatgccatgc gccgctgctg cgatgtactg 660
gtgaacacgc ttgtcgatca accctctgac cgcctgatcc tcgccggcac ctcaaacctc 720
acccgcttaa gcagggaaac ctccgcgagc ctaccgatgg ttttagaagc cttggaagag 780
caggtggtca tgttgaaact gctgtccaat gtcactgatc ttgaccaagt gagcgtgcat 840
attggcggcg aaaatgaaga cattgagctg cgcagcgcaa cggtgattac caccggttac 900
ggctcccagg gcagcgcact gggcggattg ggggtggttg gccccaccta tatggactac 960
tcgggaacaa tttctaaggt gtccgccgtt gctaagtatg ttggtcgtgt gctcgctggc 1020
gaatag 1026
<210> 48
<211> 341
<212> PRT
<213> Corynebacterium glutamicum
<400> 48
Met Ser Ala Thr Glu Lys Arg Arg Tyr Glu Val Leu Arg Ala Ile Val
1 5 10 15
Ala Asp Tyr Ile Ala Ser Gln Glu Pro Val Gly Ser Lys Ser Leu Leu
20 25 30
Glu Arg His Lys Leu Asn Val Ser Ser Ala Thr Ile Arg Asn Asp Met
35 40 45
Ser Val Leu Glu Ser Asp Gly Phe Ile Val Gln Glu His Ala Ser Ser
50 55 60
Gly Arg Val Pro Thr Glu Lys Gly Tyr Arg Leu Phe Val Asp Ser Ile
65 70 75 80
His Asp Ile Lys Pro Leu Ser Leu Ala Glu Arg Arg Ala Ile Leu Gly
85 90 95
Phe Leu Glu Gly Gly Val Asp Leu Glu Asp Val Leu Arg Arg Ser Val
100 105 110
Gln Leu Leu Ser Gln Leu Thr His Gln Ala Ala Val Val Gln Leu Pro
115 120 125
Thr Leu Lys Thr Ala Arg Val Lys His Cys Glu Val Val Pro Leu Ser
130 135 140
Pro Met Arg Leu Leu Leu Val Leu Ile Thr Asp Thr Gly Arg Val Asp
145 150 155 160
Gln Arg Asn Val Glu Leu Glu Glu Pro Leu Ala Ala Glu Glu Val Asn
165 170 175
Val Leu Arg Asp Leu Leu Asn Gly Ala Leu Gly Glu Lys Thr Leu Thr
180 185 190
Ala Ala Ser Asp Ala Leu Glu Glu Leu Ala Gln Gln Ala Pro Thr Asp
195 200 205
Ile Arg Asp Ala Met Arg Arg Cys Cys Asp Val Leu Val Asn Thr Leu
210 215 220
Val Asp Gln Pro Ser Asp Arg Leu Ile Leu Ala Gly Thr Ser Asn Leu
225 230 235 240
Thr Arg Leu Ser Arg Glu Thr Ser Ala Ser Leu Pro Met Val Leu Glu
245 250 255
Ala Leu Glu Glu Gln Val Val Met Leu Lys Leu Leu Ser Asn Val Thr
260 265 270
Asp Leu Asp Gln Val Ser Val His Ile Gly Gly Glu Asn Glu Asp Ile
275 280 285
Glu Leu Arg Ser Ala Thr Val Ile Thr Thr Gly Tyr Gly Ser Gln Gly
290 295 300
Ser Ala Leu Gly Gly Leu Gly Val Val Gly Pro Thr Tyr Met Asp Tyr
305 310 315 320
Ser Gly Thr Ile Ser Lys Val Ser Ala Val Ala Lys Tyr Val Gly Arg
325 330 335
Val Leu Ala Gly Glu
340
<210> 49
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 49
gaattgggca tcgtccacga aa 22
<210> 50
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 50
caacgatcag gattgtcgtc atg 23
<210> 51
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 51
catgacgaca atcctgatcg ttggcgtgga ttgggctaca aattc 45
<210> 52
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 52
gctaattatg ggcatccaag gg 22
<210> 53
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 53
tcgagctcgg tacccccaaa aggaatcagg ccag 34
<210> 54
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 54
gacctagttc aaacacggga ggctgctgta gcg 33
<210> 55
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 55
tgtttgaact aggtccttcc 20
<210> 56
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 56
ctctagagga tccccggttg acctttggtg gtg 33
<210> 57
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 57
catcattggg ctgagtacct g 21
<210> 58
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 58
cgaatagctg cgggtatagt tg 22
<210> 59
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 59
caactatacc cgcagctatt cgtacgtttc tctgttgcac tcac 44
<210> 60
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 60
gttgattggt gcggacggtt t 21
<210> 61
<211> 117
<212> PRT
<213> Vicugna pacos
<400> 61
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Asp
20 25 30
Ala Met Thr Trp Val Arg Gln Ala Pro Gly Lys Ala Leu Glu Trp Val
35 40 45
Ser Ser Ile Thr Leu Leu Gly Gly Gly Ile Pro Tyr Tyr Ser Asp Thr
50 55 60
Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Thr Lys Asn Met Leu
65 70 75 80
Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
85 90 95
Cys Ala Lys Gly Phe Lys Ser Asp Tyr Pro Arg Gly Gln Gly Thr Gln
100 105 110
Val Thr Val Ser Ser
115
<210> 62
<211> 354
<212> DNA
<213> Vicugna pacos
<400> 62
caggttcagc ttgtggaatc cggcggtggc ttggtgcagc ctggtggctc ccttcgcttg 60
tcttgcgcag cttccggctt caccttctcc aacgatgcaa tgacctgggt ccgtcaggca 120
cctggtaaag cgcttgagtg ggtttcctct atcaccctgc tcggtggcgg tattccatac 180
tactctgata ccgtgaaggg ccgcttcacc atctcccgtg acaacaccaa aaacatgctg 240
tacctgcaga tgaactctct caagccagaa gataccgcag tctactactg tgctaagggt 300
ttcaaatccg actaccctcg cggtcagggc acccaggtga ccgtctcctc ttag 354
<210> 63
<211> 154
<212> PRT
<213> Homo sapiens
<400> 63
Ala Ala Gly Ser Ile Thr Thr Leu Pro Ala Leu Pro Glu Asp Gly Gly
1 5 10 15
Ser Gly Ala Phe Pro Pro Gly His Phe Lys Asp Pro Lys Arg Leu Tyr
20 25 30
Cys Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro Asp Gly Arg Val
35 40 45
Asp Gly Val Arg Glu Lys Ser Asp Pro His Ile Lys Leu Gln Leu Gln
50 55 60
Ala Glu Glu Arg Gly Val Val Ser Ile Lys Gly Val Cys Ala Asn Arg
65 70 75 80
Tyr Leu Ala Met Lys Glu Asp Gly Arg Leu Leu Ala Ser Lys Cys Val
85 90 95
Thr Asp Glu Cys Phe Phe Phe Glu Arg Leu Glu Ser Asn Asn Tyr Asn
100 105 110
Thr Tyr Arg Ser Arg Lys Tyr Thr Ser Trp Tyr Val Ala Leu Lys Arg
115 120 125
Thr Gly Gln Tyr Lys Leu Gly Ser Lys Thr Gly Pro Gly Gln Lys Ala
130 135 140
Ile Leu Phe Leu Pro Met Ser Ala Lys Ser
145 150
<210> 64
<211> 465
<212> DNA
<213> Homo sapiens
<400> 64
gctgccggat ctattaccac gctcccggcg ctcccggaag acggtggaag cggcgccttc 60
ccacctggcc acttcaaaga cccgaaacgt ctgtattgta aaaatggcgg ttttttcctc 120
cgcatccacc cagatggtcg cgtcgatggt gtccgcgaaa agtccgaccc acacatcaag 180
ctgcaactgc aagcagagga acgtggcgtc gtgagcatca agggcgtgtg cgcaaaccgc 240
tatctggcca tgaaggagga tggtcgcctt cttgcatcca aatgcgtgac cgatgaatgc 300
ttcttctttg aacggctgga gtccaacaat tacaacacct accgctcccg caagtatacc 360
tcctggtatg tcgccctgaa acgcacggga caatataaac tgggttccaa gaccggtcct 420
ggccaaaagg cgattctttt cctcccaatg tccgcgaagt cttga 465
Claims (30)
- 이종 단백질의 제조 방법으로서,
상기 이종 단백질의 분비 발현용의 유전자 구축물을 갖는 코리네형 세균을 배양하는 단계, 및
분비 생산된 이종 단백질을 회수하는 단계를 포함하고,
상기 코리네형 세균이, 하기 성질 (A), (B), 및 (C):
(A) RegX3 단백질의 활성이 비개변주와 비교하여 저하되는 성질;
(B) HrrSA 시스템의 활성이 비개변주와 비교하여 저하되는 성질;
(C) HrcA 단백질의 활성이 비개변주와 비교하여 저하되는 성질로부터 선택되는 2개 이상의 성질의 조합을 갖도록 개변되어 있으며,
상기 유전자 구축물이, 5'에서 3'방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열, 및 상기 이종 단백질을 코딩하는 핵산 서열을 포함하고,
상기 이종 단백질이, 상기 신호 펩타이드와의 융합 단백질로서 발현되는, 방법. - 제1항에 있어서, 상기 성질 (A), (B) 및 (C)가 각각 하기 성질 (A1), (B1) 및 (C1)인, 방법:
(A1) RegX3 단백질의 세포당 분자수가 비개변주와 비교하여 저하되는 성질;
(B1) HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 세포당 분자수가 비개변주와 비교하여 저하되는 성질;
(C1) HrcA 단백질의 세포당 분자수가 비개변주와 비교하여 저하되는 성질. - 제1항 또는 제2항에 있어서, 상기 코리네형 세균이 상기 성질 (A)와 (B)의 조합, 상기 성질 (A)와 (C)의 조합, 또는 상기 성질 (B)와 (C)의 조합을 갖는, 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 코리네형 세균이 상기 성질 (A)와 (B)와 (C)의 조합을 갖는, 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 활성을 저하시킴으로써, 상기 성질 (B)가 얻어진, 방법.
- 제5항에 있어서, 적어도 HrrA 단백질의 활성을 저하시킴으로써, 상기 성질 (B)가 얻어진, 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 세포당 분자수를 저하시킴으로써, 상기 성질 (B)가 얻어진, 방법.
- 제7항에 있어서, 적어도 HrrA 단백질의 세포당 분자수를 저하시킴으로써, 상기 성질 (B)가 얻어진, 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 RegX3 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 42에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 42에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 단백질;
(c) 서열번호 42에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 단백질인, 방법. - 제2항 내지 제9항 중 어느 한 항에 있어서, 상기 HrrS 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 44에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 44에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 단백질;
(c) 서열번호 44에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 단백질인, 방법. - 제2항 내지 제10항 중 어느 한 항에 있어서, 상기 HrrA 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 46에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 46에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 단백질;
(c) 서열번호 46에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 단백질인, 방법. - 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 HrcA 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 48에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 48에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 단백질;
(c) 서열번호 48에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 단백질인, 방법. - 제1항 내지 제12항 중 어느 한 항에 있어서, regX3 유전자의 발현을 저하시킴으로써, 또는 regX3 유전자를 파괴함으로써, 상기 성질 (A)가 얻어진;
hrrS 유전자 및/또는 hrrA 유전자의 발현을 저하시킴으로써, 또는 hrrS 유전자 및/또는 hrrA 유전자를 파괴함으로써, 상기 성질 (B)가 얻어진; 및/또는,
hrcA 유전자의 발현을 저하시킴으로써, 또는 hrcA 유전자를 파괴함으로써, 상기 성질 (C)가 얻어진, 방법. - 제1항 내지 제13항 중 어느 한 항에 있어서, regX3 유전자의 결실에 의해, 상기 성질 (A)가 얻어지고;
hrrS 유전자 및/또는 hrrA 유전자의 결실에 의해, 상기 성질 (B)가 얻어지고; 및/또는,
hrcA 유전자의 결실에 의해, 상기 성질 (C)가 얻어진, 방법. - 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 코리네형 세균이, 추가로, 변이형 PhoS 단백질을 코딩하는 phoS 유전자를 유지하도록 개변되어 있는, 방법.
- 제15항에 있어서, 상기 변이가 야생형 PhoS 단백질에 있어서, 서열번호 2의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기를 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환한 변이인, 방법.
- 제16항에 있어서, 상기 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가, 라이신 잔기, 알라닌 잔기, 발린 잔기, 세린 잔기, 시스테인 잔기, 메티오닌 잔기, 아스파르트산 잔기, 또는 아스파라긴 잔기인, 방법.
- 제16항 또는 제17항에 있어서, 상기 야생형 PhoS 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 단백질;
(c) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 단백질인, 방법. - 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 신호 펩타이드가 Tat계 의존성 신호 펩타이드인, 방법.
- 제19항에 있어서, 상기 Tat계 의존성 신호 펩타이드가 TorA 신호 펩타이드, SufI 신호 펩타이드, PhoD 신호 펩타이드, LipA 신호 펩타이드 및 IMD 신호 펩타이드로 이루어지는 그룹으로부터 선택되는 어느 하나의 신호 펩타이드인, 방법.
- 제19항 또는 제20항에 있어서, 상기 코리네형 세균이, 추가로, Tat계 분비 시스템을 코딩하는 유전자들로부터 선택되는 1종 이상의 유전자의 발현이 비개변주와 비교하여 상승하도록 개변되어 있는, 방법.
- 제21항에 있어서, 상기 Tat계 분비 시스템을 코딩하는 유전자가 tatA 유전자, tatB 유전자, tatC 유전자 및 tatE 유전자로 이루어지는, 방법.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 신호 펩타이드가 Sec계 의존성 신호 펩타이드인, 방법.
- 제23항에 있어서, 상기 Sec계 의존성 신호 펩타이드가 PS1 신호 펩타이드, PS2 신호 펩타이드 및 SlpA 신호 펩타이드로 이루어지는 그룹으로부터 선택되는 어느 하나의 신호 펩타이드인, 방법.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 유전자 구축물이, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열을 포함하는, 방법.
- 제25항에 있어서, 상기 유전자 구축물이, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열을 포함하는, 방법.
- 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 코리네형 세균이 코리네박테리움속 세균인, 방법.
- 제27항에 있어서, 상기 코리네형 세균이 코리네박테리움 글루타미쿰인, 방법.
- 제28항에 있어서, 상기 코리네형 세균이, 코리네박테리움 글루타미쿰 AJ 12036(FERM BP-734)에서 유래하는 개변주 또는 코리네박테리움 글루타미쿰 ATCC 13869에서 유래하는 개변주인, 방법.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 코리네형 세균이, 세포 표층 단백질의 세포당 분자수가 비개변주와 비교하여 저하되어 있는 코리네형 세균인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2018-081138 | 2018-04-20 | ||
JP2018081138 | 2018-04-20 | ||
PCT/JP2019/017100 WO2019203368A1 (ja) | 2018-04-20 | 2019-04-22 | タンパク質の分泌生産法 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210002575A true KR20210002575A (ko) | 2021-01-08 |
Family
ID=68238922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207033331A KR20210002575A (ko) | 2018-04-20 | 2019-04-22 | 단백질의 분비 생산법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20210024941A1 (ko) |
EP (1) | EP3783106A4 (ko) |
JP (2) | JP7439749B2 (ko) |
KR (1) | KR20210002575A (ko) |
CN (1) | CN112004929B (ko) |
AU (1) | AU2019256065A1 (ko) |
WO (1) | WO2019203368A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112553134B (zh) * | 2020-12-30 | 2022-09-06 | 江南大学 | 一种在枯草芽孢杆菌中表达α-淀粉酶的方法 |
CN113201552B (zh) * | 2021-04-29 | 2024-03-22 | 江南大学 | 一种分子伴侣质粒系统及其应用 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4730302Y1 (ko) | 1969-12-29 | 1972-09-11 | ||
US4965197A (en) | 1987-06-12 | 1990-10-23 | Massachusetts Institute Of Technology | Coryneform expression and secretion system |
JPH06502548A (ja) | 1991-07-30 | 1994-03-24 | オルサン | 特にコリネバクテリア中で用いることのできる蛋白質の発現および分泌系 |
JPH11169182A (ja) | 1997-12-10 | 1999-06-29 | Mitsubishi Chemical Corp | コリネ型細菌内で蛋白質を効率よく培地中へ分泌させる変異型分泌装置遺伝子 |
JP4320769B2 (ja) | 1999-09-30 | 2009-08-26 | 味の素株式会社 | トランスグルタミナーゼの製造法 |
JP4362651B2 (ja) | 2001-03-30 | 2009-11-11 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013062029A1 (ja) | 2011-10-25 | 2013-05-02 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013065772A1 (ja) | 2011-11-02 | 2013-05-10 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013065869A1 (en) | 2011-11-02 | 2013-05-10 | Ajinomoto Co.,Inc. | Method for secretory production of protein |
WO2013118544A1 (ja) | 2012-02-08 | 2013-08-15 | 味の素株式会社 | タンパク質の分泌生産法 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57134500A (en) | 1981-02-12 | 1982-08-19 | Kyowa Hakko Kogyo Co Ltd | Plasmid pcg1 |
JPS57183799A (en) | 1981-04-17 | 1982-11-12 | Kyowa Hakko Kogyo Co Ltd | Novel plasmid |
JPS5835197A (ja) | 1981-08-26 | 1983-03-01 | Kyowa Hakko Kogyo Co Ltd | プラスミドpcg2 |
JPS58192900A (ja) | 1982-05-04 | 1983-11-10 | Ajinomoto Co Inc | 複合プラスミド |
JPH01191686A (ja) | 1988-01-26 | 1989-08-01 | Mitsubishi Petrochem Co Ltd | 複合プラスミド |
FR2627508B1 (fr) | 1988-02-22 | 1990-10-05 | Eurolysine | Procede pour l'integration d'un gene choisi sur le chromosome d'une bacterie et bacterie obtenue par ledit procede |
JP2678995B2 (ja) | 1988-09-08 | 1997-11-19 | 三菱化学株式会社 | トリプトフアンシンターゼの製造法 |
US5185262A (en) | 1988-07-27 | 1993-02-09 | Mitsubishi Petrochemical Co., Ltd. | DNA fragment containing gene which encodes the function of stabilizing plasmid in host microorganism |
JPH02207791A (ja) | 1989-02-07 | 1990-08-17 | Ajinomoto Co Inc | 微生物の形質転換法 |
JP2973446B2 (ja) | 1990-01-11 | 1999-11-08 | 三菱化学株式会社 | 新規プラスミドベクター |
JPH07108228B2 (ja) | 1990-10-15 | 1995-11-22 | 味の素株式会社 | 温度感受性プラスミド |
JP3720363B2 (ja) | 1994-08-26 | 2005-11-24 | ノボザイムス アクティーゼルスカブ | 微生物のトランスグルタミナーゼ、それらの産生及び使用 |
EP0871712B1 (en) | 1995-01-19 | 2003-08-27 | Novozymes A/S | Transglutaminases from oomycetes |
DK0805867T3 (da) | 1995-01-23 | 2004-04-13 | Novozymes As | DNA integration ved transposition |
JPH0970291A (ja) | 1995-06-30 | 1997-03-18 | Ajinomoto Co Inc | 人工トランスポゾンを用いた遺伝子増幅方法 |
JP4035855B2 (ja) | 1996-06-05 | 2008-01-23 | 味の素株式会社 | L−リジンの製造法 |
JP3711658B2 (ja) | 1996-10-07 | 2005-11-02 | 味の素株式会社 | コリネバクテリウム・アンモニアゲネス由来の新規な細胞表層蛋白質 |
JP4168463B2 (ja) | 1996-12-05 | 2008-10-22 | 味の素株式会社 | L−リジンの製造法 |
JP2000262288A (ja) | 1999-03-16 | 2000-09-26 | Ajinomoto Co Inc | コリネ型細菌の温度感受性プラスミド |
AU2003268693A1 (en) | 2002-09-30 | 2004-04-19 | Ajinomoto Co., Inc. | Method of producing stable isotope-labeled protein |
JP4894134B2 (ja) | 2003-07-29 | 2012-03-14 | 味の素株式会社 | 物質生産に影響する代謝フラックスの決定方法 |
DE102004013503A1 (de) * | 2004-03-18 | 2005-10-06 | Degussa Ag | Verfahren zur Herstellung von L-Aminosäuren unter Verwendung coryneformer Bakterien |
EP1748077B1 (en) | 2004-04-20 | 2013-02-27 | Ajinomoto Co., Inc. | Method of producing protein |
DE102004035543A1 (de) * | 2004-07-22 | 2006-02-09 | Henkel Kgaa | Neue sekretorische Genprodukte von Bacillus licheniformis und darauf aufbauende verbesserte biotechnologische Produktionsverfahren |
JP4595506B2 (ja) | 2004-11-25 | 2010-12-08 | 味の素株式会社 | L−アミノ酸生産菌及びl−アミノ酸の製造方法 |
US7794989B2 (en) | 2004-12-28 | 2010-09-14 | Ajinomoto Co., Inc. | L-glutamic acid-producing microorganism and a method for producing L-glutamic acid |
CN103930557A (zh) | 2011-11-11 | 2014-07-16 | 味之素株式会社 | 利用发酵法制造目标物质的方法 |
EP3287523B1 (en) * | 2015-04-24 | 2022-06-29 | Ajinomoto Co., Inc. | Method for secretory production of protein |
AU2017347017B2 (en) * | 2016-10-21 | 2021-10-28 | Ajinomoto Co., Inc. | Protein secretory production method |
WO2018074578A1 (ja) * | 2016-10-21 | 2018-04-26 | 味の素株式会社 | タンパク質の分泌生産法 |
-
2019
- 2019-04-22 WO PCT/JP2019/017100 patent/WO2019203368A1/ja active Application Filing
- 2019-04-22 CN CN201980026987.5A patent/CN112004929B/zh active Active
- 2019-04-22 JP JP2020514473A patent/JP7439749B2/ja active Active
- 2019-04-22 EP EP19789256.5A patent/EP3783106A4/en active Pending
- 2019-04-22 KR KR1020207033331A patent/KR20210002575A/ko not_active Application Discontinuation
- 2019-04-22 AU AU2019256065A patent/AU2019256065A1/en active Pending
-
2020
- 2020-10-16 US US17/072,429 patent/US20210024941A1/en active Pending
-
2023
- 2023-11-08 JP JP2023191154A patent/JP2023184699A/ja not_active Withdrawn
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4730302Y1 (ko) | 1969-12-29 | 1972-09-11 | ||
US4965197A (en) | 1987-06-12 | 1990-10-23 | Massachusetts Institute Of Technology | Coryneform expression and secretion system |
JPH06502548A (ja) | 1991-07-30 | 1994-03-24 | オルサン | 特にコリネバクテリア中で用いることのできる蛋白質の発現および分泌系 |
JPH11169182A (ja) | 1997-12-10 | 1999-06-29 | Mitsubishi Chemical Corp | コリネ型細菌内で蛋白質を効率よく培地中へ分泌させる変異型分泌装置遺伝子 |
JP4320769B2 (ja) | 1999-09-30 | 2009-08-26 | 味の素株式会社 | トランスグルタミナーゼの製造法 |
JP4362651B2 (ja) | 2001-03-30 | 2009-11-11 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013062029A1 (ja) | 2011-10-25 | 2013-05-02 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013065772A1 (ja) | 2011-11-02 | 2013-05-10 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013065869A1 (en) | 2011-11-02 | 2013-05-10 | Ajinomoto Co.,Inc. | Method for secretory production of protein |
WO2013118544A1 (ja) | 2012-02-08 | 2013-08-15 | 味の素株式会社 | タンパク質の分泌生産法 |
Non-Patent Citations (15)
Title |
---|
비특허문헌 1: Microbiol. Rev., 57,109-137(1993) |
비특허문헌 10: Appl. Microbiol. Biotechnol., 94, 1131-1150(2012) |
비특허문헌 11: J. Bacteriol., 188, 724-732(2006) |
비특허문헌 12: Han Min Woo, Regulatory and metabolic aspects of the phosphate starvation response of Corynebacterium glutamicum, URN (NBN): urn:nbn:de:hbz:061-20100825-090114-5, 뒤셀도르프 대학 박사 논문(2010) |
비특허문헌 13: J. Bacteriol., 193, 1212-1221(2011) |
비특허문헌 14: J. Bacteriol., 191, 2964-2072(2009) |
비특허문헌 15: Microb. Cell. Fact., 8: 9(2009) |
비특허문헌 2: Biotechnol., 11, 905-910(1993) |
비특허문헌 3: Biotechnol., 6, 1419-1422(1988) |
비특허문헌 4: Biotechnol., 9, 976-981(1991) |
비특허문헌 5: J. Bacteriol., 174, 1854-1861(1992) |
비특허문헌 6: Appl. Environ. Microbiol., 61, 1610-1613(1995) |
비특허문헌 7: Appl. Environ. Microbiol., 63, 4392-4400(1997) |
비특허문헌 8: EMBO J., 14, 2715-2722(1995) |
비특허문헌 9: J. Biol. Chem., 25; 273(52), 34868-74(1998) |
Also Published As
Publication number | Publication date |
---|---|
EP3783106A1 (en) | 2021-02-24 |
AU2019256065A1 (en) | 2020-11-26 |
JP2023184699A (ja) | 2023-12-28 |
WO2019203368A1 (ja) | 2019-10-24 |
JPWO2019203368A1 (ja) | 2021-04-22 |
JP7439749B2 (ja) | 2024-02-28 |
EP3783106A4 (en) | 2022-01-05 |
US20210024941A1 (en) | 2021-01-28 |
CN112004929A (zh) | 2020-11-27 |
CN112004929B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102619848B1 (ko) | 단백질의 분비 생산법 | |
KR102337932B1 (ko) | 단백질의 분비 생산법 | |
JP6064912B2 (ja) | タンパク質の分泌生産法 | |
JP6020581B2 (ja) | タンパク質の分泌生産法 | |
JP6136930B2 (ja) | タンパク質の分泌生産法 | |
WO2013118544A1 (ja) | タンパク質の分泌生産法 | |
KR102335301B1 (ko) | 단백질의 분비 생산법 | |
US20210246479A1 (en) | Method for Secretory Production of Protein | |
JP2023184699A (ja) | タンパク質の分泌生産法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |