KR20170140351A - 단백질의 분비 생산법 - Google Patents
단백질의 분비 생산법 Download PDFInfo
- Publication number
- KR20170140351A KR20170140351A KR1020177034151A KR20177034151A KR20170140351A KR 20170140351 A KR20170140351 A KR 20170140351A KR 1020177034151 A KR1020177034151 A KR 1020177034151A KR 20177034151 A KR20177034151 A KR 20177034151A KR 20170140351 A KR20170140351 A KR 20170140351A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- gene
- amino acid
- phos
- ala
- Prior art date
Links
- 230000028327 secretion Effects 0.000 title claims description 126
- 230000014616 translation Effects 0.000 title description 12
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 932
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 586
- YGYAWVDWMABLBF-UHFFFAOYSA-N Phosgene Chemical compound ClC(Cl)=O YGYAWVDWMABLBF-UHFFFAOYSA-N 0.000 claims abstract description 132
- 238000000034 method Methods 0.000 claims abstract description 107
- 230000035772 mutation Effects 0.000 claims abstract description 103
- 230000003248 secreting effect Effects 0.000 claims abstract description 77
- 238000004519 manufacturing process Methods 0.000 claims abstract description 64
- 235000018102 proteins Nutrition 0.000 claims description 561
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 174
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 166
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 146
- 230000014509 gene expression Effects 0.000 claims description 134
- 125000000539 amino acid group Chemical group 0.000 claims description 113
- 241000186254 coryneform bacterium Species 0.000 claims description 108
- 239000002773 nucleotide Substances 0.000 claims description 62
- 125000003729 nucleotide group Chemical group 0.000 claims description 62
- 241000894006 Bacteria Species 0.000 claims description 53
- 230000000694 effects Effects 0.000 claims description 52
- 238000006467 substitution reaction Methods 0.000 claims description 50
- 235000001014 amino acid Nutrition 0.000 claims description 42
- 229940024606 amino acid Drugs 0.000 claims description 40
- 150000007523 nucleic acids Chemical group 0.000 claims description 40
- 108010052285 Membrane Proteins Proteins 0.000 claims description 39
- 102000018697 Membrane Proteins Human genes 0.000 claims description 39
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 37
- 230000001419 dependent effect Effects 0.000 claims description 34
- 108020001507 fusion proteins Proteins 0.000 claims description 28
- 102000037865 fusion proteins Human genes 0.000 claims description 28
- -1 aromatic amino acid Chemical class 0.000 claims description 24
- 238000003780 insertion Methods 0.000 claims description 24
- 230000037431 insertion Effects 0.000 claims description 24
- 244000201986 Cassia tora Species 0.000 claims description 22
- NCAIGTHBQTXTLR-UHFFFAOYSA-N phentermine hydrochloride Chemical group [Cl-].CC(C)([NH3+])CC1=CC=CC=C1 NCAIGTHBQTXTLR-UHFFFAOYSA-N 0.000 claims description 22
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 claims description 22
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 claims description 21
- 238000012217 deletion Methods 0.000 claims description 20
- 230000037430 deletion Effects 0.000 claims description 20
- 230000003247 decreasing effect Effects 0.000 claims description 19
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 claims description 18
- 241000186216 Corynebacterium Species 0.000 claims description 17
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 16
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 13
- 238000007792 addition Methods 0.000 claims description 10
- 238000012258 culturing Methods 0.000 claims description 10
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims description 10
- 101150085086 tatA gene Proteins 0.000 claims description 10
- 101150019203 tatB gene Proteins 0.000 claims description 10
- 101150075675 tatC gene Proteins 0.000 claims description 10
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 claims description 9
- 101150073677 tatE gene Proteins 0.000 claims description 6
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 5
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims description 5
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 5
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 claims description 4
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 4
- 241000186031 Corynebacteriaceae Species 0.000 abstract description 50
- 108020004414 DNA Proteins 0.000 description 105
- 101710088599 Cold shock-like protein CspLB Proteins 0.000 description 75
- 239000013612 plasmid Substances 0.000 description 64
- 239000013598 vector Substances 0.000 description 63
- 230000006870 function Effects 0.000 description 55
- 101100354149 Escherichia coli (strain K12) pstS gene Proteins 0.000 description 53
- 238000006243 chemical reaction Methods 0.000 description 50
- 210000000349 chromosome Anatomy 0.000 description 46
- 210000004027 cell Anatomy 0.000 description 40
- 239000012634 fragment Substances 0.000 description 34
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 32
- 239000002609 medium Substances 0.000 description 30
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 27
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 26
- 230000001976 improved effect Effects 0.000 description 26
- 108060008539 Transglutaminase Proteins 0.000 description 25
- 238000010276 construction Methods 0.000 description 25
- 102000003601 transglutaminase Human genes 0.000 description 25
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 24
- 230000001965 increasing effect Effects 0.000 description 24
- 108020004705 Codon Proteins 0.000 description 23
- 230000002068 genetic effect Effects 0.000 description 23
- 101150022503 phoR gene Proteins 0.000 description 23
- 108010092282 Trimethylamine dehydrogenase Proteins 0.000 description 22
- 150000001413 amino acids Chemical class 0.000 description 22
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 21
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 19
- 241000588724 Escherichia coli Species 0.000 description 18
- 241000880493 Leptailurus serval Species 0.000 description 18
- 239000012228 culture supernatant Substances 0.000 description 18
- 239000013613 expression plasmid Substances 0.000 description 18
- 108091005804 Peptidases Proteins 0.000 description 17
- 102000035195 Peptidases Human genes 0.000 description 17
- 239000004365 Protease Substances 0.000 description 17
- 101150049887 cspB gene Proteins 0.000 description 17
- 108010000320 glucan 1,6-alpha-isomaltosidase Proteins 0.000 description 17
- 238000002744 homologous recombination Methods 0.000 description 17
- 230000006801 homologous recombination Effects 0.000 description 17
- 108090000765 processed proteins & peptides Proteins 0.000 description 17
- 108091008146 restriction endonucleases Proteins 0.000 description 17
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 229910052757 nitrogen Inorganic materials 0.000 description 16
- 102100026745 Fatty acid-binding protein, liver Human genes 0.000 description 15
- 101710188974 Fatty acid-binding protein, liver Proteins 0.000 description 15
- 101710189565 Fatty acid-binding protein, liver-type Proteins 0.000 description 15
- 235000019419 proteases Nutrition 0.000 description 15
- 238000012163 sequencing technique Methods 0.000 description 15
- 238000010186 staining Methods 0.000 description 15
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 14
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 14
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 14
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 14
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 14
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 14
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 14
- 230000007812 deficiency Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 239000002344 surface layer Substances 0.000 description 14
- 238000013518 transcription Methods 0.000 description 14
- 230000035897 transcription Effects 0.000 description 14
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 13
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 13
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 13
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 13
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 13
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 13
- 108010005233 alanylglutamic acid Proteins 0.000 description 13
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 13
- 239000013604 expression vector Substances 0.000 description 13
- 244000005700 microbiome Species 0.000 description 13
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 12
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 12
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 12
- 108091000080 Phosphotransferase Proteins 0.000 description 12
- 102100039175 Trefoil factor 1 Human genes 0.000 description 12
- 108010044940 alanylglutamine Proteins 0.000 description 12
- 230000003321 amplification Effects 0.000 description 12
- 239000008103 glucose Substances 0.000 description 12
- 108010077515 glycylproline Proteins 0.000 description 12
- 238000003199 nucleic acid amplification method Methods 0.000 description 12
- 102000020233 phosphotransferase Human genes 0.000 description 12
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 11
- 108010011459 Exenatide Proteins 0.000 description 11
- 244000068988 Glycine max Species 0.000 description 11
- 235000010469 Glycine max Nutrition 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- 108010081551 glycylphenylalanine Proteins 0.000 description 11
- 239000007788 liquid Substances 0.000 description 11
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 11
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 11
- 235000019796 monopotassium phosphate Nutrition 0.000 description 11
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 10
- 241000186146 Brevibacterium Species 0.000 description 10
- 241000186248 Corynebacterium callunae Species 0.000 description 10
- 241000424760 Corynebacterium crenatum Species 0.000 description 10
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 10
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 10
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 10
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 10
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 10
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 10
- 235000011130 ammonium sulphate Nutrition 0.000 description 10
- 238000003776 cleavage reaction Methods 0.000 description 10
- 230000002950 deficient Effects 0.000 description 10
- 229960001519 exenatide Drugs 0.000 description 10
- 230000004927 fusion Effects 0.000 description 10
- 239000000499 gel Substances 0.000 description 10
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 10
- 230000009467 reduction Effects 0.000 description 10
- 230000000717 retained effect Effects 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 241001644925 Corynebacterium efficiens Species 0.000 description 9
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 9
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 9
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 9
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 9
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 9
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 9
- 108010089804 glycyl-threonine Proteins 0.000 description 9
- 239000003102 growth factor Substances 0.000 description 9
- SURQXAFEQWPFPV-UHFFFAOYSA-L iron(2+) sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Fe+2].[O-]S([O-])(=O)=O SURQXAFEQWPFPV-UHFFFAOYSA-L 0.000 description 9
- 229930027917 kanamycin Natural products 0.000 description 9
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 9
- 229960000318 kanamycin Drugs 0.000 description 9
- 229930182823 kanamycin A Natural products 0.000 description 9
- 239000002243 precursor Substances 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- YQPSDMUGFKJZHR-QRTARXTBSA-N Asn-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)N)N YQPSDMUGFKJZHR-QRTARXTBSA-N 0.000 description 8
- TZBJAXGYGSIUHQ-XUXIUFHCSA-N Asp-Leu-Leu-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O TZBJAXGYGSIUHQ-XUXIUFHCSA-N 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 8
- 108010073324 Glutaminase Proteins 0.000 description 8
- 102000009127 Glutaminase Human genes 0.000 description 8
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 8
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 8
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- 108020005091 Replication Origin Proteins 0.000 description 8
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 8
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 8
- 229960002685 biotin Drugs 0.000 description 8
- 235000020958 biotin Nutrition 0.000 description 8
- 239000011616 biotin Substances 0.000 description 8
- 238000012224 gene deletion Methods 0.000 description 8
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 8
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 8
- 229960000344 thiamine hydrochloride Drugs 0.000 description 8
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 8
- 239000011747 thiamine hydrochloride Substances 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 108700026220 vif Genes Proteins 0.000 description 8
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 7
- YJCZUTXLPXBNIO-BHYGNILZSA-N Gln-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)N)N)C(=O)O YJCZUTXLPXBNIO-BHYGNILZSA-N 0.000 description 7
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 7
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 7
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 7
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 7
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 7
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 7
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 7
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 7
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 7
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- 238000009825 accumulation Methods 0.000 description 7
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 7
- 108010008355 arginyl-glutamine Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 7
- 238000010367 cloning Methods 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 7
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 7
- 108010090894 prolylleucine Proteins 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 6
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 6
- RIPMDCIXRYWXSH-KNXALSJPSA-N Ala-Trp-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N RIPMDCIXRYWXSH-KNXALSJPSA-N 0.000 description 6
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 6
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 6
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 6
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 6
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 6
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 6
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 6
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 6
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 6
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 6
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 6
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 6
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 6
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 6
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 6
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 6
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 6
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 6
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 6
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 6
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 6
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 6
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 6
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 6
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 6
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 6
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 6
- 101710099182 S-layer protein Proteins 0.000 description 6
- 108091058545 Secretory proteins Proteins 0.000 description 6
- 102000040739 Secretory proteins Human genes 0.000 description 6
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 6
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 6
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 6
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 6
- 108091081024 Start codon Proteins 0.000 description 6
- 101710183296 Surface layer protein Proteins 0.000 description 6
- 108010049264 Teriparatide Proteins 0.000 description 6
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 6
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 6
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 6
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 6
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 230000001851 biosynthetic effect Effects 0.000 description 6
- 229910000019 calcium carbonate Inorganic materials 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 108010048818 seryl-histidine Proteins 0.000 description 6
- JDFUJAMTCCQARF-UHFFFAOYSA-N tatb Chemical compound NC1=C([N+]([O-])=O)C(N)=C([N+]([O-])=O)C(N)=C1[N+]([O-])=O JDFUJAMTCCQARF-UHFFFAOYSA-N 0.000 description 6
- 229960005460 teriparatide Drugs 0.000 description 6
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 5
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 5
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 5
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 5
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 5
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 5
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 5
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 5
- 241000186074 Arthrobacter globiformis Species 0.000 description 5
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 5
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 5
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- 241000807905 Corynebacterium glutamicum ATCC 14067 Species 0.000 description 5
- 241000186308 Corynebacterium stationis Species 0.000 description 5
- 239000004470 DL Methionine Substances 0.000 description 5
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 5
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 5
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 5
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 5
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 5
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 5
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 5
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 5
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 5
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 5
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 5
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 5
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 5
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 5
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 5
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 5
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 5
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 5
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 5
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 5
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 5
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 5
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 5
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 5
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 5
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 5
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 5
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 5
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 5
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 5
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 5
- 238000000246 agarose gel electrophoresis Methods 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 5
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 239000013611 chromosomal DNA Substances 0.000 description 5
- 230000001268 conjugating effect Effects 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 5
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 5
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 5
- 101150091094 lipA gene Proteins 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 229930182817 methionine Natural products 0.000 description 5
- FFEARJCKVFRZRR-UHFFFAOYSA-N methionine Chemical compound CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 5
- 235000006109 methionine Nutrition 0.000 description 5
- 108010056582 methionylglutamic acid Proteins 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 230000026731 phosphorylation Effects 0.000 description 5
- 238000006366 phosphorylation reaction Methods 0.000 description 5
- 230000003389 potentiating effect Effects 0.000 description 5
- OGBMKVWORPGQRR-UMXFMPSGSA-N teriparatide Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 description 5
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 4
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 4
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 4
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 4
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 4
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 4
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 4
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 4
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 4
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 4
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 4
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 241000337023 Corynebacterium thermoaminogenes Species 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 4
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 4
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 4
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 4
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 4
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 4
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 4
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 4
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 4
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 4
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 4
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 4
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 4
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 4
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 4
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 4
- 108090000445 Parathyroid hormone Proteins 0.000 description 4
- 102000003982 Parathyroid hormone Human genes 0.000 description 4
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 4
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 4
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 4
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 4
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 4
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 4
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 4
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 4
- 241000319304 [Brevibacterium] flavum Species 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010036533 arginylvaline Proteins 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 210000004897 n-terminal region Anatomy 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 229960001319 parathyroid hormone Drugs 0.000 description 4
- 239000000199 parathyroid hormone Substances 0.000 description 4
- 230000001766 physiological effect Effects 0.000 description 4
- 108020003175 receptors Proteins 0.000 description 4
- 102000005962 receptors Human genes 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 241000186361 Actinobacteria <class> Species 0.000 description 3
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 3
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 3
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 3
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 3
- KNOGLZBISUBTFW-QRTARXTBSA-N Asp-Trp-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O KNOGLZBISUBTFW-QRTARXTBSA-N 0.000 description 3
- 241001025270 Brevibacterium album Species 0.000 description 3
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 description 3
- 241000909293 Corynebacterium alkanolyticum Species 0.000 description 3
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 3
- 241000133018 Corynebacterium melassecola Species 0.000 description 3
- 241001646716 Escherichia coli K-12 Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108010074860 Factor Xa Proteins 0.000 description 3
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 3
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 3
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 3
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 3
- 241000270431 Heloderma suspectum Species 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 3
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 3
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 3
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 3
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 3
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 3
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 3
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 2
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 2
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 2
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 241000186249 Corynebacterium sp. Species 0.000 description 2
- 101710088194 Dehydrogenase Proteins 0.000 description 2
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 2
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 2
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 2
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 2
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 2
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 2
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 2
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 2
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 2
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 2
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 2
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 2
- 241000144155 Microbacterium ammoniaphilum Species 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 108010025020 Nerve Growth Factor Proteins 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108010082913 S-layer proteins Proteins 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- 102000036693 Thrombopoietin Human genes 0.000 description 2
- 108010041111 Thrombopoietin Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108010009583 Transforming Growth Factors Proteins 0.000 description 2
- 102000009618 Transforming Growth Factors Human genes 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 229920000140 heteropolymer Polymers 0.000 description 2
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 229910001410 inorganic ion Inorganic materials 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 229940053128 nerve growth factor Drugs 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 230000004853 protein function Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000013076 target substance Substances 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 102000003390 tumor necrosis factor Human genes 0.000 description 2
- 108010087967 type I signal peptidase Proteins 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- AUHDWARTFSKSAC-HEIFUQTGSA-N (2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-(6-oxo-1H-purin-9-yl)oxolane-2-carboxylic acid Chemical compound [C@]1([C@H](O)[C@H](O)[C@@H](CO)O1)(N1C=NC=2C(O)=NC=NC12)C(=O)O AUHDWARTFSKSAC-HEIFUQTGSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- 108010048295 2-isopropylmalate synthase Proteins 0.000 description 1
- DMSDCBKFWUBTKX-UHFFFAOYSA-N 2-methyl-1-nitrosoguanidine Chemical compound CN=C(N)NN=O DMSDCBKFWUBTKX-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- PJWIPEXIFFQAQZ-PUFIMZNGSA-N 7-phospho-2-dehydro-3-deoxy-D-arabino-heptonic acid Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@H](O)CC(=O)C(O)=O PJWIPEXIFFQAQZ-PUFIMZNGSA-N 0.000 description 1
- 108010000700 Acetolactate synthase Proteins 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- MBWYUTNBYSSUIQ-HERUPUMHSA-N Ala-Asn-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N MBWYUTNBYSSUIQ-HERUPUMHSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 102100034613 Annexin A2 Human genes 0.000 description 1
- 108090000668 Annexin A2 Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- HJWQFFYRVFEWRM-SRVKXCTJSA-N Arg-Arg-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O HJWQFFYRVFEWRM-SRVKXCTJSA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 1
- RYKWOUUZJFSJOH-FXQIFTODSA-N Asp-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N RYKWOUUZJFSJOH-FXQIFTODSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- 108010055400 Aspartate kinase Proteins 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 1
- 101100162670 Bacillus subtilis (strain 168) amyE gene Proteins 0.000 description 1
- 101100242035 Bacillus subtilis (strain 168) pdhA gene Proteins 0.000 description 1
- 101100350224 Bacillus subtilis (strain 168) pdhB gene Proteins 0.000 description 1
- 101800001415 Bri23 peptide Proteins 0.000 description 1
- 102400000107 C-terminal peptide Human genes 0.000 description 1
- 101800000655 C-terminal peptide Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 102400000113 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 241000611330 Chryseobacterium Species 0.000 description 1
- 241000249126 Chryseobacterium proteolyticum Species 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 101100236536 Corynebacterium glutamicum (strain ATCC 13032 / DSM 20300 / BCRC 11384 / JCM 1318 / LMG 3730 / NCIMB 10025) glcB gene Proteins 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 1
- 101710116957 D-alanyl-D-alanine carboxypeptidase Proteins 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102100033238 Elongation factor Tu, mitochondrial Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010041308 Endothelial Growth Factors Proteins 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010091443 Exopeptidases Proteins 0.000 description 1
- 102000018389 Exopeptidases Human genes 0.000 description 1
- 102100031706 Fibroblast growth factor 1 Human genes 0.000 description 1
- 102100028412 Fibroblast growth factor 10 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 102100028071 Fibroblast growth factor 7 Human genes 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- NROSLUJMIQGFKS-IUCAKERBSA-N Gln-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N NROSLUJMIQGFKS-IUCAKERBSA-N 0.000 description 1
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- DSRVQBZAMPGEKU-AVGNSLFASA-N Gln-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DSRVQBZAMPGEKU-AVGNSLFASA-N 0.000 description 1
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- XIJOPMSILDNVNJ-ZVZYQTTQSA-N Glu-Val-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIJOPMSILDNVNJ-ZVZYQTTQSA-N 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 102000005133 Glutamate 5-kinase Human genes 0.000 description 1
- 108700023479 Glutamate 5-kinases Proteins 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 1
- 102100036284 Hepcidin Human genes 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- MFQVZYSPCIZFMR-MGHWNKPDSA-N His-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N MFQVZYSPCIZFMR-MGHWNKPDSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 1
- 101000911317 Homo sapiens Fatty acid-binding protein, liver Proteins 0.000 description 1
- 101000917237 Homo sapiens Fibroblast growth factor 10 Proteins 0.000 description 1
- 101001060261 Homo sapiens Fibroblast growth factor 7 Proteins 0.000 description 1
- 101001021253 Homo sapiens Hepcidin Proteins 0.000 description 1
- 108010064711 Homoserine dehydrogenase Proteins 0.000 description 1
- GRSZFWQUAKGDAV-KQYNXXCUSA-L IMP(2-) Chemical compound O[C@@H]1[C@H](O)[C@@H](COP([O-])([O-])=O)O[C@H]1N1C(N=CNC2=O)=C2N=C1 GRSZFWQUAKGDAV-KQYNXXCUSA-L 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- WSSGUVAKYCQSCT-XUXIUFHCSA-N Ile-Met-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)O)N WSSGUVAKYCQSCT-XUXIUFHCSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 108010093096 Immobilized Enzymes Proteins 0.000 description 1
- GRSZFWQUAKGDAV-UHFFFAOYSA-N Inosinic acid Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(NC=NC2=O)=C2N=C1 GRSZFWQUAKGDAV-UHFFFAOYSA-N 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 101100001037 Komagataeibacter europaeus adhA gene Proteins 0.000 description 1
- 101100123255 Komagataeibacter xylinus aceC gene Proteins 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108010071324 Livagen Proteins 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 238000003820 Medium-pressure liquid chromatography Methods 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 1
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 1
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- KPVLLNDCBYXKNV-CYDGBPFRSA-N Met-Val-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KPVLLNDCBYXKNV-CYDGBPFRSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 101100162145 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) adhC2 gene Proteins 0.000 description 1
- 101100162144 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) adhc1 gene Proteins 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 102000016978 Orphan receptors Human genes 0.000 description 1
- 108070000031 Orphan receptors Proteins 0.000 description 1
- 101100378791 Paenarthrobacter nicotinovorans aldh gene Proteins 0.000 description 1
- 108010049977 Peptide Elongation Factor Tu Proteins 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- ZZVUXQCQPXSUFH-JBACZVJFSA-N Phe-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ZZVUXQCQPXSUFH-JBACZVJFSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- FUAIIFPQELBNJF-ULQDDVLXSA-N Phe-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FUAIIFPQELBNJF-ULQDDVLXSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- UMIHVJQSXFWWMW-JBACZVJFSA-N Phe-Trp-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UMIHVJQSXFWWMW-JBACZVJFSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 1
- 108010089430 Phosphoproteins Proteins 0.000 description 1
- 102000007982 Phosphoproteins Human genes 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- XNJVJEHDZPDPQL-BZSNNMDCSA-N Pro-Trp-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H]1CCCN1)C(O)=O XNJVJEHDZPDPQL-BZSNNMDCSA-N 0.000 description 1
- BVTYXOFTHDXSNI-IHRRRGAJSA-N Pro-Tyr-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 BVTYXOFTHDXSNI-IHRRRGAJSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 108010052646 Protein Translocation Systems Proteins 0.000 description 1
- 102000018819 Protein Translocation Systems Human genes 0.000 description 1
- 241001008590 Proteiniborus Species 0.000 description 1
- 101100134871 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceE gene Proteins 0.000 description 1
- 101100406344 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceF gene Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 101100490556 Schizosaccharomyces pombe (strain 972 / ATCC 24843) adh1 gene Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- HZNFKPJCGZXKIC-DCAQKATOSA-N Ser-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N HZNFKPJCGZXKIC-DCAQKATOSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 1
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 101000815632 Streptococcus suis (strain 05ZYH33) Rqc2 homolog RqcH Proteins 0.000 description 1
- 241000520730 Streptomyces cinnamoneus Species 0.000 description 1
- 241000499056 Streptomyces griseocarneus Species 0.000 description 1
- 241000218483 Streptomyces lydicus Species 0.000 description 1
- 241001495137 Streptomyces mobaraensis Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 101150057615 Syn gene Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 1
- NCGUQWSJUKYCIT-SZZJOZGLSA-N Thr-His-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NCGUQWSJUKYCIT-SZZJOZGLSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108010058153 Twin-Arginine-Translocation System Proteins 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- JYVKKBDANPZIAW-AVGNSLFASA-N Val-Arg-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N JYVKKBDANPZIAW-AVGNSLFASA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 101150094017 aceA gene Proteins 0.000 description 1
- 101150036393 aceB gene Proteins 0.000 description 1
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 101150067366 adh gene Proteins 0.000 description 1
- 101150004356 adhC gene Proteins 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 235000011114 ammonium hydroxide Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- SCJNCDSAIRBRIA-DOFZRALJSA-N arachidonyl-2'-chloroethylamide Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCCl SCJNCDSAIRBRIA-DOFZRALJSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 230000035578 autophosphorylation Effects 0.000 description 1
- 101150070136 axeA gene Proteins 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 229910001424 calcium ion Inorganic materials 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 101150041068 cspJ gene Proteins 0.000 description 1
- 101150010904 cspLB gene Proteins 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010007093 dispase Proteins 0.000 description 1
- 229960003638 dopamine Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 102000036072 fibronectin binding proteins Human genes 0.000 description 1
- 101150005487 ftsI gene Proteins 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108020002326 glutamine synthetase Proteins 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- ZDPUTNZENXVHJC-UUOKFMHZSA-N guanosine 3'-monophosphate Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](OP(O)(O)=O)[C@H]1O ZDPUTNZENXVHJC-UUOKFMHZSA-N 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 239000004226 guanylic acid Substances 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 235000013902 inosinic acid Nutrition 0.000 description 1
- 239000004245 inosinic acid Substances 0.000 description 1
- 229940028843 inosinic acid Drugs 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- AGBQKNBQESQNJD-UHFFFAOYSA-N lipoic acid Chemical compound OC(=O)CCCCC1CCSS1 AGBQKNBQESQNJD-UHFFFAOYSA-N 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- SCVOEYLBXCPATR-UHFFFAOYSA-L manganese(II) sulfate pentahydrate Chemical compound O.O.O.O.O.[Mn+2].[O-]S([O-])(=O)=O SCVOEYLBXCPATR-UHFFFAOYSA-L 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- MBABOKRGFJTBAE-UHFFFAOYSA-N methyl methanesulfonate Chemical compound COS(C)(=O)=O MBABOKRGFJTBAE-UHFFFAOYSA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000011785 micronutrient Substances 0.000 description 1
- 235000013369 micronutrients Nutrition 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 101150060462 pbpB gene Proteins 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229910001414 potassium ion Inorganic materials 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 101150108780 pta gene Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 108010033826 ribosomal protein S1 Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 230000009962 secretion pathway Effects 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 210000002377 thylakoid Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/34—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/13—Protein-histidine kinases (2.7.13)
- C12Y207/13003—Histidine kinase (2.7.13.3)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
코리네형 세균에 의한 이종 단백질의 분비 생산을 향상시키는 신규한 기술을 개발하고, 이종 단백질의 분비 생산법을 제공한다. 이종 단백질을 분비 생산하는 능력을 갖고, 또한 특정한 변이를 갖는 phoS 유전자를 유지하도록 개변된 코리네형 세균을 배양하고, 이종 단백질을 분비 생산한다.
Description
본 발명은 이종 단백질의 분비 생산법에 관한 것이다.
미생물에 의한 이종 단백질의 분비 생산으로서는 지금까지 바실러스(Bacillus)속 세균(비특허문헌 1), 메탄올 자화성 효모 피키아 파스토리스(Pichia pastoris)(비특허문헌 2) 및 아스퍼질러스(Aspergillus)속 사상균(비특허문헌 3, 4) 등에 의한 이종 단백질의 분비 생산이 보고되어 있다.
또한, 코리네형 세균에 의해 이종 단백질을 분비 생산하는 시도도 이루어지고 있다. 코리네형 세균에 의한 이종 단백질의 분비 생산에 대해서는, 코리네박테리움·글루타미컴(Corynebacterium glutamicum)(이후, C. glutamicum이라고 생략하는 경우가 있다)에 의한 뉴클레아제(nuclease)나 리파아제(lipase)의 분비(특허문헌 1, 비특허문헌 5), 서브틸리신 등의 프로테아제의 분비(비특허문헌 6), 코리네형 세균의 세포 표층 단백질 PS1이나 PS2(CspB라고도 한다)의 시그널 펩타이드를 이용한 단백질의 분비(특허문헌 2), PS2(CspB)의 시그널 펩타이드를 이용한 피브로넥틴 결합 단백질의 분비(비특허문헌 7), PS2(CspB)나 SlpA(CspA라고도 한다)의 시그널 펩타이드를 이용한 프로트랜스글루타미나아제의 분비(특허문헌 3), 변이형 분비 장치를 이용한 단백질의 분비(특허문헌 4), 변이주에 의한 프로트랜스글루타미나아제의 분비(특허문헌 5) 등의 보고가 있다. 또한, 코리네형 세균에 의한 이종 단백질의 분비 생산량을 높이는 기술로서, 세포 표층 단백질의 활성을 저하시키는 것(특허문헌 6, 7), 페니실린 결합 단백질의 활성을 저하시키는 것(특허문헌 6), 메탈로펩티다아제를 코드하는 유전자의 발현을 증강시키는 것(특허문헌 7), 리보솜 단백질 S1 유전자에 변이를 도입하는 것(특허문헌 8), 시그널 펩타이드와 이종 단백질 사이에 Gln-Glu-Thr을 포함하는 아미노산 서열을 삽입하여 이종 단백질을 발현시키는 것(특허문헌 9) 등이 알려져 있다.
일반적인 단백질 분비 경로는 원핵 생물에서 진핵 생물까지 널리 존재하는 Sec계라고 불리는 경로이지만, 최근, Sec계와는 전혀 다른 단백질 분비 경로가 식물 세포의 엽록체의 틸라코이드막에서 발견되었다(비특허문헌 8). 이 신규 분비 경로는 이에 의해 분비되는 단백질의 시그널 서열에 아르기닌-아르기닌의 서열이 공통으로 존재하고 있기 때문에(비특허문헌 8), Tat계(Twin-Arginine Translocation system)라고 명명되었다. Sec계에서는 단백질이 고차 구조를 형성하기 전의 상태로 분비되는 반면, Tat계에서는 단백질은 세포 내에서 고차 구조를 형성한 후에 세포막을 통과하여 분비되는 것이 알려져 있다(비특허문헌 9). 코리네형 세균에서도 Tat계 의존 시그널 펩타이드를 이용한 단백질의 분비 생산의 보고가 있다(특허문헌 8, 10).
세균이 세포 내외의 다양한 환경 변화에 응답하는 시스템으로서, 2성분 제어계라고 불리는 시그널 전달 경로가 알려져 있다. 2성분 제어계는 환경 변화의 자극을 감지하는 역할의 센서 키나아제와, 센서 키나아제로부터 시그널을 받고, 또한 하류의 유전자의 발현을 제어하는 역할의 반응 조절인자(response regulator)의 2개의 성분으로 이루어지는 제어 시스템이다. 센서 키나아제가 자극을 감지하면, 특정한 히스티딘 잔기가 자기 인산화하고, 이의 인산기가, 반응 조절인자의 특정한 아스파라긴산 잔기로 전이함으로써 시그널이 전해지고, 인산화된 반응 조절인자가 활성화됨으로써 전사 인자로서 하류의 유전자 발현을 조절한다.
C. glutamicum의 2성분 제어계에 관한 지견은 비특허문헌 10 등에 자세하다. C. glutamicum에서는 2성분 제어계로서 지금까지 적어도 13종류의 시스템이 알려져 있다. 그 중의 하나가 PhoRS 시스템이고, 센서 키나아제의 PhoS 단백질과, 반응 조절인자의 PhoR 단백질로 이루어진다. PhoRS 결손주의 해석에 의해, PhoRS 시스템은 환경 중의 인산 결핍을 감지하여 시그널 전달을 행하는 제어계인 것이 밝혀져 있다(비특허문헌 11).
PhoS 단백질은 2개소의 막 관통 도메인을 갖는 막 단백질이고, 자극을 감지하는 센서 도메인, HAMP 도메인이라고 불리는 링커 도메인, 자기 인산화하는 히스티딘 잔기를 갖는 HisKA 도메인, 및 ATP 결합능과 히스티딘 잔기의 자기 인산화를 촉매하는 기능을 갖는 HATPase 도메인으로 이루어진다. PhoR 단백질은 세포내 단백질이고, 시그널을 수용하는 N 말단측의 리시버 도메인과, 하류의 유전자의 발현 조절을 행하는 C 말단측의 이펙터 도메인으로 이루어진다(비특허문헌 10).
그러나, PhoRS 시스템과, 이종 단백질의 분비 생산의 관계는 지금까지 알려져 있지 않다. 또한, 코리네형 세균에 있어서, PhoS 단백질의 변이가 이종 단백질의 분비 생산에 유효한 것은 알려져 있지 않다. 또한, PhoS 단백질에서의 특정한 변이가 이종 단백질의 분비 생산에 유효한 것도 알려져 있지 않다.
비특허문헌 1: Microbiol. rev., 57, 109-137(1993)
비특허문헌 2: Biotechnol., 11, 905-910(1993)
비특허문헌 3: Biotechnol., 6, 1419-1422(1988)
비특허문헌 4: Biotechnol., 9, 976-981(1991)
비특허문헌 5: J. Bacteriol., 174, 1854-1861(1992)
비특허문헌 6: Appl. Environ. Microbiol., 61, 1610-1613(1995)
비특허문헌 7: Appl. Environ. Microbiol., 63, 4392-4400(1997)
비특허문헌 8: EMBO J., 14, 2715-2722(1995)
비특허문헌 9: J. Biol. Chem., 25; 273(52), 34868-74(1998)
비특허문헌 10: Appl. Microbiol. Biotechnol., 94, 1131-1150(2012)
비특허문헌 11: J. Bacteriol., 188, 724-732(2006)
본 발명은 코리네형 세균에 의한 이종 단백질의 분비 생산을 향상시키는 신규의 기술을 개발하고, 코리네형 세균에 의한 이종 단백질의 분비 생산법을 제공하는 것을 과제로 한다.
본 발명자들은 상기 과제를 해결하기 위해서 예의 연구를 실시한 결과, 특정한 변이를 갖는 phoS 유전자를 유지하도록 코리네형 세균을 개변함으로써, 코리네형 세균의 이종 단백질의 분비 생산능이 향상되는 것을 발견하여 본 발명을 완성시켰다.
즉, 본 발명은 이하와 같이 예시할 수 있다.
[1]
이종 단백질의 분비 발현용 유전자 구축물을 갖는 코리네형 세균을 배양하고, 분비 생산된 이종 단백질을 회수하는 것을 포함하는 이종 단백질의 제조 방법으로서,
상기 코리네형 세균이 변이형 PhoS 단백질을 코드하는 phoS 유전자를 유지하도록 개변되어 있고,
상기 변이형 PhoS 단백질이 이종 단백질의 분비 생산량을 향상시키는 변이를 갖는 PhoS 단백질이고,
상기 유전자 구축물이 5'에서 3' 방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 시그널 펩타이드를 코드하는 핵산 서열, 및 이종 단백질을 코드하는 핵산 서열을 포함하고,
상기 이종 단백질이 상기 시그널 펩타이드와의 융합 단백질로서 발현되는, 방법.
[2]
상기 변이가, 야생형 PhoS 단백질에 있어서 자기 인산화되는 히스티딘 잔기 이외의 아미노산 잔기가 다른 아미노산 잔기로 치환되는 변이인, 상기 방법.
[3]
상기 변이가, 야생형 PhoS 단백질에 있어서 자기 인산화되는 히스티딘 잔기 이외의 HisKA 도메인의 아미노산 잔기가 다른 아미노산 잔기로 치환되는 변이인, 상기 방법.
[4]
상기 변이가, 야생형 PhoS 단백질에 있어서 서열번호 4의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기가 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환되는 변이인, 상기 방법.
[5]
이종 단백질의 분비 발현용 유전자 구축물을 갖는 코리네형 세균을 배양하고, 분비 생산된 이종 단백질을 회수하는 것을 포함하는 이종 단백질의 제조 방법으로서,
상기 코리네형 세균이 변이형 PhoS 단백질을 코드하는 phoS 유전자를 유지하도록 개변되어 있고,
상기 변이형 PhoS 단백질이, 야생형 PhoS 단백질에 있어서 서열번호 4의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기가 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환되는 변이를 갖는 PhoS 단백질이고,
상기 유전자 구축물이 5'에서 3' 방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 시그널 펩타이드를 코드하는 핵산 서열, 및 이종 단백질을 코드하는 핵산 서열을 포함하고,
상기 이종 단백질이 상기 시그널 펩타이드와의 융합 단백질로서 발현되는, 방법.
[6]
상기 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가 리신 잔기, 알라닌 잔기, 발린 잔기, 세린 잔기, 시스테인 잔기, 메티오닌 잔기, 아스파라긴산 잔기 또는 아스파라긴 잔기인, 상기 방법.
[7]
상기 야생형 PhoS 단백질이 하기 (a), (b) 또는 (c)에 기재된 단백질인, 상기 방법:
(a) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 또는 부가를 포함하는 아미노산 서열을 포함하는 단백질;
(c) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하는 단백질.
[8]
상기 시그널 펩타이드가 Tat계 의존 시그널 펩타이드인, 상기 방법.
[9]
상기 Tat계 의존 시그널 펩타이드가 TorA 시그널 펩타이드, SufI 시그널 펩타이드, PhoD 시그널 펩타이드, LipA 시그널 펩타이드 및 IMD 시그널 펩타이드로 이루어지는 그룹으로부터 선택되는, 상기 방법.
[10]
상기 코리네형 세균이 또한, Tat계 분비 장치를 코드하는 유전자로부터 선택되는 1 또는 그 이상의 유전자의 발현이 상승하도록 개변되어 있는, 상기 방법.
[11]
상기 Tat계 분비 장치를 코드하는 유전자가 tatA 유전자, tatB 유전자, tatC 유전자 및 tatE 유전자로 이루어지는, 상기 방법.
[12]
상기 시그널 펩타이드가 Sec계 의존 시그널 펩타이드인, 상기 방법.
[13]
상기 Sec계 의존 시그널 펩타이드가 PS1 시그널 펩타이드, PS2 시그널 펩타이드 및 SlpA 시그널 펩타이드로 이루어지는 그룹으로부터 선택되는, 상기 방법.
[14]
상기 유전자 구축물이, 코리네형 세균에서 기능하는 시그널 펩타이드를 코드하는 핵산 서열과 이종 단백질을 코드하는 핵산 서열 사이에, 또한 Gln-Glu-Thr을 포함하는 아미노산 서열을 코드하는 핵산 서열을 포함하는, 상기 방법.
[15]
상기 유전자 구축물이, Gln-Glu-Thr을 포함하는 아미노산 서열을 코드하는 핵산 서열과 이종 단백질을 코드하는 핵산 서열 사이에, 또한 효소적 절단에 사용되는 아미노산 서열을 코드하는 핵산 서열을 포함하는 ,상기 방법.
[16]
상기 코리네형 세균이 코리네박테리움속 세균인, 상기 방법.
[17]
상기 코리네형 세균이 코리네박테리움·글루타미컴인, 상기 방법.
[18]
상기 코리네형 세균이 코리네박테리움·글루타미컴 AJ12036(FERM BP-734) 또는 ATCC13869로부터 유래하는 개변주인, 상기 방법.
[19]
상기 코리네형 세균이 세포 표층 단백질의 활성이 저하되어 있는 코리네형 세균인, 상기 방법.
[20]
변이형 PhoS 단백질을 코드하는 phoS 유전자를 유지하도록 개변된 코리네형 세균으로서,
상기 변이형 PhoS 단백질이, 야생형 PhoS 단백질에 있어서 서열번호 4의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기가 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환되는 변이를 갖는 PhoS 단백질인, 코리네형 세균.
[21]
상기 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가 리신 잔기, 알라닌 잔기, 발린 잔기, 세린 잔기, 시스테인 잔기, 메티오닌 잔기, 아스파라긴산 잔기 또는 아스파라긴 잔기인, 상기 코리네형 세균.
[22]
상기 야생형 PhoS 단백질이 하기 (a), (b) 또는 (c)에 기재된 단백질인, 상기 코리네형 세균:
(a) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 또는 부가를 포함하는 아미노산 서열을 포함하는 단백질;
(c) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하는 단백질.
[23]
코리네박테리움속 세균인, 상기 코리네형 세균.
[24]
코리네박테리움·글루타미컴인, 상기 코리네형 세균.
[25]
코리네박테리움·글루타미컴 AJ12036(FERM BP-734) 또는 ATCC13869로부터 유래하는 개변주인, 상기 코리네형 세균.
[26]
세포 표층 단백질의 활성이 저하되어 있는, 상기 코리네형 세균.
도 1은 C. glutamicum YDK010주, 및 이의 PhoS(W302C) 변이주 및 PhoS 결손주에서 CspB50TEV-Teri(CspB의 시그널 서열 및 성숙 CspB의 N 말단 서열을 융합한 Teriparatide)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 2는 코리네박테리움속 세균의 PhoS 동족체의 HisKA 도메인의 아미노산 서열의 정렬을 나타낸 도면.
도 3은 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 CspB6Xa-LFABP(CspB의 시그널 서열 및 성숙 CspB의 N 말단 서열을 융합한 LFABP)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 4는 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 CspB6TEV-ExCP(CspB의 시그널 서열 및 성숙 CspB의 N 말단 서열을 융합한 Exenatide)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 5는 pPK6 벡터의 구축 과정을 나타낸 도면.
도 6은 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 이. 콜라이(E. coli)의 TorA 시그널 서열을 융합한 프로트랜스글루타미나아제를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 7은 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 E. coli의 TorA 시그널 서열을 융합한 프로 구조부 부착 프로테인글루타미나아제를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 8은 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 Arthrobacter globiformis의 이소말토덱스트라나아제(시그널 서열을 포함한다)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 9는 C. glutamicum YDK010주의 PhoS 결손주, 및 이의 PhoS 상보주에서 CspB50TEV-Teri를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 10은 각종의 변이형 PhoS(W302X) 유전자를 도입한 C. glutamicum YDK010주의 PhoS 결손주에서 CspB50TEV-Teri를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 11은 C. glutamicum ATCC13869주 및 이의 PhoS(W302C) 변이주에서 CspB6TEV-ExCP를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 12는 C. glutamicum ATCC13869ΔcspB주 및 이의 PhoS(W302C) 변이주에서 CspB6Xa-LFABP를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 2는 코리네박테리움속 세균의 PhoS 동족체의 HisKA 도메인의 아미노산 서열의 정렬을 나타낸 도면.
도 3은 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 CspB6Xa-LFABP(CspB의 시그널 서열 및 성숙 CspB의 N 말단 서열을 융합한 LFABP)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 4는 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 CspB6TEV-ExCP(CspB의 시그널 서열 및 성숙 CspB의 N 말단 서열을 융합한 Exenatide)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 5는 pPK6 벡터의 구축 과정을 나타낸 도면.
도 6은 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 이. 콜라이(E. coli)의 TorA 시그널 서열을 융합한 프로트랜스글루타미나아제를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 7은 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 E. coli의 TorA 시그널 서열을 융합한 프로 구조부 부착 프로테인글루타미나아제를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 8은 C. glutamicum YDK010주 및 이의 PhoS(W302C) 변이주에서 Arthrobacter globiformis의 이소말토덱스트라나아제(시그널 서열을 포함한다)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 9는 C. glutamicum YDK010주의 PhoS 결손주, 및 이의 PhoS 상보주에서 CspB50TEV-Teri를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 10은 각종의 변이형 PhoS(W302X) 유전자를 도입한 C. glutamicum YDK010주의 PhoS 결손주에서 CspB50TEV-Teri를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 11은 C. glutamicum ATCC13869주 및 이의 PhoS(W302C) 변이주에서 CspB6TEV-ExCP를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
도 12는 C. glutamicum ATCC13869ΔcspB주 및 이의 PhoS(W302C) 변이주에서 CspB6Xa-LFABP를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진.
이하, 본 발명을 상세하게 설명한다.
<1> 본 발명의 이종 단백질의 제조 방법
본 발명은 이종 단백질의 분비 발현용 유전자 구축물을 갖는 코리네형 세균을 배양하고, 분비 생산된 이종 단백질을 회수하는 것을 포함하는 이종 단백질의 제조 방법으로서, 상기 코리네형 세균이 변이형 PhoS 단백질을 코드하는 phoS 유전자를 유지하도록 개변되어 있는, 방법(이하, 「본 발명의 방법」 또는 「본 발명의 이종 단백질의 제조 방법」이라고도 한다)을 제공한다.
<1-1> 본 발명의 방법에 사용되는 코리네형 세균
본 발명의 방법에 사용되는 코리네형 세균은 이종 단백질의 분비 발현용 유전자 구축물을 갖는 코리네형 세균으로서, 또한 변이형 PhoS 유전자를 유지하도록 개변된 코리네형 세균이다. 또한, 본 발명의 방법에 사용되는 코리네형 세균을, 「본 발명의 세균」 또는 「본 발명의 코리네형 세균」이라고도 한다. 또한, 본 발명의 세균이 갖는 이종 단백질의 분비 발현용 유전자 구축물을 「본 발명에 사용되는 유전자 구축물」이라고도 한다.
<1-1-1> 이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균
본 발명의 코리네형 세균은 이종 단백질의 분비 발현용 유전자 구축물(본 발명에 사용되는 유전자 구축물)을 가짐으로써, 이종 단백질을 분비 생산하는 능력을 갖는다.
본 발명에 있어서, 단백질이 「분비」된다는 것은 단백질이 세균 균체 외(세포 외)로 이송되는 것을 말한다. 세균 균체 외(세포 외)로서는 배지 중이나 균체 표층이 열거된다. 즉, 단백질이 「분비」되는 것으로는, 최종적으로 이의 단백질의 모든 분자가 배지 중에 완전하게 유리 상태에 놓이는 경우에 한정되지 않고, 이의 단백질의 모든 분자가 균체 표층에 존재하고 있는 경우나, 이의 단백질의 일부 분자가 배지 중에 존재하고, 나머지 분자가 균체 표층에 존재하고 있는 경우도 포함된다.
즉, 본 발명에 있어서, 「이종 단백질을 분비 생산하는 능력」이란, 본 발명의 세균을 배지 중에서 배양했을 때에, 배지 중 또는 균체 표층에 이종 단백질을 분비하고, 배지 중 또는 균체 표층으로부터 회수할 수 있는 정도로 축적하는 능력을 말한다. 축적량은 예를 들면, 배지 중에서의 축적량으로서, 바람직하게는 10μg/L 이상, 보다 바람직하게는 1mg/L 이상, 특히 바람직하게는 100mg/L 이상, 더욱 바람직하게는 1g/L 이상이라도 좋다. 또한, 축적량은 예를 들면, 균체 표층에서의 축적량으로서, 균체 표층의 이종 단백질을 회수하여 배지와 같은 양의 액체에 현탁한 경우에 현탁액 중에서의 이종 단백질 농도가 바람직하게는 10μg/L 이상, 보다 바람직하게는 1mg/L 이상, 특히 바람직하게는 100mg/L 이상이 되는 양이라도 좋다. 또한, 본 발명에 있어서 분비 생산되는 「단백질」이란, 올리고펩타이드나 폴리펩타이드 등의 펩타이드로 불리는 형태도 포함하는 개념이다.
본 발명에 있어서, 「이종 단백질」(heterologous protein)이란, 동일한 단백질을 발현 및 분비시키는 코리네형 세균에 있어서 외래성(exogenous)인 단백질을 말한다. 이종 단백질은 예를 들면, 미생물 유래의 단백질이라도 좋고, 식물 유래의 단백질이라도 좋고, 동물 유래의 단백질이라도 좋고, 바이러스 유래의 단백질이라도 좋고, 또한 인공적으로 아미노산 서열을 디자인한 단백질이라도 좋다. 이종 단백질은 단량체 단백질(monomeric protein)이라도 좋고, 다량체 단백질(multimeric protein)이라도 좋다. 다량체 단백질이란, 2 또는 그 이상의 서브유닛으로 이루어지는 다량체로서 존재할 수 있는 단백질을 말한다. 다량체에 있어서, 각 서브유닛은 디설파이드 결합 등의 공유 결합으로 연결되어 있어도 좋고, 수소 결합이나 소수성 상호 작용 등의 비공유 결합으로 연결되어 있어도 좋고, 이들의 조합에 의해 연결되어 있어도 좋다. 다량체에 있어서는, 1 또는 그 이상의 분자간 디설파이드 결합이 포함되는 것이 바람직하다. 다량체는 단일 종류의 서브유닛으로 이루어지는 호모 다량체라도 좋고, 2 또는 그 이상의 종류의 서브유닛으로 이루어지는 헤테로 다량체라도 좋다. 또한, 다량체 단백질이 헤테로 다량체인 경우에는, 다량체를 구성하는 서브유닛 중 적어도 하나의 서브유닛이 이종 단백질이면 좋다. 즉, 모든 서브유닛이 이종 유래라도 좋고, 일부의 서브유닛만이 이종 유래라도 좋다. 이종 단백질은 천연으로 분비성인 단백질이라도 좋고, 천연으로는 비분비성인 단백질이라도 좋지만, 천연으로 분비성인 단백질인 것이 바람직하다. 또한, 이종 단백질은 천연으로 Tat계 의존의 분비성 단백질이라도 좋고, 천연으로 Sec계 의존의 분비성 단백질이라도 좋다. 「이종 단백질」의 구체적인 예는 후술한다.
생산되는 이종 단백질은 1종류뿐이라도 좋고, 2 또는 그 이상의 종류라도 좋다. 또한, 이종 단백질이 헤테로 다량체인 경우에는, 1종류의 서브유닛만이 생산되어도 좋고, 2 또는 그 이상의 종류의 서브유닛이 생산되어도 좋다. 즉, 「이종 단백질을 분비 생산하는」 것에는, 목적의 이종 단백질을 구성하는 서브유닛 중, 모든 서브유닛을 분비 생산하는 경우에 더하여, 일부의 서브유닛만을 분비 생산하는 경우도 포함된다.
코리네형 세균은 호기성의 그람 양성 간균(桿菌)이다. 코리네형 세균으로서는 코리네박테리움(Corynebacterium)속 세균, 브레비박테리움(Brevibacterium)속 세균 및 마이크로박테리움(Microbacterium)속 세균 등이 열거된다. 코리네형 세균을 사용하는 것의 이점으로서는, 종래 이종 단백질의 분비 생산에 이용되고 있는 사상균, 효모, Bacillus속 세균 등에 비해, 원래 균체 외에 분비되는 단백질이 매우 적고, 이종 단백질을 분비 생산하는 경우의 정제 과정의 간략화나 생략화를 기대할 수 있는 것, 또한 당, 암모니아 및 무기염 등을 함유하는 심플한 배지에서 잘 생육하고, 배지값이나 배양 방법, 배양 생산성에서 우수한 것 등이 열거된다.
코리네형 세균으로서는, 구체적으로는 하기와 같은 종이 열거된다.
코리네박테리움·아세토아시도필럼(Corynebacterium acetoacidophilum)
코리네박테리움·아세트글루타미컴(Corynebacterium acetoglutamicum)
코리네박테리움·알카노리티컴(Corynebacterium alkanolyticum)
코리네박테리움·칼루나에(Corynebacterium callunae)
코리네박테리움·크레나텀(Corynebacterium crenatum)
코리네박테리움·글루타미컴(Corynebacterium glutamicum)
코리네박테리움·릴리움(Corynebacterium lilium)
코리네박테리움·멜라세콜라(Corynebacterium melassecola)
코리네박테리움·써모아미노게네스(코리네박테리움·에피시엔스)(Corynebacterium thermoaminogenes(Corynebacterium efficiens))
코리네박테리움·헤르큘리스(Corynebacterium herculis)
브레비박테리움·디바리카텀(코리네박테리움·글루타미컴)(Brevibacterium divaricatum(Corynebacterium glutamicum))
브레비박테리움·플라범(코리네박테리움·글루타미컴)(Brevibacterium flavum(Corynebacterium glutamicum))
브레비박테리움·임마리오필럼(Brevibacterium immariophilum)
브레비박테리움·락토퍼멘텀(코리네박테리움·글루타미컴)(Brevibacterium lactofermentum(Corynebacterium glutamicum))
브레비박테리움·로제움(Brevibacterium roseum)
브레비박테리움·사카로리티컴(Brevibacterium saccharolyticum)
브레비박테리움·티오게니탈리스(Brevibacterium thiogenitalis)
코리네박테리움·암모니아게네스(코리네박테리움·스타티오니스)(Corynebacterium ammoniagenes(Corynebacterium stationis))
브레비박테리움·알범(Brevibacterium album)
브레비박테리움·세리넘(Brevibacterium cerinum)
마이크로박테리움·암모니아필럼(Microbacterium ammoniaphilum)
코리네형 세균으로서는, 구체적으로는 하기와 같은 균주가 열거된다.
Corynebacterium acetoacidophilum ATCC 13870
Corynebacterium acetoglutamicum ATCC 15806
Corynebacterium alkanolyticum ATCC 21511
Corynebacterium callunae ATCC 15991
Corynebacterium crenatum AS1.542
Corynebacterium glutamicum ATCC 13020, ATCC 13032, ATCC 13060, ATCC 13869, FERM BP-734
Corynebacterium lilium ATCC 15990
Corynebacterium melassecola AT 17965
Corynebacterium efficiens(Corynebacterium thermoaminogenes) AJ12340(FERM BP-1539)
Corynebacterium herculis ATCC 13868
Brevibacterium divaricatum(Corynebacterium glutamicum) ATCC 14020
Brevibacterium flavum(Corynebacterium glutamicum) ATCC 13826, ATCC 14067, AJ12418(FERM BP-2205)
Brevibacterium immariophilum ATCC 14068
Brevibacterium lactofermentum(Corynebacterium glutamicum) ATCC 13869
Brevibacterium roseum ATCC 13825
Brevibacterium saccharolyticum ATCC 14066
Brevibacterium thiogenitalis ATCC 19240
Corynebacterium Ammoniagenes(Corynebacterium stationis) ATCC 6871, ATCC 6872
Brevibacterium album ATCC 15111
Brevibacterium cerinum ATCC 15112
Microbacterium Ammoniaphilum ATCC 15354
또한, 코리네박테리움속 세균에는 종래 브레비박테리움속에 분류되어 있었지만, 현재 코리네박테리움속에 통합된 세균(Int. J. Syst. Bacteriol., 41, 255(1991))도 포함된다. 또한, 코리네박테리움·스타티오니스에는 종래 코리네박테리움·암모니아게네스에 분류되어 있었지만, 16S rRNA의 염기 서열 해석 등에 의해 코리네박테리움·스타티오니스에 재분류된 세균도 포함된다(Int. J. Syst. Evol. Microbiol., 60, 874-879(2010)).
이들 균주는 예를 들면, 아메리칸·타입·컬처·콜렉션(주소 12301 Parklawn Drive, Rockville, Maryland 20852 P.O. Box 1549, Manassas, VA 20108, United States of America)에서 분양을 받을 수 있다. 즉, 각 균주에 대응하는 등록번호가 부여되어 있고, 이 등록번호를 이용하여 분양을 받을 수 있다(http://www.atcc.org/참조). 각 균주에 대응하는 등록번호는 아메리칸·타입·컬처·콜렉션의 카탈로그에 기재되어 있다. 또한, 이들 균주는 예를 들면, 각 균주가 기탁된 기탁 기관에서 입수할 수 있다.
특히, 야생주 C. glutamicum ATCC 13869에서 스트렙토마이신(Sm) 내성 변이주로서 분리된 C. glutamicum AJ12036(FERM BP-734)은 이의 친주(야생주)에 비해, 단백질의 분비에 관한 기능을 담당하는 유전자에 변이가 존재하는 것이 예측되고, 단백질의 분비 생산능이 지적 배양 조건 하에서의 축적량으로서 약 2 내지 3배로 매우 높고, 숙주균으로서 적합하다(WO02/081694). AJ12036은 1984년 3월 26일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁 센터, 우편번호: 292-0818, 주소: 일본국 치바겐 키사라즈시 가즈사카마타리 2-5-8 120호실)에 국제 기탁으로서 원기탁되어, 수탁번호 FERM BP-734가 부여되어 있다.
또한, Corynebacterium thermoaminogenes AJ12340(FERM BP-1539)은, 1987년 3월 13일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁 센터, 우편번호: 292-0818, 주소: 일본국 치바겐 키사라즈시 가즈사카마타리 2-5-8 120호실)에 국제 기탁으로서 원기탁되어, 수탁번호 FERM BP-1539가 부여되어 있다. 또한, Brevibacterium flavum AJ12418(FERM BP-2205)은, 1988년 12월 24일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁 센터, 우편번호: 292-0818, 주소: 일본국 치바겐 키사라즈시 가즈사카마타리 2-5-8 120호실)에 국제 기탁으로서 원기탁되어, 수탁번호 FERM BP-2205가 부여되어 있다.
또한, 상술한 바와 같은 코리네형 세균을 친주로서, 돌연 변이법이나 유전자 재조합법을 이용하여 단백질의 분비 생산능이 높아진 주를 선발하여, 숙주로서 이용하여도 좋다. 예를 들면, 자외선 조사 또는 N-메틸-N'-니트로소구아니딘 등의 화학 변이제에 의한 처리를 행한 후, 단백질의 분비 생산능이 높아진 주를 선발할 수 있다.
또한, 이러한 균주로부터 세포 표층 단백질을 생산하지 않도록 개변한 균주를 숙주로서 사용하면, 배지 중 또는 균체 표층에 분비된 이종 단백질의 정제가 용이해져 특히 바람직하다. 이와 같은 개변은 돌연 변이법 또는 유전자 재조합법에 의해 염색체 위의 세포 표층 단백질의 코드 영역 또는 이의 발현 조절 영역에 변이를 도입함으로써 행할 수 있다. 세포 표층 단백질을 생산하지 않도록 개변된 코리네형 세균으로서는, C. glutamicum AJ12036(FERM BP-734)의 세포 표층 단백질 PS2의 결손주인 C. glutamicum YDK010주(WO2004/029254)가 열거된다.
이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균은 상술한 바와 같은 코리네형 세균에, 본 발명에 사용되는 유전자 구축물을 도입하여 유지시킴으로써 얻을 수 있다. 본 발명에 사용되는 유전자 구축물이나 이의 도입법에 대해서는 후술한다.
<1-1-2> 변이형 PhoS 유전자의 도입
본 발명의 세균은 변이형 PhoS 유전자를 유지하도록 개변되어 있다. 「변이형 PhoS 유전자를 유지한다」는 것을, 「변이형 PhoS 유전자를 갖는다」 또는 「phoS 유전자에 변이를 갖는다」라고도 한다. 또한, 「변이형 PhoS 유전자를 유지한다」는 것을, 「변이형 PhoS 단백질을 갖는다」 또는 「PhoS 단백질에 변이를 갖는다」라고도 한다. 본 발명의 세균은 이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균을, 변이형 PhoS 유전자를 유지하도록 개변함으로써 얻을 수 있다. 또한, 본 발명의 세균은 변이형 PhoS 유전자를 유지하도록 코리네형 세균을 개변한 후에, 이종 단백질을 분비 생산하는 능력을 부여함으로써도 얻을 수 있다. 본 발명에 있어서, 본 발명의 세균을 구축하기 위한 개변은 임의의 순서로 행할 수 있다. 또한, 본 발명의 세균의 구축에 사용되는, 변이형 PhoS 유전자를 유지하도록 개변되기 전의 주는, 이종 단백질의 분비 발현용 유전자 구축물을 갖는다고 가정한 경우에, 이종 단백질을 분비 생산할 수 있어도 좋고, 할 수 없어도 좋다. 즉, 본 발명의 세균은 예를 들면, 변이형 PhoS 유전자를 유지하도록 개변됨으로써 이종 단백질을 분비 생산하는 능력을 획득한 것이라도 좋다. 구체적으로는, 예를 들면, 본 발명의 세균은 변이형 PhoS 유전자를 유지하도록 개변되기 전에는 이종 단백질의 분비 발현용 유전자 구축물을 갖고 있어도 이종 단백질을 분비 생산할 수 없었던 주로부터 얻어진 것으로서, 변이형 PhoS 유전자를 유지하도록 개변됨으로써 이종 단백질을 분비 생산할 수 있게 된 것이라도 좋다.
이하, phoS 유전자 및 PhoS 단백질에 대하여 설명한다. phoS 유전자는 PhoRS 시스템의 센서 키나아제인 PhoS 단백질을 코드하는 유전자이다. PhoRS 시스템은 2성분 제어계의 하나이며, 환경 중의 인산 결핍에 대한 응답을 야기한다. PhoRS 시스템은 phoS 유전자에 코드되는 센서 키나아제 PhoS와, phoR 유전자에 코드되는 반응 조절인자 PhoR로 이루어진다.
본 발명에 있어서, 「특정한 변이」를 갖는 PhoS 단백질을 「변이형 PhoS 단백질」, 이것을 코드하는 유전자를 「변이형 PhoS 유전자」라고도 한다. 「변이형 PhoS 유전자」는 바꿔 말하면, 「특정한 변이」를 갖는 phoS 유전자이다. 또한, 본 발명에 있어서, 「특정한 변이」를 갖지 않는 PhoS 단백질을 「야생형 PhoS 단백질」, 이것을 코드하는 유전자를 「야생형 PhoS 유전자」라고도 한다. 「야생형 PhoS 유전자」는 바꿔 말하면, 「특정한 변이」를 갖지 않는 phoS 유전자이다. 또한, 여기에서 말하는 「야생형」이란, 「변이형」과 구별하기 위한 편의상의 기재이며, 「특정한 변이」를 갖지 않는 한, 천연으로 얻어지는 것에는 한정되지 않는다. 「특정한 변이」에 대해서는 후술한다.
야생형 PhoS 유전자로서는 예를 들면, 코리네형 세균의 phoS 유전자가 열거된다. 코리네형 세균의 phoS 유전자로서 구체적으로는 예를 들면, C. glutamicum YDK010주, C. glutamicum ATCC13032주, C. glutamicum ATCC14067주, C. callunae, C. crenatum 및 C. efficiens의 phoS 유전자가 열거된다. C. glutamicum YDK010주의 phoS 유전자의 염기 서열을 서열번호 3에 나타낸다. 또한, 이들 phoS 유전자가 코드하는 야생형 PhoS 단백질의 아미노산 서열을 각각 서열번호 4, 54, 55, 56, 57 및 58에 나타낸다. 즉, 야생형 PhoS 유전자는 예를 들면, 서열번호 3에 나타낸 염기 서열을 갖는 유전자라도 좋다. 또한, 야생형 PhoS 단백질은 예를 들면, 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 「(아미노산 또는 염기)서열을 갖는다」는 표현은 당해 「(아미노산 또는 염기)서열을 포함한다」는 경우 및 당해 「(아미노산 또는 염기)서열로 이루어진다」는 경우를 포함한다.
야생형 PhoS 유전자는 「특정한 변이」를 갖지 않고, 또한 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 PhoS 유전자의 변이체(variant)라도 좋다. 마찬가지로, 야생형 PhoS 단백질은 「특정한 변이」를 갖지 않고, 또한 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 PhoS 유전자에 코드되는 단백질의 변이체라도 좋다. 이와 같은 원래의 기능이 유지된 변이체를 「보존적 변이체」라고 하는 경우가 있다. 본 발명에서 「야생형 PhoS 유전자」라는 용어는 상기 예시한 야생형 PhoS 유전자에 한정되지 않고, 이의 보존적 변이체로서 「특정한 변이」를 갖지 않는 것을 포함하는 것으로 한다. 마찬가지로, 「야생형 PhoS 단백질」이라는 용어는 상기 예시한 야생형 PhoS 유전자에 코드되는 단백질에 한정되지 않고, 이의 보존적 변이체이며 「특정한 변이」를 갖지 않는 것을 포함하는 것으로 한다. 보존적 변이체로서는 예를 들면, 상기 예시한 야생형 PhoS 유전자나 야생형 PhoS 단백질의 동족체나 인위적인 개변체가 열거된다.
「원래의 기능이 유지되고 있다」란, 유전자 또는 단백질의 변이체가 원래의 유전자 또는 단백질의 기능(활성이나 성질)에 대응하는 기능(활성이나 성질)을 갖는 것을 말한다. 즉, 「원래의 기능이 유지되고 있다」란, 야생형 PhoS 유전자에 있어서는, 유전자의 변이체가 원래의 기능이 유지된 단백질을 코드하는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, 야생형 PhoS 단백질에 있어서는, 단백질의 변이체가 PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 것이라도 좋다. 「PhoRS 시스템의 센서 키나아제로서의 기능」이란, 구체적으로는, 반응 조절인자인 PhoR 단백질과 공액하여 환경 중의 인산 결핍에 대한 응답을 야기하는 기능이라도 좋다. 「PhoRS 시스템의 센서 키나아제로서의 기능」이란, 더 구체적으로는, 환경 중의 인산 결핍을 감지하여 자기 인산화되고, 인산기 전이에 의해 PhoR 단백질을 활성화시키는 기능이라도 좋다.
PhoS 단백질의 변이체가 PhoRS 시스템의 센서 키나아제로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코드하는 유전자를 코리네형 세균의 phoS 유전자의 결손주에 도입하고, 인산 결핍에 대한 응답성이 상보되는지 여부를 확인함으로써 확인할 수 있다. 인산 결핍에 대한 응답성의 상보는, 예를 들면, 인산 결핍 조건에서의 생육의 향상으로서, 또는 인산 결핍 조건으로 발현이 유도되는 것이 알려져 있는 유전자 발현의 유도로서 검출할 수 있다(J. Bacteriol., 188, 724-732(2006)). 코리네형 세균의 phoS 유전자의 결손주로서는 예를 들면, C. glutamicum YDK010주의 phoS 유전자 결손주나, C. glutamicum ATCC13032주의 phoS 유전자 결손주를 사용할 수 있다.
이하, 보존적 변이체에 대하여 예시한다.
야생형 PhoS 유전자의 동족체는, 예를 들면, 상기 예시한 야생형 PhoS 유전자의 염기 서열을 문의 서열로서 사용한 BLAST 검색이나 FASTA 검색에 의해 공개 데이터 베이스로부터 용이하게 취득할 수 있다. 또한, 야생형 PhoS 유전자의 동족체는, 예를 들면, 코리네형 세균의 염색체를 주형으로 하여, 이들 공지된 야생형 PhoS 유전자의 염기 서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로서 사용한 PCR에 의해 취득할 수 있다.
야생형 PhoS 단백질은 「특정한 변이」를 갖지 않고, 또한 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 PhoS 단백질의 아미노산 서열(서열번호 4, 54, 55, 56, 57 또는 58)에 있어서, 1 또는 몇 개의 위치에서의 1 또는 몇 개의 아미노산이 치환, 결실, 삽입, 또는 부가된 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 상기 「1 또는 몇 개」란, 아미노산 잔기의 단백질의 입체 구조에서의 위치나 아미노산 잔기의 종류에 의해서도 다르지만, 구체적으로는 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더욱 바람직하게는 1 내지 5개, 특히 바람직하게는 1 내지 3개를 의미한다.
상기의 1 또는 몇 개의 아미노산의 치환, 결실, 삽입 또는 부가는 단백질의 기능이 정상적으로 유지되는 보존적 변이이다. 보존적 변이의 대표적인 것은 보존적 치환이다. 보존적 치환이란, 치환 부위가 방향족 아미노산인 경우에는 Phe, Trp, Tyr 사이에서, 치환 부위가 소수성 아미노산인 경우에는 Leu, Ile, Val 사이에서, 극성 아미노산인 경우에는 Gln, Asn 사이에서, 염기성 아미노산인 경우에는 Lys, Arg, His 사이에서, 산성 아미노산인 경우에는 Asp, Glu 사이에서, 하이드록실기를 갖는 아미노산인 경우에는 Ser, Thr 사이에서 서로 치환하는 변이이다. 보존적 치환으로 간주되는 치환으로서는, 구체적으로는, Ala로부터 Ser 또는 Thr로의 치환, Arg로부터 Gln, His 또는 Lys로의 치환, Asn으로부터 Glu, Gln, Lys, His 또는 Asp로의 치환, Asp로부터 Asn, Glu 또는 Gln로의 치환, Cys로부터 Ser 또는 Ala로의 치환, Gln으로부터 Asn, Glu, Lys, His, Asp 또는 Arg로의 치환, Glu로부터 Gly, Asn, Gln, Lys 또는 Asp로의 치환, Gly로부터 Pro로의 치환, His로부터 Asn, Lys, Gln, Arg 또는 Tyr로의 치환, Ile로부터 Leu, Met, Val 또는 Phe로의 치환, Leu로부터 Ile, Met, Val 또는 Phe로의 치환, Lys로부터 Asn, Glu, Gln, His 또는 Arg로의 치환, Met로부터 Ile, Leu, Val 또는 Phe로의 치환, Phe로부터 Trp, Tyr, Met, Ile 또는 Leu로의 치환, Ser로부터 Thr 또는 Ala로의 치환, Thr로부터 Ser 또는 Ala로의 치환, Trp로부터 Phe 또는 Tyr로의 치환, Tyr로부터 His, Phe 또는 Trp로의 치환, 및 Val로부터 Met, Ile 또는 Leu로의 치환이 열거된다. 또한, 상기한 바와 같은 아미노산의 치환, 결실, 삽입 또는 부가에는 유전자가 유래하는 세균의 개체 차이, 종의 차이에 기초한 경우 등 천연에 생기는 변이(돌연변이체(mutant) 또는 변이체(variant))에 의해 생기는 것도 포함된다.
또한, 야생형 PhoS 단백질은 「특정한 변이」를 갖지 않고, 또한 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 PhoS 단백질의 아미노산 서열(서열번호 4, 54, 55, 56, 57 또는 58) 전체에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖는 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 본 명세서에 있어서, 「상동성」(homology)은 「동일성」(identity)을 가리키는 경우가 있다.
야생형 PhoS 단백질에 있어서는, 자기 인산화되는 히스티딘 잔기가 보존되어 있는 것이 바람직하다. 즉, 보존적 변이는 자기 인산화되는 히스티딘 잔기 이외의 아미노산 잔기에서 생기는 것이 바람직하다. 「자기 인산화되는 히스티딘 잔기」란 야생형 PhoS 단백질의 276 위치의 히스티딘 잔기를 가리킨다. 또한, 야생형 PhoS 단백질은 예를 들면, 상기 예시한 야생형 PhoS 단백질의 보존 서열을 갖는 것이 바람직하다. 즉, 보존적 변이는 예를 들면, 상기 예시한 야생형 PhoS 단백질에 있어서 보존되지 않은 아미노산 잔기에서 생기는 것이 바람직하다.
또한, 야생형 PhoS 유전자는 「특정한 변이」를 갖지 않고, 또한 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 PhoS 유전자의 염기 서열(서열번호 3,등)의 상보 서열 또는 이 상보 서열로부터 조제될 수 있는 프로브와 엄격한(stringent) 조건 하에서 하이브리다이즈하는 DNA라도 좋다. 「엄격한 조건」이란, 소위 특이적인 하이브리드가 형성되고, 비특이적인 하이브리드가 형성되지 않는 조건을 말한다. 일례를 나타내면, 상동성이 높은 DNA끼리, 예를 들면 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖는 DNA끼리가 하이브리다이즈하고, 이에 의해 상동성이 낮은 DNA끼리가 하이브리다이즈하지 않는 조건, 또는 통상의 서던 하이브리다이제이션의 세정 조건인 60℃, 1×SSC, 0.1% SDS, 바람직하게는 60℃, 0.1×SSC, 0.1% SDS, 보다 바람직하게는 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 바람직하게는 2 내지 3회 세정하는 조건을 들 수 있다.
상기 프로브는 예를 들면 유전자의 상보 서열의 일부라도 좋다. 이와 같은 프로브는, 공지된 유전자의 염기 서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로 하고, 이들 염기 서열을 포함하는 DNA 단편을 주형으로 하는 PCR에 의해 제작할 수 있다. 프로브로서는 예를 들면, 300bp 정도 길이의 DNA 단편을 사용할 수 있다. 이와 같은 경우, 하이브리다이제이션의 세정 조건으로서는 50℃, 2×SSC, 0.1% SDS가 열거된다.
또한, 야생형 PhoS 유전자는 상기 예시한 야생형 PhoS 유전자 또는 이의 보존적 변이체의 염기 서열에 있어서, 임의의 코돈을 이것과 등가의 코돈으로 치환한 염기 서열을 갖는 것이라도 좋다. 예를 들면, 야생형 PhoS 유전자는 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변되어도 좋다.
2개의 서열간의 서열 동일성의 퍼센티지는 예를 들면, 수학적 알고리즘을 사용하여 결정할 수 있다. 이러한 수학적 알고리즘의 한정되지 않는 예로서는, Myers 및 Miller (1988) CABIOS 4:11 17의 알고리즘, Smith et al (1981) Adv. Appl. Math. 2:482의 국소 호몰로지 알고리즘, Needleman 및 Wunsch (1970) J. Mol. Biol. 48:443 453의 호몰로지 정렬 알고리즘, Pearson 및 Lipman (1988) Proc. Natl. Acad. Sci. 85:2444 2448의 유사성을 검색하는 방법, Karlin 및 Altschul (1993) Proc. Natl. Acad. Sci. USA 90:5873 5877에 기재되어 있는 바와 같은, 개량된 Karlin 및 Altschul (1990) Proc. Natl. Acad. Sci. USA 872264의 알고리즘이 열거된다.
이들 수학적 알고리즘에 기초한 프로그램을 이용하여 서열 동일성을 결정하기 위한 서열 비교(정렬(alignment))를 행할 수 있다. 프로그램은 적절히 컴퓨터에 의해 실행할 수 있다. 이러한 프로그램으로서는 특별히 한정되지 않지만, PC/Gene 프로그램의 CLUSTAL(Intelligenetics, Mountain View, Calif.로부터 입수 가능), ALIGN 프로그램(Version 2.0), 및 Wisconsin Genetics Software Package, Version 8(Genetics Computer Group(GCG), 575 Science Drive, Madison, Wis., USA로부터 입수 가능)의 GAP, BESTFIT, BLAST, FASTA 및 TFASTA가 열거된다. 이들 프로그램을 사용한 정렬은 예를 들면, 초기 파라미터를 사용하여 행할 수 있다. CLUSTAL 프로그램에 대해서는, Higgins et al. (1988) Gene 73:237 244 (1988), Higgins et al. (1989) CABIOS 5:151 153, Corpet et al. (1988) Nucleic Acids Res. 16:10881 90, Huang et al. (1992) CABIOS 8:155 65, 및 Pearson et al. (1994) Meth. Mol. Biol. 24:307 331에 잘 기재되어 있다.
대상의 단백질을 코드하는 뉴클레오티드 서열과 상동성이 있는 뉴클레오티드 서열을 얻기 위해서 구체적으로는, 예를 들면, BLAST 뉴클레오티드 검색을 BLASTN프로그램, 스코어=100, 워드 길이=12로 행할 수 있다. 대상의 단백질과 상동성이 있는 아미노산 서열을 얻기 위해서 구체적으로는 예를 들면, BLAST 단백질 검색을 BLASTX 프로그램, 스코어=50, 워드 길이=3으로 행할 수 있다. BLAST 뉴클레오티드 검색이나 BLAST 단백질 검색에 대해서는 http://www.ncbi.nlm.nih.gov를 참조하기 바란다. 또한, 비교를 목적으로 갭을 가한 정렬을 얻기 위해서, Gapped BLAST(BLAST 2.0)를 이용할 수 있다. 또한, PSI-BLAST(BLAST 2.0)를 서열간의 이간(離間)된 관계를 검출하는 반복 검색을 행하는데도 이용할 수 있다. Gapped BLAST 및 PSI-BLAST에 대해서는 Altschul et al. (1997) Nucleic Acids Res. 25:3389를 참조하기 바란다. BLAST, Gapped BLAST 또는 PSI-BLAST를 이용할 경우, 예를 들면, 각 프로그램(예를 들면, 뉴클레오티드 서열에 대하여 BLASTN, 아미노산 서열에 대하여 BLASTX)의 초기 파라미터를 사용할 수 있다. 정렬은 수동으로 행하여져도 좋다.
2개의 서열간의 서열 동일성은, 2개의 서열을 최대 일치되도록 정렬했을 때에 2개의 서열 사이에서 일치하는 잔기의 비율로서 산출된다.
또한, 상기의 유전자나 단백질의 변이체에 관한 기재는 PhoR 단백질, 세포 표층 단백질, Tat계 분비 장치, 본 발명에서 분비 생산되는 이종 단백질 등의 임의의 단백질, 및 이들을 코드하는 유전자에도 준용할 수 있다.
변이형 PhoS 단백질은 상술한 바와 같은 야생형 PhoS 단백질의 아미노산 서열에서 「특정한 변이」를 갖는다.
즉, 바꿔 말하면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에는 상기 예시한 야생형 PhoS 단백질이나 이의 보존적 변이체와 동일하여도 좋다. 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에는, 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에는, 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 있어서, 1 또는 몇 개의 아미노산의 치환, 결실, 삽입 또는 부가를 포함하는 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에는, 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 보다 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖는 아미노산 서열을 갖는 단백질이라도 좋다.
또한, 바꿔 말하면, 변이형 PhoS 단백질은 상기 예시한 야생형 PhoS 단백질에서 「특정한 변이」를 갖고, 또한 당해 「특정한 변이」 이외의 개소에 추가로 보존적 변이를 포함하는 변이체라도 좋다. 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에서 「특정한 변이」를 갖고, 또한 당해 「특정한 변이」 이외의 개소에 추가로 1 또는 몇 개의 아미노산의 치환, 결실, 삽입 또는 부가를 포함하는 아미노산 서열을 갖는 단백질이라도 좋다.
변이형 PhoS 유전자는 상기와 같은 변이형 PhoS 단백질을 코드하는 한, 특별히 제한되지 않는다.
이하, 변이형 PhoS 단백질이 갖는 「특정한 변이」에 대하여 설명한다.
「특정한 변이」는 상술한 바와 같은 야생형 PhoS 단백질의 아미노산 서열이 변화되는 것으로서, 또한 이종 단백질의 분비 생산에 유효한 것이면 특별히 제한되지 않는다.
「특정한 변이」는 이종 단백질의 분비 생산량을 향상시키는 변이인 것이 바람직하다. 「이종 단백질의 분비 생산량을 향상시킨다」란, 변이형 PhoS 유전자를 갖도록 개변된 코리네형 세균(개변주)이 비개변주보다도 많은 양의 이종 단백질을 분비 생산할 수 있는 것을 말한다. 「비개변주」란, phoS 유전자에 변이를 갖지 않는 대조주, 즉 변이형 PhoS 유전자를 갖지 않는 대조주를 말하고, 예를 들면, 야생주 또는 친주라도 좋다. 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」는 것은, 이종 단백질의 분비 생산량이 비개변주와 비교하여 증대하는 한 특별히 제한되지 않지만, 예를 들면, 배지 중 및/또는 균체 표층에서의 축적량으로서, 비개변주와 비교하여, 바람직하게는 1.1배 이상, 보다 바람직하게는 1.2배 이상, 더욱 바람직하게는 1.3배 이상, 더욱 바람직하게는 2배 이상, 특히 바람직하게는 5배 이상인 양의 이종 단백질을 분비 생산하는 것이라도 좋다. 또한, 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」는 것은, 농축하지 않은 비개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 없지만, 농축하지 않은 개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 있는 것이라도 좋다. 또한, 「이종 단백질의 분비 생산량을 향상시킨다」는 것은, 모든 이종 단백질의 분비 생산량이 향상될 필요는 없고, 분비 생산의 타겟으로서 설정한 이종 단백질의 분비 생산량이 향상되면 충분하다. 「이종 단백질의 분비 생산량을 향상시킨다」는 것은, 구체적으로는, 예를 들면, CspB50TEV-Teri, CspB6Xa-LFABP, CspB6TEV-ExCP, E. coli의 TorA 시그널 서열을 융합한 프로트랜스글루타미나아제, E. coli의 TorA 시그널 서열을 융합한 프로 구조부 부착 프로테인글루타미나아제, 시그널 서열 부착 이소말토덱스트라나아제 등의, 실시예에 기재된 이종 단백질의 분비 생산량을 향상시키는 것을 의미하여도 좋다.
어떤 변이가 이종 단백질의 분비 생산량을 향상시키는 변이인지의 여부는, 예를 들면, 코리네형 세균에 속하는 균주를 기초로 당해 변이를 갖는 PhoS 단백질을 코드하는 유전자를 갖도록 개변된 주를 제작하고, 당해 개변주를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양을 정량하고, 개변 전의 주(비개변주)를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양과 비교함으로써 확인할 수 있다.
아미노산 서열의 변화로서는 아미노산 잔기의 치환이 바람직하다. 즉, 「특정한 변이」는 야생형 PhoS 단백질 중 어느 하나의 아미노산 잔기가 다른 아미노산 잔기로 치환되는 것인 것이 바람직하다. 「특정한 변이」에 의해 치환이 생기는 아미노산 잔기는 1잔기라도 좋고, 2잔기 또는 그 이상의 조합이라도 좋다. 「특정한 변이」에 의해 치환이 생기는 아미노산 잔기는, 바람직하게는 자기 인산화되는 히스티딘 잔기 이외의 아미노산 잔기라도 좋다. 「특정한 변이」에 의해 치환이 생기는 아미노산 잔기는, 보다 바람직하게는 자기 인산화되는 히스티딘 잔기 이외의 HisKA 도메인의 아미노산 잔기라도 좋다. 「자기 인산화되는 히스티딘 잔기」란, 야생형 PhoS 단백질의 276 위치의 히스티딘 잔기를 가리킨다. 「HisKA 도메인 」이란, 야생형 PhoS 단백질의 266 내지 330 위치의 아미노산 잔기로 이루어지는 영역을 가리킨다. 「특정한 변이」에 의해 치환이 생기는 아미노산 잔기는, 특히 바람직하게는 야생형 PhoS 단백질의 302 위치의 트립토판 잔기(W302)라도 좋다.
상기 변이에서 치환 후의 아미노산 잔기로서는 K(Lys), R(Arg), H(His), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), F(Phe), W(Trp), Y(Tyr), C(Cys), M(Met), D(Asp), E(Glu), N(Asn), Q(Gln) 중, 원래의 아미노산 잔기 이외의 것이 열거된다. 치환 후의 아미노산 잔기로서는 예를 들면, 이종 단백질의 분비 생산량이 향상하는 것을 선택할 수 있다.
W302가 치환될 경우, 치환 후의 아미노산 잔기로서는 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가 열거된다. 「방향족 아미노산 및 히스티딘 이외의 아미노산 잔기」로서, 구체적으로는 K(Lys), R(Arg), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), C(Cys), M(Met), D(Asp), E(Glu), N(Asn), Q(Gln)이 열거된다. 「방향족 아미노산 및 히스티딘 이외의 아미노산 잔기」로서, 더 구체적으로는 K(Lys), A(Ala), V(Val), S(Ser), C(Cys), M(Met), D(Asp), N(Asn)이 열거된다.
또한, phoS 유전자에서의 「특정한 변이」란, 코드하는 PhoS 단백질에 상기와 같은 「특정한 변이」를 생기게 하는 염기 서열 상의 변이를 의미한다.
본 발명에서 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」란, 서열번호 4의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기를 의미한다. 예를 들면, 「W302」란, 서열번호 4의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기를 의미한다. 상기 아미노산 잔기의 위치는 상대적인 위치를 나타내는 것으로서, 아미노산의 결실, 삽입, 부가 등에 의해 이의 위치는 전후하는 경우가 있다. 예를 들면, 서열번호 4에 나타낸 아미노산 서열로 이루어지는 야생형 PhoS 단백질에 있어서, X 위치보다도 N 말단측의 위치에서 1아미노산 잔기가 결실되거나 삽입된 경우, 원래의 X 위치의 아미노산 잔기는 각각 N 말단로부터 세어 X-1번째 또는 X+1번째의 아미노산 잔기가 되지만, 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」로 간주된다. 구체적으로는, 예를 들면, 서열번호 4, 54, 55, 56, 57 및 58에 나타낸 야생형 PhoS 단백질의 아미노산 서열에서 「W302」란, 각각 302 위치, 302 위치, 302 위치, 321 위치, 275 위치, 및 286 위치의 트립토판 잔기를 가리킨다. 또한, 서열번호 4, 54, 55, 56, 57 및 58에 나타낸 야생형 PhoS 단백질의 아미노산 서열에서 「야생형 PhoS 단백질의 276 위치의 히스티딘 잔기(자기 인산화되는 히스티딘 잔기)」란, 각각 276 위치, 276 위치, 276 위치, 295 위치, 249 위치 및 260 위치의 히스티딘 잔기를 가리킨다. 또한, 서열번호 4, 54, 55, 56, 57 및 58에 나타낸 야생형 PhoS 단백질의 아미노산 서열에서 「야생형 PhoS 단백질의 266 내지 330 위치의 아미노산 잔기로 이루어지는 영역(HisKA 도메인)」이란, 각각 266 내지 330 위치, 266 내지 330 위치, 266 내지 330 위치, 285 내지 349 위치, 239 내지 303 위치, 및 250 내지 314 위치의 아미노산 잔기로 이루어지는 영역을 가리킨다.
또한, 여기에서 말하는 「W302」는 통상 트립토판 잔기이지만, 트립토판 잔기가 아니어도 좋다. 즉, 야생형 PhoS 단백질이 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열 이외의 아미노산 서열을 갖는 경우에는, 「W302」는 트립토판 잔기가 아닌 경우가 있을 수 있다. 따라서, 예를 들면, 「W302가 시스테인 잔기로 치환되는 변이」에는, 「W302」가 트립토판 잔기인 경우에 당해 트립토판 잔기가 시스테인 잔기로 치환되는 변이에 한정되지 않고, 「W302」가 K(Lys), R(Arg), H(His), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), F(Phe), Y(Tyr), M(Met), D(Asp), E (Glu), N(Asn) 또는 Q(Gln)인 경우에 당해 아미노산 잔기가 시스테인 잔기로 치환되는 변이도 포함된다. 다른 변이에 대해서도 마찬가지이다.
임의의 PhoS 단백질의 아미노산 서열에 있어서, 어느 아미노산 잔기가 「서열번호 4에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기」인지는, 당해 임의의 PhoS 단백질의 아미노산 서열과 서열번호 4의 아미노산 서열과 정렬을 행함으로써 결정할 수 있다. 정렬은 예를 들면 공지된 유전자 해석 소프트웨어를 이용하여 행할 수 있다. 구체적인 소프트웨어로서는 히타치솔루션즈 제조의 DNASIS나, 제네틱스 제조의 GENETYX 등이 열거된다(Elizabeth C. Tyler et al., Computers and Biomedical Research, 24(1), 72-96, 1991; Barton GJ et al., Journal of molecular biology, 198(2), 327-37. 1987).
변이형 PhoS 유전자는 예를 들면, 야생형 PhoS 유전자를, 코드되는 PhoS 단백질이 상술한 「특정한 변이」를 갖도록 개변함으로써 취득할 수 있다. 개변의 바탕이 되는 야생형 PhoS 유전자는 예를 들면, 야생형 PhoS 유전자를 갖는 생물로부터의 클로닝에 의해, 또는 화학 합성에 의해 취득할 수 있다. 또한, 변이형 PhoS 유전자는 야생형 PhoS 유전자를 통하지 않고 취득할 수도 있다. 예를 들면, 화학 합성에 의해 변이형 PhoS 유전자를 직접 취득하여도 좋다. 취득한 변이형 PhoS 유전자는 더욱 개변하여 이용하여도 좋다.
유전자의 개변은 공지된 수법에 의해 행할 수 있다. 예를 들면, 부위 특이적 변이법에 의해 DNA의 목적 부위에 목적의 변이를 도입할 수 있다. 부위 특이적 변이법으로서는 PCR을 사용하는 방법(Higuchi, R., 61, in PCR technology, Erlich, H. A. Eds., Stockton press (1989); Carter, P., Meth. in Enzymol., 154, 382 (1987))이나, 파지를 사용하는 방법(Kramer, W. and Frits, H. J., Meth. in Enzymol., 154, 350 (1987); Kunkel, T. A. et al., Meth. in Enzymol., 154, 367 (1987))이 열거된다.
이하, 변이형 PhoS 유전자를 갖도록 코리네형 세균을 개변하는 수법에 대하여 설명한다.
변이형 PhoS 유전자를 갖도록 코리네형 세균을 개변하는 것은, 변이형 PhoS 유전자를 코리네형 세균에 도입함으로써 달성할 수 있다. 또한, 변이형 PhoS 유전자를 갖도록 코리네형 세균을 개변하는 것은, 코리네형 세균의 염색체 상의 phoS 유전자에 상술한 「특정한 변이」를 도입함으로써도 달성할 수 있다. 염색체 상의 유전자로의 변이 도입은 자연 변이, 변이원 처리, 또는 유전자 공학적 수법에 의해 달성할 수 있다.
변이형 PhoS 유전자를 코리네형 세균에 도입하는 수법은 특별히 제한되지 않는다. 본 발명의 세균에 있어서, 변이형 PhoS 유전자는 코리네형 세균에서 기능하는 프로모터의 제어 하에서 발현 가능하게 유지되어 있으면 좋다. 프로모터는 숙주 유래의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 phoS 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 본 발명의 세균에 있어서, 변이형 PhoS 유전자는 플라스미드와 같이 염색체 외에서 자율 증식하는 벡터 상에 존재하고 있어도 좋고, 염색체 상에 포함되어 있어도 좋다. 본 발명의 세균은 변이형 PhoS 유전자를 1카피만 갖고 있어도 좋고, 2 또는 그 이상의 카피를 갖고 있어도 좋다. 본 발명의 세균은 1종류의 변이형 PhoS 유전자만을 갖고 있어도 좋고, 2 또는 그 이상의 종류의 변이형 PhoS 유전자를 갖고 있어도 좋다. 변이형 PhoS 유전자의 도입은 예를 들면, 후술하는 유전자의 발현을 상승시키는 수법에서의 유전자의 도입이나, 본 발명에 사용되는 유전자 구축물의 도입과 마찬가지로 행할 수 있다.
본 발명의 세균은 야생형 PhoS 유전자를 갖고 있어도 좋고, 갖고 있지 않아도 좋지만, 갖고 있지 않은 것이 바람직하다.
야생형 PhoS 유전자를 갖지 않는 코리네형 세균은 염색체 상의 야생형 PhoS 유전자를 파괴함으로써 취득할 수 있다. 야생형 PhoS 유전자의 파괴는 공지된 수법에 의해 행할 수 있다. 구체적으로는, 예를 들면, 야생형 PhoS 유전자의 프로모터 영역 및/또는 코드 영역의 일부 또는 전부를 결손시킴으로써 야생형 PhoS 유전자를 파괴할 수 있다.
또한, 염색체 상의 야생형 PhoS 유전자를 변이형 PhoS 유전자로 치환함으로써, 야생형 PhoS 유전자를 갖지 않고, 또한 변이형 PhoS 유전자를 갖도록 개변된 코리네형 세균을 취득할 수 있다. 이러한 유전자 치환을 행하는 방법으로서는 예를 들면, 「Red-드리븐 인테그레이션(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97: 6640-6645 (2000)), Red 드리븐 인테그레이션법과 λ 파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203 (2002))을 조합한 방법(WO2005/010175호 참조) 등의 직쇄상 DNA를 사용하는 방법이나, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살(suicide) 벡터를 사용하는 방법 등이 열거된다(미국특허 제6303383호, 일본 공개특허공보 특개 평05-007491호).
PhoS 단백질은 반응 조절인자인 PhoR 단백질과 공액하여 기능하는, 즉 환경 중의 인산 결핍에 대한 응답을 야기한다. 따라서, 본 발명의 세균은 변이형 PhoS 단백질이 기능하도록 phoR 유전자를 갖는다. phoR 유전자는 PhoRS 시스템의 반응 조절인자인 PhoR 단백질을 코드하는 유전자이다. 「phoR 유전자를 갖는다」는 것을 「PhoR 단백질을 갖는다」라고도 한다. 통상, 본 발명의 세균이 본래적으로 갖는 PhoR 단백질이 변이형 PhoS 단백질과 공액하여 기능하면 충분하다. 한편, 본 발명의 세균에는 본 발명의 세균이 본래적으로 갖는 PhoR 유전자에 더하여, 또는 대신하여 적당한 phoR 유전자가 도입되어 있어도 좋다. 도입되는 phoR 유전자는 변이형 PhoS 단백질과 공액하여 기능하는 PhoR 단백질을 코드하는 것이면 특별히 제한되지 않는다.
phoR 유전자로서는 예를 들면 코리네형 세균의 phoR 유전자가 열거된다. 코리네형 세균의 phoR 유전자로서 구체적으로는, 예를 들면, C. glutamicum YDK010주, C. glutamicum ATCC13032주, C. glutamicum ATCC14067주, C. callunae, C. crenatum 및 C. efficiens의 phoR 유전자가 열거된다. C. glutamicum ATCC13032주의 phoR 유전자의 염기 서열 및 PhoR 단백질의 아미노산 서열을 각각 서열번호 96 및 97에 나타낸다.
phoR 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 phoR 유전자의 변이체라도 좋다. 마찬가지로, PhoR 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 PhoR 단백질의 변이체라도 좋다. 즉, 예를 들면, 「phoR 유전자」라는 용어에는 상기 예시한 phoR 유전자에 더하여, 이의 보존적 변이체가 포함되는 것으로 한다. 마찬가지로, 「PhoR 단백질」이라고 하는 용어에는 상기 예시한 PhoR 단백질에 더하여, 이의 보존적 변이체가 포함되는 것으로 한다. PhoR 단백질 및 phoR 유전자의 변이체에 대해서는, 상술한 PhoS 단백질 및 phoS 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, phoR 유전자는 원래의 기능이 유지된 단백질을 코드하는 한, 상기 아미노산 서열에 있어서, 1 또는 몇 개의 위치에서의 1 또는 몇 개의 아미노산이 치환, 결실, 삽입 또는 부가된 아미노산 서열을 갖는 단백질을 코드하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, PhoR 단백질에 있어서는, 단백질의 변이체가 PhoRS 시스템의 반응 조절인자로서의 기능을 갖는 것이라도 좋다. 「PhoRS 시스템의 반응 조절인자로서의 기능」이란, 구체적으로는, 센서 키나아제인 PhoS 단백질과 공액하여 환경 중의 인산 결핍에 대한 응답을 야기하는 기능이라도 좋다. 「PhoRS 시스템의 반응 조절인자로서의 기능」이란, 더 구체적으로는, 환경 중의 인산 결핍을 감지하여 자기 인산화된 PhoS 단백질로부터의 인산기 전이에 의해 활성화되고, 환경 중의 인산 결핍에 응답하는 유전자의 발현을 제어하는 기능이라도 좋다.
PhoR 단백질의 변이체가 PhoRS 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코드하는 유전자를 코리네형 세균의 phoR 유전자의 결손주에 도입하고, 인산 결핍에 대한 응답성이 상보되는지 여부를 확인함으로써 확인할 수 있다. 인산 결핍에 대한 응답성의 상보는, 예를 들면, 인산 결핍 조건에서의 생육의 향상으로서, 또는 인산 결핍 조건에서 발현이 유도되는 것이 알려져 있는 유전자 발현의 유도로서 검출할 수 있다(J. Bacteriol., 188, 724-732 (2006)). 코리네형 세균의 phoR 유전자의 결손주로서는 예를 들면, C. glutamicum YDK010주의 phoR 유전자 결손주나, C. glutamicum ATCC13032주의 phoR 유전자 결손주를 사용할 수 있다.
<1-1-3> 세포 표층 단백질의 활성 저하
본 발명의 세균은 세포 표층 단백질의 활성이 저하되어 있는 것이라도 좋다. 이하에, 세포 표층 단백질 및 이것을 코드하는 유전자에 대하여 설명한다.
세포 표층 단백질은 세균이나 고세균의 세포 표층(S층)을 구성하는 단백질이다. 코리네형 세균의 세포 표층 단백질로서는 C. glutamicum의 PS1 및 PS2(CspB)(일본 공개특허공보 특표 평6-502548), 및 C. stationis의 SlpA(CspA)(일본 공개특허공보 특개 평10-108675)가 열거된다. 이들 중에서는 PS2 단백질의 활성을 저하시키는 것이 바람직하다.
C. glutamicum ATCC13869의 cspB 유전자의 염기 서열 및 이 유전자가 코드하는 PS2 단백질(CspB 단백질)의 아미노산 서열을 각각 서열번호 67 및 68에 나타낸다.
또한, 예를 들면, 28주의 C. glutamicum에 대하여 CspB 동족체의 아미노산 서열이 보고되어 있다(J Biotechnol., 112, 177-193(2004)). 이들 28주의 C. glutamicum과 cspB 유전자 동족체의 NCBI 데이터 베이스의 GenBank accession 번호를 이하에 예시한다(괄호 안이 GenBank accession 번호를 나타낸다).
C. glutamicum ATCC13058(AY524990)
C. glutamicum ATCC13744(AY524991)
C. glutamicum ATCC13745(AY524992)
C. glutamicum ATCC14017(AY524993)
C. glutamicum ATCC14020(AY525009)
C. glutamicum ATCC14067(AY524994)
C. glutamicum ATCC14068(AY525010)
C. glutamicum ATCC14747(AY525011)
C. glutamicum ATCC14751(AY524995)
C. glutamicum ATCC14752(AY524996)
C. glutamicum ATCC14915(AY524997)
C. glutamicum ATCC15243(AY524998)
C. glutamicum ATCC15354(AY524999)
C. glutamicum ATCC17965(AY525000)
C. glutamicum ATCC17966(AY525001)
C. glutamicum ATCC19223(AY525002)
C. glutamicum ATCC19240(AY525012)
C. glutamicum ATCC21341(AY525003)
C. glutamicum ATCC21645(AY525004)
C. glutamicum ATCC31808(AY525013)
C. glutamicum ATCC31830(AY525007)
C. glutamicum ATCC31832(AY525008)
C. glutamicum LP-6(AY525014)
C. glutamicum DSM20137(AY525015)
C. glutamicum DSM20598(AY525016)
C. glutamicum DSM46307(AY525017)
C. glutamicum 22220(AY525005)
C. glutamicum 22243(AY525006)
코리네형 세균이 속하는 종 또는 균주에 의해, 세포 표층 단백질을 코드하는 유전자의 염기 서열에 차이가 존재하는 경우가 있기 때문에, 세포 표층 단백질을 코드하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 세포 표층 단백질을 코드하는 유전자의 변이체라도 좋다. 마찬가지로, 세포 표층 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 세포 표층 단백질의 변이체라도 좋다. 즉, 예를 들면, 「cspB 유전자」라는 용어에는 상기 예시한 cspB 유전자에 더하여, 이의 보존적 변이체가 포함되는 것으로 한다. 마찬가지로, 「CspB 단백질」이라고 하는 용어에는 상기 예시한 CspB 단백질에 더하여, 이의 보존적 변이체가 포함되는 것으로 한다. 세포 표층 단백질 및 이것을 코드하는 유전자의 변이체에 대해서는 상기한 PhoS 단백질 및 phoS 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, 세포 표층 단백질을 코드하는 유전자는 원래의 기능이 유지된 단백질을 코드하는 한, 상기 아미노산 서열에 있어서, 1 또는 몇 개의 위치에서의 1 또는 몇 개의 아미노산이 치환, 결실, 삽입 또는 부가된 아미노산 서열을 갖는 단백질을 코드하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, 세포 표층 단백질에 있어서는, 예를 들면, 코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질을 갖는 것이라도 좋다.
「코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질」이란, 코리네형 세균에서 활성을 저하시켰을 때에 비개변주보다도 많은 양의 이종 단백질을 분비 생산하는 능력을 코리네형 세균에 부여하는 성질을 말한다. 「비개변주」란, 세포 표층 단백질의 활성이 저하되지 않은 대조주를 말하고, 예를 들면, 야생주 또는 친주라도 좋다. 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 이종 단백질의 분비 생산량이 비개변주와 비교하여 증대하는 한 특별히 제한되지 않지만, 예를 들면, 배지 중 및/또는 균체 표층에서의 축적량으로서, 비개변주와 비교하여, 바람직하게는 1.1배 이상, 보다 바람직하게는 1.2배 이상, 더욱 바람직하게는 1.3배 이상, 특히 바람직하게는 2배 이상인 양의 이종 단백질을 분비 생산하는 것이라도 좋다. 또한, 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 농축하지 않은 비개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 없지만, 농축하지 않은 개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 있는 것이라도 좋다.
어떤 단백질이 코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질을 갖는지 여부는, 코리네형 세균에 속하는 균주를 기초로 이의 단백질의 활성이 저하되도록 개변된 주를 제작하고, 당해 개변주를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양을 정량하고, 개변 전의 주(비개변주)를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양과 비교함으로써 확인할 수 있다.
본 발명에 있어서, 「세포 표층 단백질의 활성이 저하되어 있다」는 것에는, 세포 표층 단백질의 활성이 저하되도록 코리네형 세균이 개변된 경우, 및 코리네형 세균에 있어서 원래 세포 표층 단백질의 활성이 저하되어 있는 경우가 포함된다. 「코리네형 세균에 있어서 원래 세포 표층 단백질의 활성이 저하되어 있는 경우」에는, 코리네형 세균이 원래 세포 표층 단백질을 갖지 않는 경우가 포함된다. 즉, 세포 표층 단백질의 활성이 저하되어 있는 코리네형 세균으로서는 예를 들면, 원래 세포 표층 단백질을 갖지 않는 코리네형 세균이 열거된다. 「코리네형 세균이 원래 세포 표층 단백질을 갖지 않는 경우」로서는, 예를 들면, 코리네형 세균이 원래 세포 표층 단백질을 코드하는 유전자를 갖지 않는 경우가 열거된다. 또한, 「코리네형 세균이 원래 세포 표층 단백질을 갖지 않는다」란, 코리네형 세균이, 당해 코리네형 세균이 속하는 종의 다른 주에 발견되는 세포 표층 단백질로부터 선택되는 1 또는 그 이상의 단백질을 원래 갖지 않는 것이라도 좋다. 예를 들면, 「C. glutamicum이 원래 세포 표층 단백질을 갖지 않는다」란, C. glutamicum주가, 다른 C. glutamicum주에 발견되는 세포 표층 단백질로부터 선택되는 1 또는 그 이상의 단백질, 즉, 예를 들면 PS1 및/또는 PS2(CspB)를 원래 갖지 않는 것이라도 좋다. 원래 세포 표층 단백질을 갖지 않는 코리네형 세균으로서는 예를 들면, 원래 cspB 유전자를 갖지 않는 C. glutamicum ATCC 13032가 열거된다.
이하에, 세포 표층 단백질 등의 단백질의 활성을 저하시키는 수법에 대하여 설명한다. 또한, 이하에 기재하는 단백질의 활성을 저하시키는 수법은 야생형 PhoS 단백질의 파괴에도 이용할 수 있다.
「단백질의 활성이 저하된다」란, 이 단백질의 세포당 활성이 비개변주와 비교하여 감소되어 있는 것을 의미하고, 활성이 완전하게 소실되어 있는 경우를 포함한다. 여기에서 말하는 「비개변주」란, 표적의 단백질의 활성이 저하되도록 개변되어 있지 않은 대조주를 의미한다. 비개변주로서는 야생주나 친주가 열거된다. 단백질의 활성이 저하된다」란, 구체적으로는, 비개변주와 비교하여, 이 단백질의 세포당 분자수가 저하되어 있는 것, 및/또는 이 단백질의 분자당 기능이 저하되어 있는 것을 말한다. 즉, 「단백질의 활성이 저하된다」라고 할 경우의 「활성」이란, 단백질의 촉매 활성에 한정되지 않고, 단백질을 코드하는 유전자의 전사량(mRNA량) 또는 번역량(단백질의 양)을 의미하여도 좋다. 또한, 「단백질의 세포당 분자수가 저하되어 있다」는 것에는, 이 단백질이 전혀 존재하지 않고 있는 경우가 포함된다. 또한, 「단백질의 분자당 기능이 저하되어 있다」는 것에는, 이 단백질의 분자당 기능이 완전하게 소실되어 있는 경우가 포함된다. 단백질 활성의 저하의 정도는 단백질의 활성이 비개변주와 비교하여 저하되어 있으면 특별히 제한되지 않는다. 단백질의 활성은 예를 들면 비개변주와 비교하여, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
단백질의 활성이 저하되는 개변은 예를 들면, 이 단백질을 코드하는 유전자의 발현을 저하시킴으로써 달성할 수 있다. 「유전자의 발현이 저하된다」란, 이 유전자의 세포당 발현량이 야생주나 친주 등의 비개변주와 비교하여 감소하는 것을 의미한다. 「유전자의 발현이 저하된다」란, 구체적으로는 유전자의 전사량(mRNA량)이 저하되는 것, 및/또는 유전자의 번역량(단백질의 양)이 저하되는 것을 의미하여도 좋다. 「유전자의 발현이 저하된다」는 것에는, 이 유전자가 전혀 발현되지 않고 있는 경우가 포함된다. 또한, 「유전자의 발현이 저하된다」는 것을 「유전자의 발현이 약화된다」라고도 한다. 유전자의 발현은 예를 들면 비개변주와 비교하여, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
유전자 발현의 저하는 예를 들면 전사 효율의 저하에 의한 것이라도 좋고, 번역 효율의 저하에 의한 것이라도 좋고, 이들의 조합에 의한 것이라도 좋다. 유전자 발현의 저하는 예를 들면, 유전자의 프로모터, 샤인달가노(SD) 서열(리보솜 결합 부위(RBS)라고도 한다), RBS와 개시 코돈 사이의 스페이서 영역 등의 발현 조절 서열을 개변함으로써 달성할 수 있다. 발현 조절 서열을 개변할 경우에는, 발현 조절 서열은 바람직하게는 1염기 이상, 보다 바람직하게는 2염기 이상, 특히 바람직하게는 3염기 이상이 개변된다. 또한, 발현 조절 서열의 일부 또는 전부를 결실시켜도 좋다. 또한, 유전자 발현의 저하는, 예를 들면, 발현 제어에 관한 인자를 조작함으로써도 달성할 수 있다. 발현 제어에 관한 인자로서는 전사나 번역 제어에 관한 저분자(유도 물질, 저해 물질 등), 단백질(전사 인자 등), 핵산(siRNA 등) 등이 열거된다. 또한, 유전자 발현의 저하는 예를 들면, 유전자의 코드 영역에 유전자의 발현이 저하되는 변이를 도입함으로써도 달성할 수 있다. 예를 들면, 유전자의 코드 영역의 코돈을, 숙주에서 보다 저빈도로 이용되는 동의 코돈으로 치환함으로써 유전자의 발현을 저하시킬 수 있다. 또한, 예를 들면, 후술하는 바와 같은 유전자의 파괴에 의해 유전자의 발현 자체가 저하될 수 있다.
또한, 단백질의 활성이 저하되는 개변은 예를 들면, 이 단백질을 코드하는 유전자를 파괴함으로써 달성할 수 있다. 「유전자가 파괴된다」란, 정상으로 기능하는 단백질을 생산하지 않도록 이 유전자가 개변되는 것을 의미한다. 「정상으로 기능하는 단백질을 생산하지 않는」 것에는, 이 유전자로부터 단백질이 전혀 생산되지 않는 경우나, 이 유전자로부터 분자당 기능(활성이나 성질)이 저하 또는 소실된 단백질이 생산되는 경우가 포함된다.
유전자의 파괴는, 예를 들면, 염색체 상의 유전자의 코드 영역의 일부 또는 전부를 결손시킴으로써 달성할 수 있다. 또한, 염색체 상의 유전자 전후의 서열을 포함하여 유전자 전체를 결실시켜도 좋다. 단백질의 활성 저하가 달성될 수 있는 한, 결실시키는 영역은 N 말단 영역, 내부 영역, C 말단 영역 등 중 어느 하나의 영역이라도 좋다. 통상, 결실시키는 영역은 긴 쪽이 확실하게 유전자를 불활화할 수 있다. 또한, 결실시키는 영역 전후의 서열은 리딩 프레임이 일치하지 않는 것이 바람직하다.
또한, 유전자의 파괴는, 예를 들면, 염색체 상의 유전자의 코드 영역에 아미노산 치환(미스센스 변이)을 도입하는 것, 종결 코돈을 도입하는 것(넌센스 변이), 또는 1 내지 2염기를 부가 또는 결실하는 프레임 시프트 변이를 도입하는 것 등에 의해서도 달성할 수 있다(Journal of Biological Chemistry 272: 8611-8617(1997), Proceedings of the National Academy of Sciences, USA 955511-5515(1998), Journal of Biological Chemistry 26 116, 20833-20839(1991)).
또한, 유전자의 파괴는, 예를 들면, 염색체 상의 유전자의 코드 영역에 다른 서열을 삽입함으로써도 달성할 수 있다. 삽입 부위는 유전자 중 어느 영역이라도 좋지만, 삽입하는 서열은 긴 쪽이 확실하게 유전자를 불활화할 수 있다. 또한, 삽입 부위 전후의 서열은 리딩 프레임이 일치하지 않는 것이 바람직하다. 다른 서열로서는, 코드되는 단백질의 활성을 저하 또는 소실시키는 것이면 특별히 제한되지 않지만, 예를 들면, 항생 물질 내성 유전자 등의 마커 유전자나 목적 물질의 생산에 유용한 유전자가 열거된다.
염색체 상의 유전자를 상기한 바와 같이 개변하는 것은, 예를 들면, 정상으로 기능하는 단백질을 생산하지 않도록 개변한 결실형 유전자를 제작하고, 당해 결실형 유전자를 포함하는 재조합 DNA로 숙주를 형질전환하여, 결실형 유전자와 염색체 상의 야생형 유전자로 상동 재조합을 일으키게 함으로써, 염색체 상의 야생형 유전자를 결실형 유전자로 치환하여 달성할 수 있다. 이때, 재조합 DNA에는 숙주의 영양 요구성 등의 형질에 따라 마커 유전자를 포함시켜 두면 조작이 쉽다. 결실형 유전자로서는 유전자의 전체 영역 또는 일부의 영역을 결실한 유전자, 미스센스 변이를 도입한 유전자, 트랜스포존이나 마커 유전자 등의 삽입 서열을 삽입한 유전자, 넌센스 변이를 도입한 유전자, 프레임 시프트 변이를 도입한 유전자가 열거된다. 상동 재조합에 사용하는 재조합 DNA의 구조는 원하는 형태로 상동 재조합이 일어나는 것이면 특별히 제한되지 않는다. 예를 들면, 결실형 유전자를 포함하는 선상 DNA로서, 양단에 염색체 상의 야생형 유전자의 상류 및 하류의 서열을 각각 구비한 선상 DNA로 숙주를 형질전환하여, 야생형 유전자의 상류 및 하류에서 각각 상동 재조합을 일으키게 함으로써, 1스텝으로 야생형 유전자를 결실형 유전자로 치환할 수 있다. 결실형 유전자에 의해 코드되는 단백질은 생성하였다고 하여도, 야생형 단백질과는 다른 입체 구조를 갖고, 기능이 저하 또는 소실된다. 이러한 상동 재조합을 이용한 유전자 치환에 의한 유전자 파괴는 이미 확립되어 있고, 「Red 드리븐 인테그레이션(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97: 6640-6645 (2000)), Red 드리븐 인테그레이션법과 λ 파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203 (2002))을 조합한 방법(WO2005/010175호 참조) 등의 직쇄상 DNA를 사용하는 방법이나, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터를 사용하는 방법 등이 있다(미국특허 제6303383호, 일본 공개특허공보 특개 평05-007491호).
또한, 단백질의 활성이 저하되는 개변은 예를 들면, 돌연 변이 처리에 의해 행하여도 좋다. 돌연 변이 처리로서는 X선의 조사, 자외선의 조사, 및 N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), 에틸메탄설포네이트(EMS), 및 메틸메탄설포네이트(MMS) 등의 변이제에 의한 처리가 열거된다.
단백질의 활성이 저하된 것은 이 단백질의 활성을 측정함으로써 확인할 수 있다.
단백질의 활성이 저하된 것은 이 단백질을 코드하는 유전자의 발현이 저하된 것을 확인함으로써도 확인할 수 있다. 유전자의 발현이 저하된 것은 이 유전자의 전사량이 저하된 것을 확인하는 것이나, 이 유전자로부터 발현되는 단백질의 양이 저하된 것을 확인함으로써 확인할 수 있다.
유전자의 전사량이 저하된 것의 확인은 이 유전자로부터 전사되는 mRNA의 양을 비개변주와 비교함으로써 행할 수 있다. mRNA의 양을 평가하는 방법으로서는 노던 하이브리다이제이션, RT-PCR 등이 열거된다(Molecular cloning(Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001)). mRNA의 양은 비개변주와 비교하여, 예를 들면, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
단백질의 양이 저하된 것의 확인은 SDS-PAGE를 행하고, 분리된 단백질 밴드의 강도를 확인함으로써 행할 수 있다. 또한, 단백질의 양이 저하된 것의 확인은 항체를 사용하여 웨스턴 블롯에 의해 행할 수 있다(Molecular cloning(Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001)). 단백질의 양은 비개변주와 비교하여, 예를 들면, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
유전자가 파괴된 것은 파괴에 사용한 수단에 따라, 이 유전자의 일부 또는 전부의 염기 서열, 제한 효소 지도, 또는 전체 길이 등을 결정함으로써 확인할 수 있다.
<1-1-4> 단백질의 분비계
본 발명의 세균은 단백질의 분비계를 갖는다. 단백질의 분비계는 목적의 이종 단백질을 분비할 수 있는 것이면 특별히 제한되지 않는다. 단백질의 분비계로서는 Sec계(Sec계 분비 장치)나 Tat계(Tat계 분비 장치)가 열거된다. 본 발명의 세균은 단백질의 분비계가 증강되어 있어도 좋다. 예를 들면, 본 발명의 세균은 Tat계 분비 장치를 코드하는 유전자로부터 선택되는 1 또는 그 이상의 유전자의 발현이 상승하도록 개변되어 있어도 좋다. 본 발명에 있어서, 이러한 개변을 「Tat계 분비 장치의 증강」이라고도 한다. Tat계 분비 장치의 증강은 특히 Tat계 의존 시그널 펩타이드를 이용하여 이종 단백질을 분비 생산하는 경우에 적합하다. Tat계 분비 장치를 코드하는 유전자의 발현을 상승시키는 수법에 대해서는 특허 제4730302호에 기재되어 있다.
Tat계 분비 장치를 코드하는 유전자로서는 C. glutamicum의 tatA 유전자, tatB 유전자 및 tatC 유전자가 열거된다. C. glutamicum ATCC 13032의 tatA 유전자, tatB 유전자 및 tatC 유전자는 각각, NCBI 데이터 베이스에 GenBank accession NC_003450(VERSION NC_003450.3 GI: 58036263)으로서 등록되어 있는 게놈 서열 중, 1571065 내지 1571382 위치의 서열의 상보 서열, 1167110 내지 1167580 위치의 서열, 및 1569929 내지 1570873 위치의 서열의 상보 서열에 상당한다. 또한, C. glutamicum ATCC 13032의 TatA 단백질, TatB 단백질 및 TatC 단백질은 각각, GenBank accession NP_600707(버젼(version) NP_600707.1 GI: 19552705, 유전자좌_태그(locus_tag)="NCgl1434"), GenBank accession NP_600350(버젼 NP_600350.1 GI: 19552348, 유전자좌_태그="NCgl1077"), 및 GenBank accession NP_600706(버젼 P_600706.1 GI: 19552704, 유전자좌_태그="NCgl1433")으로서 등록되어 있다. C. glutamicum ATCC 13032의 tatA 유전자, tatB 유전자, 및 tatC 유전자의 염기 서열 및 TatA 단백질, TatB 단백질, 및 TatC 단백질의 아미노산 서열을 서열번호 69 내지 74에 나타낸다.
또한, Tat계 분비 장치를 코드하는 유전자로서는 E. coli의 tatA 유전자, tatB 유전자, tatC 유전자 및 tatE 유전자를 들 수 있다. E.coli K-12 MG1655의 tatA 유전자, tatB 유전자, tatC 유전자 및 tatE 유전자는 각각, NCBI 데이터 베이스에 GenBank accession NC_000913(VERSION NC_000913.2 GI: 49175990)로서 등록되어 있는 게놈 서열 중, 4019968 내지 4020237 위치의 서열, 4020241 내지 4020756 위치의 서열, 4020759 내지 4021535 위치의 서열, 658170 내지 658373 위치의 서열에 상당한다. 또한, E.coli K-12 MG1655의 TatA 단백질, TatB 단백질, TatC 단백질, 및 TatE 단백질은 각각, GenBank accession NP_418280(버젼 NP_418280.4 GI: 90111653, 유전자좌_태그="b3836"), GenBank accession YP_026270(버젼 YP_026270.1 GI:49176428, 유전자좌_태그="b3838"), GenBank accession NP_418282(버젼 NP_418282.1 GI:16131687, 유전자좌_태그="b3839"), 및 GenBank accession NP_415160(버젼 NP_415160.1 GI:16128610, 유전자좌_태그="b0627")로서 등록되어 있다.
Tat계 분비 장치를 코드하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 분비 장치를 코드하는 유전자의 변이체라도 좋다. 마찬가지로, Tat계 분비 장치는 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 분비 장치의 변이체라도 좋다. 즉, 예를 들면, 「tatA 유전자」, 「tatB 유전자」, 「tatC 유전자」 및 「tatE 유전자」라는 용어에는 각각, 상기 예시한 tatA 유전자, tatB 유전자, tatC 유전자 및 tatE 유전자에 더하여, 이의 보존적 변이체가 포함되는 것으로 한다. 마찬가지로, 「TatA 단백질」, 「TatB 단백질」, 「TatC 단백질」 및 「TatE 단백질」이라고 하는 용어에는 각각, 상기 예시한 TatA 단백질, TatB 단백질, TatC 단백질 및 TatE 단백질에 더하여, 이의 보존적 변이체가 포함되는 것으로 한다. Tat계 분비 장치 및 이것을 코드하는 유전자의 변이체에 대해서는 상기한 PhoS 단백질 및 phoS 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, Tat계 분비 장치를 코드하는 유전자는 원래의 기능이 유지된 단백질을 코드하는 한, 상기 아미노산 서열에 있어서, 1 또는 몇 개의 위치에서의 1 또는 몇 개의 아미노산이 치환, 결실, 삽입 또는 부가된 아미노산 서열을 갖는 단백질을 코드하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, Tat계 분비 장치에 있어서는, Tat계 의존 시그널 펩타이드가 N 말단에 부가된 단백질을 세포 외로 분비하는 기능을 갖는 것이라도 좋다.
이하에, Tat계 분비 장치를 코드하는 유전자 등의 유전자의 발현을 상승시키는 수법에 대하여 설명한다.
「유전자의 발현이 상승한다」란, 이 유전자의 발현이 비개변주에 비하여 상승되어 있는 것을 의미한다. 여기에서 말하는 「비개변주」란, 표적의 유전자의 발현이 상승하도록 개변되어 있지 않은 대조주를 의미한다. 비개변주로서는 야생주나 친주를 들 수 있다. 「유전자의 발현이 상승한다」란, 구체적으로는, 유전자의 전사량(mRNA량)이 증대하는 것, 및/또는 유전자의 번역량(단백질의 양)이 증대하는 것을 의미하여도 좋다. 또한, 「유전자의 발현이 상승한다」는 것을, 「유전자의 발현이 증강된다」라고도 한다. 유전자 발현의 상승의 정도는 유전자의 발현이 비개변주와 비교하여 상승되어 있으면 특별히 제한되지 않는다. 유전자의 발현은 비개변주와 비교하여, 바람직하게는 1.5배 이상, 보다 바람직하게는 2배 이상, 더욱 바람직하게는 3배 이상 상승하여도 좋다. 또한, 「유전자의 발현이 상승한다」란, 원래 표적의 유전자가 발현되어 있는 균주에 있어서 이 유전자의 발현량을 상승시키는 것뿐만 아니라, 원래 표적의 유전자가 발현되어 있지 않은 균주에 있어서, 이 유전자를 발현시키는 것을 포함한다. 즉, 「유전자의 발현이 상승한다」란, 예를 들면, 표적의 유전자를 유지하지 않는 균주에 이 유전자를 도입하고, 이 유전자를 발현시키는 것을 포함한다.
유전자 발현의 상승은 예를 들면 유전자의 카피수를 증가시킴으로써 달성할 수 있다.
유전자의 카피수의 증가는 숙주의 염색체에 이 유전자를 도입함으로써 달성할 수 있다. 염색체로의 유전자의 도입은 예를 들면, 상동 재조합을 이용하여 행할 수 있다(MillerI, J. H. Experiments in Molecular Genetics, 1972, Cold Spring Harbor Laboratory). 상동 재조합을 이용하는 유전자 도입법으로서는 예를 들면, Red 드리븐 인테그레이션(Red-driven integration)법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97:6640-6645 (2000)) 등의 직쇄상 DNA를 사용하는 방법, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터를 사용하는 방법, 파지를 사용한 형질도입(transduction)법이 열거된다. 상동 재조합에 사용하는 재조합 DNA의 구조는 원하는 형태로 상동 재조합이 일어나는 것이면 특별히 제한되지 않는다. 구체적으로는, 예를 들면, 표적 유전자를 포함하는 선상 DNA로서, 양단에 염색체 상의 치환 대상 부위의 상류 및 하류의 서열을 각각 구비한 선상 DNA로 코리네형 세균을 형질전환하여, 치환 대상 부위의 상류 및 하류에서 각각 상동 재조합을 일으키게 함으로써, 치환 대상 부위를 표적 유전자로 치환할 수 있다. 상동 재조합에 사용하는 재조합 DNA는 형질전환체를 선택하기 위한 마커 유전자를 구비하고 있어도 좋다. 유전자는 1카피만 도입되어도 좋고, 2카피 또는 그 이상 도입되어도 좋다. 예를 들면, 염색체 상에 다수의 카피가 존재하는 서열을 표적으로서 상동 재조합을 행함으로써 염색체에 유전자의 다수의 카피를 도입할 수 있다. 염색체 상에 다수의 카피가 존재하는 서열로서는 반복 DNA 서열(repetitive DNA), 트랜스포존의 양단에 존재하는 인버티드·리피트(inverted repeat)가 열거된다. 또한, 목적 물질의 생산에 불필요한 유전자 등의 염색체 상의 적당한 서열을 표적으로서 상동 재조합을 행하여도 좋다. 또한, 유전자는 트랜스포존이나 Mini-Mu를 사용하여 염색체 상에 랜덤으로 도입할 수도 있다(일본 공개특허공보 특개 평2-109985호, US5,882,888, EP0805867B1). 트랜스포존으로서는 인공 트랜스포존을 이용하여도 좋다(일본 공개특허공보 특개 평9-70291).
염색체 상에 표적 유전자가 도입된 것의 확인은 이 유전자의 전부 또는 일부와 상보적인 서열을 갖는 프로브를 사용한 서던 하이브리다이제이션, 또는 이 유전자의 서열에 기초하여 작성한 프라이머를 사용한 PCR 등에 의해 확인할 수 있다.
또한, 유전자의 카피수의 증가는 이 유전자를 포함하는 벡터를 숙주에 도입함으로써도 달성할 수 있다. 예를 들면, 표적 유전자를 포함하는 DNA 단편을, 숙주에서 기능하는 벡터와 연결하여 이 유전자의 발현 벡터를 구축하고, 당해 발현 벡터로 숙주를 형질전환함으로써 이 유전자의 카피수를 증가시킬 수 있다. 표적 유전자를 포함하는 DNA 단편은, 예를 들면, 표적 유전자를 갖는 미생물의 게놈 DNA를 주형으로 하는 PCR에 의해 취득할 수 있다. 벡터로서는 숙주의 세포 내에서 자율 복제 가능한 벡터를 사용할 수 있다. 벡터는 멀티 카피 벡터인 것이 바람직하다. 또한, 형질전환체를 선택하기 위해서, 벡터는 항생 물질 내성 유전자 등의 마커를 갖는 것이 바람직하다. 또한, 벡터는 삽입된 유전자를 발현하기 위한 프로모터나 터미네이터를 구비하고 있어도 좋다. 벡터는 예를 들면 세균 플라스미드 유래의 벡터, 효모 플라스미드 유래의 벡터, 박테리오파지 유래의 벡터, 코스미드 또는 파지미드 등이라도 좋다. 코리네형 세균에서 자율 복제 가능한 벡터로서, 구체적으로는 pHM1519(Agric, Biol. Chem., 48, 2901-2903(1984)); pAM330(Agric. Biol. Chem., 48, 2901-2903(1984)); 이들을 개량한 약제 내성 유전자를 갖는 플라스미드; 일본 공개특허공보 특개 평3-210184호에 기재된 플라스미드 pCRY30; 일본 공개특허공보 특개 평2-72876호 및 미국특허 제5,185,262호 명세서 공보에 기재된 플라스미드 pCRY21, pCRY2KE, pCRY2KX, pCRY31, pCRY3KE 및 pCRY3KX; 일본 공개특허공보 특개 평1-191686호에 기재된 플라스미드 pCRY2 및 pCRY3; 일본 공개특허공보 특개 소58-192900호에 기재된 pAJ655, pAJ611 및 pAJ1844; 일본 공개특허공보 특개 소57-134500호에 기재된 pCG1; 일본 공개특허공보 특개 소58-35197호에 기재된 pCG2; 일본 공개특허공보 특개 소57-183799호에 기재된 pCG4 및 pCG11; 일본 공개특허공보 특개 평10-215883호에 기재된 pVK7, 일본 공개특허공보 특개 평9-070291호에 기재된 pVC7 등이 열거된다.
유전자를 도입할 경우, 유전자는 발현 가능하게 본 발명의 세균에 유지되어 있으면 좋다. 구체적으로는, 유전자는 본 발명의 세균에서 기능하는 프로모터 서열에 의한 제어를 받아 발현하도록 도입되어 있으면 좋다. 프로모터는 숙주 유래의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 도입하는 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 프로모터로서는 후술하는 바와 같은, 코리네형 세균에서 기능하는 프로모터를 이용할 수 있다.
유전자의 하류에는 전사 종결용 터미네이터를 배치할 수 있다. 터미네이터는 본 발명의 세균에서 기능하는 것이면 특별히 제한되지 않는다. 터미네이터는 숙주 유래의 터미네이터라도 좋고, 이종 유래의 터미네이터라도 좋다. 터미네이터는 도입하는 유전자 고유의 터미네이터라도 좋고, 다른 유전자의 터미네이터라도 좋다.
각종 미생물에서 이용 가능한 벡터, 프로모터, 터미네이터에 대해서는, 예를 들면 「미생물학 기초강좌 8 유전자 공학, 공립 출판, 1987년」에 상세하게 기재되어 있고, 이것을 이용하는 것이 가능하다.
또한, 2 또는 그 이상의 유전자를 도입할 경우, 각 유전자가 발현 가능하게 본 발명의 세균에 유지되어 있으면 좋다. 예를 들면, 각 유전자는 모두가 단일의 발현 벡터 상에 유지되어 있어도 좋고, 모두가 염색체 상에 유지되어 있어도 좋다. 또한, 각 유전자는 복수의 발현 벡터 상에 각각 유지되어 있어도 좋고, 단일 또는 복수의 발현 벡터 상과 염색체 상에 각각 유지되어 있어도 좋다. 또한, 2 또는 그 이상의 유전자로 오페론을 구성하여 도입하여도 좋다.
도입되는 유전자는 숙주에서 기능하는 단백질을 코드하는 것이면 특별히 제한되지 않는다. 도입되는 유전자는 숙주 유래의 유전자라도 좋고, 이종 유래의 유전자라도 좋다. 도입되는 유전자는 예를 들면, 이 유전자의 염기 서열에 기초하여 설계한 프라이머를 사용하고, 이 유전자를 갖는 생물의 게놈 DNA나 이 유전자를 탑재하는 플라스미드 등을 주형으로서, PCR에 의해 취득할 수 있다. 또한, 도입되는 유전자는 예를 들면, 이 유전자의 염기 서열에 기초하여 전체 합성하여도 좋다(Gene, 60(1), 115-127 (1987)). 취득한 유전자는 그대로, 또는 적절히 개변하여 이용할 수 있다.
또한, 유전자 발현의 상승은 유전자의 전사 효율을 향상시킴으로써 달성할 수 있다. 또한, 유전자 발현의 상승은 유전자의 번역 효율을 향상시킴으로써 달성할 수 있다. 유전자의 전사 효율이나 번역 효율의 향상은 예를 들면, 발현 조절 서열의 개변에 의해 달성할 수 있다. 「발현 조절 서열」이란, 유전자의 발현에 영향을 주는 부위의 총칭이다. 발현 조절 서열로서는 예를 들면, 프로모터, 샤인달가노(SD) 서열(리보솜 결합 부위(RBS)라고도 한다), 및 RBS와 개시 코돈 사이의 스페이서 영역이 열거된다. 발현 조절 서열은 프로모터 검색 벡터나 GENETYX 등의 유전자 해석 소프트를 사용하여 결정할 수 있다. 이들 발현 조절 서열의 개변은 예를 들면, 상동 재조합을 이용하여 행할 수 있다. 상동 재조합을 이용한 개변 수법으로서는 온도 감수성 벡터를 사용한 방법이나, Red 드리븐 인테그레이션법(WO2005/010175)이 열거된다.
유전자의 전사 효율의 향상은 예를 들면, 염색체 상의 유전자의 프로모터를 보다 강력한 프로모터로 치환함으로써 달성할 수 있다. 「보다 강력한 프로모터 」란, 유전자의 전사가 원래 존재하고 있는 야생형의 프로모터보다도 향상되는 프로모터를 의미한다. 코리네형 세균에서 이용할 수 있는 강력한 프로모터로서는, 인위적으로 설계 변경된 P54-6 프로모터(Appl. Microbiol. Biotechnolo., 53, 674-679 (2000)), 코리네형 세균 내에서 아세트산, 에탄올, 피루브산 등으로 유도할 수 있는 pta, aceA, aceB, adh, amyE 프로모터, 코리네형 세균 내에서 발현량이 많은 강력한 프로모터인 cspB, SOD, tuf(EF-Tu) 프로모터(Journal of Biotechnology 104 (2003) 311-323, Appl Environ Microbiol. 2005 Dec; 71(12):8587-96.), lac 프로모터, tac 프로모터, trc 프로모터가 열거된다. 또한, 보다 강력한 프로모터로서는 각종 리포터 유전자를 사용함으로써, 재래의 프로모터의 고활성형인 것을 취득하여도 좋다. 예를 들면, 프로모터 영역 내의 -35, -10 영역을 콘센서스 서열에 가까이함으로써 프로모터의 활성을 높일 수 있다(국제공개 제00/18935호). 프로모터 강도의 평가법 및 강력한 프로모터의 예는, Goldstein 등의 논문(Prokaryotic promoters in biotechnology. Biotechnol. Annu. Rev., 1, 105-128 (1995)) 등에 기재되어 있다.
유전자의 번역 효율의 향상은 예를 들면, 염색체 상의 유전자의 샤인달가노(SD) 서열(리보솜 결합 부위(RBS)라고도 한다)을 보다 강력한 SD 서열로 치환함으로써 달성할 수 있다. 「보다 강력한 SD 서열」이란, mRNA의 번역이 원래 존재하고 있는 야생형의 SD 서열보다도 향상되는 SD 서열을 의미한다. 보다 강력한 SD 서열로서는 예를 들면, 파지 T7 유래의 유전자 10의 RBS가 열거된다(Olins P. O. et al, Gene, 1988, 73, 227-235). 또한, RBS와 개시 코돈 사이의 스페이서 영역, 특히 개시 코돈의 바로 상류의 서열(5'-UTR)에서의 몇 개의 뉴클레오티드의 치환, 또는 삽입, 또는 결실이 mRNA의 안정성 및 번역 효율에 매우 영향을 미치는 것이 알려져 있고, 이들을 개변함으로써도 유전자의 번역 효율을 향상시킬 수 있다.
유전자의 번역 효율의 향상은 예를 들면, 코돈의 개변에 의해서도 달성할 수 있다. 예를 들면, 유전자 중에 존재하는 레어 코돈을, 보다 고빈도로 이용되는 동의 코돈으로 치환함으로써 유전자의 번역 효율을 향상시킬 수 있다. 즉, 도입되는 유전자는 예를 들면, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변되어도 좋다. 코돈의 치환은 예를 들면, DNA의 목적의 부위에 목적의 변이를 도입하는 부위 특이적 변이법에 의해 행할 수 있다. 부위 특이적 변이법으로서는 PCR을 사용하는 방법(Higuchi, R., 61, in PCR technology, Erlich, H. A. Eds., Stockton press (1989); Carter, P., Meth. in Enzymol., 154, 382 (1987))이나, 파지를 사용하는 방법(Kramer, W. and Frits, H. J., Meth. in Enzymol., 154, 350 (1987); Kunkel, T. A. et al., Meth. in Enzymol., 154, 367 (1987))이 열거된다. 또한, 코돈이 치환된 유전자 단편을 전체 합성하여도 좋다. 다양한 생물에서의 코돈의 사용 빈도는 「코돈 사용 데이터 베이스」(http://www.kazusa.or.jp/codon; Nakamura, Y. et al, Nucl. Acids Res., 28, 292 (2000))에 개시되어 있다.
또한, 유전자 발현의 상승은 표적 유전자의 발현을 상승시키는 레귤레이터를 증폭시키는 것, 또는 표적 유전자의 발현을 저하시키는 레귤레이터를 결실 또는 약화시킴으로써도 달성할 수 있다.
상기와 같은 유전자의 발현을 상승시키는 수법은 단독으로 사용하여도 좋고, 임의의 조합으로 사용하여도 좋다.
형질전환의 방법은 특별히 한정되지 않고, 종래 알려진 방법을 사용할 수 있다. 예를 들면, 에쉐리키아·콜라이 K-12에 대하여 보고되어 있는 바와 같은, 수용균 세포를 염화칼슘으로 처리하여 DNA의 투과성을 증대시키는 방법(Mandel, M. and Higa, A.,J. Mol. Biol. 1970, 53, 159-162)이나, 바실러스·서브틸리스에 대하여 보고되어 있는 바와 같은, 증식 단계의 세포로부터 컴피턴트 셀(competent cell)을 조제하여 DNA를 도입하는 방법(Duncan, C. H., Wilson, G. A. and Young, F. E.., 1997. Gene 1: 153-167)을 사용할 수 있다. 또는 바실러스·서브틸리스, 방선균류 및 효모에 대하여 알려져 있는 바와 같은, DNA 수용균의 세포를, 재조합 DNA를 용이하게 받아들이는 프로토플라스트 또는 스페로플라스트의 상태로 하여 재조합 DNA를 DNA 수용균에 도입하는 방법(Chang, S. and Choen, S. N., 1979. Mol. Gen. Genet. 168: 111-115; Bibb, M. J., Ward, J. M. and Hopwood, O. A. 1978. Nature 274: 398-400; Hinnen, A., Hicks, J. B. and Fink, G. R. 1978. Proc. Natl. Acad. Sci. USA 75: 1929-1933)도 응용할 수 있다. 코리네형 세균의 형질전환은 구체적으로는, 예를 들면, 프로토플라스트법(Gene, 39, 281-286(1985)), 일렉트로포레이션법(Bio/Technology, 7, 1067-1070(1989)), 전기 펄스법(일본 공개특허공보 특개 평2-207791호) 등으로 행할 수 있다.
유전자의 발현이 상승한 것은 예를 들면, 이 유전자로부터 발현되는 단백질의 활성이 상승한 것을 확인함으로써 확인할 수 있다. 단백질의 활성이 상승한 것은 이 단백질의 활성을 측정함으로써 확인할 수 있다. 예를 들면, Tat계 분비 장치의 활성이 상승한 것은 예를 들면, Tat계 의존 시그널 펩타이드가 N 말단에 부가된 단백질의 분비 생산량이 증대한 것을 확인함으로써 확인할 수 있다. 이 경우, Tat계 의존 시그널 펩타이드가 N 말단에 부가된 단백질의 분비 생산량은 비개변주와 비교하여, 예를 들면, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승하고 있는 것이 바람직하다.
또한, 유전자의 발현이 상승한 것은 예를 들면, 이 유전자의 전사량이 상승한 것을 확인하는 것이나, 이 유전자로부터 발현되는 단백질의 양이 상승한 것을 확인함으로써 확인할 수 있다.
유전자의 전사량이 상승한 것의 확인은 이 유전자로부터 전사되는 mRNA의 양을 야생주 또는 친주 등의 비개변주와 비교함으로써 행할 수 있다. mRNA의 양을 평가하는 방법으로서는 노던 하이브리다이제이션, RT-PCR 등이 열거된다(Sambrook, J., et al., Molecular Cloning A Laboratory Manual/Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (USA), 2001). mRNA의 양은 비개변주와 비교하여, 예를 들면, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승되어 있는 것이 바람직하다.
단백질의 양이 상승한 것의 확인은 SDS-PAGE를 행하고, 분리된 단백질 밴드의 강도를 확인함으로써 행할 수 있다. 또한, 단백질의 양이 상승한 것의 확인은 항체를 사용하여 웨스턴 블롯에 의해 행할 수 있다(Molecular cloning (Cold Spring Harbor Laboratory Press, Cold Spring Harbor (USA), 2001)). 단백질의 양은 비개변주와 비교하여, 예를 들면, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승되어 있는 것이 바람직하다.
<1-1-5> 이종 단백질의 분비 발현용 유전자 구축물
분비성 단백질(secretory protein)은 일반적으로 프레단백질(프레펩타이드라고도 한다) 또는 프레프로단백질(프레프로펩타이드라고도 한다)로서 번역되고, 그 후, 프로세싱에 의해 성숙 단백질(mature protein)이 되는 것이 알려져 있다. 구체적으로는, 분비성 단백질은 일반적으로, 프레단백질 또는 프레프로단백질로서 번역된 후, 프레 부분인 시그널 펩타이드가 프로테아제(일반적으로 시그널펩티다아제라고 불린다)에 의해 절단되어 성숙 단백질 또는 프로단백질로 변환되고, 프로단백질은 프로테아제에 의해 더욱 프로 부분이 절단되어 성숙 단백질이 된다. 따라서, 본 발명의 방법에서는 이종 단백질의 분비 생산에 시그널 펩타이드를 이용한다. 또한, 본 발명에 있어서, 분비형 단백질의 프레단백질 및 프레프로단백질을 총칭하여 「분비형 단백질 전구체」라고 하는 경우가 있다. 본 발명에 있어서, 「시그널 펩타이드」(「시그널 서열」이라고 한다)란, 분비성 단백질 전구체의 N 말단에 존재하고, 또한 통상, 천연의 성숙 단백질에는 존재하지 않는 아미노산 서열을 말한다.
본 발명에 사용되는 유전자 구축물은 5'에서 3' 방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 시그널 펩타이드를 코드하는 핵산 서열, 및 이종 단백질을 코드하는 핵산 서열을 포함한다. 시그널 펩타이드를 코드하는 핵산 서열은 프로모터 서열의 하류에, 이 프로모터에 의한 제어를 받아 시그널 펩타이드가 발현하도록 연결되어 있으면 좋다. 이종 단백질을 코드하는 핵산 서열은 시그널 펩타이드를 코드하는 핵산 서열의 하류에, 이 시그널 펩타이드와의 융합 단백질로서 이종 단백질이 발현하도록 연결되어 있으면 좋다. 당해 융합 단백질을 「본 발명의 융합 단백질」이라고도 한다. 또한, 본 발명의 융합 단백질에 있어서, 시그널 펩타이드와 이종 단백질은 인접하고 있어도 좋고, 인접하고 있지 않아도 좋다. 즉, 「이종 단백질이 시그널 펩타이드와의 융합 단백질로서 발현하다」란, 이종 단백질이 시그널 펩타이드에 인접하여 이 시그널 펩타이드와의 융합 단백질로서 발현하는 경우에 한정되지 않고, 이종 단백질이 다른 아미노산 서열을 통하여 시그널 펩타이드와의 융합 단백질로서 발현하는 경우도 포함된다. 예를 들면, 후술하는 바와 같이, 본 발명의 융합 단백질에 있어서, 시그널 펩타이드와 이종 단백질 사이에는, Gln-Glu-Thr을 포함하는 아미노산 서열이나 효소적 절단에 사용되는 아미노산 서열 등의 삽입 서열이 포함될 수 있다. 핵산 서열은 「유전자」로 대체하여도 좋다. 예를 들면, 이종 단백질을 코드하는 핵산 서열을 「이종 단백질을 코드하는 유전자」 또는 「이종 단백질 유전자」라고도 한다. 핵산 서열로서는 DNA가 열거된다. 또한, 본 발명에 사용되는 유전자 구축물은 코리네형 세균에서 본 발명의 융합 단백질을 발현시키기 위해서 유효한 제어 서열(오퍼레이터나 터미네이터 등)을, 이들이 기능할 수 있도록 적절한 위치에 갖고 있어도 좋다.
본 발명에서 사용되는 프로모터는 코리네형 세균에서 기능하는 프로모터인 한 특별히 제한되지 않는다. 프로모터는 코리네형 세균 유래(예를 들면 숙주 유래)의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 이종 단백질 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 「코리네형 세균에서 기능하는 프로모터」란, 코리네형 세균에서 프로모터 활성을 갖는 프로모터를 말한다.
이종 유래의 프로모터로서 구체적으로는, 예를 들면, tac 프로모터, lac 프로모터, trp 프로모터 및 araBAD 프로모터 등의 E.coli 유래의 프로모터가 열거된다. 이 중에서도, tac 프로모터 등의 강력한 프로모터나, araBAD 프로모터 등의 유도형 프로모터가 바람직하다.
코리네형 세균 유래의 프로모터로서는 예를 들면, 세포 표층 단백질인 PS1, PS2(CspB라고도 한다), SlpA(CspA라고도 한다)의 유전자의 프로모터, 각종 아미노산 생합성계 유전자의 프로모터가 열거된다. 각종 아미노산 생합성계 유전자의 프로모터로서 구체적으로는, 예를 들면, 글루타민산 생합성계의 글루타민산 탈수소 효소 유전자, 글루타민 합성계의 글루타민 합성 효소 유전자, 리신 생합성계의 아스파르토키나아제 유전자, 스레오닌 생합성계의 호모세린 탈수소 효소 유전자, 이소류신 및 발린 생합성계의 아세토하이드록시산 합성 효소 유전자, 류신 생합성계의 2-이소프로필말산 합성 효소 유전자, 프롤린 및 아르기닌 생합성계의 글루타민산 키나아제 유전자, 히스티딘 생합성계의 포스포리보실-ATP 피로포스포릴라아제 유전자, 트립토판, 티로신 및 페닐알라닌 등의 방향족 아미노산 생합성계의 데옥시아라비노헵투론산 인산(DAHP) 합성 효소 유전자, 이노신산 및 구아닐산과 같은 핵산 생합성계에서의 포스포리보실 피로포스페이트(PRPP) 아미드트랜스퍼라제 유전자, 이노신산 탈수소 효소 유전자, 및 구아닐산 합성 효소 유전자의 프로모터가 열거된다.
또한, 코리네형 세균에서 기능하는 프로모터로서는 상술한 바와 같은, 코리네형 세균에서 이용할 수 있는 강력한 프로모터가 열거된다. 또한, 프로모터로서는 각종 리포터 유전자를 사용함으로써 재래의 프로모터의 고활성형인 것을 취득하여 이용하여도 좋다. 예를 들면, 프로모터 영역 내의 -35, -10 영역을 콘센서스 서열에 가까이함으로써 프로모터의 활성을 높일 수 있다(국제공개 제00/18935호). 프로모터 강도의 평가법 및 강력한 프로모터의 예는, Goldstein 등의 논문(Prokaryotic promoters in biotechnology. Biotechnol. Annu. Rev., 1, 105-128(1995)) 등에 기재되어 있다. 또한, 리보솜 결합 부위(RBS)와 개시 코돈 사이의 스페이서 영역, 특히 개시 코돈의 바로 상류의 서열(5'-UTR)에서의 몇 개의 뉴클레오티드의 치환, 또는 삽입, 또는 결실이 mRNA의 안정성 및 번역 효율에 매우 영향을 미치는 것이 알려져 있고, 이들을 개변하는 것도 가능하다.
본 발명에서 사용되는 시그널 펩타이드는 코리네형 세균에서 기능하는 시그널 펩타이드인 한 특별히 제한되지 않는다. 시그널 펩타이드는 코리네형 세균 유래(예를 들면 숙주 유래)의 시그널 펩타이드라도 좋고, 이종 유래의 시그널 펩타이드라도 좋다. 시그널 펩타이드는 이종 단백질 고유의 시그널 펩타이드라도 좋고, 다른 단백질의 시그널 펩타이드라도 좋다. 「코리네형 세균에서 기능하는 시그널 펩타이드」란, 목적 단백질의 N 말단에 연결했을 때에, 코리네형 세균이 당해 단백질을 분비할 수 있는 펩타이드를 말한다. 어떤 시그널 펩타이드가 코리네형 세균에서 기능하는지 여부는, 예를 들면, 목적 단백질을 당해 시그널 펩타이드와 융합시켜서 발현시키고, 당해 단백질이 분비되는지를 확인함으로써 확인할 수 있다.
시그널 펩타이드로서는 Tat계 의존 시그널 펩타이드나 Sec계 의존 시그널 펩타이드가 열거된다.
「Tat계 의존 시그널 펩타이드」란, Tat계에 의해 인식되는 시그널 펩타이드를 말한다. 「Tat계 의존 시그널 펩타이드」란, 구체적으로는, 목적 단백질의 N 말단에 연결했을 때에, Tat계 분비 장치에 의해 당해 단백질이 분비되는 펩타이드라도 좋다.
Tat계 의존 시그널 펩타이드로서는 예를 들면, E. coli의 TorA 단백질(트리메틸아민-N-옥시도리덕타제)의 시그널 펩타이드, E. coli의 SufI 단백질(ftsI의 서프레서)의 시그널 펩타이드, Bacillus subtilis의 PhoD 단백질(포스포디에스테라아제)의 시그널 펩타이드, Bacillus subtilis의 LipA 단백질(리포산 신타제)의 시그널 펩타이드, Arthrobacter globiformis의 IMD 단백질(이소말토덱스트라나아제)의 시그널 펩타이드가 열거된다. 이들 시그널 펩타이드의 아미노산 서열은 이하와 같다.
TorA 시그널 펩타이드: MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATA (서열번호 75)
SufI 시그널 펩타이드: MSLSRRQFIQASGIALCAGAVPLKASA (서열번호 76)
PhoD 시그널 펩타이드: MAYDSRFDEWVQKLKEESFQNNTFDRRKFIQGAGKIAGLSLGLTIAQS (서열번호 77)
LipA 시그널 펩타이드: MKFVKRRTTALVTTLMLSVTSLFALQPSAKAAEH (서열번호 78)
IMD 시그널 펩타이드: MMNLSRRTLLTTGSAATLAYALGMAGSAQA (서열번호 79)
Tat계 의존 시그널 펩타이드는 트윈·아르기닌 모티프를 갖는다. 트윈·아르기닌 모티프로서는 예를 들면, S/T-R-R-X-F-L-K(서열번호 80)나 R-R-X-#-#(#: 소수성 잔기)(서열번호 81)가 열거된다.
「Sec계 의존 시그널 펩타이드」란, Sec계에 의해 인식되는 시그널 펩타이드를 말한다. 「Sec계 의존 시그널 펩타이드」란, 구체적으로는, 목적 단백질의 N 말단에 연결했을 때에, Sec계 분비 장치에 의해 당해 단백질이 분비되는 펩타이드라도 좋다.
Sec계 의존 시그널 펩타이드로서는 예를 들면, 코리네형 세균의 세포 표층 단백질의 시그널 펩타이드가 열거된다. 코리네형 세균의 세포 표층 단백질에 대해서는 상술한 바와 같다. 코리네형 세균의 세포 표층 단백질로서는, C. glutamicum로부터 유래하는 PS1 및 PS2(CspB)(일본 공개특허공보 특표 평6-502548), 및 C. stationis로부터 유래하는 SlpA(CspA)(일본 공개특허공보 특개 평10-108675)가 열거된다. C. glutamicum의 PS1의 시그널 펩타이드(PS1 시그널 펩타이드)의 아미노산 서열을 서열번호 82에, C. glutamicum의 PS2(CspB)의 시그널 펩타이드(PS2 시그널 펩타이드)의 아미노산 서열을 서열번호 83에, C. stationis의 SlpA(CspA)의 시그널 펩타이드(SlpA 시그널 펩타이드)의 아미노산 서열을 서열번호 84에 나타낸다.
Tat계 의존 시그널 펩타이드는 트윈·아르기닌 모티프를 갖고, 또한 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 의존 시그널 펩타이드의 변이체라도 좋다. 또한, Sec계 의존 시그널 펩타이드는 원래의 기능이 유지되고 있는 한, 상기 예시한 Sec계 의존 시그널 펩타이드의 변이체라도 좋다. 시그널 펩타이드 및 이것을 코드하는 유전자의 변이체에 대해서는 상술한 PhoS 단백질 및 phoS 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, 시그널 펩타이드는 상기 예시한 시그널 펩타이드의 아미노산 서열에 있어서, 1 또는 몇 개의 위치에서의 1 또는 몇 개의 아미노산이 치환, 결실, 삽입 또는 부가된 아미노산 서열을 갖는 펩타이드라도 좋다. 또한, 시그널 펩타이드의 변이체에서의 상기 「1 또는 몇 개」란, 구체적으로는 바람직하게는 1 내지 7개, 보다 바람직하게는 1 내지 5개, 더욱 바람직하게는 1 내지 3개, 특히 바람직하게는 1 내지 2개를 의미한다. 또한, 본 발명에 있어서, 「TorA 시그널 펩타이드」, 「SufI 시그널 펩타이드」, 「PhoD 시그널 펩타이드」, 「LipA 시그널 펩타이드」, 「IMD 시그널 펩타이드」, 「PS1 시그널 펩타이드」, 「PS2 시그널 펩타이드」 및 「SlpA 시그널 펩타이드」라고 하는 용어에는 각각, 서열번호 75, 76, 77, 78, 79, 82, 83 및 84에 기재된 펩타이드에 더하여, 이의 보존적 변이체가 포함되는 것으로 한다.
Tat계 의존 시그널 펩타이드에 대한 「원래의 기능이 유지되고 있다」란, Tat계에 의해 인식되는 것을 말하고, 구체적으로는, 목적 단백질의 N 말단에 연결했을 때에, Tat계 분비 장치에 의해 당해 단백질이 분비되는 기능을 갖는 것이라도 좋다. 어떤 펩타이드가 Tat계 의존 시그널 펩타이드로서의 기능을 갖는지 여부는, 예를 들면, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Tat계 분비 장치의 증강에 의해 증대하는 것을 확인하는 것이나, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Tat계 분비 장치의 결손에 의해 감소하는 것을 확인함으로써 확인할 수 있다.
Sec계 의존 시그널 펩타이드에 대한 「원래의 기능이 유지되고 있다」란, Sec계에 의해 인식되는 것을 말하고, 구체적으로는, 목적 단백질의 N 말단에 연결했을 때에, Sec계 분비 장치에 의해 당해 단백질이 분비되는 기능을 갖는 것이라도 좋다. 어떤 펩타이드가 Sec계 의존 시그널 펩타이드로서의 기능을 갖는지 여부는, 예를 들면, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Sec계 분비 장치의 증강에 의해 증대하는 것을 확인하는 것이나, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Sec계 분비 장치의 결손에 의해 감소하는 것을 확인함으로써 확인할 수 있다.
시그널 서열은 일반적으로, 번역 산물이 균체 외로 분비될 때에 시그널펩티다아제에 의해 절단된다. 또한, 시그널 펩타이드를 코드하는 유전자는 천연형의 그 자체로도 사용할 수 있지만, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변하여도 좋다.
본 발명에서 사용되는 유전자 구축물에 있어서는, 시그널 펩타이드를 코드하는 핵산 서열과 이종 단백질을 코드하는 핵산 서열 사이에, Gln-Glu-Thr을 포함하는 아미노산 서열을 코드하는 핵산 서열이 삽입되어 있어도 좋다(WO2013/062029). 또한, 당해 「Gln-Glu-Thr을 포함하는 아미노산 서열」을 「본 발명에서 사용되는 삽입 서열」이라고도 한다. 본 발명에서 사용되는 삽입 서열로서는 WO2013/062029에 기재된 Gln-Glu-Thr을 포함하는 아미노산 서열이 열거된다. 본 발명에서 사용되는 삽입 서열은 특히 Sec계 의존 시그널 펩타이드와 조합하여 적합하게 사용할 수 있다.
본 발명에서 사용되는 삽입 서열은 코리네형 세균의 세포 표층 단백질 CspB의 성숙 단백질(이하, 「성숙 CspB」 또는 「CspB 성숙 단백질」이라고도 한다)의 N 말단으로부터의 3 아미노산 잔기 또는 그 이상으로 이루어지는 서열인 것이 바람직하다. 「N 말단으로부터의 3 아미노산 잔기 또는 그 이상으로 이루어지는 서열」이란, N 말단의 1 위치의 아미노산 잔기로부터 3 위치 또는 그 이상의 아미노산 잔기까지의 아미노산 서열을 말한다.
코리네형 세균의 세포 표층 단백질 CspB에 대해서는 상술한 바와 같다. CspB로서 구체적으로는, 예를 들면, C. glutamicum ATCC13869의 CspB나 상기 예시한 28주의 C. glutamicum의 CspB, 및 이들의 변이체가 열거된다. 서열번호 68에 나타낸 C. glutamicum ATCC13869의 CspB의 아미노산 서열 중, 1 내지 30 위치의 아미노산 잔기가 시그널 펩타이드에 상당하고, 31 내지 499 위치의 아미노산 잔기가 CspB 성숙 단백질에 상당한다. 시그널 펩타이드 부분 30 아미노산 잔기를 제외한, C. glutamicum ATCC13869의 CspB 성숙 단백질의 아미노산 서열을 서열번호 85에 나타낸다. 또한, C. glutamicum ATCC13869의 성숙 CspB에 있어서, N 말단의 1 내지 3 위치의 아미노산 잔기가 Gln-Glu-Thr에 상당한다.
본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터 3 내지 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 바람직하다. 본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터 3 내지 8, 17, 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 보다 바람직하다. 본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터 4, 6, 17, 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 특히 바람직하다.
본 발명에서 사용되는 삽입 서열은 예를 들면, 하기 A 내지 H의 아미노산 서열로 이루어지는 그룹으로부터 선택되는 아미노산 서열인 것이 바람직하다.
(A) Gln-Glu-Thr
(B) Gln-Glu-Thr-Xaa1(서열번호 86)
(C) Gln-Glu-Thr-Xaa1-Xaa2(서열번호 87)
(D) Gln-Glu-Thr-Xaa1-Xaa2-Xaa3(서열번호 88)
(E) Gln-Glu-Thr에 성숙 CspB의 4 내지 7 위치의 아미노산 잔기가 부가된 아미노산 서열
(F) Gln-Glu-Thr에 성숙 CspB의 4 내지 8 위치의 아미노산 잔기가 부가된 아미노산 서열
(G) Gln-Glu-Thr에 성숙 CspB의 4 내지 17 위치의 아미노산 잔기가 부가된 아미노산 서열
(H) Gln-Glu-Thr에 성숙 CspB의 4 내지 50 위치의 아미노산 잔기가 부가된 아미노산 서열
A 내지 H의 아미노산 서열에 있어서, Xaa1은 Asn, Gly, Thr, Pro 또는 Ala이며, Xaa2는 Pro, Thr 또는 Val이고, Xaa3은 Thr 또는 Tyr이다. 또한, A 내지 H의 아미노산 서열에 있어서, 「Gln-Glu-Thr에 성숙 CspB의 4 내지 X 위치의 아미노산 잔기가 부가된」이란, Gln-Glu-Thr의 Thr에 성숙 CspB의 N 말단의 4 위치로부터 X 위치까지의 아미노산 잔기가 부가되어 있는 것을 의미한다. 또한, 통상, 성숙 CspB의 N 말단의 1 내지 3번째의 아미노산 잔기는 Gln-Glu-Thr이고, 이 경우, 「Gln-Glu-Thr에 성숙 CspB의 4 내지 X 위치의 아미노산 잔기가 부가된 아미노산 서열」이란, 성숙 CspB의 1 내지 X 위치의 아미노산 잔기로 이루어지는 아미노산 서열과 동의이다.
또한, 본 발명에서 사용되는 삽입 서열은 구체적으로는, 예를 들면, Gln-Glu-Thr-Asn-Pro-Thr(서열번호 89), Gln-Glu-Thr-Gly-Thr-Tyr(서열번호 90), Gln-Glu-Thr-Thr-Val-Thr(서열번호 91), Gln-Glu-Thr-Pro-Val-Thr(서열번호 92) 및 Gln-Glu-Thr-Ala-Val-Thr(서열번호 93)로 이루어지는 그룹으로부터 선택되는 아미노산 서열인 것이 바람직하다.
본 발명에 있어서, 「성숙 CspB의 X 위치의 아미노산 잔기」란, 서열번호 85에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기를 의미한다. 임의의 성숙 CspB의 아미노산 서열에 있어서, 어느 아미노산 잔기가 「서열번호 85에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기」인지는, 당해 임의의 성숙 CspB의 아미노산 서열과 서열번호 85의 아미노산 서열과 정렬을 행함으로써 결정할 수 있다.
본 발명의 방법에 의해 분비 생산되는 이종 단백질로서는 예를 들면, 생리 활성 단백질, 리셉터 단백질, 백신으로서 사용되는 항원 단백질, 효소가 열거된다.
효소로서는 예를 들면, 트랜스글루타미나아제, 프로테인글루타미나아제, 이소말토덱스트라나아제, 프로테아제, 엔도펩티다아제, 엑소펩티다아제, 아미노펩티다아제, 카르복시펩티다아제, 콜라게나아제 및 키티나아제 등이 열거된다. 트랜스글루타미나아제로서는 예를 들면, Streptoverticillium mobaraense IFO 13819(WO01/23591), Streptoverticillium cinnamoneum IFO 12852, Streptoverticillium griseocarneum IFO 12776, Streptomyces lydicus(WO9606931) 등의 방선균이나, Oomycetes(WO9622366) 등의 사상균의 분비형 트랜스글루타미나아제가 열거된다. 프로테인글루타미나아제로서는 예를 들면, Chryseobacterium proteolyticum의 프로테인글루타미나아제가 열거된다(WO2005/103278). 이소말토덱스트라나아제로서는 예를 들면, Arthrobacter globiformis의 이소말토덱스트라나아제가 열거된다(WO2005/103278).
생리 활성 단백질로서는 예를 들면, 성장 인자(증식 인자), 호르몬, 사이토카인, 항체 관련 분자가 열거된다.
성장 인자(증식 인자)로서 구체적으로는, 예를 들면, 상피 성장 인자(Epidermal growth factor; EGF), 인슐린 성장 인자-1(Insulin-like growth factor-1; IGF-1), 트랜스포밍 성장 인자(Transforming growth factor; TGF), 신경성장 인자(Nerve growth factor; NGF), 뇌 유래 신경 영양 인자(Brain-derived neurotrophic factor; BDNF), 혈관내피세포 증식 인자(Vesicular endothelial growth factor; VEGF), 과립구 콜로니 자극 인자(Granulocyte-colony stimulating factor; G-CSF), 과립구 마크로파지 콜로니 자극 인자(Granulocyte-macrophage-colony stimulating factor; GM-CSF), 혈소판 유래 성장 인자(Platelet-derived growth factor; PDGF), 에리스로포이에틴(Erythropoietin; EPO), 트롬보포이에틴(Thrombopoietin; TPO), 산성 섬유아세포 증식 인자(acidic fibroblast growth factor; aFGF 또는 FGF1), 염기성 섬유아세포 증식 인자(basic fibroblast growth factor; bFGF 또는 FGF2), 각질세포 증식 인자(keratinocyto growth factor; KGF-1 또는 FGF7, KGF-2 또는 FGF10), 간세포 증식 인자(Hepatocyte growth factor; HGF)가 열거된다.
호르몬으로서 구체적으로는, 예를 들면, 인슐린, 글루카곤, 소마토스타틴(somatostatin), 인간 성장 호르몬(human growth hormone; hGH), 부갑상선 호르몬(parathyroid hormone; PTH), 칼시토닌(calcitonin), 엑세나타이드(exenatide)가 열거된다.
사이토카인으로서 구체적으로는, 예를 들면, 인터류킨, 인터페론, 종양 괴사 인자(Tumor Necrosis Factor; TNF)가 열거된다.
또한, 성장 인자(증식 인자), 호르몬 및 사이토카인은 서로 엄밀하게 구별되지 않아도 좋다. 예를 들면, 생리 활성 단백질은 성장 인자(증식 인자), 호르몬 및 사이토카인으로부터 선택되는 어느 하나의 그룹에 속하는 것이라도 좋고, 이들로부터 선택되는 복수의 그룹에 속하는 것이라도 좋다.
또한, 생리 활성 단백질은 단백질 전체라도 좋고, 이의 일부라도 좋다. 단백질의 일부로서는 예를 들면, 생리 활성을 갖는 부분이 열거된다. 생리 활성을 갖는 부분으로서 구체적으로는, 예를 들면, 부갑상선 호르몬(parathyroid hormone; PTH)의 성숙체의 N 말단 34 아미노산 잔기로 이루어지는 생리 활성 펩타이드Teriparatide가 열거된다.
항체 관련 분자란, 완전 항체를 구성하는 도메인으로부터 선택되는 단일의 도메인 또는 2 또는 그 이상의 도메인의 조합으로 이루어지는 분자종을 포함하는 단백질을 말한다. 완전 항체를 구성하는 도메인으로서는 중쇄의 도메인인 VH, CH1, CH2 및 CH3, 및 경쇄의 도메인인 VL 및 CL이 열거된다. 항체 관련 분자는 상술한 분자종을 포함하는 한, 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 또한, 항체 관련 분자가 다량체 단백질인 경우에는, 단일 종류의 서브유닛으로 이루어지는 호모 다량체라도 좋고, 2 또는 그 이상의 종류의 서브유닛으로 이루어지는 헤테로 다량체라도 좋다. 항체 관련 분자로서 구체적으로는, 예를 들면, 완전 항체, Fab, F(ab'), F(ab')2, Fc, 중쇄(H쇄)와 경쇄(L쇄)로 이루어지는 이량체, Fc 융합 단백질, 중쇄(H쇄), 경쇄(L쇄), 단쇄 Fv(scFv), sc(Fv)2, 디설파이드 결합 Fv(sdFv), Diabody가 열거된다.
리셉터 단백질은 특별히 제한되지 않고, 예를 들면, 생리 활성 단백질이나 그 밖의 생리 활성 물질에 대한 리셉터 단백질이라도 좋다. 그 밖의 생리 활성 물질로서는 예를 들면, 도파민 등의 신경 전달 물질이 열거된다. 또한, 리셉터 단백질은 대응하는 리간드가 알려져 있지 않은 오펀(orphan) 수용체라도 좋다.
백신으로서 사용되는 항원 단백질은 면역 응답을 야기할 수 있는 것이면 특별히 제한되지 않고, 상정하는 면역 응답의 대상에 따라 적절히 선택하면 좋다.
또한, 그 밖의 단백질로서 Liver-type fatty acid-binding protein(LFABP)이열거된다.
이들 단백질을 코드하는 유전자는 사용하는 숙주에 따라, 및 원하는 활성을 얻기 위해서 개변할 수 있다. 예를 들면, 이들 단백질을 코드하는 유전자는 이들의 단백질에 1 또는 몇 개의 아미노산의 부가, 결실, 치환 등이 포함되도록 개변되어도 좋다. 상술한 PhoS 단백질 및 phoS 유전자의 변이체에 관한 기재는 본 발명의 방법에 의해 분비 생산되는 이종 단백질 및 이것을 코드하는 유전자에도 준용할 수 있다. 또한, 이들 단백질을 코드하는 유전자는 임의의 코돈을 이것과 등가의 코돈으로 치환한 것이라도 좋다. 예를 들면, 이들 단백질을 코드하는 유전자는 필요에 의해 숙주의 코돈 사용 빈도에 따라 최적의 코돈으로 변환하여도 좋다.
본 발명의 유전자 구축물은 Gln-Glu-Thr을 포함하는 아미노산 서열을 코드하는 핵산 서열과 이종 단백질을 코드하는 핵산 서열 사이에, 또한 효소적 절단에 사용되는 아미노산 서열을 코드하는 핵산 서열을 포함하고 있어도 좋다. 효소적 절단에 사용되는 아미노산 서열을 본 발명의 융합 단백질에 삽입함으로써, 발현된 융합 단백질을 효소적으로 절단하고, 목적의 이종 단백질을 얻을 수 있다.
효소적 절단에 사용되는 아미노산 서열은 펩타이드 결합을 가수분해하는 효소에 의해 인식되어 절단되는 서열이면 특별히 제한되지 않고, 목적의 이종 단백질의 아미노산 서열에 따라 사용 가능한 서열을 적절히 선택하면 좋다. 효소적 절단에 사용되는 아미노산 서열을 코드하는 핵산 서열은 이 아미노산 서열에 기초하여 적절히 설정하면 좋고, 또한, 예를 들면, 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 사용하면 좋다.
효소적 절단에 사용되는 아미노산 서열은 기질 특이성이 높은 프로테아제의 인식 서열인 것이 바람직하다. 이와 같은 아미노산 서열로서 구체적으로는, 예를 들면, Factor Xa 프로테아제의 인식 서열이나 proTEV 프로테아제의 인식 서열이 열거된다. Factor Xa 프로테아제는 단백질 중의 Ile-Glu-Gly-Arg(=IEGR)(서열번호 94)의 아미노산 서열을, proTEV 프로테아제는 단백질 중의 Glu-Asn-Leu-Tyr-Phe-Gln(=ENLYFQ)(서열번호 95)의 아미노산 서열을 인식하고, 각 서열의 C 말단측을 특이적으로 절단한다.
본 발명의 방법에 의해 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 동일하여도 좋고, 천연의 단백질과 동일하지 않아도 좋다. 예를 들면, 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 비교하여, 1 또는 몇 개의 아미노산을 여분으로 부가된, 또는 결실된 것이라도 좋다. 또한 상기 「1 또는 몇 개」란, 목적의 이종 단백질의 전체 길이나 구조 등에 의해서도 다르지만, 구체적으로는 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더욱 바람직하게는 1 내지 5개, 특히 바람직하게는 1 내지 3개를 의미한다.
또한, 분비 생산되는 이종 단백질은 프로 구조부가 부가한 단백질(프로단백질)이라도 좋다. 분비 생산되는 이종 단백질이 프로단백질인 경우, 최종적으로 얻어지는 이종 단백질은 프로단백질이라도 좋고, 그렇지 않아도 좋다. 즉, 프로단백질은 프로 구조부가 절단되어 성숙 단백질이 되어도 좋다. 절단은 예를 들면, 프로테아제에 의해 행할 수 있다. 프로테아제를 사용하는 경우에는, 최종적으로 얻어지는 단백질의 활성이라는 관점에서, 프로단백질은 일반적으로는 천연의 단백질과 거의 같은 위치에서 절단되는 것이 바람직하고, 천연의 단백질과 완전하게 같은 위치에서 절단되어 천연의 것과 동일한 성숙 단백질을 얻을 수 있는 것이 보다 바람직하다. 따라서, 일반적으로는, 천연 발생 성숙 단백질과 동일한 단백질이 생성되는 위치에서 프로단백질을 절단하는 특이적 프로테아제가 가장 바람직하다. 그러나, 상술한 바와 같이, 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 동일하지 않아도 좋다. 예를 들면, 생산되는 이종 단백질의 종류나 사용 목적 등에 따라서는, 천연의 단백질에 비교하여 N 말단이 아미노산 1 내지 몇개분 긴 또는 짧은 단백질이 보다 적절한 활성을 갖는 경우가 있다. 본 발명에서 사용할 수 있는 프로테아제에는 Dispase(베링거만하임사 제조)와 같은 상업적으로 입수할 수 있는 것 외에, 미생물의 배양액, 예를 들면 방선균의 배양액 등으로부터 얻을 수 있는 것이 포함된다. 이와 같은 프로테아제는 미정제 상태로 사용할 수도 있고, 필요에 따라 적당한 순도까지 정제한 후에 사용하여도 좋다. 또한, 프로 구조부를 절단하여 성숙 단백질을 얻을 경우에는, 삽입한 Gln-Glu-Thr을 포함하는 아미노산 서열은 프로 구조부와 함께 절단 제거되기 때문에, Gln-Glu-Thr을 포함하는 아미노산 서열의 뒤에 효소적 절단에 사용되는 아미노산 서열을 배위하지 않더라도 목적의 단백질을 얻을 수 있다.
본 발명에 사용되는 유전자 구축물을 코리네형 세균에 도입하는 수법은 특별히 제한되지 않는다. 「본 발명에 사용되는 유전자 구축물의 도입」이란, 이 유전자 구축물을 숙주에 유지시키는 것을 말한다. 「본 발명에 사용되는 유전자 구축물의 도입」에는, 미리 구축한 이 유전자 구축물을 숙주에 일괄하여 도입하는 경우에 한정되지 않고, 적어도 이종 단백질 유전자가 숙주에 도입되고, 또한 숙주 내에서 이 유전자 구축물이 구축되는 경우도 포함된다. 본 발명의 세균에 있어서, 본 발명에 사용되는 유전자 구축물은 플라스미드와 같이 염색체 외에서 자율 증식하는 벡터 상에 존재하고 있어도 좋고, 염색체 상에 포함되어 있어도 좋다. 본 발명에 사용되는 유전자 구축물의 도입은 예를 들면, 상술한 유전자의 발현을 상승시키는 수법에서의 유전자의 도입과 마찬가지로 행할 수 있다. 또한, 본 발명의 세균을 구축함에 있어서, 본 발명에 사용되는 유전적 구축물의 도입, 변이형 PhoS 유전자의 도입 및 그 외의 개변은 임의의 순서로 행할 수 있다.
본 발명에 사용되는 유전자 구축물은 예를 들면, 이 유전자 구축물을 포함하는 벡터를 사용하여 숙주에 도입할 수 있다. 예를 들면, 본 발명에 사용되는 유전자 구축물을 벡터와 연결하여 이 유전자 구축물의 발현 벡터를 구축하고, 당해 발현 벡터로 숙주를 형질전환함으로써, 이 유전자 구축물을 숙주에 도입할 수 있다. 또한, 예를 들면, 벡터가 코리네형 세균에서 기능하는 프로모터를 구비할 경우, 당해 프로모터의 하류에 본 발명의 융합 단백질을 코드하는 염기 서열을 연결함으로써도, 본 발명에 사용되는 유전자 구축물의 발현 벡터를 구축할 수 있다. 벡터는 코리네형 세균에서 자율 복제 가능한 것이면 특별히 제한되지 않는다. 코리네형 세균에서 이용할 수 있는 벡터에 대해서는 상술한 바와 같다.
또한, 본 발명에 사용되는 유전자 구축물은 예를 들면, 인공 트랜스포존 등의 트랜스포존을 사용하여 숙주의 염색체 상에 도입할 수 있다. 트랜스포존이 사용되는 경우에는, 상동 재조합 또는 이의 자신의 전이능에 의해 본 발명에 사용되는 유전자 구축물이 염색체 상에 도입된다. 또한, 본 발명에 사용되는 유전자 구축물은 그 외에 상동 재조합을 이용하는 도입법에 의해 숙주의 염색체 상에 도입할 수 있다. 상동 재조합을 이용하는 도입법으로서는 예를 들면, 직쇄상 DNA, 온도 감수성 복제 기점을 포함하는 플라스미드, 접합 전달 가능한 플라스미드, 또는 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터 등을 사용하는 방법이 열거된다. 또한, 적어도 이종 단백질 유전자를 염색체 상에 도입하고, 본 발명에 사용되는 유전자 구축물을 염색체 상에 구축하여도 좋다. 이 경우, 이종 단백질 유전자 이외의 본 발명에 사용되는 유전자 구축물의 구성 요소의 일부 또는 전부는 숙주의 염색체 상에 원래 존재하는 것이라도 좋다. 구체적으로는, 예를 들면, 숙주의 염색체 상에 원래 존재하는 프로모터 서열과 이 프로모터 서열의 하류에 접속된 시그널 펩타이드를 코드하는 핵산 서열을 그대로 이용하고, 이 시그널 펩타이드를 코드하는 핵산 서열의 하류에 접속된 유전자만을 목적의 이종 단백질 유전자로 치환함으로써도, 염색체 상에 본 발명에 사용되는 유전자 구축물이 구축되어, 본 발명의 세균을 구축할 수 있다. 이종 단백질 유전자 등의, 본 발명에 사용되는 유전자 구축물의 일부의 염색체로의 도입은 본 발명에 사용되는 유전자 구축물의 염색체로의 도입과 마찬가지로 행할 수 있다.
본 발명에 사용되는 유전자 구축물이나 이의 구성 요소(프로모터 서열, 시그널 펩타이드를 코드하는 핵산 서열, 이종 단백질을 코드하는 핵산 서열 등)는 예를 들면, 클로닝에 의해 취득할 수 있다. 구체적으로는, 예를 들면, 목적의 이종 단백질을 갖는 생물로부터의 클로닝에 의해 이종 단백질 유전자를 취득하고, 시그널 서열을 코드하는 염기 서열의 도입이나 프로모터 서열의 도입 등의 개변을 행하여, 본 발명에 사용되는 유전자 구축물을 취득할 수 있다. 또한, 본 발명에 사용되는 유전자 구축물이나 이의 구성 요소는 화학 합성에 의해서도 취득할 수 있다(Gene, 60(1), 115-127(1987)). 취득한 유전자 구축물이나 이의 구성 요소는 그대로, 또는 적절히 개변하여 이용할 수 있다.
또한, 2 또는 그 이상의 종류의 단백질을 발현할 경우, 각 단백질의 분비 발현용 유전자 구축물은 목적의 이종 단백질의 분비 발현이 달성 가능하도록 본 발명의 세균에 유지되어 있으면 좋다. 구체적으로는, 예를 들면, 각 단백질의 분비 발현용 유전자 구축물은 모두가 단일의 발현 벡터 상에 유지되어 있어도 좋고, 모두가 염색체 상에 유지되어 있어도 좋다. 또한, 각 단백질의 분비 발현용 유전자 구축물은 복수의 발현 벡터 상에 각각 유지되어 있어도 좋고, 단일 또는 복수의 발현 벡터 상과 염색체 상에 각각 유지되어 있어도 좋다. 「2 또는 그 이상의 종류의 단백질을 발현할 경우」란, 예를 들면, 2 또는 그 이상의 종류의 이종 단백질이 분비 생산되는 경우나, 헤테로 다량체 단백질이 분비 생산되는 경우를 말한다.
본 발명에 사용되는 유전자 구축물의 코리네형 세균으로의 도입 방법은 특별히 한정되지 않고, 일반적으로 사용되는 방법, 예를 들면, 프로토플라스트법 (Gene, 39, 281-286(1985)), 일렉트로포레이션법(Bio/Technology, 7, 1067-1070(1989)), 전기 펄스법(일본 공개특허공보 특개 평2-207791호) 등을 사용할 수 있다.
<1-2> 이종 단백질의 제조법
상기한 바와 같이 하여 얻어지는 본 발명의 세균을 배양하고, 이종 단백질을 발현시킴으로써 균체 외에 분비된 다량의 이종 단백질을 얻을 수 있다.
본 발명의 세균은 통상 사용되는 방법 및 조건에 따라 배양할 수 있다. 예를 들면, 본 발명의 세균은 탄소원, 질소원, 무기 이온을 함유하는 통상의 배지에서 배양할 수 있다. 또한 높은 증식을 얻기 위해서, 비타민, 아미노산 등의 유기 미량 영양소를 필요에 따라 첨가할 수도 있다.
탄소원으로서는 글루코오스 및 슈크로오스와 같은 탄수화물, 아세트산과 같은 유기산, 알코올류, 그 외를 사용할 수 있다. 질소원으로서는 암모니아 가스, 암모니아수, 암모늄염, 그 외를 사용할 수 있다. 무기 이온으로서는 칼슘 이온, 마그네슘 이온, 인산 이온, 칼륨 이온, 철 이온 등을 필요에 따라 적절히 사용한다. 배양은 pH5.0 내지 8.5, 15℃ 내지 37℃의 적절한 범위에서 호기적 조건 하에서 행하고, 1 내지 7일간 정도 배양한다. 또한, 코리네형 세균의 L-아미노산 생산에서의 배양 조건이나, 그 외에 Sec계 의존, Tat계 의존의 시그널 펩타이드를 사용한 단백질의 제조법에 기재된 조건을 사용할 수 있다(WO01/23591, WO2005/103278 참조). 또한, 이종 단백질의 발현을 위해서 유도형 프로모터를 사용한 경우에는, 배지에 프로모터 유도제를 첨가하여 배양할 수도 있다. 이러한 조건 하에서 본 발명의 세균을 배양함으로써, 목적 단백질은 균체 내에서 다량으로 생산되어 효율적으로 균체 외에 분비된다. 또한, 본 발명의 방법에 의하면, 생산된 이종 단백질은 균체 외에 분비되기 때문에, 예를 들면 트랜스글루타미나아제 등의 미생물의 균체 내에서 다량으로 축적하면 일반적으로 치사적인 단백질도, 치사적 영향을 받지 않고 연속적으로 생산할 수 있다.
본 발명의 방법에 의해 배지 중에 분비된 단백질은 당업자에게 잘 알려진 방법에 따라 배양 후의 배지로부터 분리 정제할 수 있다. 예를 들면, 균체를 원심분리 등에 의해 제거한 후, 염석, 에탄올 침전, 한외여과, 겔 여과 크로마토그래피, 이온 교환 컬럼 크로마토그래피, 어피니티 크로마토그래피, 중고압 액체 크로마토그래피, 역상 크로마토그래피, 소수 크로마토그래피 등의 이미 알려진 적절한 방법, 또는 이들을 조합함으로써 분리 정제할 수 있다. 또한, 어떤 경우에는, 배양물이나 배양 상청을 그대로 사용하여도 좋다. 본 발명의 방법에 의해 균체 표층에 분비된 단백질도 당업자에게 잘 알려진 방법, 예를 들면 염 농도의 상승, 계면활성제의 사용 등에 의해 가용화한 후에, 배지 중에 분비된 경우와 같게 하여 분리 정제할 수 있다. 또한, 어떤 경우에는, 균체 표층에 분비된 단백질을 가용화하지 않고, 예를 들면 고정화 효소로서 사용하여도 좋다.
목적의 이종 단백질이 분비 생산된 것은 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로서 SDS-PAGE를 행하고, 분리된 단백질 밴드의 분자량을 확인함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 분비 생산된 것은 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로서 항체를 사용한 웨스턴 블롯에 의해 확인할 수 있다(Molecular cloning(Cold Spring Harbor Laboratory Press, Cold Spring Harbor (USA), 2001)). 또한, 목적의 이종 단백질이 분비 생산된 것은 단백질 서열분석기를 사용하여 목적 단백질의 N 말단 아미노산 서열을 검출함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 분비 생산된 것은 질량분석계를 사용하여 목적 단백질의 질량을 결정함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 효소나 어떠한 측정 가능한 생리 활성을 갖는 것일 경우에는, 목적의 이종 단백질이 분비 생산된 것은 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로서, 목적의 이종 단백질의 효소 활성 또는 생리 활성을 측정함으로써 확인할 수 있다.
<2> 변이형 PhoS 유전자를 유지하는 코리네형 세균
또한, 본 발명은 변이형 PhoS 유전자를 유지하도록 개변된 코리네형 세균을 제공한다. 당해 코리네형 세균은 이종 단백질의 분비 생산능을 갖고 있어도 좋고, 갖고 있지 않아도 좋다. 즉, 당해 코리네형 세균은 이종 단백질의 분비 발현용 유전자 구축물을 갖고 있어도 좋고, 갖고 있지 않아도 좋다. 당해 코리네형 세균에 대해서는 이종 단백질의 분비 발현용 유전자 구축물을 갖고 있지 않아도 좋은 것 이외에는 상술한 「본 발명의 방법에 사용되는 코리네형 세균」에 관한 기재를 준용할 수 있다. 당해 코리네형 세균은 예를 들면, 이종 단백질의 분비 발현용 유전자 구축물을 유지시킴으로써, 이종 단백질의 분비 생산에 적합하게 이용할 수 있다. 즉, 당해 코리네형 세균의 일 형태는 상술한 「본 발명의 방법에 사용되는 코리네형 세균」이다.
실시예
본 발명은 이하의 실시예에 의해 더욱 구체적으로 설명되지만, 이들은 어떠한 의미에서도 본 발명을 한정하는 것이라고 해석해서는 안된다.
실시예 1: C. glutamicum YDK010주 유래의 PhoS 변이주의 취득
(1) phoS 유전자에 변이를 갖는 자연 변이주의 취득
WO2014/126260에 기재된 생리 활성 펩타이드인 Teriparatide의 분비 발현 플라스미드 pPKK50TEV-Teri를 사용하여, WO2002/081694에 기재된 C. glutamicum YDK010주를 형질전환하였다. 또한, pPKK50TEV-Teri는 생리 활성 펩타이드인 Teriparatide의 분비 발현용 벡터로서, C. glutamicum ATCC13869주의 cspB 유전자의 프로모터 영역, 이 프로모터의 하류에 발현 가능하게 연결된 이 주의 CspB 시그널 펩타이드, 이 주의 성숙 CspB의 N 말단 50 아미노산 잔기, ProTEV 프로테아제의 인식 서열 ENLYFQ, 및 Teriparatide의 융합 단백질(이하, CspB50TEV-Teri라고 표기한다)을 코드하는 염기 서열을 갖는 플라스미드이다(WO2014/126260). C. glutamicum YDK010주는 C. glutamicum AJ12036(FERM BP-734)의 세포 표층 단백질 CspB의 결손주이다(WO2002/081694). 얻어진 형질전환체를 25mg/l의 카나마이신을 포함하는 CMDex 한천 배지(글루코오스 5g, 황산마그네슘 7수화물 0.4g, 황산철 7수화물 0.01g, 황산망간 5수화물 0.01g, 인산 2수소칼륨 1g, 비오틴 10μg, DifcoTM Select Soytone(Becton Dickinson) 10g, BactoTM Yeast Extract(Becton Dickinson) 10g, 요소 3g, 대두 염산 가수분해액(전체 질소량 1.2g), 한천 분말 20g, 물로 1L로 하여 pH6.5로 조정) 상에서 30℃로 배양하여 콜로니를 형성시켰다.
배양 후, phoS 유전자에 변이가 도입된 자연 변이주를 선택하고, YDK0107주라고 명명하였다. YDK0107주가 갖는 변이형 PhoS 유전자의 염기 서열, 및 이 유전자가 코드하는 변이형 PhoS 단백질의 아미노산 서열을 <서열번호 01> 및 <서열번호 02>에 나타낸다. YDK0107주의 변이형 PhoS 유전자에서는 YDK010주의 야생형 PhoS 유전자의 염기 서열 <서열번호 03>에서의 906 위치의 G가 T로 변이되어 있다. 이 변이에 의해, YDK0107주의 변이형 PhoS 단백질에서는 YDK010주의 phoS 유전자에 의해 코드되는 야생형 PhoS 단백질의 아미노산 서열 <서열번호 04>에서의 302 위치의 트립토판 잔기가 시스테인 잔기로 치환되어 있다. 이 변이를 PhoS(W302C) 변이라고 명명하였다. 또한, 게놈 DNA의 조제는 PurEluteTM Genomic DNA Kit(EdgeBio)를 사용하고, 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(2) 변이형 PhoS(W302C)를 코드하는 phoS 유전자 치환용 벡터의 구축
<서열번호 05> 및 <서열번호 06>에 기재된 프라이머를 사용하고, PurEluteTM Genomic DNA Kit(EdgeBio)를 사용하여 조제한 C. glutamicum YDK0107주의 염색체 DNA를 주형으로서 변이형 PhoS(W302C)를 코드하는 phoS 유전자(변이형 PhoS 유전자 또는 변이형 PhoS(W302C) 유전자라고도 한다)를 포함하는 약 1.5kbp의 영역을 PCR법에 의해 증폭시켰다. PCR 반응에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.
이어서, 증폭된 약 1.5kbp의 DNA 단편을 아가로스겔 전기영동 후, 목적의 밴드를 자르고, Wizard(R) SV Gel and PCR Clean-Up System(Promega)을 사용하여 겔로부터 회수하였다. 회수한 DNA 단편을 WO2006/057450에 기재된 pBS5T의 Sma I 부위에 삽입한 후, E. coli JM109(Takara Bio)의 컴피턴트 셀에 도입하였다. 변이형 PhoS 유전자를 포함하는 DNA 단편이 클론화된 플라스미드를 유지하는 균주를 취득하고, 이로부터 플라스미드를 회수하고, 변이형 PhoS 유전자가 클론화된 플라스미드 pBS5T-phoS(W302C)를 얻었다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 유전자가 클론화되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(3) YDK010주에서의 PhoS(W302C) 변이 치환주의 구축
실시예 1(2)에서 구축한 플라스미드 pBS5T-phoS(W302C)로 WO2002/081694에 기재된 C. glutamicum YDK010주를 형질전환하였다. 얻어진 형질전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하고, 염색체 상의 야생형 PhoS 유전자가 변이형 PhoS 유전자로 치환된 YDK010::phoS(W302C)주를 얻었다. 또한, YDK010::phoS(W302C)주는 YDK0107주의 염색체 DNA를 이용하지 않더라도, 예를 들면 유전자 공학적으로 취득한 변이형 PhoS 유전자 단편 등을 이용하여 재현적으로 구축할 수 있다.
(4) phoS 유전자 결손용 벡터 pBS5TΔphoS의 구축
PurEluteTM Genomic DNA Kit(EdgeBio)를 사용하여 조제한 C. glutamicum ATCC13869주의 염색체 DNA를 주형으로서, <서열번호 07>과 <서열번호 08>의 프라이머를 사용하여 phoS 유전자의 5'측 상류 약 1kbp를, <서열번호 09>와 <서열번호 10>의 프라이머를 사용하여 phoS 유전자의 3'측 하류 약 1kbp의 영역을, 각각 PCR법에 의해 증폭시켰다. PCR에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 증폭된 각각 약 1kbp의 DNA 단편을 아가로스겔 전기영동 후, 목적의 밴드를 자르고, Wizard(R) SV Gel and PCR Clean-Up System(Promega)을 사용하여 겔로부터 회수하였다. 회수한 2개의 DNA 단편을, 융합(infusion) 반응에 의해 WO2006/057450에 기재된 pBS5T의 Sma I 부위에 삽입함으로써, phoS 유전자 결손용 벡터 pBS5TΔphoS를 얻었다. 융합 반응에는 In-Fusion(R) HD Cloning Kit(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.
(5) YDK010주의 PhoS 결손주의 구축
실시예 1(4)에서 구축한 pBS5TΔphoS로 WO2002/081694에 기재된 C. glutamicum YDK010주를 형질전환하였다. 얻어진 형질전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하고, phoS 유전자가 결손된 YDK010ΔphoS주를 얻었다.
실시예 2: PhoS(W302C) 변이주 및 PhoS 결손주에서의 CspB 시그널 서열을 사용한 CspB50TEV-Teriparatide 융합 단백질의 분비 발현
WO2014/126260에 기재된 생리 활성 펩타이드인 Teriparatide의 분비 발현 플라스미드 pPKK50TEV-Teri를 사용하여, WO2002/081694에 기재된 C. glutamicum YDK010주, 실시예 1(1)에서 얻어진 YDK0107주, 실시예 1(3)에서 얻어진 YDK010::phoS(W302C)주, 실시예 1(5)에서 얻어진 YDK010ΔphoS주의 각각을 형질전환하고, YDK010/pPKK50TEV-Teri주, YDK0107/pPKK50TEV-Teri주, YDK010::phoS(W302C)/pPKK50TEV-Teri주 및 YDK010ΔphoS/pPKK50TEV-Teri주를 얻었다. 얻어진 각 형질전환체를, 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 각각 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 5μl을 환원 SDS-PAGE에 제공하고나서 SYPRO Orange(Life Technologies)로 염색을 행하였다. 그 결과, YDK0107주 및 YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, CspB50TEV-Teri 분비량이 현저하게 향상되어 있었다(도 1). 염색 후, 화상 해석 소프트 Multi Gauge(FUJIFILM)를 사용하여 CspB50TEV-Teri의 밴드 강도의 수치화를 행하고, 각 주에서 CspB50TEV-Teri를 발현시켰을 때의 밴드 강도의 평균값을, YDK010주에서 CspB50TEV-Teri를 발현시켰을 때의 밴드 강도의 평균값을 1로 했을 때의 상대값으로서 산출하였다. 그 결과, YDK0107주 및 YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, CspB50TEV-Teri 분비량이 각각 약 13.2배, 약 12.5배로 향상되어 있는 것이 확인되었다(표 1). 한편, YDK010ΔphoS주에서는 YDK010주와 비교하여, CspB50TEV-Teri 분비량이 약 0.2배로 감소되어 있었다. 이러한 사실로부터, PhoS(W302C) 변이는 CspB 50TEV-Teri 분비에 있어서, 현저한 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다. 한편, phoS 유전자 결손은 CspB50TEV-Teri 분비에 있어서 유리한 효과가 확인되지 않았다.
Appl. Environ. Microbiol., 94, 1131-1150(2012)에 의하면, C. glutamicum ATCC13032주의 PhoS 단백질의 266-330 위치의 영역은 HisKA 도메인이라고 생각되고 있고, HisKA 도메인은 자기 인산화하는 히스티딘 잔기를 포함하고 있다. 302 위치의 트립토판 잔기는 이 HisKA 도메인 중에 존재하기 때문에, 다양한 코리네박테리움속 세균의 PhoS 동족체에서의 HisKA 도메인의 아미노산 서열을 비교하였다. BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 해석한 염기 서열로부터 추정되는 C. glutamicum YDK0107주, C. glutamicum YDK010주, 및 C. glutamicum ATCC13869주의 PhoS 단백질의 HisKA 도메인의 아미노산 서열, 또한, 서열번호 4의 아미노산 서열을 문의 서열로서 사용한 BLAST 검색에 의해 상동성 70% 이상의 동족체로서 데이터 베이스로부터 취득한 C. glutamicum ATCC13032주(Genbank Accession No. NP_601807), C. glutamicum ATCC14067주(Genbank Accession No. KEI24167), C. callunae(Genbank Accession No. WP_015652043), C. crenatum(Genbank Accession No. WP_031512002), 및 C. efficiens(Genbank Accession No. WP_006769148)의 PhoS 동족체의 HisKA 도메인의 아미노산 서열의 정렬을 도 2에 나타내고, 302 위치의 아미노산 잔기를 프레임으로 나타내었다. 그 결과, 302 위치의 트립토판 잔기는 YDK0107주 이외의 코리네박테리움속 세균 사이에서 공통으로 보존되어 있는 것이 판명되었다. PhoS 단백질은 2성분 제어계의 센서 키나아제 단백질인 것이 알려져 있지만, 이종 단백질 분비 발현에 미치는 영향은 지금까지 알려져 있지 않았다. 또한, W302와 같은 보존성이 높은 아미노산 잔기의 변이가 이종 단백질 분비량의 향상을 초래하는 것을 예측하는 것은 용이하게는 할 수 없는 곤란한 것이었다.
실시예 3: YDK010::phoS(W302C)주에서의 CspB 시그널 서열을 사용한 성숙 CspB의 N 말단 아미노산 잔기를 융합한 Liver-type fatty acid-binding protein(LFABP)의 분비 발현
(1) CspB의 성숙 단백질의 N 말단 6 아미노산 잔기를 융합한 Liver-type Fatty acid-binding protein(LFABP)의 분비 발현 플라스미드의 구축
인간의 Liver-type fatty acid-binding protein(이하, LFABP라고 표기한다)의 아미노산 서열은 이미 결정되어 있다(Genbank Accession No. NP_001434). 이 아미노산 서열을 <서열번호 11>에 나타내었다. C. glutamicum의 코돈 사용 빈도를 고려하여, LFABP를 코드하는 염기 서열을 디자인하였다. 또한, C. glutamicum ATCC13869주 유래의 CspB의 시그널 펩타이드 30 아미노산 잔기, 이 주 유래의 CspB 성숙 단백질의 N 말단 6 아미노산 잔기, FactorXa 프로테아제의 인식 서열 IEGR, 및 LFABP의 융합 단백질(이하, CspB6Xa-LFABP라고 표기한다)과, 이의 융합 단백질을 코드하는 염기 서열을 디자인하였다. 디자인한 융합 단백질을 코드하는 염기 서열을 <서열번호 12>에, 융합 단백질의 아미노산 서열을 <서열번호 13>에 나타내었다.
이어서, <서열번호 12>에 기재된 DNA의 상류에 C. glutamicum ATCC13869주 유래의 cspB 유전자의 프로모터를 연결하고, 또한 5'-측과 3'-측의 양단에 Kpn I 사이트를 부가한 CspB6Xa-LFABP의 발현 카세트를 전체 합성하였다. 전체 합성한 DNA 단편을 제한 효소 Kpn I 처리 후에, 일본 공개특허공보 특개 평9-322774에 기재된 pPK4의 Kpn I 부위에 삽입함으로써 CspB6Xa-LFABP의 분비 발현 플라스미드인 pPK4_CspB6Xa-LFABP를 구축하였다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 CspB6Xa-LFABP를 코드하는 유전자가 구축되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(2) CspB의 성숙 단백질의 N 말단 6 아미노산 잔기를 융합한 Liver-type Fatty acid-binding protein(LFABP)의 분비 발현
실시예 3(1)에서 구축한 성숙 CspB의 N 말단 6 아미노산 잔기 및 FactorXa 프로테아제 인식 서열 IEGR를 융합한 LFABP의 분비 발현 플라스미드인 pPK4_CspB6Xa-LFABP를 사용하여, WO2002/081694에 기재된 C. glutamicum YDK010주와, 실시예 1(3)에서 제작한 YDK010::phoS(W302C)주의 각각을 형질전환하고, YDK010/pPK4_CspB6Xa-LFABP주와 YDK010::phoS(W302C)/pPK4_CspB6Xa-LFABP주를 얻었다.
얻어진 각 형질전환체를 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 6.5μl을 환원 SDS-PAGE에 제공하고나서 Quick-CBB(Wako Pure Chemical Industries)로 염색을 행하였다.
그 결과, YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, CspB6Xa-LFABP의 분자량을 갖는 단백질을 나타내는 밴드가 짙게 검출되고, CspB6Xa-LFABP 분비량이 유의적으로 향상되어 있는 것이 확인되었다(도 3). 염색 후, 화상 해석 소프트 Multi Gauge(FUJIFILM)를 사용하여 CspB6Xa-LFABP의 밴드 강도의 수치화를 행하고, YDK010::phoS(W302C)주에서 CspB6Xa-LFABP를 발현시켰을 때의 밴드 강도의 평균값을, YDK010주에서 CspB6Xa-LFABP를 발현시켰을 때의 밴드 강도의 평균값을 1로 했을 때의 상대값으로서 산출하였다. 그 결과, YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, CspB6Xa-LFABP 분비량이 약 1.9배로 향상되어 있는 것이 확인되었다(표 2). 이러한 사실로부터, PhoS(W302C) 변이는 CspBpB6Xa-LFABP의 분비에 있어서도, 유의한 분비량 향상을 초래하는 유효 변이인 것을 알았다.
실시예 4: YDK010::phoS(W302C)주에서의 CspB 시그널 서열을 사용한 성숙 CspB의 N 말단 아미노산 잔기를 융합한 Exenatide 전구체(ExCP)의 분비 발현
(1) CspB의 성숙 단백질의 N 말단 6 아미노산 잔기를 융합한 Exenatide 전구체(ExCP)의 분비 발현 플라스미드의 구축
생리 활성 펩타이드 Exenatide의 아미노산 서열은 이미 결정되어 있다(Genbank Accession No. P26349). 활성형 Exenatide는 C 말단이 아미드화된 펩타이드이기 때문에, 아미드화 Exenatide의 전구체로서, C 말단에 Cys-Pro를 부가한 Exenatide 전구체(이하, ExCP라고 표기한다)의 아미노산 서열을 <서열번호 14>에 나타내었다. C. glutamicum의 코돈 사용 빈도를 고려하여, ExCP를 코드하는 염기 서열을 디자인하였다. 또한, C. glutamicum ATCC13869주 유래의 CspB의 시그널 펩타이드 30 아미노산 잔기, 이 주 유래의 CspB 성숙 단백질의 N 말단 6 아미노산 잔기, ProTEV 프로테아제의 인식 서열 ENLYFQ, 및 ExCP의 융합 단백질(이하, CspB6TEV-ExCP라고 표기한다)과, 이의 융합 단백질을 코드하는 염기 서열을 디자인하였다. 디자인한 융합 단백질을 코드하는 염기 서열을 <서열번호 15>에, 융합 단백질의 아미노산 서열을 <서열번호 16>에 나타내었다.
이어서, <서열번호 15>에 기재된 DNA의 상류에 C. glutamicum ATCC13869주 유래의 cspB 유전자의 프로모터를 연결하고, 또한 5'-측과 3'-측의 양단에 Kpn I 사이트를 부가한 CspB6TEV-ExCP의 발현 카세트를 전체 합성하였다. 전체 합성한 DNA 단편을 제한 효소 Kpn I 처리 후에, 일본 공개특허공보 특개 평9-322774에 기재된 pPK4의 Kpn I 부위에 삽입함으로써 CspB6TEV-ExCP의 분비 발현 플라스미드인 pPK4_CspB6TEV-ExCP를 구축하였다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 CspB6TEV-ExCP를 코드하는 유전자가 구축되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(2) CspB의 성숙 단백질의 N 말단 6 아미노산 잔기를 융합한 Exenatide 전구체(ExCP)의 분비 발현
실시예 4(1)에서 구축한 성숙 CspB의 N 말단 6 아미노산 잔기 및 ProTEV 프로테아제 인식 서열을 융합한 ExCP의 분비 발현 플라스미드인 pPK4_CspB6TEV-ExCP를 사용하여, WO2002/081694에 기재된 C. glutamicum YDK010주와, 실시예 1(3)에서 제작한 YDK010::phoS(W302C)주의 각각을 형질전환하고, YDK010/pPK4_CspB6TEV-ExCP 주와 YDK010::phoS(W302C)/pPK4_CspB6TEV-ExCP주를 얻었다.
얻어진 각 형질전환체를, 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 6.5μl을 환원 SDS-PAGE에 제공하고나서 Quick-CBB(Wako Pure Chemical Industries)로 염색을 행하였다.
그 결과, YDK010주에서는 CspB6TEV-ExCP의 분자량을 갖는 단백질을 나타내는 밴드가 거의 검출되지 않은 반면, YDK010::phoS(W302C)에서는 CspB6TEV-ExCP의 밴드가 짙게 검출되고, CspB6TEV-ExCP 분비량이 유의적으로 향상되어 있는 것이 확인되었다(도 4). 또한, 각 주에 의한 CspB6TEV-ExCP 분비량을 평균화하고, 「±」 내지 「+++」로 표 3에 나타내었다. 이러한 사실로부터, PhoS(W302C) 변이는 CspBpB6TEV-ExCP 분비에 있어서도, 유의한 분비량 향상을 초래하는 유효 변이인 것을 알았다.
실시예 2 내지 4로부터, WO2013/062029에 기재되어 있는 바와 같이 CspB 융합법(성숙 CspB의 N 말단 아미노산 잔기를 융합하여 이종 단백질을 발현하는 방법)에서 Sec계 분비 장치를 이용하여 이종 단백질을 분비 발현할 때, 발현시키는 단백질의 종류, 융합시키는 성숙 CspB의 N 말단 아미노산 잔기의 수, 및 프로테아제 인식 서열의 종류에 의하지 않고, PhoS(W302C) 변이주를 사용함으로써 목적 단백질의 분비 발현량을 유의적으로 향상시킬 수 있는 것을 알았다.
실시예 5: PhoS(W302C) 변이주에서의 TorA 시그널 서열을 사용한 프로트랜스글루타미나아제의 분비 발현
(1) Tat계 분비 장치를 코드하는 tatABC 유전자와 TorA 시그널 서열이 부가된 프로트랜스글루타미나아제를 코드하는 유전자의 공발현 플라스미드의 구축
(a) pPK4 벡터 중의 Nae I 인식 사이트를 개변한 벡터(pPK5)의 구축
일본 공개특허공보 특개 평9-322774에 기재된 pPK4 중에는 제한 효소 Nae I의 인식 서열이 1개소 존재한다. 이 서열을 개변하기 위해서, Nae I 인식 서열 gccggc를 gcaggc로 개변한 서열과 pPK4에서의 이의 주변 서열을 포함하는 <서열번호 17> 및 <서열번호 18>에 기재된 프라이머를 합성하였다. 이어서, pPK4를 주형으로서, <서열번호 17>과 <서열번호 18>의 프라이머를 사용하여, 약 5.6kbp의 플라스미드 전체 길이를 PCR법에 의해 증폭시켰다. PCR 반응에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 95℃ 5분, (95℃ 30초, 55℃ 1분, 72℃ 12분)×12cycle로 행하였다.
이어서, 얻어진 PCR 산물을 제한 효소 Dpn I로 처리하고, 메틸화되어 있는 주형 DNA를 소화하였다. DpnI 소화 후에 얻어진 비메틸화 플라스미드를, E. coli JM109(Takara Bio)의 컴피턴트 셀에 도입하고, 플라스미드를 취득하였다. 염기 서열 결정의 결과, 예상대로 Nae I 인식 사이트가 개변된 플라스미드가 구축되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다. 이렇게 하여 얻어진 pPK4 벡터 중의 NaeI 인식 사이트를 개변한 벡터를 pPK5라고 명명하였다.
(b) pPK5 벡터에 tatABC 유전자를 탑재한 벡터(pPK5-tatABC)의 구축
이어서, WO2005/103278에 기재된 Tat계 분비 장치의 증폭 플라스미드인 pVtatABC를 주형으로 하여, <서열번호 19>와 <서열번호 20>의 프라이머를 사용하여, tatABC 유전자를 코드하는 서열을 포함하는 약 3.7kbp의 DNA 단편을 PCR법에 의해 증폭시켰다. <서열번호 20>의 프라이머에는 제한 효소 Kpn I와 Apa I의 인식 서열이 디자인되어 있다. PCR에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편의 말단을 BKL Kit(Takara Bio)를 사용하여 인산화하고, 별도 Kpn I 처리하고, 또한 BKL Kit(TakaraBio)를 사용하여 평활 말단화하고, 또한 CIAP(Takara Bio)를 사용하여 말단을 탈인산화 처리한 pPK5 벡터에 삽입함으로써, tatABC 유전자 탑재 벡터인 pPK5-tatABC를 구축하였다. 라이게이션 반응에는 DNA Ligation Kit Ver.2.1(Takara Bio)을 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 유전자가 삽입되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(c) pPK5-tatABC 벡터 중의 tatABC 유전자 내 Kpn I 및 Xba I 인식 사이트를 개변한 벡터(pPK6)의 구축
(b)에서 구축한 pPK5-tatABC 플라스미드 중의 tatABC 유전자 영역 중에는, 제한 효소 Kpn I 및 Xba I의 인식 서열이 1개소씩 존재한다. 이들 서열을 개변하기 위해서, Kpn I 인식 서열 ggtacc를 ggaacc로 개변한 서열과 pPK5-tatABC에서의 이의 주변 서열을 포함하는 <서열번호 21> 및 <서열번호 22>에 기재된 프라이머와, XbaI 인식 서열 tctaga를 tgtaga로 개변한 서열과 pPK5-tatABC에서의 이의 주변 서열을 포함하는 <서열번호 23> 및 <서열번호 24>에 기재된 프라이머를 합성하였다.
우선, pPK5-tatABC를 주형으로서, <서열번호 21>과 <서열번호 22>의 프라이머를 사용하여, tatABC 유전자 영역 내의 Kpn I 인식 사이트를 개변하도록 약 9.4kbp의 플라스미드 전체 길이를 PCR법에 의해 증폭시켰다. PCR 반응에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 95℃ 5분, (95℃ 30초, 55℃ 1분, 72℃ 12분)×12cycle로 행하였다.
이어서, 얻어진 PCR 산물을 제한 효소 Dpn I로 처리하고, 메틸화되어 있는 주형 DNA를 소화하였다. Dpn I 소화 후에 얻어진 비메틸화 플라스미드를, E. coli JM109(Takara Bio)의 컴피턴트 셀에 도입하고, 플라스미드를 취득하였다. 이렇게 하여 tatABC 유전자 영역 내의 Kpn I 인식 사이트를 개변한 벡터인 pPK5-tatABCΔKpn I를 구축하였다.
이어서, pPK5-tatABCΔKpn I를 주형으로서, <서열번호 23>과 <서열번호 24>의 프라이머를 사용하여, tatABC 유전자 영역 내의 Xba I 인식 사이트를 개변하도록 약 9.4kbp의 플라스미드 전체 길이를 PCR법에 의해 증폭시켰다. PCR 반응에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 95℃ 5분, (95℃ 30초, 55℃ 1분, 72℃ 12분)×12cycle로 행하였다.
이어서, 얻어진 PCR 산물을 제한 효소 Dpn I로 처리하고, 메틸화되어 있는 주형 DNA를 소화하였다. Dpn I 소화 후에 얻어진 비메틸화 플라스미드를, E. coli JM109(Takara Bio)의 컴피턴트 셀에 도입하고, 플라스미드를 취득하였다. 이렇게 하여 tatABC 유전자 영역 내의 Xba I 인식 서열을 개변한 벡터인 pPK5-tatABCΔKpn IΔXba I를 취득하였다. 염기 서열 결정의 결과, 예상대로의 유전자가 구축되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
이렇게 하여 얻어진 pPK4 벡터를 기초로 한 tatABC 유전자 탑재 벡터를 pPK6이라고 명명하였다. pPK4로부터 pPK6을 구축한 과정을 도 5에 나타내었다. Tat계에 의한 단백질 분비 발현에 있어서, TatABC 분비 장치를 증폭할 경우, WO2005/103278에 기재된 방법에서는, 목적 단백질의 분비 발현 플라스미드와, Tat계 분비 장치의 증폭 플라스미드인 pVtatABC의 2개의 플라스미드를 사용할 필요가 있었지만, pPK6 벡터를 사용함으로써 목적 단백질의 발현과, TatABC 분비 장치의 증폭을, 1플라스미드에서 실시하는 것이 가능해졌다.
(d) pPK6 벡터에 cspB 프로모터 및 TorA 시그널 서열을 코드하는 DNA를 탑재한 벡터(pPK6-TorAss)의 구축
Appl. Environ. Microbiol., 72, 7183-7192(2006)에 기재된 pPTGFP를 주형으로서, <서열번호 25>와 <서열번호 26>의 프라이머를 사용하여, C. glutamicum ATCC13869주 유래의 cspB 유전자의 프로모터 영역과 E. coli 유래의 TorA 시그널 서열을 코드하는 염기 서열을 포함하는 약 0.7kbp의 DNA 단편을 PCR법에 의해 증폭시켰다. <서열번호 26>의 프라이머에는 제한 효소 Apa I와 Nae I의 인식 서열이 디자인되어 있다. PCR에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편을 제한 효소 Kpn I 및 Apa I로 처리하고, (c)에서 제작한 pPK6 벡터의 Kpn I-Apa I 부위에 삽입함으로써, C. glutamicum ATCC13869주 유래의 cspB 유전자의 프로모터 영역과 E. coli 유래의 TorA 시그널 서열을 코드하는 염기 서열을 탑재한 벡터인 pPK6-TorAss를 얻었다. 라이게이션 반응에는 DNA Ligation Kit Ver.2.1(Takara Bio)을 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 염기 서열 결정의 결과, 예상대로의 유전자가 구축되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(e) pPK6-TorAss 벡터를 사용한 프로트랜스글루타미나아제 분비 발현용 벡터의 구축
WO2001/23591에 기재된 프로트랜스글루타미나아제의 분비 발현용 벡터 pPKSPTG1을 주형으로서, <서열번호 27>과 <서열번호 28>의 프라이머를 사용하여, 프로트랜스글루타미나아제를 코드하는 약 1.1kbp의 DNA 단편을 PCR법에 의해 증폭시켰다. <서열번호 28>의 프라이머에는 제한 효소 Xba I의 인식 서열이 디자인되어 있다. PCR에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편을 제한 효소 Xba I로 처리하고, (d)에서 구축한 pPK6-TorAss 벡터의 Nae I-Xba I 부위에 삽입함으로써 TatABC 분비 장치와, TorA 시그널 서열이 부가된 프로트랜스글루타미나아제의 공발현 벡터인 pPK6_T_PTG를 구축하였다. 라이게이션 반응에는 DNA Ligation Kit Ver.2.1(Takara Bio)을 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 유전자가 삽입되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(2) YDK010주 및 YDK010::phoS(W302C)주에서의 TorA 시그널 서열을 사용한 프로트랜스글루타미나아제의 분비 발현
실시예 5(1)(e)에서 얻어진 프로트랜스글루타미나아제 분비 발현 플라스미드 pPK6_T_PTG를 사용하여, WO2002/081694에 기재된 C. glutamicum YDK010주 및 실시예 1(3)에서 얻어진 YDK010::phoS(W302C)주의 각각을 형질전환하고, YDK010/pPK6_T_PTG주 및 YDK010::phoS(W302C)/pPK6_T_PTG주를 얻었다. 얻어진 각 형질전환체를, 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 각각 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 5μl을 환원 SDS-PAGE에 제공하고나서 Quick-CBB(Wako Pure Chemical Industries)로 염색을 행하였다. 그 결과, YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, 프로트랜스글루타미나아제 분비량이 현저하게 향상되어 있었다(도 6). 염색 후, 화상 해석 소프트 Multi Gauge(FUJIFILM)를 사용하여 프로트랜스글루타미나아제의 밴드 강도의 수치화를 행하고, YDK010::phoS(W302C)주에서 프로트랜스글루타미나아제를 발현시켰을 때의 밴드 강도의 평균값을, YDK010주에서 프로트랜스글루타미나아제를 발현시켰을 때의 밴드 강도의 평균값을 1로 했을 때의 상대값으로서 산출하였다. 그 결과, YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, 프로트랜스글루타미나아제 분비량이 약 7.2배로 향상되어 있는 것이 확인되었다(표 4). 이러한 사실로부터, PhoS(W302C) 변이는 E. coli 유래의 TorA 시그널 서열을 사용한 프로트랜스글루타미나아제 분비에서도, 현저한 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다.
실시예 6: PhoS(W302C) 변이주에서의 TorA 시그널 서열을 사용한 프로 구조 부착 프로트랜스글루타미나아제의 분비 발현
(1) Tat계 분비 장치를 코드하는 tatABC 유전자와 TorA 시그널 서열이 부가된 프로 구조 부착 프로트랜스글루타미나아제 발현 유전자의 공발현 플라스미드의 구축
WO2005/103278에 기재된 프로 구조 부착 프로트랜스글루타미나아제 발현 플라스미드 pPKT-PPG를 주형으로 하고, <서열번호 29>와 <서열번호 30>에 기재된 DNA를 프라이머로서 사용한 PCR법에 의해, C. glutamicum ATCC13869주 유래의 cspB 유전자의 프로모터 영역, 이 프로모터의 하류에 발현 가능하게 연결된 E. coli 유래의 TorA 시그널 펩타이드와 Chryseobacterium proteolyticum 유래의 프로 구조 부착 프로트랜스글루타미나아제의 융합 단백질을 코드하는 염기 서열을 증폭시켰다. <서열번호 29>와 <서열번호 30>에 기재된 양쪽 프라이머에는 모두 제한 효소 Xba I의 인식 서열이 디자인되어 있다. PCR에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편을 제한 효소 Xba I로 처리하고, 실시예 5(1)에서 구축한 pPK6 벡터의 Xba I 부위에 삽입함으로써 TatABC 분비 장치와, TorA 시그널 서열이 부가된 프로 구조 부착 프로트랜스글루타미나아제의 공발현 벡터인 pPK6_T_PPG를 구축하였다. 라이게이션 반응에는 DNA Ligation Kit<Mighty Mix>(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 유전자가 삽입되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(2) YDK010주 및 YDK010::phoS(W302C)주에서의 TorA 시그널 서열을 사용한 프로 구조 부착 프로트랜스글루타미나아제의 분비 발현
실시예 6(1)에서 얻어진 프로 구조 부착 프로트랜스글루타미나아제 발현 플라스미드 pPK6_T_PPG를 사용하여, WO2002/081694에 기재된 C. glutamicum YDK010주 및 실시예 1(3)에서 얻어진 YDK010::phoS(W302C)주의 각각을 형질전환하고, YDK010/pPK6_T_PPG주 및 YDK010::phoS(W302C)/pPK6_T_PPG주를 얻었다. 얻어진 각 형질전환체를, 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 각각 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 5μl을 환원 SDS-PAGE에 제공하고나서 Quick-CBB(Wako Pure Chemical Industries)로 염색을 행하였다. 그 결과, YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, 프로 구조 부착 프로트랜스글루타미나아제 분비량이 현저하게 향상되어 있었다(도 7). 염색 후, 화상 해석 소프트 Multi Gauge(FUJIFILM)를 사용하여 프로 구조 부착 프로트랜스글루타미나아제의 밴드 강도의 수치화를 행하고, YDK010::phoS(W302C)주에서 프로 구조 부착 프로트랜스글루타미나아제를 발현시켰을 때의 밴드 강도의 평균값을, YDK010주에서 프로 구조 부착 프로트랜스글루타미나아제를 발현시켰을 때의 밴드 강도의 평균값을 1로 했을 때의 상대값으로서 산출하였다. 그 결과, YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, 프로 구조 부착 프로트랜스글루타미나아제 분비량이 약 8.3배로 향상되어 있는 것이 확인되었다(표 5). 이러한 사실로부터, PhoS(W302C) 변이는 E. coli 유래의 TorA 시그널 서열을 사용한 프로 구조 부착 프로트랜스글루타미나아제 분비에서도, 현저한 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다.
실시예 7: PhoS(W302C) 변이주에서의 IMD 시그널 서열을 사용한 이소말토덱스트라나아제의 분비 발현
(1) Tat계 분비 장치를 코드하는 tatABC 유전자와 이소말토덱스트라나아제를 코드하는 유전자의 공발현 플라스미드의 구축
WO2005/103278에 기재된 이소말토덱스트라나아제 발현 플라스미드 pPKI-IMD를 주형으로 하고, <서열번호 29>와 <서열번호 31>에 기재된 DNA를 프라이머로서 사용한 PCR법에 의해, C. glutamicum ATCC13869주 유래의 cspB 유전자의 프로모터 영역, 이 프로모터의 하류에 발현 가능하게 연결된 Arthrobacter globiformis 유래의 IMD 유전자 서열(IMD 시그널 서열의 코드 영역을 포함한다)을 증폭시켰다. <서열번호 29>와 <서열번호 31>에 기재된 양쪽 프라이머에는 모두 제한 효소 Xba I의 인식 서열이 디자인되어 있다. PCR에는 PrimeSTAR(R) GXL DNA Polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편을 제한 효소 Xba I로 처리하고, 실시예 5(1)에서 구축한 pPK6 벡터의 Xba I 부위에 삽입함으로써 TatABC 분비 장치와, IMD 시그널 서열을 포함하는 이소말토덱스트라나아제의 공발현 벡터인 pPK6_I_IMD를 구축하였다. 라이게이션 반응에는 DNA Ligation Kit<Mighty Mix>(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 유전자가 삽입되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(2) YDK010주 및 YDK010::phoS(W302C)주에서의 IMD 시그널 서열을 사용한 이소말토덱스트라나아제의 분비 발현
실시예 7(1)에서 얻어진 이소말토덱스트라나아제 발현 플라스미드 pPK6_I_IMD를 사용하여, WO2002/081694에 기재된 C. glutamicum YDK010주 및 실시예 1(3)에서 얻어진 YDK010::phoS(W302C)주의 각각을 형질전환하고, YDK010/pPK6_I_IMD주 및 YDK010::phoS(W302C)/pPK6_I_IMD주를 얻었다. 얻어진 각 형질전환체를, 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 각각 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 5μl을 환원 SDS-PAGE에 제공하고나서 Quick-CBB(Wako Pure Chemical Industries)로 염색을 행하였다. 그 결과, YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, 이소말토덱스트라나아제 분비량이 현저하게 향상되어 있었다(도 8). 염색 후, 화상 해석 소프트 Multi Gauge(FUJIFILM)를 사용하여 이소말토덱스트라나아제의 밴드 강도의 수치화를 행하고, YDK010::phoS(W302C)주에서 이소말토덱스트라나아제를 발현시켰을 때의 밴드 강도의 평균값을, YDK010주에서 이소말토덱스트라나아제를 발현시켰을 때의 밴드 강도의 평균값을 1로 했을 때의 상대값으로서 산출하였다. 그 결과, YDK010::phoS(W302C)주에서는 YDK010주와 비교하여, 이소말토덱스트라나아제 분비량이 약 6.6배로 향상되어 있는 것이 확인되었다(표 6). 이러한 사실로부터, PhoS(W302C) 변이는 A. globiformis 유래의 IMD 시그널 서열을 사용한 이소말토덱스트라나아제 분비에서도, 현저한 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다.
실시예 5 내지 7로부터, WO2005/103278에 기재되어 있는 바와 같이 Tat계 분비 장치를 이용하여 이종 단백질을 분비 발현할 때, 발현시키는 단백질의 종류, 및 이용하는 시그널 서열의 종류에 의하지 않고, PhoS(W302C) 변이주를 사용함으로써 목적 단백질의 분비 발현량을 유의적으로 향상시킬 수 있는 것을 알았다.
즉, 실시예 2 내지 7로부터, 이용하는 분비 경로의 종류, 이용하는 시그널 서열의 종류, 및 발현시키는 단백질의 종류에 의하지 않고, PhoS(W302C) 변이주를 사용함으로써 이종 단백질 분비량을 유의적으로 향상시킬 수 있는 것을 알았다.
실시예 8: phoS 유전자의 플라스미드 증폭에 의한 PhoS 결손주의 기능 상보
(1) 야생형 PhoS 유전자 및 변이형 PhoS(W302C) 유전자의 증폭 플라스미드의 구축
(a) 야생형 PhoS 유전자의 증폭 플라스미드의 구축
<서열번호 32> 및 <서열번호 33>에 기재된 프라이머를 사용하고, PurEluteTM Genomic DNA Kit(EdgeBio)를 사용하여 조제한 C. glutamicum YDK010주의 염색체 DNA를 주형으로서, 야생형 PhoS 유전자를 포함하는 약 1.5kbp의 영역을 PCR법에 의해 증폭시켰다. PCR 반응에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.
이어서, 증폭된 약 1.5kbp의 DNA 단편을 아가로스겔 전기영동 후, 목적의 밴드를 자르고, Wizard(R) SV Gel and PCR Clean-Up System(Promega)을 사용하여 겔로부터 회수하였다. 회수한 DNA 단편을 일본 공개특허공보 특개 평9-070291에 기재된 pVC7 벡터(클로람페니콜 내성 유전자를 갖는 대장균 및 코리네형 세균의 양쪽에서 복제 가능한 셔틀벡터)의 Sma I 부위에 융합 반응을 사용하여 삽입함으로써, 야생형 PhoS 유전자의 증폭용 플라스미드 pVphoS(WT)를 얻었다. 융합 반응에는 In-Fusion(R) HD Cloning Kit(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 유전자가 삽입되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(b) 변이형 PhoS(W302C) 유전자의 증폭 플라스미드의 구축
마찬가지로, <서열번호 32> 및 <서열번호 33>에 기재된 프라이머를 사용하고, PurEluteTM Genomic DNA Kit(EdgeBio)를 사용하여 조제한 C. glutamicum YDK010::phoS(W302C)주의 염색체 DNA를 주형으로서, 변이형 PhoS(W302C) 유전자를 포함하는 약 1.5kbp의 영역을 PCR법에 의해 증폭시켰다. PCR 반응에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.
이어서, 증폭된 약 1.5kbp의 DNA 단편을 아가로스겔 전기영동 후, 목적의 밴드를 자르고, Wizard(R) SV Gel and PCR Clean-Up System(Promega)을 사용하여 겔로부터 회수하였다. 회수한 DNA 단편을 일본 공개특허공보 특개 평9-070291에 기재된 pVC7 벡터의 Sma I 부위에 융합 반응을 사용하여 삽입함으로써, 변이형 PhoS(W302C) 유전자의 증폭용 플라스미드 pVphoS(W302C)를 얻었다. 융합 반응에는 In-Fusion(R) HD Cloning Kit(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 유전자가 삽입되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
(2) phoS 결손주를 사용한 CspB50TEV-Teri 분비 발현에서의 야생형 PhoS 유전자 또는 변이형 PhoS(W302C) 유전자의 증폭 효과
WO2014/126260에 기재된 pPKK50TEV-Teri와, 실시예 8(1)에서 구축한 pVphoS(WT) 또는 pVphoS(W302C)를 사용하여, 실시예 1(5)에서 작성한 YDK010ΔphoS주를 형질전환하였다. 또한, 대조로서, 일본 공개특허공보 특개 평9-322774에 기재된 pPK4 벡터와, 실시예 8(1)에서 구축한 pVphoS(WT) 또는 pVphoS(W302C)를 사용하여, 실시예 1(5)에서 작성한 YDK010ΔphoS주를 형질전환하였다. 얻어진 각 형질전환체를, 6mg/l의 클로람페니콜과 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 각각 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 5μl을 환원 SDS-PAGE에 제공하고나서 SYPRO Orange(Life Technologies)로 염색을 행하고, CspB50TEV-Teri의 분비량을 비교하였다(도 9). 또한, 일부의 주에 대하여 CspB50TEV-Teri 분비량을 「+」 내지 「+++」로 표 7에 나타내었다. 그 결과, YDK010ΔphoS주에 pVphoS(WT)를 도입한 경우에는, YDK010주와 동등한 CspB50TEV-Teri 분비량을 얻을 수 있고, YDK010ΔphoS주에 pVphoS(W302C)를 도입한 경우에는, YDK010::phoS(W302C)주와 동등한 CspB50TEV-Teri 분비량을 얻을 수 있었다(표 7). 이러한 사실로부터, 야생형 및 변이형 모두에 대해서도, phoS 유전자를 플라스미드에서 증폭시킴으로써, 염색체 상의 phoS 유전자의 결손을 기능 상보할 수 있는 것을 알았다. 따라서, 변이형 PhoS 유전자를 발현시키는 플라스미드를 이용함으로써, 염색체 상의 phoS 유전자를 변이시킨 경우와 동등한 효과를 얻을 수 있는 것을 알았다.
실시예 9: 야생형 PhoS 단백질의 302 위치의 트립토판 잔기를 임의의 아미노산 잔기로 개변한 변이형 PhoS(W302X) 발현주를 사용한 이종 단백질의 분비 발현
(1) 각종의 변이형 PhoS(W302X) 단백질을 코드하는 변이형 PhoS 유전자의 발현 플라스미드의 구축
야생형 PhoS 단백질의 302 위치의 트립토판 잔기(W302)를 다른 아미노산 잔기로 치환한 변이형 PhoS(W302X)를 발현시키기 위한 플라스미드 pVphoS(W302X)의 구축을 행하였다. 「X」는 임의의 아미노산 잔기를 나타낸다.
변이형 PhoS(W302S) 단백질 발현용 플라스미드 pVphoS(W302S)의 구축에서는 실시예 8(1)에서 구축한 pVphoS(WT) 플라스미드를 주형으로서, <서열번호 32> 및 <서열번호 34>의 프라이머를 사용하여 phoS 유전자의 N 말단측을 포함하는 약 0.9kbp의 영역을, <서열번호 33> 및 <서열번호 35>의 프라이머를 사용하여 phoS 유전자의 C 말단측을 포함하는 약 0.6kbp의 영역을, PCR법에 의해 각각 증폭시켰다. <서열번호 34> 및 <서열번호 35>의 프라이머는 PhoS 단백질의 302 위치의 트립토판 잔기를 코드하는 코돈(tgg)을, 세린 잔기를 코드하는 코돈(tcc)으로 치환하도록 디자인하였다. PCR 반응에는 Pyrobest(R) DNA polymerase(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 증폭된 각각의 DNA 단편을 아가로스겔 전기영동 후, 목적의 밴드를 자르고, Wizard(R) SV Gel and PCR Clean-Up System(Promega)을 사용하여 겔로부터 회수하였다. 회수한 2개의 DNA 단편을, 일본 공개특허공보 특개 평9-070291에 기재된 pVC7 벡터의 Sma I 부위에 융합 반응을 사용하여 삽입함으로써, 변이형 PhoS(W302S) 유전자의 증폭용 플라스미드 pVphoS(W302C)를 얻었다. 융합 반응에는 In-Fusion(R) HD Cloning Kit(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 삽입 단편의 염기 서열 결정의 결과, 예상대로의 유전자가 구축되어 있는 것을 확인하였다. 염기 서열의 결정은 BigDye(R) Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)와 3130 Genetic Analyzer(Applied Biosystems)를 사용하여 행하였다.
마찬가지로 하여, 변이형 PhoS(W302A) 단백질 발현용 플라스미드의 pVphoS(W302A), 변이형 PhoS(W302V) 단백질 발현용 플라스미드의 pVphoS(W302V), 변이형 PhoS(W302M) 단백질 발현용 플라스미드 pVphoS(W302M), 변이형 PhoS(W302F) 단백질 발현용 플라스미드 pVphoS(W302F), 변이형 PhoS(W302Y) 단백질 발현용 플라스미드 pVphoS(W302Y), 변이형 PhoS(W302D) 단백질 발현의 플라스미드 pVphoS(W302D), 변이형 PhoS(W302N) 단백질 발현용 플라스미드 pVphoS(W302N), 변이형 PhoS(W302H) 발현용 플라스미드 pVphoS(W302H), 및 변이형 PhoS(W302K) 단백질 발현용 플라스미드 pVphoS(W302K)를 구축함으로써, 10종류의 변이형 PhoS(W302X) 단백질 발현용 플라스미드를 구축하였다. 플라스미드 구축시의 PCR에서 사용한, phoS 유전자의 N 말단측을 포함하는 영역을 증폭할 때의 프라이머 세트 및 C 말단측을 포함하는 영역을 증폭할 때의 프라이머 세트를 표 8에 나타내었다.
(2) phoS 결손주를 사용한 CspB50TEV-Teri 분비 발현에서의 각종의 변이형 PhoS(W302X) 단백질의 증폭 효과
WO2014/126260에 기재된 pPKK50TEV-Teri와, 실시예 9(1)에서 구축한 각종의 pVphoS(W302X) 플라스미드를 사용하여, 실시예 1(5)에서 작성한 YDK010ΔphoS주를 형질전환하였다. 얻어진 각 형질전환체를, 6mg/l의 클로람페니콜과 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 각각 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 5μl을 환원 SDS-PAGE에 제공하고나서 SYPRO Orange(Life Technologies)로 염색을 행하고, CspB50TEV-Teri의 분비량을 비교하였다(도 10). 또한, 각 주에 의한 CspB50TEV-Teri 분비량을 「+」 내지 「+++」로 표 9에 나타내었다. 그 결과, 야생형 PhoS 단백질과 비교하여, 야생형 PhoS 단백질의 302 위치의 트립토판 잔기를 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환한 경우, 시스테인 잔기로의 치환과 마찬가지로, CspB50TEV-Teri 분비량이 유의적으로 향상되는 것을 알았다. 한편, pVphoS(W302Y) 도입주는 형질전환체를 취득할 수 없었기 때문에, CspB50TEV-Teri 분비량을 평가할 수 없었다.
이러한 사실로부터, 야생형 PhoS 단백질의 302 위치의 트립토판 잔기의 변이는 시스테인 잔기로 변이시키는 경우에 한정되지 않고, 방향족 아미노산 및 히스티딘 이외의 임의의 아미노산 잔기로 변이시키는 경우에도, 이종 단백질 분비량을 유의적으로 향상시킬 수 있는 것을 알았다.
실시예 10: Corynebacterium glutamicum ATCC13869주에서의 PhoS(W302C) 변이주의 구축과 이종 단백질의 분비 발현
(1) C. glutamicum ATCC13869::phoS(W302C)주의 구축
실시예 1(2)에서 구축한 변이형 PhoS 유전자 치환용 벡터인 pBS5T-phoS(W302C)를 사용하여, C. glutamicum ATCC13869주를 형질전환하였다. 얻어진 형질전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하고, 염색체 상의 야생형 PhoS 유전자가 변이형 PhoS 유전자로 치환된 ATCC13869::phoS(W302C)주를 얻었다.
(2) C. glutamicum ATCC13869::phoS(W302C)주에서의, CspB의 성숙 단백질의 N 말단 6 아미노산 잔기를 융합한 Exenatide 전구체(ExCP)의 분비 발현
실시예 4(1)에서 구축한 성숙 CspB의 N 말단 6 아미노산 잔기 및 ProTEV 프로테아제 인식 서열을 융합한 ExCP의 분비 발현 플라스미드인 pPK4_CspB6TEV-ExCP를 사용하여, C. glutamicum ATCC13869주와, 실시예 10(1)에서 제작한 ATCC13869::phoS(W302C)주의 각각을 형질전환하고, ATCC13869/pPK4_CspB6TEV-ExCP 주와 ATCC13869::phoS(W302C)/pPK4_CspB6TEV-ExCP주를 얻었다.
얻어진 각 형질전환체를, 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 6.5μl을 환원 SDS-PAGE에 제공하고나서 Quick-CBB(Wako Pure Chemical Industries)로 염색을 행하였다.
그 결과, YDK010주를 유전적 배경으로서 사용한 경우와 마찬가지로, ATCC13869주에서는 CspB6TEV-ExCP의 분자량을 갖는 단백질을 나타내는 밴드가 거의 검출되지 않은 반면, ATCC13869::phoS(W302C)에서는 CspB6TEV-ExCP의 밴드가 짙게 검출되고, CspB6TEV-ExCP 분비량이 유의적으로 향상되어 있는 것이 확인되었다(도 11). 이러한 사실로부터, PhoS(W302C) 변이는 ATCC13869주를 유전적 배경으로 한 경우에 있어서도, CspB6TEV-ExCP의 유의한 분비량 향상을 초래하는 유효 변이인 것을 알았다.
실시예 11: Corynebacterium glutamicum ATCC13869::phoS(W302C)주에서의 CspB 결손주의 구축과 이종 단백질의 분비 발현
(1) C. glutamicum ATCC13869::phoS(W302C)ΔcspB주의 구축
WO2013/065869에 기재된 cspB 유전자 결손용 벡터 pBS5T-ΔcspB를 사용하여, 실시예 10(1)에서 구축한 ATCC13869::phoS(W302C)를 형질전환하였다. 얻어진 형질전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하고, cspB 유전자가 결손된 ATCC13869::phoS(W302C)ΔcspB주를 얻었다.
(2) C. glutamicum ATCC13869::phoS(W302C)ΔcspB주에서의, CspB의 성숙 단백질의 N 말단 6 아미노산 잔기를 융합한 LFABP의 분비 발현
실시예 3(1)에서 구축한 성숙 CspB의 N 말단 6 아미노산 잔기 및 FactorXa 프로테아제 인식 서열 IEGR를 융합한 LFABP의 분비 발현 플라스미드인 pPK4_CspB6Xa-LFABP를 사용하여, WO2013/065869에 기재된 C. glutamicum ATCC13869ΔcspB주와, 실시예 11(1)에서 제작한 ATCC13869::phoS(W302C)ΔcspB주의 각각을 형질전환하고, ATCC13869ΔcspB/pPK4_CspB6Xa-LFABP주와 ATCC13869::phoS(W302C)ΔcspB/pPK4_CspB6Xa-LFABP주를 얻었다.
얻어진 각 형질전환체를, 25mg/l의 카나마이신을 포함하는 MMTG 액체 배지(글루코오스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, 대두 염산 가수분해액(전체 질소량 0.2g), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 30℃, 72시간 배양하였다. 배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 6.5μl을 환원 SDS-PAGE에 제공하고나서 Quick-CBB(Wako Pure Chemical Industries)로 염색을 행하였다.
그 결과, YDK010주를 유전적 배경으로서 사용한 경우와 마찬가지로, ATCC13869::phoS(W302C)ΔcspB주에서는 ATCC13869ΔcspB주와 비교하여, CspB6Xa-LFABP의 분자량을 갖는 단백질을 나타내는 밴드가 안정적으로 짙게 검출되고, CspB6Xa-LFABP 분비량이 유의적으로 향상되어 있는 것이 확인되었다(도 12). 이러한 사실로부터, PhoS(W302C) 변이는 ATCC13869ΔcspB주를 유전적 배경으로 한 경우에 있어서도, 안정적으로 CspB6Xa-LFABP의 유의한 분비량 향상을 초래하는 유효 변이인 것을 알았다.
실시예 10 내지 11로부터, ATCC13869주 또는 ATCC13869ΔcspB주를 유전적 배경으로 한 경우에 있어서도, PhoS(W302C) 변이주를 사용함으로써 목적 단백질의 분비 발현량을 유의적으로 향상시킬 수 있는 것을 알았다.
즉, 실시예 2 내지 11로부터, 숙주주의 유전적 배경의 차이에 의하지 않고, PhoS(W302C) 변이주를 사용함으로써 이종 단백질 분비량을 유의적으로 향상시킬 수 있는 것을 알았다.
[산업상의 이용가능성]
본 발명에 의해 이종 단백질을 효율적으로 분비 생산할 수 있다.
〔서열표의 설명〕
서열번호 1: C. glutamicum YDK0107의 변이형 PhoS 유전자의 염기 서열
서열번호 2: C. glutamicum YDK0107의 변이형 PhoS 단백질의 아미노산 서열
서열번호 3: C. glutamicum YDK010의 야생형 PhoS 유전자의 염기 서열
서열번호 4: C. glutamicum YDK010의 야생형 PhoS 단백질의 아미노산 서열
서열번호 5 내지 10: 프라이머
서열번호 11: LFABP의 아미노산 서열
서열번호 12: CspB6Xa-LFABP를 코드하는 염기 서열
서열번호 13: CspB6Xa-LFABP의 아미노산 서열
서열번호 14: Exenatide 전구체의 아미노산 서열
서열번호 15: CspB6TEV-ExCP를 코드하는 염기 서열
서열번호 16: CspB6TEV-ExCP의 아미노산 서열
서열번호 17 내지 53: 프라이머
서열번호 54: C. glutamicum ATCC 13032의 PhoS 단백질의 아미노산 서열
서열번호 55: C. glutamicum ATCC 14067의 PhoS 단백질의 아미노산 서열
서열번호 56: C. callunae의 PhoS 단백질의 아미노산 서열
서열번호 57: C. crenatum의 PhoS 단백질의 아미노산 서열
서열번호 58: C. efficiens의 PhoS 단백질의 아미노산 서열
서열번호 59: C. glutamicum YDK0107의 PhoS 단백질의 HisKA 도메인의 아미노산 서열
서열번호 60: C. glutamicum YDK010의 PhoS 단백질의 HisKA 도메인의 아미노산 서열
서열번호 61: C. glutamicum ATCC 13869의 PhoS 단백질의 HisKA 도메인의 아미노산 서열
서열번호 62: C. glutamicum ATCC 13032의 PhoS 단백질의 HisKA 도메인의 아미노산 서열
서열번호 63: C. glutamicum ATCC 14067의 PhoS 단백질의 HisKA 도메인의 아미노산 서열
서열번호 64: C. callunae의 PhoS 단백질의 HisKA 도메인의 아미노산 서열
서열번호 65: C. crenatum의 PhoS 단백질의 HisKA 도메인의 아미노산 서열
서열번호 66: C. efficiens의 PhoS 단백질의 HisKA 도메인의 아미노산 서열
서열번호 67: C. glutamicum ATCC 13869의 cspB 유전자의 염기 서열
서열번호 68: C. glutamicum ATCC 13869의 CspB 단백질의 아미노산 서열
서열번호 69: C. glutamicum ATCC 13032의 tatA 유전자의 염기 서열
서열번호 70: C. glutamicum ATCC 13032의 TatA 단백질의 아미노산 서열
서열번호 71: C. glutamicum ATCC 13032의 tatB 유전자의 염기 서열
서열번호 72: C. glutamicum ATCC 13032의 TatB 단백질의 아미노산 서열
서열번호 73: C. glutamicum ATCC 13032의 tatC 유전자의 염기 서열
서열번호 74: C. glutamicum ATCC 13032의 TatC 단백질의 아미노산 서열
서열번호 75: TorA 시그널 펩타이드의 아미노산 서열
서열번호 76: SufI 시그널 펩타이드의 아미노산 서열
서열번호 77: PhoD 시그널 펩타이드의 아미노산 서열
서열번호 78: LipA 시그널 펩타이드의 아미노산 서열
서열번호 79: IMD 시그널 펩타이드의 아미노산 서열
서열번호 80, 81: 트윈·아르기닌 모티프의 아미노산 서열
서열번호 82: PS1 시그널 펩타이드의 아미노산 서열
서열번호 83: PS2 시그널 펩타이드의 아미노산 서열
서열번호 84: SlpA 시그널 펩타이드의 아미노산 서열
서열번호 85: C. glutamicum ATCC 13869의 CspB 성숙 단백질의 아미노산 서열
서열번호 86 내지 93: 본 발명에서 사용되는 삽입 서열의 일 형태의 아미노산 서열
서열번호 94: Factor Xa 프로테아제의 인식 서열
서열번호 95: ProTEV 프로테아제의 인식 서열
서열번호 96: C. glutamicum ATCC 13032의 phoR 유전자의 염기 서열
서열번호 97: C. glutamicum ATCC 13032의 PhoR 단백질의 아미노산 서열
SEQUENCE LISTING
<110> AJINOMOTO CO., INC.
<120> METHOD FOR SECRETORY PRODUCTION OF PROTEIN
<130> D757-16011
<150> JP2015-089046
<151> 2015-04-24
<160> 97
<170> KoPatentIn 3.0
<210> 1
<211> 1458
<212> DNA
<213> Corynebacterium glutamicum
<400> 1
atggaaaacc cttatgtcgc tgcgctcgat gacgataaaa aagaagtcgg cgcaataaaa 60
gaagcagaaa aagaacctga aataggtccc atcagagctg ccggacgagc cataccgctg 120
cgcacccgca tcattttgat cgtggtgggt atcgccgggc ttggtttgct ggtcaacgcg 180
attgctgttt ccagcctcat gcgtgaagtt tcctataccc gcatggatca agagctagag 240
acctcgatgg ggacgtgggc gcataacgtt gagctgttta atttcgatgg cgtccgccaa 300
gggccaccca gcgattatta tgtggccaag gtttttcctg atggatccag cattattttc 360
aacgatgcac aatcggcacc caatctagct gaaaccacca tcggtactgg tccacacact 420
gtggatgctg ctagcggttc tgcctccaac actccgtggc gtgtgatggc ggaaaagaac 480
ggtgacatta tcaccgtggt gggtaaaagc atggggcgtg aaacaaacct gctgtaccga 540
ttggtgatgg tgcagatgat catcggcgcg ctgattctgg ttgctatttt gattacttca 600
ctcttcctag tcagacgctc gttgcggccg ttgagagaag ttgaagagac cgccaccagg 660
attgcgggcg gtgatttgga tcgacgtgtc ccgcagtggc caatgaccac agaagtcgga 720
cagctgtcga atgccctcaa tatcatgttg gagcagctcc aagcctcaat tctgaccgcc 780
cagcaaaaag aagctcagat gcgccgattc gttggcgacg cctcccacga gctccgcaca 840
ccactgacct ctgtgaaggg cttcaccgag ctgtattcat caggtgcaac agatgatgcc 900
aactgtgtca tgtccaagat cggtggcgaa gcccaacgca tgagtgtgct tgtggaagac 960
ctcctgtcac tgacgcgtgc cgaaggccag caaatggaga agcaccgcgt tgacgtgctg 1020
gaactcgcat tggcagtacg cggatccatg cgagcagcct ggccagatcg caccgtcaac 1080
gtgtccaata aagccgagtc cattccagtt gttgaaggcg acccaacccg cctccaccaa 1140
gttctcacca acctggttgc caacggactc aaccacggcg gaccggacgc ggaagtcagc 1200
attgagatca acaccgatgg gcaaaacgtg aggattctcg tggcagacaa cggtgtcgga 1260
atgtctgaag aagatgccca gcatatcttc gagcgtttct accgcgccga ttcctcccgc 1320
tcacgcgcat ccggcggatc gggcctcggc cttgcgatca cgaaatccct ggtcgaaggc 1380
cacggcggca cagtcaccgt cgacagcgtg caaggcgaag gcacggtgtt cacgatcacc 1440
ttgccggcgg tttcttaa 1458
<210> 2
<211> 485
<212> PRT
<213> Corynebacterium glutamicum
<400> 2
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Asp Lys Lys Glu Val
1 5 10 15
Gly Ala Ile Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asn
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Cys Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 3
<211> 1458
<212> DNA
<213> Corynebacterium glutamicum
<400> 3
atggaaaacc cttatgtcgc tgcgctcgat gacgataaaa aagaagtcgg cgcaataaaa 60
gaagcagaaa aagaacctga aataggtccc atcagagctg ccggacgagc cataccgctg 120
cgcacccgca tcattttgat cgtggtgggt atcgccgggc ttggtttgct ggtcaacgcg 180
attgctgttt ccagcctcat gcgtgaagtt tcctataccc gcatggatca agagctagag 240
acctcgatgg ggacgtgggc gcataacgtt gagctgttta atttcgatgg cgtccgccaa 300
gggccaccca gcgattatta tgtggccaag gtttttcctg atggatccag cattattttc 360
aacgatgcac aatcggcacc caatctagct gaaaccacca tcggtactgg tccacacact 420
gtggatgctg ctagcggttc tgcctccaac actccgtggc gtgtgatggc ggaaaagaac 480
ggtgacatta tcaccgtggt gggtaaaagc atggggcgtg aaacaaacct gctgtaccga 540
ttggtgatgg tgcagatgat catcggcgcg ctgattctgg ttgctatttt gattacttca 600
ctcttcctag tcagacgctc gttgcggccg ttgagagaag ttgaagagac cgccaccagg 660
attgcgggcg gtgatttgga tcgacgtgtc ccgcagtggc caatgaccac agaagtcgga 720
cagctgtcga atgccctcaa tatcatgttg gagcagctcc aagcctcaat tctgaccgcc 780
cagcaaaaag aagctcagat gcgccgattc gttggcgacg cctcccacga gctccgcaca 840
ccactgacct ctgtgaaggg cttcaccgag ctgtattcat caggtgcaac agatgatgcc 900
aactgggtca tgtccaagat cggtggcgaa gcccaacgca tgagtgtgct tgtggaagac 960
ctcctgtcac tgacgcgtgc cgaaggccag caaatggaga agcaccgcgt tgacgtgctg 1020
gaactcgcat tggcagtacg cggatccatg cgagcagcct ggccagatcg caccgtcaac 1080
gtgtccaata aagccgagtc cattccagtt gttgaaggcg acccaacccg cctccaccaa 1140
gttctcacca acctggttgc caacggactc aaccacggcg gaccggacgc ggaagtcagc 1200
attgagatca acaccgatgg gcaaaacgtg aggattctcg tggcagacaa cggtgtcgga 1260
atgtctgaag aagatgccca gcatatcttc gagcgtttct accgcgccga ttcctcccgc 1320
tcacgcgcat ccggcggatc gggcctcggc cttgcgatca cgaaatccct ggtcgaaggc 1380
cacggcggca cagtcaccgt cgacagcgtg caaggcgaag gcacggtgtt cacgatcacc 1440
ttgccggcgg tttcttaa 1458
<210> 4
<211> 485
<212> PRT
<213> Corynebacterium glutamicum
<400> 4
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Asp Lys Lys Glu Val
1 5 10 15
Gly Ala Ile Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asn
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 5
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 5
aggcagcaaa acaccgagga ctcaa 25
<210> 6
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 6
cgggcttggt ttgctggtca acgcg 25
<210> 7
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 7
tcgagctcgg tacccggcta atcctctggc ctg 33
<210> 8
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 8
taactaattt ctcctaggca tcaagggccg gaa 33
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 9
aggagaaatt agttacgtgg 20
<210> 10
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 10
ctctagagga tcccccggat gtacgtggaa gac 33
<210> 11
<211> 127
<212> PRT
<213> Homo sapiens
<400> 11
Met Ser Phe Ser Gly Lys Tyr Gln Leu Gln Ser Gln Glu Asn Phe Glu
1 5 10 15
Ala Phe Met Lys Ala Ile Gly Leu Pro Glu Glu Leu Ile Gln Lys Gly
20 25 30
Lys Asp Ile Lys Gly Val Ser Glu Ile Val Gln Asn Gly Lys His Phe
35 40 45
Lys Phe Thr Ile Thr Ala Gly Ser Lys Val Ile Gln Asn Glu Phe Thr
50 55 60
Val Gly Glu Glu Cys Glu Leu Glu Thr Met Thr Gly Glu Lys Val Lys
65 70 75 80
Thr Val Val Gln Leu Glu Gly Asp Asn Lys Leu Val Thr Thr Phe Lys
85 90 95
Asn Ile Lys Ser Val Thr Glu Leu Asn Gly Asp Ile Ile Thr Asn Thr
100 105 110
Met Thr Leu Gly Asp Ile Val Phe Lys Arg Ile Ser Lys Arg Ile
115 120 125
<210> 12
<211> 504
<212> DNA
<213> Homo sapiens
<400> 12
atgtttaaca accgtatccg cactgcagct ctcgctggtg caatcgcaat ctccaccgca 60
gcttccggcg tagctatccc agcattcgct caggagacca acccaaccat cgagggccgc 120
atgtccttct ccggcaagta ccagctgcag tcccaggaaa acttcgaggc attcatgaag 180
gctatcggtc tgccagaaga gctcatccag aagggcaagg atatcaaggg tgtttccgaa 240
atcgtgcaga acggcaagca cttcaagttc accatcaccg caggttccaa ggtcatccag 300
aacgagttca ccgttggcga agagtgcgaa ctcgagacca tgaccggtga aaaggttaag 360
accgtggtcc agctggaggg cgacaacaag ctcgtgacca ccttcaagaa catcaagtcc 420
gtcaccgaac tgaacggcga tatcatcacc aacaccatga ccctcggtga catcgtgttc 480
aagcgcatct ccaagcgtat ctaa 504
<210> 13
<211> 167
<212> PRT
<213> Homo sapiens
<400> 13
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala Gln Glu
20 25 30
Thr Asn Pro Thr Ile Glu Gly Arg Met Ser Phe Ser Gly Lys Tyr Gln
35 40 45
Leu Gln Ser Gln Glu Asn Phe Glu Ala Phe Met Lys Ala Ile Gly Leu
50 55 60
Pro Glu Glu Leu Ile Gln Lys Gly Lys Asp Ile Lys Gly Val Ser Glu
65 70 75 80
Ile Val Gln Asn Gly Lys His Phe Lys Phe Thr Ile Thr Ala Gly Ser
85 90 95
Lys Val Ile Gln Asn Glu Phe Thr Val Gly Glu Glu Cys Glu Leu Glu
100 105 110
Thr Met Thr Gly Glu Lys Val Lys Thr Val Val Gln Leu Glu Gly Asp
115 120 125
Asn Lys Leu Val Thr Thr Phe Lys Asn Ile Lys Ser Val Thr Glu Leu
130 135 140
Asn Gly Asp Ile Ile Thr Asn Thr Met Thr Leu Gly Asp Ile Val Phe
145 150 155 160
Lys Arg Ile Ser Lys Arg Ile
165
<210> 14
<211> 41
<212> PRT
<213> Heloderma suspectum
<400> 14
His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu
1 5 10 15
Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser
20 25 30
Ser Gly Ala Pro Pro Pro Ser Cys Pro
35 40
<210> 15
<211> 252
<212> DNA
<213> Heloderma suspectum
<400> 15
atgtttaaca accgtatccg cactgcagct ctcgctggtg caatcgcaat ctccaccgca 60
gcttccggcg tagctatccc agcattcgct caggagacca acccaaccga aaacctgtac 120
ttccagcacg gcgagggaac cttcacgtct gatctgtcta agcagatgga ggaagaggca 180
gttcgcctgt tcattgagtg gctgaaaaat ggcggtcctt ctagcggtgc acctcccccc 240
tcctgcccat ga 252
<210> 16
<211> 83
<212> PRT
<213> Heloderma suspectum
<400> 16
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala Gln Glu
20 25 30
Thr Asn Pro Thr Glu Asn Leu Tyr Phe Gln His Gly Glu Gly Thr Phe
35 40 45
Thr Ser Asp Leu Ser Lys Gln Met Glu Glu Glu Ala Val Arg Leu Phe
50 55 60
Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro
65 70 75 80
Ser Cys Pro
<210> 17
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 17
cgagccacca ggcaggcggg aaaatcg 27
<210> 18
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 18
cgattttccc gcctgcctgg tggctcg 27
<210> 19
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 19
cccgcttgat cattccttta agg 23
<210> 20
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 20
aatgggccct ttggtacccc taaataatat cggtcc 36
<210> 21
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 21
cgtgctctag gggaaccgtg cgttccc 27
<210> 22
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 22
gggaacgcac ggttccccta gagcacg 27
<210> 23
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 23
cgacgctgaa gttgtagaga tcatccg 27
<210> 24
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 24
cggatgatct ctacaacttc agcgtcg 27
<210> 25
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 25
ggcggtaccc aaattcctgt gaagtagc 28
<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 26
ggcgggcccg ccggcagtcg cacgtcgcgg cgttaacaat gacg 44
<210> 27
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 27
gacaatggcg cgggggaaga gacg 24
<210> 28
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 28
caggtcgact ctagaggatc cc 22
<210> 29
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 29
atattattta ggtctagaca aattcctgtg 30
<210> 30
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 30
ctgcaggtcg actctagaat taattaaaat ccaca 35
<210> 31
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 31
ctgcaggtcg actctagatc acatgtccaa ctctatcc 38
<210> 32
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 32
ctctagagga tccccatgga aaacccttat gtcgc 35
<210> 33
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 33
tcgagctcgg tacccttaag aaaccgccgg caag 34
<210> 34
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 34
catgacggag ttggcatcat ctgttgcacc 30
<210> 35
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 35
gccaactccg tcatgtccaa gatcggtgg 29
<210> 36
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 36
catgactgcg ttggcatcat ctgttgcacc 30
<210> 37
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 37
gccaacgcag tcatgtccaa gatcggtgg 29
<210> 38
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 38
catgaccacg ttggcatcat ctgttgcacc 30
<210> 39
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 39
gccaacgtgg tcatgtccaa gatcggtgg 29
<210> 40
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 40
catgaccatg ttggcatcat ctgttgcacc 30
<210> 41
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 41
gccaacatgg tcatgtccaa gatcggtgg 29
<210> 42
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 42
catgacgaag ttggcatcat ctgttgcacc 30
<210> 43
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 43
gccaacttcg tcatgtccaa gatcggtgg 29
<210> 44
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 44
catgacgtag ttggcatcat ctgttgcacc 30
<210> 45
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 45
gccaactacg tcatgtccaa gatcggtgg 29
<210> 46
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 46
catgacatcg ttggcatcat ctgttgcacc 30
<210> 47
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 47
gccaacgatg tcatgtccaa gatcggtgg 29
<210> 48
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 48
catgacgttg ttggcatcat ctgttgcacc 30
<210> 49
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 49
gccaacaacg tcatgtccaa gatcggtgg 29
<210> 50
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 50
catgacgtgg ttggcatcat ctgttgcacc 30
<210> 51
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 51
gccaaccacg tcatgtccaa gatcggtgg 29
<210> 52
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 52
catgaccttg ttggcatcat ctgttgcacc 30
<210> 53
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 53
gccaacaagg tcatgtccaa gatcggtgg 29
<210> 54
<211> 485
<212> PRT
<213> Corynebacterium glutamicum
<400> 54
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val
1 5 10 15
Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Lys Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 55
<211> 485
<212> PRT
<213> Corynebacterium glutamicum
<400> 55
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val
1 5 10 15
Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Val Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 56
<211> 504
<212> PRT
<213> Corynebacterium callunae
<400> 56
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Lys Asn Ser Asn Phe Gly
1 5 10 15
Ala Lys Asp Thr Asp Ser Ala Val Ser Asp Ser Thr Glu Val Ser Gln
20 25 30
Asn Asn Asp Gly Ile Gly Thr Pro Ala Thr Ala Glu Pro Lys Val Gly
35 40 45
Pro Ile Arg Thr Ala Gly Arg Ala Met Pro Leu Arg Thr Arg Ile Ile
50 55 60
Leu Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Val
65 70 75 80
Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln
85 90 95
Asp Leu Glu Ser Ala Met Gly Thr Trp Val Arg Asn Val Glu Leu Phe
100 105 110
Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala
115 120 125
Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Glu Ser
130 135 140
Ala Pro Asp Leu Gly Gln Thr Thr Ile Gly Thr Gly Pro His Thr Val
145 150 155 160
Glu Ala Ala Glu Gly Ser Ala Ser Ser Thr His Trp Arg Val Met Ala
165 170 175
Ala Lys Asn Gly Asp Val Ile Thr Val Val Gly Lys Ser Met Gly Arg
180 185 190
Glu Ser Thr Leu Leu Tyr Arg Leu Val Val Val Gln Met Val Ile Gly
195 200 205
Val Leu Ile Leu Ile Ala Ile Leu Ile Gly Ser Phe Phe Leu Val Arg
210 215 220
Arg Ser Leu Lys Pro Leu Arg Glu Val Glu Glu Thr Ala Ser Arg Ile
225 230 235 240
Ala Gly Gly Glu Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr
245 250 255
Glu Val Gly Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu
260 265 270
Gln Thr Ser Ile Met Asn Ala Gln Gln Lys Glu Ala Gln Met Arg Arg
275 280 285
Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val
290 295 300
Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Gln Asp Ala Asp
305 310 315 320
Trp Val Leu Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu
325 330 335
Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu
340 345 350
Lys His Arg Val Asp Met Leu Glu Leu Ala Leu Ala Val Arg Gly Ser
355 360 365
Leu Lys Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ala Asn Arg Ser
370 375 380
Glu Asn Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val
385 390 395 400
Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Glu Ala
405 410 415
Glu Val Asn Ile Gln Val Glu Thr Ala Asp Asp Lys Val Lys Ile Leu
420 425 430
Val Ile Asp Asn Gly Val Gly Met Ser Lys Glu Asp Ala Glu His Ile
435 440 445
Phe Glu Arg Phe Tyr Arg Ala Asp Thr Ser Arg Ser Arg Ala Ser Gly
450 455 460
Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His
465 470 475 480
Gly Gly Thr Ile Thr Val Asp Ser Glu Leu Gly Lys Gly Thr Val Phe
485 490 495
Ser Ile Ile Leu Pro Ala Ala Glu
500
<210> 57
<211> 458
<212> PRT
<213> Corynebacterium crenatum
<400> 57
Ile Gly Pro Ile Arg Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg
1 5 10 15
Ile Ile Leu Ile Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn
20 25 30
Ala Ile Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met
35 40 45
Asp Gln Glu Leu Glu Thr Ser Met Gly Thr Trp Ala His Asn Val Glu
50 55 60
Leu Phe Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr
65 70 75 80
Val Ala Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala
85 90 95
Gln Ser Ala Pro Asp Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His
100 105 110
Thr Val Asp Ala Ala Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val
115 120 125
Met Ala Glu Lys Asn Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met
130 135 140
Gly Arg Glu Thr Asn Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile
145 150 155 160
Ile Gly Ala Leu Ile Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu
165 170 175
Val Arg Arg Ser Leu Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr
180 185 190
Arg Ile Ala Gly Gly Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met
195 200 205
Thr Thr Glu Val Gly Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu
210 215 220
Gln Leu Gln Ala Ser Ile Leu Ser Ala Gln Gln Lys Glu Ala Gln Met
225 230 235 240
Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr
245 250 255
Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp
260 265 270
Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser
275 280 285
Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln
290 295 300
Met Glu Lys His Arg Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg
305 310 315 320
Gly Ser Met Arg Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn
325 330 335
Lys Ala Ala Ser Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His
340 345 350
Gln Val Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro
355 360 365
Asp Ala Glu Val Ser Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg
370 375 380
Ile Leu Val Ala Asp Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln
385 390 395 400
His Ile Phe Glu Arg Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala
405 410 415
Ser Gly Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu
420 425 430
Gly His Gly Gly Thr Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr
435 440 445
Val Phe Thr Ile Thr Leu Pro Ala Val Ser
450 455
<210> 58
<211> 471
<212> PRT
<213> Corynebacterium efficiens
<400> 58
Met Thr Ala Pro Glu Asn Pro His Ala Gln Val Thr Pro Val Gly Arg
1 5 10 15
Phe Arg Gln Ala Ala Arg Gly Val Pro Leu Arg Thr Arg Ile Ile Leu
20 25 30
Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala
35 40 45
Val Ser Ser Leu Met Arg Glu Val Ser Tyr Ser Arg Met Asp Gln Glu
50 55 60
Leu Glu Ser Ala Met Asn Ser Trp Ala Gln Thr Ala Glu Leu Phe Gly
65 70 75 80
Ser Ile Thr Leu Gly Pro Pro Ser Asp Tyr Tyr Val Val Arg Ile Phe
85 90 95
Pro Asp Gly Ser His Met Val Phe Asn Gln Ser Asp Ser Ala Pro Asp
100 105 110
Leu Gly Glu Thr Thr Ile Gly Ile Gly Pro His Thr Ala Ser Ala Ala
115 120 125
Pro Gly Ser Ser Ser Ser Val Pro Trp Arg Val Ile Ala Ile Ser Asp
130 135 140
Asn Gly Thr Ile Thr Val Val Gly Lys Ser Leu Ala Pro Glu Ser Met
145 150 155 160
Leu Leu Tyr Arg Leu Val Ile Val Gln Leu Val Ile Gly Met Leu Ile
165 170 175
Val Val Ala Ile Leu Leu Ser Ser Leu Tyr Leu Val Asn Arg Ser Leu
180 185 190
Arg Pro Leu Arg Glu Val Glu Lys Thr Ala Lys Ser Ile Ala Gly Gly
195 200 205
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
210 215 220
Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
225 230 235 240
Ile Leu Ser Ala Gln Glu Lys Glu Ser Gln Met Arg Arg Phe Val Gly
245 250 255
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Tyr
260 265 270
Ser Glu Leu Tyr His Ser Gly Ala Thr Arg Asp Ala Asp Trp Val Leu
275 280 285
Ser Lys Ile Ser Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
290 295 300
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys Arg Pro
305 310 315 320
Val Asp Val Leu Glu Leu Ser Leu Ser Val Ala Ser Ser Met Arg Ala
325 330 335
Ala Trp Pro Glu Arg Ser Ile Thr Val Val Asn Lys Thr Gly Ser Leu
340 345 350
Pro Val Val Glu Gly Asp Ala Thr Arg Leu His Gln Val Leu Thr Asn
355 360 365
Leu Val Asn Asn Gly Leu Asn His Gly Gly Pro Asp Ala Ser Val Glu
370 375 380
Ile Glu Ile Ser Ala Glu Gly Gly Ser Val Leu Val Arg Val Val Asp
385 390 395 400
Asp Gly Val Gly Met Thr Ala Glu Asp Ala Gln His Ile Phe Glu Arg
405 410 415
Phe Tyr Arg Thr Asp Thr Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
420 425 430
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Arg Gly Thr
435 440 445
Ile Thr Val Asp Ser Glu Val Gly Glu Gly Thr Val Phe Thr Ile Thr
450 455 460
Leu Pro Ser Arg Met Glu Asp
465 470
<210> 59
<211> 65
<212> PRT
<213> Corynebacterium glutamicum
<400> 59
Gln Met Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro
1 5 10 15
Leu Thr Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr
20 25 30
Asp Asp Ala Asn Cys Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg
35 40 45
Met Ser Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly
50 55 60
Gln
65
<210> 60
<211> 65
<212> PRT
<213> Corynebacterium glutamicum
<400> 60
Gln Met Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro
1 5 10 15
Leu Thr Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr
20 25 30
Asp Asp Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg
35 40 45
Met Ser Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly
50 55 60
Gln
65
<210> 61
<211> 65
<212> PRT
<213> Corynebacterium glutamicum
<400> 61
Gln Met Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro
1 5 10 15
Leu Thr Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr
20 25 30
Asp Asp Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg
35 40 45
Met Ser Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly
50 55 60
Gln
65
<210> 62
<211> 65
<212> PRT
<213> Corynebacterium glutamicum
<400> 62
Gln Met Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro
1 5 10 15
Leu Thr Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr
20 25 30
Asp Asp Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg
35 40 45
Met Ser Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly
50 55 60
Gln
65
<210> 63
<211> 65
<212> PRT
<213> Corynebacterium glutamicum
<400> 63
Gln Met Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro
1 5 10 15
Leu Thr Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr
20 25 30
Asp Asp Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg
35 40 45
Met Ser Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly
50 55 60
Gln
65
<210> 64
<211> 65
<212> PRT
<213> Corynebacterium callunae
<400> 64
Gln Met Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro
1 5 10 15
Leu Thr Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr
20 25 30
Gln Asp Ala Asp Trp Val Leu Ser Lys Ile Gly Gly Glu Ala Gln Arg
35 40 45
Met Ser Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly
50 55 60
Gln
65
<210> 65
<211> 65
<212> PRT
<213> Corynebacterium crenatum
<400> 65
Gln Met Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro
1 5 10 15
Leu Thr Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr
20 25 30
Asp Asp Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg
35 40 45
Met Ser Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly
50 55 60
Gln
65
<210> 66
<211> 65
<212> PRT
<213> Corynebacterium efficiens
<400> 66
Gln Met Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro
1 5 10 15
Leu Thr Ser Val Lys Gly Tyr Ser Glu Leu Tyr His Ser Gly Ala Thr
20 25 30
Arg Asp Ala Asp Trp Val Leu Ser Lys Ile Ser Gly Glu Ala Gln Arg
35 40 45
Met Ser Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly
50 55 60
Gln
65
<210> 67
<211> 1500
<212> DNA
<213> Corynebacterium glutamicum
<400> 67
atgtttaaca accgtatccg cactgcagct ctcgctggtg caatcgcaat ctccaccgca 60
gcttccggcg tagctatccc agcattcgct caggagacca acccaacctt caacatcaac 120
aacggcttca acgatgctga tggatccacc atccagccag ttgagccagt taaccacacc 180
gaggaaaccc tccgcgacct gactgactcc accggcgctt acctggaaga gttccagtac 240
ggcaacgttg aggaaatcgt tgaagcatac ctgcaggttc aggcttccgc agacggattc 300
gatccttctg agcaggctgc ttacgaggct ttcgaggctg ctcgcgttcg tgcatcccag 360
gagctcgcgg cttccgctga gaccatcact aagacccgcg agtccgttgc ttacgcactc 420
aaggctgacc gcgaagctac cgcagctttc gaggcttacc tcagcgctct tcgtcaggtt 480
tcagtcatca acgatctgat cgctgatgct aacgccaaga acaagactga ctttgcagag 540
atcgagctct acgatgttct ttacaccgac gccgacatct ctggcgatgc tccacttctt 600
gctcctgcat acaaggagct gaaggacctt caggctgagg ttgacgcaga cttcgagtgg 660
ttgggcgagt tcgcaattga taacaatgaa gacaactacg tcattcgtac tcacatccct 720
gctgtagagg cactcaaggc agcgatcgat tcactggtcg acaccgttga gccacttcgt 780
gcagacgcta tcgctaagaa catcgaggct cagaagtctg acgttctggt tccccagctc 840
ttcctcgagc gtgcaactgc acagcgcgac accctgcgtg ttgtagaggc aatcttctct 900
acctctgctc gttacgttga actctacgag aacgtcgaga acgttaacgt tgagaacaag 960
acccttcgcc agcactactc ttccctgatc cctaacctct tcatcgcagc ggttggcaac 1020
atcaacgagc tcaacaatgc agatcaggct gcacgtgagc tcttcctcga ttgggacacc 1080
gacctcacca ccaacgatga ggacgaagct tactaccagg ctaagctcga cttcgctatc 1140
gagacctacg caaagatcct gatcaacggt gaagtttggc aggagccact cgcttacgtc 1200
cagaacctgg atgcaggcgc acgtcaggaa gcagctgacc gcgaagcaga gcgcgcagct 1260
gacgcagcat accgcgctga gcagctccgc atcgctcagg aagcagctga cgctcagaag 1320
gctctcgctg aggctcttgc taatgcaggc aacaacgaca acggtggcga caactcctcc 1380
gacgacaagg gaaccggttc ttccgacatc ggaacctggg gacctttcgc agcaattgca 1440
gctatcatcg cagcaatcgc agctatcttc ccattcctct ccggtatcgt taagttctaa 1500
<210> 68
<211> 499
<212> PRT
<213> Corynebacterium glutamicum
<400> 68
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala Gln Glu
20 25 30
Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala Asp Gly
35 40 45
Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu Thr Leu
50 55 60
Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe Gln Tyr
65 70 75 80
Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln Ala Ser
85 90 95
Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala Phe Glu
100 105 110
Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala Glu Thr
115 120 125
Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala Asp Arg
130 135 140
Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg Gln Val
145 150 155 160
Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn Lys Thr
165 170 175
Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp Ala Asp
180 185 190
Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu Leu Lys
195 200 205
Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly Glu Phe
210 215 220
Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His Ile Pro
225 230 235 240
Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp Thr Val
245 250 255
Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala Gln Lys
260 265 270
Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr Ala Gln
275 280 285
Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser Ala Arg
290 295 300
Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu Asn Lys
305 310 315 320
Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe Ile Ala
325 330 335
Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala Ala Arg
340 345 350
Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp Glu Asp
355 360 365
Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr Tyr Ala
370 375 380
Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala Tyr Val
385 390 395 400
Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg Glu Ala
405 410 415
Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg Ile Ala
420 425 430
Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu Ala Asn
435 440 445
Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp Lys Gly
450 455 460
Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala Ile Ala
465 470 475 480
Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser Gly Ile
485 490 495
Val Lys Phe
<210> 69
<211> 318
<212> DNA
<213> Corynebacterium glutamicum
<400> 69
atgtccctcg gaccatggga aattggaatc attgtcctgc tgatcatcgt gctgttcggc 60
gcgaagaagc tgcctgatgc agctcgttcc atcggccgtt ccatgcgcat cttcaagtct 120
gaagtcaaag aaatgaacaa ggacggcgat accccagaac aacagcagca gcctcagcag 180
cagattgcgc ccaaccagat cgaggctcct cagccaaact ttgagcagca ctaccaggga 240
cagcaggttc agcagcctca gaaccctcag acccctgact accgtcagaa ctacgaggat 300
ccaaaccgca cctcttaa 318
<210> 70
<211> 105
<212> PRT
<213> Corynebacterium glutamicum
<400> 70
Met Ser Leu Gly Pro Trp Glu Ile Gly Ile Ile Val Leu Leu Ile Ile
1 5 10 15
Val Leu Phe Gly Ala Lys Lys Leu Pro Asp Ala Ala Arg Ser Ile Gly
20 25 30
Arg Ser Met Arg Ile Phe Lys Ser Glu Val Lys Glu Met Asn Lys Asp
35 40 45
Gly Asp Thr Pro Glu Gln Gln Gln Gln Pro Gln Gln Gln Ile Ala Pro
50 55 60
Asn Gln Ile Glu Ala Pro Gln Pro Asn Phe Glu Gln His Tyr Gln Gly
65 70 75 80
Gln Gln Val Gln Gln Pro Gln Asn Pro Gln Thr Pro Asp Tyr Arg Gln
85 90 95
Asn Tyr Glu Asp Pro Asn Arg Thr Ser
100 105
<210> 71
<211> 471
<212> DNA
<213> Corynebacterium glutamicum
<400> 71
atgttttcta gcgtgggttg gggagagatc ttcctcttag tcgttgtggg ccttgttgtc 60
atcggcccgg aacggttgcc tcgtttgatc caggacgcac gcgctgcgct gctcgctgca 120
cgtaccgcta tcgacaatgc aaagcagtcg ttggacagtg attttggttc ggaatttgat 180
gaaatccgaa agccactaac ccaggttgca cagtacagcc ggatgagccc caagacggcc 240
atcactaagg cgttatttga taatgattcc tcgttcctgg atgactttga tccaaagaag 300
atcatggccg aaggaacaga aggcgaagct cagcgcaaca agcaggcagc tgacaacaat 360
gcgaatgtgg tggaacgtcc agctgatggt tccaccgcac gcccaacgca aaacgatcca 420
aaagacggcc cgaattactc aggtggcgtc tcttggaccg atattattta g 471
<210> 72
<211> 156
<212> PRT
<213> Corynebacterium glutamicum
<400> 72
Met Phe Ser Ser Val Gly Trp Gly Glu Ile Phe Leu Leu Val Val Val
1 5 10 15
Gly Leu Val Val Ile Gly Pro Glu Arg Leu Pro Arg Leu Ile Gln Asp
20 25 30
Ala Arg Ala Ala Leu Leu Ala Ala Arg Thr Ala Ile Asp Asn Ala Lys
35 40 45
Gln Ser Leu Asp Ser Asp Phe Gly Ser Glu Phe Asp Glu Ile Arg Lys
50 55 60
Pro Leu Thr Gln Val Ala Gln Tyr Ser Arg Met Ser Pro Lys Thr Ala
65 70 75 80
Ile Thr Lys Ala Leu Phe Asp Asn Asp Ser Ser Phe Leu Asp Asp Phe
85 90 95
Asp Pro Lys Lys Ile Met Ala Glu Gly Thr Glu Gly Glu Ala Gln Arg
100 105 110
Asn Lys Gln Ala Ala Asp Asn Asn Ala Asn Val Val Glu Arg Pro Ala
115 120 125
Asp Gly Ser Thr Ala Arg Pro Thr Gln Asn Asp Pro Lys Asp Gly Pro
130 135 140
Asn Tyr Ser Gly Gly Val Ser Trp Thr Asp Ile Ile
145 150 155
<210> 73
<211> 945
<212> DNA
<213> Corynebacterium glutamicum
<400> 73
atgtccattg ttgagcacat caaagagttt cgacgccgac ttcttatcgc tctggcgggc 60
atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120
actttgggcg agctgctgag ggatccgtac tgttctctgc ctgctgaatc ccgctgggcc 180
atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240
cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300
ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360
gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420
tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480
gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540
ccactggtga tcggcatgct caacattgtg ggtatcttgc cttacgatgc cattaaagat 600
aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660
gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtaga gcttgccctg 720
cagttctgtc gtttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780
gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840
gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900
ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945
<210> 74
<211> 314
<212> PRT
<213> Corynebacterium glutamicum
<400> 74
Met Ser Ile Val Glu His Ile Lys Glu Phe Arg Arg Arg Leu Leu Ile
1 5 10 15
Ala Leu Ala Gly Ile Leu Val Gly Thr Ile Ile Gly Phe Ile Trp Tyr
20 25 30
Asp Phe Ser Phe Trp Gln Ile Pro Thr Leu Gly Glu Leu Leu Arg Asp
35 40 45
Pro Tyr Cys Ser Leu Pro Ala Glu Ser Arg Trp Ala Met Ser Asp Ser
50 55 60
Glu Glu Cys Arg Leu Leu Ala Thr Gly Pro Phe Asp Pro Phe Met Leu
65 70 75 80
Arg Leu Lys Val Ala Ala Leu Val Gly Met Val Leu Gly Ser Pro Val
85 90 95
Trp Leu Ser Gln Leu Trp Gly Phe Ile Thr Pro Gly Leu Met Lys Asn
100 105 110
Glu Arg Arg Tyr Thr Ala Ile Phe Val Thr Ile Ala Val Val Leu Phe
115 120 125
Val Gly Gly Ala Val Leu Ala Tyr Phe Val Val Ala Tyr Gly Leu Glu
130 135 140
Phe Leu Leu Thr Ile Gly Gly Asp Thr Gln Ala Ala Ala Leu Thr Gly
145 150 155 160
Asp Lys Tyr Phe Gly Phe Leu Leu Ala Leu Leu Ala Ile Phe Gly Val
165 170 175
Ser Phe Glu Val Pro Leu Val Ile Gly Met Leu Asn Ile Val Gly Ile
180 185 190
Leu Pro Tyr Asp Ala Ile Lys Asp Lys Arg Arg Met Ile Ile Met Ile
195 200 205
Leu Phe Val Phe Ala Ala Phe Met Thr Pro Gly Gln Asp Pro Phe Thr
210 215 220
Met Leu Val Leu Ala Leu Ser Leu Thr Val Leu Val Glu Leu Ala Leu
225 230 235 240
Gln Phe Cys Arg Phe Asn Asp Lys Arg Arg Asp Lys Lys Arg Pro Glu
245 250 255
Trp Leu Asp Gly Asp Asp Leu Ser Ala Ser Pro Leu Asp Thr Ser Ala
260 265 270
Gly Gly Glu Asp Ala Pro Ser Pro Val Glu Thr Pro Glu Ala Val Glu
275 280 285
Pro Ser Arg Met Leu Asn Pro Ser Gly Glu Ala Ser Ile Ser Tyr Lys
290 295 300
Pro Gly Arg Ala Asp Phe Gly Asp Val Leu
305 310
<210> 75
<211> 39
<212> PRT
<213> Escherichia coli
<400> 75
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala
35
<210> 76
<211> 27
<212> PRT
<213> Escherichia coli
<400> 76
Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu
1 5 10 15
Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala
20 25
<210> 77
<211> 48
<212> PRT
<213> Bacillus subtilis
<400> 77
Met Ala Tyr Asp Ser Arg Phe Asp Glu Trp Val Gln Lys Leu Lys Glu
1 5 10 15
Glu Ser Phe Gln Asn Asn Thr Phe Asp Arg Arg Lys Phe Ile Gln Gly
20 25 30
Ala Gly Lys Ile Ala Gly Leu Ser Leu Gly Leu Thr Ile Ala Gln Ser
35 40 45
<210> 78
<211> 34
<212> PRT
<213> Bacillus subtilis
<400> 78
Met Lys Phe Val Lys Arg Arg Thr Thr Ala Leu Val Thr Thr Leu Met
1 5 10 15
Leu Ser Val Thr Ser Leu Phe Ala Leu Gln Pro Ser Ala Lys Ala Ala
20 25 30
Glu His
<210> 79
<211> 30
<212> PRT
<213> Arthrobacter globiformis
<400> 79
Met Met Asn Leu Ser Arg Arg Thr Leu Leu Thr Thr Gly Ser Ala Ala
1 5 10 15
Thr Leu Ala Tyr Ala Leu Gly Met Ala Gly Ser Ala Gln Ala
20 25 30
<210> 80
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Twin-Arginine Motif
<220>
<221> misc_feature
<222> (1)..(1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 80
Xaa Arg Arg Xaa Phe Leu Lys
1 5
<210> 81
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Twin-Arginine Motif
<220>
<221> misc_feature
<222> (3)..(5)
<223> Xaa can be any naturally occurring amino acid
<400> 81
Arg Arg Xaa Xaa Xaa
1 5
<210> 82
<211> 43
<212> PRT
<213> Corynebacterium glutamicum
<400> 82
Met Arg Asp Thr Ala Phe Arg Ser Ile Lys Ala Lys Ala Gln Ala Lys
1 5 10 15
Arg Arg Ser Leu Trp Ile Ala Ala Gly Ala Val Pro Thr Ala Ile Ala
20 25 30
Leu Thr Met Ser Leu Ala Pro Met Ala Ser Ala
35 40
<210> 83
<211> 30
<212> PRT
<213> Corynebacterium glutamicum
<400> 83
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala
20 25 30
<210> 84
<211> 25
<212> PRT
<213> Corynebacterium stationis
<400> 84
Met Lys Arg Met Lys Ser Leu Ala Ala Ala Leu Thr Val Ala Gly Ala
1 5 10 15
Met Leu Ala Ala Pro Val Ala Thr Ala
20 25
<210> 85
<211> 469
<212> PRT
<213> Corynebacterium glutamicum
<400> 85
Gln Glu Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala
1 5 10 15
Asp Gly Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu
20 25 30
Thr Leu Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe
35 40 45
Gln Tyr Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln
50 55 60
Ala Ser Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala
65 70 75 80
Phe Glu Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala
85 90 95
Glu Thr Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala
100 105 110
Asp Arg Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg
115 120 125
Gln Val Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn
130 135 140
Lys Thr Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp
145 150 155 160
Ala Asp Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu
165 170 175
Leu Lys Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly
180 185 190
Glu Phe Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His
195 200 205
Ile Pro Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp
210 215 220
Thr Val Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala
225 230 235 240
Gln Lys Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr
245 250 255
Ala Gln Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser
260 265 270
Ala Arg Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu
275 280 285
Asn Lys Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe
290 295 300
Ile Ala Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala
305 310 315 320
Ala Arg Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp
325 330 335
Glu Asp Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr
340 345 350
Tyr Ala Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala
355 360 365
Tyr Val Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg
370 375 380
Glu Ala Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg
385 390 395 400
Ile Ala Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu
405 410 415
Ala Asn Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp
420 425 430
Lys Gly Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala
435 440 445
Ile Ala Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser
450 455 460
Gly Ile Val Lys Phe
465
<210> 86
<211> 4
<212> PRT
<213> Corynebacterium glutamicum
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa is Asn, Gly, Thr, Pro, or Ala
<400> 86
Gln Glu Thr Xaa
1
<210> 87
<211> 5
<212> PRT
<213> Corynebacterium glutamicum
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Asn, Gly, Thr, Pro, or Ala
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa is Pro, Thr, or Val
<400> 87
Gln Glu Thr Xaa Xaa
1 5
<210> 88
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Asn, Gly, Thr, Pro, or Ala
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa is Pro, Thr, or Val
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa is Thr or Tyr
<400> 88
Gln Glu Thr Xaa Xaa Xaa
1 5
<210> 89
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 89
Gln Glu Thr Asn Pro Thr
1 5
<210> 90
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 90
Gln Glu Thr Gly Thr Tyr
1 5
<210> 91
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 91
Gln Glu Thr Thr Val Thr
1 5
<210> 92
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 92
Gln Glu Thr Pro Val Thr
1 5
<210> 93
<211> 6
<212> PRT
<213> Corynebacterium glutamicum
<400> 93
Gln Glu Thr Ala Val Thr
1 5
<210> 94
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Factor Xa
<400> 94
Ile Glu Gly Arg
1
<210> 95
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> ProTEV
<400> 95
Glu Asn Leu Tyr Phe Gln
1 5
<210> 96
<211> 708
<212> DNA
<213> Corynebacterium glutamicum
<400> 96
atggacaacc agtctgacgg acaaatccgc gtactcgtcg ttgatgacga gccaaacatc 60
gtcgagctgc tcaccgtaag ccttaaattc caaggcttcg cagtgatgac cgccaacgat 120
ggcaatgaag ccctgaagat tgctcgtgag ttccgtccag acgcatacat cctcgatgtc 180
atgatgccag gaatggacgg cttcgagctg ctgaccaagc tgcgcggcga aggccttgac 240
agcccagttc tgtacctcac cgcaaaggat gccgtggagc accgcatcca cggcctgacc 300
atcggcgctg acgactacgt gaccaagcct ttctccctgg aagaagtaat cacccgcctg 360
cgcgtgattc ttcgtcgcgg tggagcagtt gaagaagaca cctcaacttc cctgcagtac 420
gcagacctca ccctcaacga tgaaacccac gaggtcacca aggctggcga actgatcgat 480
ctttccccaa ctgaattcaa cctcctgcgc tacctcatgc tcaacgctga agtggtgctg 540
tccaaggcaa agatcctgga taacgtgtgg cactacgatt ttggtggcga cggcaacgtc 600
gtggaatcct acatctccta cctgcgccgc aaggtggaca cccaggatcc gcagctaatt 660
cagactgttc gtggcgttgg atatgttctg cgcaccccac gtagctaa 708
<210> 97
<211> 235
<212> PRT
<213> Corynebacterium glutamicum
<400> 97
Met Asp Asn Gln Ser Asp Gly Gln Ile Arg Val Leu Val Val Asp Asp
1 5 10 15
Glu Pro Asn Ile Val Glu Leu Leu Thr Val Ser Leu Lys Phe Gln Gly
20 25 30
Phe Ala Val Met Thr Ala Asn Asp Gly Asn Glu Ala Leu Lys Ile Ala
35 40 45
Arg Glu Phe Arg Pro Asp Ala Tyr Ile Leu Asp Val Met Met Pro Gly
50 55 60
Met Asp Gly Phe Glu Leu Leu Thr Lys Leu Arg Gly Glu Gly Leu Asp
65 70 75 80
Ser Pro Val Leu Tyr Leu Thr Ala Lys Asp Ala Val Glu His Arg Ile
85 90 95
His Gly Leu Thr Ile Gly Ala Asp Asp Tyr Val Thr Lys Pro Phe Ser
100 105 110
Leu Glu Glu Val Ile Thr Arg Leu Arg Val Ile Leu Arg Arg Gly Gly
115 120 125
Ala Val Glu Glu Asp Thr Ser Thr Ser Leu Gln Tyr Ala Asp Leu Thr
130 135 140
Leu Asn Asp Glu Thr His Glu Val Thr Lys Ala Gly Glu Leu Ile Asp
145 150 155 160
Leu Ser Pro Thr Glu Phe Asn Leu Leu Arg Tyr Leu Met Leu Asn Ala
165 170 175
Glu Val Val Leu Ser Lys Ala Lys Ile Leu Asp Asn Val Trp His Tyr
180 185 190
Asp Phe Gly Gly Asp Gly Asn Val Val Glu Ser Tyr Ile Ser Tyr Leu
195 200 205
Arg Arg Lys Val Asp Thr Gln Asp Pro Gln Leu Ile Gln Thr Val Arg
210 215 220
Gly Val Gly Tyr Val Leu Arg Thr Pro Arg Ser
225 230 235
Claims (26)
- 이종 단백질의 분비 발현용 유전자 구축물을 갖는 코리네형 세균을 배양하고, 분비 생산된 이종 단백질을 회수하는 것을 포함하는 이종 단백질의 제조 방법으로서,
상기 코리네형 세균이 변이형 PhoS 단백질을 코드하는 phoS 유전자를 유지하도록 개변되어 있고,
상기 변이형 PhoS 단백질이 이종 단백질의 분비 생산량을 향상시키는 변이를 갖는 PhoS 단백질이고,
상기 유전자 구축물이 5'에서 3' 방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 시그널 펩타이드를 코드하는 핵산 서열, 및 이종 단백질을 코드하는 핵산 서열을 포함하고,
상기 이종 단백질이 상기 시그널 펩타이드와의 융합 단백질로서 발현되는, 방법. - 제1항에 있어서, 상기 변이가, 야생형 PhoS 단백질에 있어서 자기 인산화되는 히스티딘 잔기 이외의 아미노산 잔기가 다른 아미노산 잔기로 치환되는 변이인, 방법.
- 제1항에 있어서, 상기 변이가, 야생형 PhoS 단백질에 있어서 자기 인산화되는 히스티딘 잔기 이외의 HisKA 도메인의 아미노산 잔기가 다른 아미노산 잔기로 치환되는 변이인, 방법.
- 제1항에 있어서, 상기 변이가, 야생형 PhoS 단백질에 있어서 서열번호 4의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기가 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환되는 변이인, 방법.
- 이종 단백질의 분비 발현용 유전자 구축물을 갖는 코리네형 세균을 배양하고, 분비 생산된 이종 단백질을 회수하는 것을 포함하는 이종 단백질의 제조 방법으로서,
상기 코리네형 세균이 변이형 PhoS 단백질을 코드하는 phoS 유전자를 유지하도록 개변되어 있고,
상기 변이형 PhoS 단백질이, 야생형 PhoS 단백질에 있어서 서열번호 4의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기가 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환되는 변이를 갖는 PhoS 단백질이고,
상기 유전자 구축물이 5'에서 3' 방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 시그널 펩타이드를 코드하는 핵산 서열, 및 이종 단백질을 코드하는 핵산 서열을 포함하고,
상기 이종 단백질이 상기 시그널 펩타이드와의 융합 단백질로서 발현되는, 방법. - 제4항 또는 제5항에 있어서, 상기 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가 리신 잔기, 알라닌 잔기, 발린 잔기, 세린 잔기, 시스테인 잔기, 메티오닌 잔기, 아스파라긴산 잔기 또는 아스파라긴 잔기인, 방법.
- 제2항 내지 제6항 중 어느 한 항에 있어서, 상기 야생형 PhoS 단백질이 하기 (a), (b) 또는 (c)에 기재된 단백질인, 방법:
(a) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 또는 부가를 포함하는 아미노산 서열을 포함하는 단백질;
(c) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하는 단백질. - 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 시그널 펩타이드가 Tat계 의존 시그널 펩타이드인, 방법.
- 제8항에 있어서, 상기 Tat계 의존 시그널 펩타이드가 TorA 시그널 펩타이드, SufI 시그널 펩타이드, PhoD 시그널 펩타이드, LipA 시그널 펩타이드 및 IMD 시그널 펩타이드로 이루어지는 그룹으로부터 선택되는, 방법.
- 제8항 또는 제9항에 있어서, 상기 코리네형 세균이 또한, Tat계 분비 장치를 코드하는 유전자로부터 선택되는 1 또는 그 이상의 유전자의 발현이 상승하도록 개변되어 있는, 방법.
- 제10항에 있어서, 상기 Tat계 분비 장치를 코드하는 유전자가 tatA 유전자, tatB 유전자, tatC 유전자 및 tatE 유전자로 이루어지는, 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 시그널 펩타이드가 Sec계 의존 시그널 펩타이드인, 방법.
- 제12항에 있어서, 상기 Sec계 의존 시그널 펩타이드가 PS1 시그널 펩타이드, PS2 시그널 펩타이드 및 SlpA 시그널 펩타이드로 이루어지는 그룹으로부터 선택되는, 방법.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 유전자 구축물이, 코리네형 세균에서 기능하는 시그널 펩타이드를 코드하는 핵산 서열과 이종 단백질을 코드하는 핵산 서열 사이에, 또한 Gln-Glu-Thr을 포함하는 아미노산 서열을 코드하는 핵산 서열을 포함하는, 방법.
- 제14항에 있어서, 상기 유전자 구축물이, Gln-Glu-Thr을 포함하는 아미노산 서열을 코드하는 핵산 서열과 이종 단백질을 코드하는 핵산 서열 사이에, 또한 효소적 절단에 사용되는 아미노산 서열을 코드하는 핵산 서열을 포함하는, 방법.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 코리네형 세균이 코리네박테리움속 세균인, 방법.
- 제16항에 있어서, 상기 코리네형 세균이 코리네박테리움·글루타미컴(Corynebacterium glutamicum)인, 방법.
- 제17항에 있어서, 상기 코리네형 세균이 코리네박테리움·글루타미컴 AJ12036(FERM BP-734) 또는 ATCC13869로부터 유래하는 개변주인, 방법.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 코리네형 세균이 세포 표층 단백질의 활성이 저하되어 있는 코리네형 세균인, 방법.
- 변이형 PhoS 단백질을 코드하는 phoS 유전자를 유지하도록 개변된 코리네형 세균으로서,
상기 변이형 PhoS 단백질이, 야생형 PhoS 단백질에 있어서 서열번호 4의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기가 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환되는 변이를 갖는 PhoS 단백질인, 코리네형 세균. - 제20항에 있어서, 상기 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가 리신 잔기, 알라닌 잔기, 발린 잔기, 세린 잔기, 시스테인 잔기, 메티오닌 잔기, 아스파라긴산 잔기 또는 아스파라긴 잔기인, 코리네형 세균.
- 제20항 또는 제21항에 있어서, 상기 야생형 PhoS 단백질이 하기 (a), (b) 또는 (c)에 기재된 단백질인, 코리네형 세균:
(a) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 또는 부가를 포함하는 아미노산 서열을 포함하는 단백질;
(c) 서열번호 4, 54, 55, 56, 57 또는 58에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하는 단백질. - 제20항 내지 제22항 중 어느 한 항에 있어서, 코리네박테리움속 세균인, 코리네형 세균.
- 제23항에 있어서, 코리네박테리움·글루타미컴인, 코리네형 세균.
- 제24항에 있어서, 코리네박테리움·글루타미컴 AJ12036(FERM BP-734) 또는 ATCC13869로부터 유래하는 개변주인, 코리네형 세균.
- 제20항 내지 제25항 중 어느 한 항에 있어서, 세포 표층 단백질의 활성이 저하되어 있는, 코리네형 세균.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2015-089046 | 2015-04-24 | ||
JP2015089046 | 2015-04-24 | ||
PCT/JP2016/062675 WO2016171224A1 (ja) | 2015-04-24 | 2016-04-21 | タンパク質の分泌生産法 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170140351A true KR20170140351A (ko) | 2017-12-20 |
KR102619848B1 KR102619848B1 (ko) | 2024-01-04 |
Family
ID=57143158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177034151A KR102619848B1 (ko) | 2015-04-24 | 2016-04-21 | 단백질의 분비 생산법 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10538798B2 (ko) |
EP (1) | EP3287523B1 (ko) |
JP (1) | JP6741000B2 (ko) |
KR (1) | KR102619848B1 (ko) |
CN (1) | CN107532163A (ko) |
AU (1) | AU2016253217B2 (ko) |
DK (1) | DK3287523T3 (ko) |
WO (1) | WO2016171224A1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2017347017B2 (en) | 2016-10-21 | 2021-10-28 | Ajinomoto Co., Inc. | Protein secretory production method |
AU2017347016B2 (en) | 2016-10-21 | 2021-09-23 | Ajinomoto Co., Inc. | Secretory production method for protein |
WO2019078095A1 (en) | 2017-10-16 | 2019-04-25 | Ajinomoto Co., Inc. | PROCESS FOR PRODUCTION OF PROTEIN HAVING ALPHA-HYDROXYLANTIC PEPTIDYLGLYCIN MONOOXYGENASE ACTIVITY |
CN108330095B (zh) * | 2018-03-01 | 2020-12-29 | 江南大学 | 一种积累n-乙酰神经氨酸的重组谷氨酸棒杆菌及其应用 |
EP3783106A4 (en) * | 2018-04-20 | 2022-01-05 | Ajinomoto Co., Inc. | PROCESS FOR THE SECRETION OF A PROTEIN |
CN110511953B (zh) * | 2018-08-31 | 2022-09-30 | 江南大学 | 一种适用于谷氨酸棒杆菌的重组表达载体、外源蛋白表达系统、应用和木聚糖酶的制备方法 |
WO2020071538A1 (en) | 2018-10-05 | 2020-04-09 | Ajinomoto Co., Inc. | Method for producing target substance by bacterial fermentation |
JP7375767B2 (ja) * | 2018-10-25 | 2023-11-08 | 味の素株式会社 | タンパク質の分泌生産法 |
JPWO2020090979A1 (ja) | 2018-10-31 | 2021-09-24 | 味の素株式会社 | 抗体に対する親和性物質、切断性部分および反応性基を有する化合物またはその塩 |
CN111434770B (zh) * | 2019-01-11 | 2022-12-06 | 华东师范大学 | 蛋白质谷氨酰胺酶酶原在枯草芽孢杆菌中的表达和自加工 |
KR20220110556A (ko) | 2019-12-06 | 2022-08-08 | 아지노모토 가부시키가이샤 | 생리 활성을 갖는 펩타이드의 제조 방법 및 단쇄 링커를 포함하는 펩타이드 |
WO2023282315A1 (ja) | 2021-07-07 | 2023-01-12 | 味の素株式会社 | 非天然アミノ酸含有タンパク質の分泌生産法 |
EP4417684A1 (en) * | 2021-10-11 | 2024-08-21 | Ajinomoto Co., Inc. | Bacterium modified to express heterologous tat protein |
WO2024172163A1 (ja) * | 2023-02-16 | 2024-08-22 | 味の素株式会社 | タンパク質の分泌生産法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4965197A (en) | 1987-06-12 | 1990-10-23 | Massachusetts Institute Of Technology | Coryneform expression and secretion system |
WO2004035792A1 (en) * | 2002-10-16 | 2004-04-29 | Celltech R & D Limited | E.coli host cells with modified phos/psts periplasmic phosphate-binding proteins, and method of manufacturing recombinant fabs |
US20070184525A1 (en) * | 2004-04-20 | 2007-08-09 | Masayo Date | Method of producing proteins |
JP4320769B2 (ja) | 1999-09-30 | 2009-08-26 | 味の素株式会社 | トランスグルタミナーゼの製造法 |
JP4362651B2 (ja) | 2001-03-30 | 2009-11-11 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013062029A1 (ja) | 2011-10-25 | 2013-05-02 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013065869A1 (en) | 2011-11-02 | 2013-05-10 | Ajinomoto Co.,Inc. | Method for secretory production of protein |
WO2013065772A1 (ja) | 2011-11-02 | 2013-05-10 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013118544A1 (ja) | 2012-02-08 | 2013-08-15 | 味の素株式会社 | タンパク質の分泌生産法 |
JP6502548B2 (ja) | 2013-03-28 | 2019-04-17 | 株式会社半導体エネルギー研究所 | 発光素子 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS592689A (ja) * | 1982-06-04 | 1984-01-09 | Handai Biseibutsubiyou Kenkyukai | 強力な遺伝子発現能を有する新規レプリコンの作成法 |
EP0551506A1 (fr) | 1991-07-30 | 1993-07-21 | Orsan | Systeme d'expression et de secretion de proteines utilisables en particulier chez les corynebacteries |
JPH11169182A (ja) | 1997-12-10 | 1999-06-29 | Mitsubishi Chemical Corp | コリネ型細菌内で蛋白質を効率よく培地中へ分泌させる変異型分泌装置遺伝子 |
CN100554431C (zh) * | 2004-04-20 | 2009-10-28 | 味之素株式会社 | 生产蛋白质的方法 |
EP2080769A3 (en) * | 2004-07-02 | 2010-12-01 | Metanomics GmbH | Process for the production of fine chemicals |
BRPI0512818A (pt) * | 2004-07-02 | 2007-10-23 | Metanomics Gmbh | processos para a produção do respectivo produto quìmico fino e de um polipeptìdeo e para a identificação de um composto conferindo produção incrementada do respectivo produto quìmico fino, molécula de ácido nucleico isolada, construção de ácido nucleico, vetor, célula hospedeira, polipeptìdeo, anticorpo, tecido de planta, material de propagação, material colhido ou uma planta. métodos para selecionar agonistas e antagonistas da atividade de um polipeptìdeo, para identificar um produto gênico e para produzir uma composição agrìcola, composição e usos de uma molécula de ácido nucleico e de um polipeptìdeo e célula de planta, organela de célula de planta, tecido de planta, planta ou parte da mesma |
CN102517280A (zh) * | 2007-01-31 | 2012-06-27 | 菲尼克斯股份有限公司 | 用于提高表达的细菌前导序列 |
-
2016
- 2016-04-21 WO PCT/JP2016/062675 patent/WO2016171224A1/ja unknown
- 2016-04-21 DK DK16783245.0T patent/DK3287523T3/da active
- 2016-04-21 AU AU2016253217A patent/AU2016253217B2/en active Active
- 2016-04-21 KR KR1020177034151A patent/KR102619848B1/ko active IP Right Grant
- 2016-04-21 CN CN201680023752.7A patent/CN107532163A/zh active Pending
- 2016-04-21 JP JP2017514190A patent/JP6741000B2/ja active Active
- 2016-04-21 EP EP16783245.0A patent/EP3287523B1/en active Active
-
2017
- 2017-10-23 US US15/790,495 patent/US10538798B2/en active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4965197A (en) | 1987-06-12 | 1990-10-23 | Massachusetts Institute Of Technology | Coryneform expression and secretion system |
JP4320769B2 (ja) | 1999-09-30 | 2009-08-26 | 味の素株式会社 | トランスグルタミナーゼの製造法 |
JP4362651B2 (ja) | 2001-03-30 | 2009-11-11 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2004035792A1 (en) * | 2002-10-16 | 2004-04-29 | Celltech R & D Limited | E.coli host cells with modified phos/psts periplasmic phosphate-binding proteins, and method of manufacturing recombinant fabs |
US20070184525A1 (en) * | 2004-04-20 | 2007-08-09 | Masayo Date | Method of producing proteins |
JP4730302B2 (ja) | 2004-04-20 | 2011-07-20 | 味の素株式会社 | タンパク質の製造法 |
WO2013062029A1 (ja) | 2011-10-25 | 2013-05-02 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013065869A1 (en) | 2011-11-02 | 2013-05-10 | Ajinomoto Co.,Inc. | Method for secretory production of protein |
WO2013065772A1 (ja) | 2011-11-02 | 2013-05-10 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2013118544A1 (ja) | 2012-02-08 | 2013-08-15 | 味の素株式会社 | タンパク質の分泌生産法 |
JP6502548B2 (ja) | 2013-03-28 | 2019-04-17 | 株式会社半導体エネルギー研究所 | 発光素子 |
Non-Patent Citations (11)
Title |
---|
비특허문헌 1: Microbiol. rev., 57, 109-137(1993) |
비특허문헌 10: Appl. Microbiol. Biotechnol., 94, 1131-1150(2012) |
비특허문헌 11: J. Bacteriol., 188, 724-732(2006) |
비특허문헌 2: Biotechnol., 11, 905-910(1993) |
비특허문헌 3: Biotechnol., 6, 1419-1422(1988) |
비특허문헌 4: Biotechnol., 9, 976-981(1991) |
비특허문헌 5: J. Bacteriol., 174, 1854-1861(1992) |
비특허문헌 6: Appl. Environ. Microbiol., 61, 1610-1613(1995) |
비특허문헌 7: Appl. Environ. Microbiol., 63, 4392-4400(1997) |
비특허문헌 8: EMBO J., 14, 2715-2722(1995) |
비특허문헌 9: J. Biol. Chem., 25; 273(52), 34868-74(1998) |
Also Published As
Publication number | Publication date |
---|---|
JPWO2016171224A1 (ja) | 2018-02-22 |
EP3287523B1 (en) | 2022-06-29 |
US20180037918A1 (en) | 2018-02-08 |
AU2016253217B2 (en) | 2021-09-02 |
KR102619848B1 (ko) | 2024-01-04 |
EP3287523A4 (en) | 2018-09-05 |
JP6741000B2 (ja) | 2020-08-19 |
AU2016253217A1 (en) | 2017-11-23 |
EP3287523A1 (en) | 2018-02-28 |
US10538798B2 (en) | 2020-01-21 |
DK3287523T3 (da) | 2022-07-25 |
CN107532163A (zh) | 2018-01-02 |
WO2016171224A9 (ja) | 2017-09-28 |
WO2016171224A1 (ja) | 2016-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102619848B1 (ko) | 단백질의 분비 생산법 | |
KR102337932B1 (ko) | 단백질의 분비 생산법 | |
WO2013118544A1 (ja) | タンパク質の分泌生産法 | |
JP6020581B2 (ja) | タンパク質の分泌生産法 | |
JP6064912B2 (ja) | タンパク質の分泌生産法 | |
JP6136930B2 (ja) | タンパク質の分泌生産法 | |
KR102335301B1 (ko) | 단백질의 분비 생산법 | |
JP2023184699A (ja) | タンパク質の分泌生産法 | |
JP7375767B2 (ja) | タンパク質の分泌生産法 | |
WO2024172163A1 (ja) | タンパク質の分泌生産法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |