KR20180088915A - 향상된 단백질 생산 및 이의 방법 - Google Patents
향상된 단백질 생산 및 이의 방법 Download PDFInfo
- Publication number
- KR20180088915A KR20180088915A KR1020187021108A KR20187021108A KR20180088915A KR 20180088915 A KR20180088915 A KR 20180088915A KR 1020187021108 A KR1020187021108 A KR 1020187021108A KR 20187021108 A KR20187021108 A KR 20187021108A KR 20180088915 A KR20180088915 A KR 20180088915A
- Authority
- KR
- South Korea
- Prior art keywords
- rasp
- gene
- gram
- cells
- gly
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 113
- 230000014616 translation Effects 0.000 title description 15
- 230000001976 improved effect Effects 0.000 title description 13
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 196
- 230000014509 gene expression Effects 0.000 claims abstract description 139
- 230000001580 bacterial effect Effects 0.000 claims abstract description 134
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 113
- 230000001965 increasing effect Effects 0.000 claims abstract description 60
- 210000004027 cell Anatomy 0.000 claims description 424
- 101150073763 rasP gene Proteins 0.000 claims description 183
- 102100030616 Protein-cysteine N-palmitoyltransferase HHAT Human genes 0.000 claims description 142
- 108700026244 Open Reading Frames Proteins 0.000 claims description 60
- 239000013612 plasmid Substances 0.000 claims description 57
- 238000004519 manufacturing process Methods 0.000 claims description 55
- 101150009206 aprE gene Proteins 0.000 claims description 50
- 102000040430 polynucleotide Human genes 0.000 claims description 48
- 108091033319 polynucleotide Proteins 0.000 claims description 48
- 239000002157 polynucleotide Substances 0.000 claims description 48
- 108091005804 Peptidases Proteins 0.000 claims description 46
- 150000007523 nucleic acids Chemical group 0.000 claims description 46
- 102000004190 Enzymes Human genes 0.000 claims description 42
- 108090000790 Enzymes Proteins 0.000 claims description 42
- 229940088598 enzyme Drugs 0.000 claims description 42
- 230000004048 modification Effects 0.000 claims description 39
- 238000012986 modification Methods 0.000 claims description 39
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 39
- 239000004382 Amylase Substances 0.000 claims description 38
- 229920001184 polypeptide Polymers 0.000 claims description 37
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 37
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 36
- 239000004365 Protease Substances 0.000 claims description 36
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 35
- 102000013142 Amylases Human genes 0.000 claims description 34
- 108010065511 Amylases Proteins 0.000 claims description 34
- 235000019418 amylase Nutrition 0.000 claims description 34
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 28
- 230000002759 chromosomal effect Effects 0.000 claims description 28
- 230000000694 effects Effects 0.000 claims description 27
- -1 kitinase Proteins 0.000 claims description 27
- 210000000349 chromosome Anatomy 0.000 claims description 25
- 101150002464 spoVG gene Proteins 0.000 claims description 24
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 19
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 19
- 239000002773 nucleotide Substances 0.000 claims description 16
- 125000003729 nucleotide group Chemical group 0.000 claims description 16
- 102100026189 Beta-galactosidase Human genes 0.000 claims description 15
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 15
- 125000000539 amino acid group Chemical group 0.000 claims description 14
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 claims description 12
- 102100022624 Glucoamylase Human genes 0.000 claims description 12
- 108010018734 hexose oxidase Proteins 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 12
- 108010059820 Polygalacturonase Proteins 0.000 claims description 11
- 108090001060 Lipase Proteins 0.000 claims description 10
- 102000004882 Lipase Human genes 0.000 claims description 10
- 239000004367 Lipase Substances 0.000 claims description 10
- 235000019421 lipase Nutrition 0.000 claims description 10
- 238000012239 gene modification Methods 0.000 claims description 9
- 210000005255 gram-positive cell Anatomy 0.000 claims description 9
- 239000001814 pectin Substances 0.000 claims description 8
- 229920001277 pectin Polymers 0.000 claims description 8
- 235000010987 pectin Nutrition 0.000 claims description 8
- 102000016938 Catalase Human genes 0.000 claims description 7
- 108010053835 Catalase Proteins 0.000 claims description 7
- 108010059892 Cellulase Proteins 0.000 claims description 7
- 102000004157 Hydrolases Human genes 0.000 claims description 7
- 108090000604 Hydrolases Proteins 0.000 claims description 7
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 7
- 108060008539 Transglutaminase Proteins 0.000 claims description 7
- 229940106157 cellulase Drugs 0.000 claims description 7
- 238000012258 culturing Methods 0.000 claims description 7
- 102000003601 transglutaminase Human genes 0.000 claims description 7
- 108010013043 Acetylesterase Proteins 0.000 claims description 6
- 102000004400 Aminopeptidases Human genes 0.000 claims description 6
- 108090000915 Aminopeptidases Proteins 0.000 claims description 6
- 102000005367 Carboxypeptidases Human genes 0.000 claims description 6
- 108010006303 Carboxypeptidases Proteins 0.000 claims description 6
- 102000014914 Carrier Proteins Human genes 0.000 claims description 6
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 claims description 6
- 108010059881 Lactase Proteins 0.000 claims description 6
- 108090000856 Lyases Proteins 0.000 claims description 6
- 102000004317 Lyases Human genes 0.000 claims description 6
- 108010054377 Mannosidases Proteins 0.000 claims description 6
- 102000001696 Mannosidases Human genes 0.000 claims description 6
- 108010083644 Ribonucleases Proteins 0.000 claims description 6
- 102000006382 Ribonucleases Human genes 0.000 claims description 6
- 102000004357 Transferases Human genes 0.000 claims description 6
- 108090000992 Transferases Proteins 0.000 claims description 6
- 108010009043 arylesterase Proteins 0.000 claims description 6
- 102000028848 arylesterase Human genes 0.000 claims description 6
- 108010051210 beta-Fructofuranosidase Proteins 0.000 claims description 6
- 230000005017 genetic modification Effects 0.000 claims description 6
- 235000013617 genetically modified food Nutrition 0.000 claims description 6
- 108010002430 hemicellulase Proteins 0.000 claims description 6
- 229940059442 hemicellulase Drugs 0.000 claims description 6
- 230000001939 inductive effect Effects 0.000 claims description 6
- 239000001573 invertase Substances 0.000 claims description 6
- 235000011073 invertase Nutrition 0.000 claims description 6
- 229940116108 lactase Drugs 0.000 claims description 6
- 229910052751 metal Inorganic materials 0.000 claims description 6
- 239000002184 metal Substances 0.000 claims description 6
- 108010011619 6-Phytase Proteins 0.000 claims description 5
- 108010078791 Carrier Proteins Proteins 0.000 claims description 5
- 108010060309 Glucuronidase Proteins 0.000 claims description 5
- 102000053187 Glucuronidase Human genes 0.000 claims description 5
- 108090000769 Isomerases Proteins 0.000 claims description 5
- 102000004195 Isomerases Human genes 0.000 claims description 5
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 claims description 5
- 108020004410 pectinesterase Proteins 0.000 claims description 5
- 108090000746 Chymosin Proteins 0.000 claims description 4
- 101001096557 Dickeya dadantii (strain 3937) Rhamnogalacturonate lyase Proteins 0.000 claims description 4
- 241000192125 Firmicutes Species 0.000 claims description 4
- 108010056771 Glucosidases Proteins 0.000 claims description 4
- 102000004366 Glucosidases Human genes 0.000 claims description 4
- 102000003992 Peroxidases Human genes 0.000 claims description 4
- 102000003425 Tyrosinase Human genes 0.000 claims description 4
- 108060008724 Tyrosinase Proteins 0.000 claims description 4
- 108010030291 alpha-Galactosidase Proteins 0.000 claims description 4
- 102000005840 alpha-Galactosidase Human genes 0.000 claims description 4
- 229940080701 chymosin Drugs 0.000 claims description 4
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 claims description 4
- 108010072638 pectinacetylesterase Proteins 0.000 claims description 4
- 102000004251 pectinacetylesterase Human genes 0.000 claims description 4
- 108040007629 peroxidase activity proteins Proteins 0.000 claims description 4
- 229940085127 phytase Drugs 0.000 claims description 4
- 108010015776 Glucose oxidase Proteins 0.000 claims description 3
- 239000004366 Glucose oxidase Substances 0.000 claims description 3
- 102100024295 Maltase-glucoamylase Human genes 0.000 claims description 3
- 108010028144 alpha-Glucosidases Proteins 0.000 claims description 3
- 229940116332 glucose oxidase Drugs 0.000 claims description 3
- 235000019420 glucose oxidase Nutrition 0.000 claims description 3
- 230000000593 degrading effect Effects 0.000 claims description 2
- 108010026424 tau Proteins Proteins 0.000 claims description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 3
- 101710130006 Beta-glucanase Proteins 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 34
- 101150084044 P gene Proteins 0.000 abstract 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 165
- 235000018102 proteins Nutrition 0.000 description 103
- 108020004414 DNA Proteins 0.000 description 54
- 102000035195 Peptidases Human genes 0.000 description 42
- 239000013598 vector Substances 0.000 description 35
- 244000063299 Bacillus subtilis Species 0.000 description 31
- 101150090795 tepA gene Proteins 0.000 description 30
- 235000019419 proteases Nutrition 0.000 description 26
- 239000002609 medium Substances 0.000 description 24
- 229960005091 chloramphenicol Drugs 0.000 description 22
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 22
- 238000000855 fermentation Methods 0.000 description 22
- 230000004151 fermentation Effects 0.000 description 22
- 230000028327 secretion Effects 0.000 description 21
- 108091026890 Coding region Proteins 0.000 description 19
- 108010076504 Protein Sorting Signals Proteins 0.000 description 19
- 235000001014 amino acid Nutrition 0.000 description 18
- 230000012010 growth Effects 0.000 description 18
- 102000039446 nucleic acids Human genes 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 17
- 101000842302 Homo sapiens Protein-cysteine N-palmitoyltransferase HHAT Proteins 0.000 description 16
- 101100043081 Bacillus subtilis (strain 168) spoIIIAA gene Proteins 0.000 description 15
- 238000002835 absorbance Methods 0.000 description 15
- 150000001413 amino acids Chemical class 0.000 description 15
- 239000000758 substrate Substances 0.000 description 15
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 239000000243 solution Substances 0.000 description 13
- 229920001817 Agar Polymers 0.000 description 12
- 239000008272 agar Substances 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 12
- 239000001963 growth medium Substances 0.000 description 12
- 238000013518 transcription Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- 235000013305 food Nutrition 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 108010050848 glycylleucine Proteins 0.000 description 10
- 230000002018 overexpression Effects 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 239000011701 zinc Substances 0.000 description 10
- 101100112372 Acinetobacter baylyi (strain ATCC 33305 / BD413 / ADP1) catM gene Proteins 0.000 description 9
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 9
- 101000581514 Homo sapiens Membrane-bound transcription factor site-2 protease Proteins 0.000 description 9
- 102100027382 Membrane-bound transcription factor site-2 protease Human genes 0.000 description 9
- 229920002472 Starch Polymers 0.000 description 9
- 101150053553 catR gene Proteins 0.000 description 9
- 108010089804 glycyl-threonine Proteins 0.000 description 9
- 235000019698 starch Nutrition 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 8
- 108091035707 Consensus sequence Proteins 0.000 description 8
- 241001625930 Luria Species 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 8
- 239000008107 starch Substances 0.000 description 8
- 101150076274 upp gene Proteins 0.000 description 8
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 235000019833 protease Nutrition 0.000 description 7
- 239000006137 Luria-Bertani broth Substances 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 239000007983 Tris buffer Substances 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 230000010261 cell growth Effects 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 241000194108 Bacillus licheniformis Species 0.000 description 5
- 108090000637 alpha-Amylases Proteins 0.000 description 5
- 102000004139 alpha-Amylases Human genes 0.000 description 5
- 229940024171 alpha-amylase Drugs 0.000 description 5
- 239000012131 assay buffer Substances 0.000 description 5
- 230000027455 binding Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 5
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 241000149420 Bothrometopus brevis Species 0.000 description 4
- 241000195940 Bryophyta Species 0.000 description 4
- 240000001817 Cereus hexagonus Species 0.000 description 4
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- 125000002947 alkylene group Chemical group 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 125000001475 halogen functional group Chemical group 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 238000001114 immunoprecipitation Methods 0.000 description 4
- 239000003262 industrial enzyme Substances 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 235000011929 mousse Nutrition 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000004753 textile Substances 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 108010087967 type I signal peptidase Proteins 0.000 description 4
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 3
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 3
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 3
- 108050007599 Anti-sigma factor Proteins 0.000 description 3
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 3
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 3
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 3
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 3
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 108010084185 Cellulases Proteins 0.000 description 3
- 102000005575 Cellulases Human genes 0.000 description 3
- 241001660259 Cereus <cactus> Species 0.000 description 3
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 3
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 3
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 3
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 3
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 3
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 3
- 241000143229 Idaea consanguinaria Species 0.000 description 3
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 3
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 3
- 229920002774 Maltodextrin Polymers 0.000 description 3
- 239000005913 Maltodextrin Substances 0.000 description 3
- 102100029083 Minor histocompatibility antigen H13 Human genes 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 229930193140 Neomycin Natural products 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 102000004316 Oxidoreductases Human genes 0.000 description 3
- 108090000854 Oxidoreductases Proteins 0.000 description 3
- 241000635201 Pumilus Species 0.000 description 3
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 3
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 3
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 3
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 3
- 230000001914 calming effect Effects 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 239000012228 culture supernatant Substances 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000002158 endotoxin Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 108010093305 exopolygalacturonase Proteins 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 229940049920 malate Drugs 0.000 description 3
- BJEPYKJPYRNKOW-UHFFFAOYSA-N malic acid Chemical compound OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 3
- 229940035034 maltodextrin Drugs 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 229960004927 neomycin Drugs 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 108010087558 pectate lyase Proteins 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 3
- 229920000053 polysorbate 80 Polymers 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 108020004418 ribosomal RNA Proteins 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 108010031009 signal peptide peptidase Proteins 0.000 description 3
- 239000012089 stop solution Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- PPINMSZPTPRQQB-NHCYSSNCSA-N 2-[[(2s)-1-[(2s)-2-[[(2s)-2-amino-3-methylbutanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]acetic acid Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PPINMSZPTPRQQB-NHCYSSNCSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 2
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 2
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 2
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 2
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 2
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 2
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 2
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 2
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 2
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 2
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 2
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 2
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 2
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 2
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- DKQCWCQRAMAFLN-UBHSHLNASA-N Asp-Trp-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O DKQCWCQRAMAFLN-UBHSHLNASA-N 0.000 description 2
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 2
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 108010082495 Dietary Plant Proteins Proteins 0.000 description 2
- 108090000371 Esterases Proteins 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 108050001049 Extracellular proteins Proteins 0.000 description 2
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 2
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 2
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 2
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 2
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 2
- RVGMVLVBDRQVKB-UWVGGRQHSA-N Gly-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN RVGMVLVBDRQVKB-UWVGGRQHSA-N 0.000 description 2
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- QZAFGJNKLMNDEM-DCAQKATOSA-N His-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 QZAFGJNKLMNDEM-DCAQKATOSA-N 0.000 description 2
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 2
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 2
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 2
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 2
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 2
- 108090000131 Metalloendopeptidases Proteins 0.000 description 2
- 102000003843 Metalloendopeptidases Human genes 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 241000611789 Paenibacillus curdlanolyticus Species 0.000 description 2
- OXUMFAOVGFODPN-KKUMJFAQSA-N Phe-Asn-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OXUMFAOVGFODPN-KKUMJFAQSA-N 0.000 description 2
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 2
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 2
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 2
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- XSXABUHLKPUVLX-JYJNAYRXSA-N Pro-Ser-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O XSXABUHLKPUVLX-JYJNAYRXSA-N 0.000 description 2
- 108090001066 Racemases and epimerases Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 2
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 2
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 2
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 108090000787 Subtilisin Proteins 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 2
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 2
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 2
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 2
- OGXQLUCMJZSJPW-LYSGOOTNSA-N Trp-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O OGXQLUCMJZSJPW-LYSGOOTNSA-N 0.000 description 2
- DDHFMBDACJYSKW-AQZXSJQPSA-N Trp-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DDHFMBDACJYSKW-AQZXSJQPSA-N 0.000 description 2
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 2
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 2
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 2
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 2
- NMPXRFYMZDIBRF-ZOBUZTSGSA-N Val-Asn-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NMPXRFYMZDIBRF-ZOBUZTSGSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- NSUUANXHLKKHQB-BZSNNMDCSA-N Val-Pro-Trp Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 NSUUANXHLKKHQB-BZSNNMDCSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 101710204001 Zinc metalloprotease Proteins 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 235000004458 antinutrient Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 108010047754 beta-Glucosidase Proteins 0.000 description 2
- 102000006995 beta-Glucosidase Human genes 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000013351 cheese Nutrition 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000012470 diluted sample Substances 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 235000021472 generally recognized as safe Nutrition 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 2
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 238000002386 leaching Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 229920006008 lipopolysaccharide Polymers 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920005862 polyol Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 230000006920 protein precipitation Effects 0.000 description 2
- 230000002797 proteolythic effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000000700 radioactive tracer Substances 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 229960000268 spectinomycin Drugs 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 235000010436 thaumatin Nutrition 0.000 description 2
- 239000000892 thaumatin Substances 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108010072644 valyl-alanyl-prolyl-glycine Proteins 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 102000005416 ATP-Binding Cassette Transporters Human genes 0.000 description 1
- 108010006533 ATP-Binding Cassette Transporters Proteins 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- SFPRJVVDZNLUTG-OWLDWWDNSA-N Ala-Trp-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFPRJVVDZNLUTG-OWLDWWDNSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 1
- LLZXKVAAEWBUPB-KKUMJFAQSA-N Arg-Gln-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLZXKVAAEWBUPB-KKUMJFAQSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- GURLOFOJBHRPJN-AAEUAGOBSA-N Asn-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GURLOFOJBHRPJN-AAEUAGOBSA-N 0.000 description 1
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- UOUHBHOBGDCQPQ-IHPCNDPISA-N Asn-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)N)N UOUHBHOBGDCQPQ-IHPCNDPISA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- MLJZMGIXXMTEPO-UBHSHLNASA-N Asn-Trp-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O MLJZMGIXXMTEPO-UBHSHLNASA-N 0.000 description 1
- ULZOQOKFYMXHPZ-AQZXSJQPSA-N Asn-Trp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ULZOQOKFYMXHPZ-AQZXSJQPSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 1
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 1
- FRSGNOZCTWDVFZ-ACZMJKKPSA-N Asp-Asp-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRSGNOZCTWDVFZ-ACZMJKKPSA-N 0.000 description 1
- KGAJCJXBEWLQDZ-UBHSHLNASA-N Asp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N KGAJCJXBEWLQDZ-UBHSHLNASA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- MRYDJCIIVRXVGG-QEJZJMRPSA-N Asp-Trp-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O MRYDJCIIVRXVGG-QEJZJMRPSA-N 0.000 description 1
- IHZFGJLKDYINPV-XIRDDKMYSA-N Asp-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(O)=O)N)C(O)=O)C1=CN=CN1 IHZFGJLKDYINPV-XIRDDKMYSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 101100043086 Bacillus subtilis (strain 168) spoIIIAF gene Proteins 0.000 description 1
- 101100366265 Bacillus subtilis (strain 168) spoIIIAH gene Proteins 0.000 description 1
- 108700038091 Beta-glucanases Proteins 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102000012529 Chaperone DnaK Human genes 0.000 description 1
- 108050002144 Chaperone DnaK Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102100025840 Coiled-coil domain-containing protein 86 Human genes 0.000 description 1
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 1
- ZXGDAZLSOSYSBA-IHRRRGAJSA-N Cys-Val-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZXGDAZLSOSYSBA-IHRRRGAJSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 101900077693 Escherichia coli Signal peptidase I Proteins 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- OPINTGHFESTVAX-BQBZGAKWSA-N Gln-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N OPINTGHFESTVAX-BQBZGAKWSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 1
- XQEAVUJIRZRLQQ-SZMVWBNQSA-N Gln-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CCC(=O)N)N XQEAVUJIRZRLQQ-SZMVWBNQSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- XMWNHGKDDIFXQJ-NWLDYVSISA-N Gln-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XMWNHGKDDIFXQJ-NWLDYVSISA-N 0.000 description 1
- VXAIXLOYBPMZPT-JBACZVJFSA-N Gln-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VXAIXLOYBPMZPT-JBACZVJFSA-N 0.000 description 1
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 1
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 1
- UERORLSAFUHDGU-AVGNSLFASA-N Glu-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UERORLSAFUHDGU-AVGNSLFASA-N 0.000 description 1
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 1
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 1
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- QLNKFGTZOBVMCS-JBACZVJFSA-N Glu-Tyr-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QLNKFGTZOBVMCS-JBACZVJFSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- GMIWMPUGTFQFHK-KCTSRDHCSA-N His-Ala-Trp Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O GMIWMPUGTFQFHK-KCTSRDHCSA-N 0.000 description 1
- UCDWNBFOZCZSNV-AVGNSLFASA-N His-Arg-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O UCDWNBFOZCZSNV-AVGNSLFASA-N 0.000 description 1
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 1
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 1
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 1
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 1
- FONIDUOGWNWEAX-XIRDDKMYSA-N His-Trp-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O FONIDUOGWNWEAX-XIRDDKMYSA-N 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 1
- GYXDQXPCPASCNR-NHCYSSNCSA-N His-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N GYXDQXPCPASCNR-NHCYSSNCSA-N 0.000 description 1
- 101000932708 Homo sapiens Coiled-coil domain-containing protein 86 Proteins 0.000 description 1
- 101000939384 Homo sapiens Urocortin-2 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- IIXDMJNYALIKGP-DJFWLOJKSA-N Ile-Asn-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IIXDMJNYALIKGP-DJFWLOJKSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- JDCQDJVYUXNCGF-SPOWBLRKSA-N Ile-Ser-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JDCQDJVYUXNCGF-SPOWBLRKSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 1
- 108010028688 Isoamylase Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 1
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- XOEDPXDZJHBQIX-ULQDDVLXSA-N Leu-Val-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOEDPXDZJHBQIX-ULQDDVLXSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- YRWCPXOFBKTCFY-NUTKFTJISA-N Lys-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N YRWCPXOFBKTCFY-NUTKFTJISA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 1
- ZNAPAUSAUBHENO-IHPCNDPISA-N Lys-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CCCCN)N ZNAPAUSAUBHENO-IHPCNDPISA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 1
- QMIXOTQHYHOUJP-KKUMJFAQSA-N Met-Gln-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N QMIXOTQHYHOUJP-KKUMJFAQSA-N 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 1
- YYEIFXZOBZVDPH-DCAQKATOSA-N Met-Lys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O YYEIFXZOBZVDPH-DCAQKATOSA-N 0.000 description 1
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 1
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 101000663233 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) Signal recognition particle protein Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- CTQNGGLPUBDAKN-UHFFFAOYSA-N O-Xylene Chemical compound CC1=CC=CC=C1C CTQNGGLPUBDAKN-UHFFFAOYSA-N 0.000 description 1
- 235000010676 Ocimum basilicum Nutrition 0.000 description 1
- 240000007926 Ocimum gratissimum Species 0.000 description 1
- 241000179039 Paenibacillus Species 0.000 description 1
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 1
- UEXCHCYDPAIVDE-SRVKXCTJSA-N Phe-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- ZZVUXQCQPXSUFH-JBACZVJFSA-N Phe-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ZZVUXQCQPXSUFH-JBACZVJFSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- PMKIMKUGCSVFSV-CQDKDKBSSA-N Phe-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PMKIMKUGCSVFSV-CQDKDKBSSA-N 0.000 description 1
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 1
- FINLZXKJWTYYLC-ACRUOGEOSA-N Phe-His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FINLZXKJWTYYLC-ACRUOGEOSA-N 0.000 description 1
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 1
- XMQSOOJRRVEHRO-ULQDDVLXSA-N Phe-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMQSOOJRRVEHRO-ULQDDVLXSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- APXXVISUHOLGEE-ILWGZMRPSA-N Phe-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=CC=C4)N)C(=O)O APXXVISUHOLGEE-ILWGZMRPSA-N 0.000 description 1
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 1
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 241000132152 Polymyxa Species 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- CFVRJNZJQHDQPP-CYDGBPFRSA-N Pro-Ile-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 CFVRJNZJQHDQPP-CYDGBPFRSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- MTMJNKFZDQEVSY-BZSNNMDCSA-N Pro-Val-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MTMJNKFZDQEVSY-BZSNNMDCSA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102000018819 Protein Translocation Systems Human genes 0.000 description 1
- 108010052646 Protein Translocation Systems Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000018673 SEC Translocation Channels Human genes 0.000 description 1
- 108010091732 SEC Translocation Channels Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000831652 Salinivibrio sharmensis Species 0.000 description 1
- 108091003202 SecA Proteins Proteins 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- XPVIVVLLLOFBRH-XIRDDKMYSA-N Ser-Trp-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)CO)C(O)=O XPVIVVLLLOFBRH-XIRDDKMYSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- LSHUNRICNSEEAN-BPUTZDHNSA-N Ser-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N LSHUNRICNSEEAN-BPUTZDHNSA-N 0.000 description 1
- 229940122055 Serine protease inhibitor Drugs 0.000 description 1
- 101710102218 Serine protease inhibitor Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 1
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- FRQRWAMUESPWMT-HSHDSVGOSA-N Thr-Trp-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N)O FRQRWAMUESPWMT-HSHDSVGOSA-N 0.000 description 1
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 1
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- CDPXXGFRDZVVGF-OYDLWJJNSA-N Trp-Arg-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CDPXXGFRDZVVGF-OYDLWJJNSA-N 0.000 description 1
- DXDMNBJJEXYMLA-UBHSHLNASA-N Trp-Asn-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 DXDMNBJJEXYMLA-UBHSHLNASA-N 0.000 description 1
- VKMOGXREKGVZAF-QEJZJMRPSA-N Trp-Asp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VKMOGXREKGVZAF-QEJZJMRPSA-N 0.000 description 1
- SSNGFWKILJLTQM-QEJZJMRPSA-N Trp-Gln-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SSNGFWKILJLTQM-QEJZJMRPSA-N 0.000 description 1
- OTWIOROMZLNAQC-XIRDDKMYSA-N Trp-His-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OTWIOROMZLNAQC-XIRDDKMYSA-N 0.000 description 1
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- RZRDCZDUYHBGDT-BVSLBCMMSA-N Trp-Met-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RZRDCZDUYHBGDT-BVSLBCMMSA-N 0.000 description 1
- JEYRCNVVYHTZMY-SZMVWBNQSA-N Trp-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JEYRCNVVYHTZMY-SZMVWBNQSA-N 0.000 description 1
- GBEAUNVBIMLWIB-IHPCNDPISA-N Trp-Ser-Phe Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 GBEAUNVBIMLWIB-IHPCNDPISA-N 0.000 description 1
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 1
- MPYZGXUYLNPSNF-NAZCDGGXSA-N Trp-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O MPYZGXUYLNPSNF-NAZCDGGXSA-N 0.000 description 1
- RQKMZXSRILVOQZ-GMVOTWDCSA-N Trp-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RQKMZXSRILVOQZ-GMVOTWDCSA-N 0.000 description 1
- SJWLQICJOBMOGG-PMVMPFDFSA-N Trp-Tyr-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CC4=CN=CN4)C(=O)O)N SJWLQICJOBMOGG-PMVMPFDFSA-N 0.000 description 1
- ITUAVBRBGKVBLH-BVSLBCMMSA-N Trp-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ITUAVBRBGKVBLH-BVSLBCMMSA-N 0.000 description 1
- JYLWCVVMDGNZGD-WIRXVTQYSA-N Trp-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYLWCVVMDGNZGD-WIRXVTQYSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- KSVMDJJCYKIXTK-IGNZVWTISA-N Tyr-Ala-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KSVMDJJCYKIXTK-IGNZVWTISA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- YRBHLWWGSSQICE-IHRRRGAJSA-N Tyr-Asp-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O YRBHLWWGSSQICE-IHRRRGAJSA-N 0.000 description 1
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 1
- FGJWNBBFAUHBEP-IHPCNDPISA-N Tyr-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FGJWNBBFAUHBEP-IHPCNDPISA-N 0.000 description 1
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- IJUTXXAXQODRMW-KBPBESRZSA-N Tyr-Gly-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O IJUTXXAXQODRMW-KBPBESRZSA-N 0.000 description 1
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 1
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- ARSHSYUZHSIYKR-ACRUOGEOSA-N Tyr-His-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ARSHSYUZHSIYKR-ACRUOGEOSA-N 0.000 description 1
- AXWBYOVVDRBOGU-SIUGBPQLSA-N Tyr-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AXWBYOVVDRBOGU-SIUGBPQLSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 1
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 1
- RZAGEHHVNYESNR-RNXOBYDBSA-N Tyr-Trp-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RZAGEHHVNYESNR-RNXOBYDBSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- 102100029789 Urocortin-2 Human genes 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- AAOPYWQQBXHINJ-DZKIICNBSA-N Val-Gln-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AAOPYWQQBXHINJ-DZKIICNBSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- BCBFMJYTNKDALA-UFYCRDLUSA-N Val-Phe-Phe Chemical compound N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O BCBFMJYTNKDALA-UFYCRDLUSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 229940025131 amylases Drugs 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 235000019730 animal feed additive Nutrition 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 230000000433 anti-nutritional effect Effects 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000001746 atrial effect Effects 0.000 description 1
- XYOVOXDWRFGKEX-UHFFFAOYSA-N azepine Chemical compound N1C=CC=CC=C1 XYOVOXDWRFGKEX-UHFFFAOYSA-N 0.000 description 1
- 230000010310 bacterial transformation Effects 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 108010055059 beta-Mannosidase Proteins 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 239000007621 bhi medium Substances 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000006727 cell loss Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 101150034144 ci gene Proteins 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 235000021448 clear apple juice Nutrition 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 108010005400 cutinase Proteins 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 229960003964 deoxycholic acid Drugs 0.000 description 1
- 238000009990 desizing Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000019621 digestibility Nutrition 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000002934 diuretic Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 235000015203 fruit juice Nutrition 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000003208 gene overexpression Methods 0.000 description 1
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 239000011121 hardwood Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- LELOWRISYMNNSU-UHFFFAOYSA-N hydrogen cyanide Chemical compound N#C LELOWRISYMNNSU-UHFFFAOYSA-N 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011090 industrial biotechnology method and process Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010011519 keratan-sulfate endo-1,4-beta-galactosidase Proteins 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 230000028744 lysogeny Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000001452 natriuretic effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 210000004798 organs belonging to the digestive system Anatomy 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000003068 pathway analysis Methods 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 150000002978 peroxides Chemical class 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 235000002949 phytic acid Nutrition 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 229920000499 poly(galactose) polymer Polymers 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000000541 pulsatile effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 229920006261 self reinforced polyphenylene Polymers 0.000 description 1
- 239000003001 serine protease inhibitor Substances 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- FHHPUSMSKHSNKW-SMOYURAASA-M sodium deoxycholate Chemical compound [Na+].C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC([O-])=O)C)[C@@]2(C)[C@@H](O)C1 FHHPUSMSKHSNKW-SMOYURAASA-M 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000028070 sporulation Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002912 waste gas Substances 0.000 description 1
- 235000014101 wine Nutrition 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 239000008096 xylene Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
- C12N9/54—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/24—Metalloendopeptidases (3.4.24)
Abstract
본 개시는 일반적으로 증가된 양의 하나 이상의 관심 대상 단백질(들)을 생성하는 변형 그람 양성 박테리아 세포에 관한 것이다. 따라서, 본 개시의 특정 구현예는 비변형(즉, 모) 그람 양성 박테리아 세포에 비해 증가된 양의 POI를 발현하는 변형 그람 양성 박테리아 세포에 관한 것으로, 여기에서 변형된(즉, 딸) 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함한다. 다른 특정 구현예에서, 본 개시는 변형(딸) 세포가 증가된 수준의 관심 대상 단백질을 생산하도록 박테리아 세포를 변형시키는 방법에 관한 것이다. 다른 구현예에서, 본 개시는 본 개시의 변형 박테리아 세포를 발효시킴으로써 생산된 관심 대상 단백질에 관한 것이다. 본 개시의 다른 특정 구현예는 그렇게 만들어진 하나 이상의 관심 대상 단백질(들)을 포함하는 하나 이상의 단백질성 조성물에 관한 것이다.
Description
관련 출원에 대한 상호 참조
본 출원은, 각각 본원에 그 전체가 참고로 포함되는, 2015년 12월 23일 출원된 미국 가출원 번호 제62/387,578호 및 2016년 3월 15일 출원된 미국 가출원 번호 제62/308,440호의 이익을 주장한다.
기술분야
본 개시는 일반적으로 세균학, 미생물학, 유전학, 분자 생물학, 효소학 등의 분야에 관한 것이다. 특정 구현예는 증가된 양의 하나 이상의 관심 대상 단백질(들)을 발현 및 생산하는 변형 그람 양성 박테리아 세포에 관한 것이다.
서열
목록에 대한 참조
"NB40883WOPCT_SequenceListing.txt"로 명명된 서열 목록 텍스트 파일의 전자 제출 내용은 2016년 11월 16일자로 생성되었으며, 크기가 39 KB이고, 본원에 그 전체가 참고로 포함된다.
미생물 숙주에서 단백질(예를 들어, 효소, 항체, 수용체 등)의 생산은 생명공학 분야에서 특별한 관심 대상이다. 마찬가지로, 하나 이상의 관심 대상 단백질(들)의 생산 및 분비를 위한 미생물 숙주 세포의 최적화는, 특히 산업적 생명공학 환경에서 높은 관련성을 갖는데, 여기에서 단백질 수율에서의 작은 개선은 단백질이 대량의 산업적인 양으로 생산될 때 매우 중요하다.
바실루스 서브틸리스(Bacillus subtilis), 바실루스 리케니포르미스(Bacillus licheniformis) 및 바실루스 아밀로리쿠에파시엔스(Bacillus amyloliquefaciens)와 같은 그람 양성 박테리아는, 이들의 우수한 발효 특성 및 높은 수율(배양액 리터 당 25그램까지; Van Dijl and Hecker, 2013)로 인해, 종종 산업적으로 관련된 단백질의 생산을 위한 미생물 공장으로서 사용된다. 예를 들어 B. 서브틸리스는 식품, 직물, 세탁, 제약 산업 등을 위해 필요한 α-아밀라아제(Jensen et al., 2000; Raul et al., 2014) 및 프로테아제(Brode et al., 1996)의 생산으로 잘 알려져 있다(Westers et al., 2004). 이들 비-병원성 그람 양성 박테리아는 독성 부산물(예를 들어, 리포폴리사카라이드; LPS, 내독소로도 알려짐)이 완전히 결여된 단백질을 생산하기 때문에, 유럽 식품 안전성 당국(European Food Safety Authority)의 "공인된 안전성 추정(Qualified Presumption of Safety, QPS)" 자격을 얻었으며, 이들 생산물 중 다수가 미국 식품 의약국(US Food and Drug Administration)으로부터 "일반적으로 안전한 것으로 인정됨(Generally Recognized As Safe, GRAS)" 자격을 얻었다(Olempska-Beer et al., 2006; Earl et al., 2008; Caspers et al., 2010).
그람 양성 박테리아인 B. 서브틸리스는 단백질을 분비하는 다양한 경로를 사용하는데, 이 중에서 Tat-시스템(Raul et al., 2014; Goosens et al., 2014; Tjalsma et al., 2004) 및 Sec-시스템(Tjalsma et al., 2004)이 가장 잘 연구된 두 가지이다. 대부분의 단백질은 비중첩(비-천연) 입체구조로 Sec-경로를 통해 분비되는데(Harwood and Cranenburgh, 2007), 여기에서는 소수성 신호 펩티드가 단백질을 세포의 전좌(translocation) 시스템으로 보낸다. ATPase SecA에 의해 촉진된 SecYEG 트랜스로콘(translocon)을 통한 전좌 직후, 단백질의 신호 펩티드는 신호 펩티다아제 SipS-SipW의 하나에 의해 유리되고(절단되고)(Tjalsma et al., 1997), 다음에 신호 펩티드 펩티다아제 TepA 및 SppA에 의해 분해된다(Bolhuis et al., 1999).
지난 30년간, B. 서브틸리스, B. 리케니포르미스, B. 아밀로리쿠에파시엔스 등에 의한 이종 단백질의 분비를 개선하기 위해 많은 연구가 수행되었다. 이 최적화의 주요 표적은 신호 펩티드, SRP, 전좌 시스템, 신호 펩티다아제 및 조절 인자의 조성이다(Kang et al., 2014). 최근, 필수 단백질 PrsA(전좌-후 중첩에 연루됨) 및 샤프롱 DnaK의 과발현이 B. 서브틸리스에서 아밀라아제의 개선된 분비를 초래하는 것이 밝혀져(Chen et al., 2015), 효과적인 단백질 분비에 대한 적절한 중첩의 영향을 보여주는데, 여기에서 PrsA는 효과적인 단백질 분비에 대한 제한 인자인 것으로 상정되었다(Kontinen and Sarvas, 1993). 더욱이, PrsA가 WprA 및 세포벽에 위치한 다른 프로테아제에 의해 분해될 수 있다는 것이 최근 밝혀져(Krishnappa et al., 2014), 이를 산업적 용도에 덜 적절하게 만든다.
따라서, 이들 미생물 세포 공장의 높은 상업적/산업적 용도로 인해, 그람 양성 박테리아에서 산업적으로 관련된 단백질의 분비 및/또는 생산의 개선을 위한 새로운 표적이 생명공학 분야에서 매우 요망된다.
본 개시는 그람 양성 박테리아 세포에서 관심 대상 단백질의 증가된 생산 및/또는 분비에 대한 충족되지 못한 요구를 다루고 이를 충족시킨다. 더욱 구체적으로, 아래의 '발명을 실시하기 위한 구체적인 내용'에서 제시되는 바와 같이, 본 개시는 "항-시그마 인자 조절 프로테아제(regulating anti-sigma factor protease)" 또는 "RasP"(이전에 YluC로서 알려짐)를 암호화하는 rasP 유전자를 발현 또는 과발현하도록 변형된 그람 양성 박테리아 세포가, 변형 그람 양성 박테리아 세포로부터 하나 이상의 관심 대상 단백질(들)의 증가된 생산을 초래한다는 놀랍고도 예상치 못한 발견에 관한 것이다.
특정 구현예에서, 본 개시는 비변형(모) 그람 양성 박테리아 세포에 비해 증가된 양의 관심 대상 단백질(이하, "POI")을 생산하는 변형 그람 양성 박테리아 세포와 관한 것으로, 여기에서 변형 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함한다. 특정 구현예에서, rasP 유전자 발현을 증가시키는 변형은 내인성 염색체 rasP 유전자에 대한 변형이다. 다른 구현예에서, 내인성 염색체 rasP 유전자의 천연 프로모터는 천연 rasP 프로모터보다 더 높은 활성을 갖는 임의의 프로모터로 교체된다. 다른 특정 구현예에서, 내인성 염색체 rasP 유전자의 천연 프로모터는 spoVG 프로모터 또는 aprE 프로모터로 교체된다. 또 다른 구현예에서, spoVG 프로모터는 서열번호: 3에 대하여 95%의 서열 동일성을 포함하는 뉴클레오티드 서열을 포함한다. 다른 구현예에서, aprE 프로모터는 서열번호: 4에 대하여 95%의 서열 동일성을 포함하는 뉴클레오티드 서열을 포함한다.
다른 특정 구현예에서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 5'-비번역 영역(5'-UTR)의 변형이다. 다른 구현예에서, 천연 rasP 염색체 5'-UTR은 서열번호: 5의 aprE 5'-UTR에 대하여 95%의 서열 동일성을 포함하는 5'-UTR로 교체된다. 또 다른 구현예에서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 프로모터 및 천연 5'-UTR 둘 다의 변형이다.
다른 특정 구현예에서, rasP 유전자 발현을 증가시키는 변형은 rasP 유전자를 포함하는 외인성 폴리뉴클레오티드이다. 특정 구현예에서, rasP 유전자를 포함하는 외인성 폴리뉴클레오티드는 염색체외 플라스미드 내에 포함된다. 다른 구현예에서, 염색체외 플라스미드는 발현 카세트이다. 다른 구현예에서, 염색체외 플라스미드는 통합 플라스미드이다. 다른 특정 구현예에서, 플라스미드는 변형 세포의 염색체로 안정적으로 통합된다.
다른 구현예에서, rasP 발현을 증가시키는 유전적 변형은 외인성 rasP 오픈 리딩 프레임(ORF)을 포함하는 폴리뉴클레오티드이며, 여기에서 ORF는 구성적 프로모터, 유도 가능한 프로모터 또는 조건부 프로모터에 작동 가능하게 연결되고 그의 제어 하에 있다. 특정 구현예에서, rasP ORF를 포함하는 외인성 폴리뉴클레오티드는 염색체외 플라스미드 내에 포함된다. 특정 구현예에서, 염색체외 플라스미드는 발현 카세트이다. 다른 특정 구현예에서, 염색체외 플라스미드는 통합 플라스미드이다. 특정 구현예에서, 플라스미드는 변형 세포의 염색체로 통합된다.
다른 구현예에서, rasP 유전자는 서열번호: 1의 오픈 리딩 프레임(ORF) 핵산 서열에 대하여 적어도 60%의 서열 동일성을 포함하는 핵산 서열을 포함한다. 다른 구현예에서, 서열번호: 1의 ORF는 RasP 폴리펩티드를 암호화하는데, 여기에서 RasP 폴리펩티드는 부위-2 프로테아제(S2P) 활성을 갖는 Zn2 + 메탈로프로테아제로서 추가로 정의된다. 다른 구현예에서, rasP 유전자는 서열번호: 2의 RasP 폴리펩티드에 대하여 60%의 아미노산 서열 동일성을 포함하는 RasP 폴리펩티드를 암호화하고 서열번호: 6의 활성 부위 공통 서열(LVFFHELGHLL)을 포함하는데, 이는 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 16 내지 26과 정렬된다. 또 다른 구현예에서, rasP 유전자는 서열번호: 2의 RasP 폴리펩티드에 대하여 80%의 아미노산 서열 동일성을 포함하는 RasP 폴리펩티드를 암호화하고 서열번호: 7의 활성 부위 공통 서열(HEXXH)을 포함하는데, 이는 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 20 내지 24와 정렬된다.
다른 구현예에서, 생산된 POI의 증가된 양은 비변형(모) 그람 양성 세포에 비해 적어도 5% 증가이다. 다른 구현예에서, 생산된 POI의 증가된 양은 비변형(모) 그람 양성 세포에 비해 적어도 10% 증가이다.
다른 특정 구현예에서, 그람 양성 박테리아 세포는 바실루스(Bacillus) 속의 구성원이다. 또 다른 구현예에서, 바실루스는 B. 서브틸리스 ( subtilis ), B. 리케니포 르미스(licheniformis), B. 렌투스 ( lentus ), B. 브레비스 ( brevis ), B. 스테아로서모 필루스(stearothermophilus), B. 알칼로필루스 ( alkalophilus ), B. 아밀로리쿠에파시 엔스(amyloliquefaciens), B. 클라우시이 ( clausii ), B. 소노렌시스 ( sonorensis ), B. 할로두란스(halodurans), B. 푸밀루스 ( pumilus ), B. 라우투스 ( lautus ), B. 파불 리(pabuli), B. 세레우스( cereus ), B. 아가라드하에렌 스(agaradhaerens), B 아키바이 ( akibai ), B. 클라르키이 ( clarkii ), B. 슈도피르무스 (pseudofirmus), B. 레헨시스 ( lehensis ), B. 메가테륨 ( megaterium ), B. 코아굴란 스(coagulans), B. 서쿨란스 ( circulans ), B. 깁소니이 ( gibsonii ), B. 마르마렌시스 (marmarensis), 및 B. 투린기엔시스(thuringiensis)로부터 선택된다. 다른 구현예에서, 바실루스는 B. 서브틸리스 또는 B. 리케니포르미스이다.
다른 특정 구현예에서, POI는 변형 박테리아 세포에 대하여 외인성인 유전자 또는 변형 박테리아 세포에 대하여 내인성인 유전자에 의해 암호화된다. 또 다른 구현예에서, POI는 세포외로 분비되거나 수송된다. 추가의 구현예에서, 세포외로 분비되거나 수송된 POI는 추가로 단리 및 정제된다.
다른 특정 구현예에서, POI는 효소이다. 다른 구현예에서, 효소는 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 람노-갈락투로나아제, 리보뉴클레아제, 타우마틴, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이들의 조합으로 구성되는 군으로부터 선택된다.
다른 구현예에서, 본 개시는 본 개시의 변형 세포에 의해 생산되는 단리된 POI에 관한 것이다.
다른 특정 구현예에서, 본 개시는 (a) 증가된 양의 POI를 생산하는 변형 그람 양성 박테리아 세포를 얻는 단계(여기에서 변형 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함함), 및 (b) POI가 발현되도록 하는 조건 하에 변형 세포를 배양하는 단계(여기에서 증가된 양의 POI를 생산하는 변형 박테리아 세포는 비변형(모) 그람 양성 박테리아 세포에서의 동일한 POI의 생산과 비교됨)를 포함하는, 그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법에 관한 것이다.
다른 특정 구현예에서, 본 개시는 본 개시의 방법에 의해 생산되는 단리된 POI에 관한 것이다.
다른 구현예에서, 본 개시는 (a) 모 그람 양성 박테리아 세포로 rasP 유전자 발현을 증가시키는 적어도 하나의 유전자 변형을 도입하는 단계, 및 (b) 증가된 양의 POI를 발현하는 하나 이상의 딸 세포를 선택하는 단계(여기에서 증가된 양의 POI를 생산하기 위해 선택된 하나 이상의 딸 세포는 변형(딸) 그람 양성 박테리아 세포로 정의됨)를 포함하는, 증가된 양의 POI를 생산하는 변형 그람 양성 박테리아 세포를 수득하는 방법에 관한 것이다.
도 1은 결실된 tepA 유전자(ΔtepA) 또는 결실된 rasP 유전자(ΔrasP) 중 하나를 포함하는 변형 B. 서브틸리스 세포로부터 배양 배지로 분비되는 AmyE 아밀라아제, AmyL 아밀라아제 및 프로테아제 BPN'-Y217L의 발현을, 비변형(모; 야생형) B. 서브틸리스 세포에 대하여 비교한다. 도 1a는 B. 서브틸리스 세포(모) 세포에 비해, rasP 또는 tepA 유전자가 결여된 B. 서브틸리스 세포로부터 분비된 효소(AmyE, AmyL 및 BPN'-Y217L)의 LDS-PAGE 겔을 보여준다. 도 1b는 비변형(모) 야생형 B. 서브틸리스 세포로부터 분비된 단백질의 비율에 대하여, 결실된 rasP(ΔrasP) 또는 tepA(ΔtepA) 유전자를 포함하는 B. 서브틸리스 세포로부터 분비된 단백질의 비율(즉, ΔtepA 세포/wt 세포 및 ΔrasP/wt 세포)로 제시되는, 분비된 AmyE, AmyL 및 BPN'-Y217L 단백질의 ImageJ를 사용한 정량화를 보여준다.
도 2는 야생형(모) B. 서브틸리스 세포, spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 카세트) 및 spoVG 프로모터 및 aprE 5'UTR의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-UTR-rasP" 발현 카세트)로부터의 OD600에서 측정한 세포 밀도(도 2a) 및 AmyE의 생산(도 2b)을 보여준다.
도 3은 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 카세트)로부터의 아밀라아제 PcuAmy1-v6의 진탕 플라스크 생산을 보여준다.
도 4는 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 tepA 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-tepA" 발현 카세트)로부터의 세포 밀도(도 4a) 및 아밀라아제 PcuAmy1-v6의 생산(도 4b)을 보여준다.
도 5는 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 카세트)로부터의 베타-D-글루카나아제(BglC)의 생산을 보여준다.
도 6은 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 카세트)로부터의 세포 밀도(도 6a) 및 프로페라아제(Properase)의 생산(도 6b)을 보여준다.
도 7은 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형(딸) B. 서브틸리스(즉, "PspoVG-rasP" 발현 카세트)로부터의 세포 밀도(도 7a) 및 발현된 "AmyAc 패밀리" α-아밀라아제의 생산(도 7b)을 보여준다. 이 실험에 사용된 모 및 변형(딸) B. 서브틸리스 세포는 딥 웰(deep well) 미세적정 플레이트(DWMTP)에서 5SM12 성장 배지를 사용하여 성장시켰다.
도 2는 야생형(모) B. 서브틸리스 세포, spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 카세트) 및 spoVG 프로모터 및 aprE 5'UTR의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-UTR-rasP" 발현 카세트)로부터의 OD600에서 측정한 세포 밀도(도 2a) 및 AmyE의 생산(도 2b)을 보여준다.
도 3은 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 카세트)로부터의 아밀라아제 PcuAmy1-v6의 진탕 플라스크 생산을 보여준다.
도 4는 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 tepA 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-tepA" 발현 카세트)로부터의 세포 밀도(도 4a) 및 아밀라아제 PcuAmy1-v6의 생산(도 4b)을 보여준다.
도 5는 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 카세트)로부터의 베타-D-글루카나아제(BglC)의 생산을 보여준다.
도 6은 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 카세트)로부터의 세포 밀도(도 6a) 및 프로페라아제(Properase)의 생산(도 6b)을 보여준다.
도 7은 야생형(모) B. 서브틸리스 세포 및 spoVG 프로모터의 제어 하 rasP 유전자를 포함하고 발현/과발현하는 변형(딸) B. 서브틸리스(즉, "PspoVG-rasP" 발현 카세트)로부터의 세포 밀도(도 7a) 및 발현된 "AmyAc 패밀리" α-아밀라아제의 생산(도 7b)을 보여준다. 이 실험에 사용된 모 및 변형(딸) B. 서브틸리스 세포는 딥 웰(deep well) 미세적정 플레이트(DWMTP)에서 5SM12 성장 배지를 사용하여 성장시켰다.
본 개시는 일반적으로 증가된 양의 하나 이상의 관심 대상 단백질(들)(이하, "POI")을 생산하는 변형 그람 양성 박테리아 세포에 관한 것이다. 따라서, 본 개시의 특정 구현예는 동일한 POI를 생산하는 비변형(모) 그람 양성 박테리아 세포에 비해 증가된 양의 POI를 생산하는 변형 그람 양성 박테리아 세포에 관한 것으로, 여기에서 변형 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함한다.
본원에 제시되는 바와 같이, rasP 유전자는 "항-시그마 인자 조절 프로테아제(regulating anti-sigma factor protease)" 또는 "RasP"(이전에 YluC로서 알려짐)를 암호화한다. RasP는 아연-의존성 막내 절단 프로테아제(intramembrane cleaving proteases)(또는 "iClips)의 군에 속하고 본원에서 부위-2 프로테아제(S2P) 또는 부위-2 아연 메탈로프로테아제로서 추가로 정의된다(예를 들어, Saito et al., 2011; Heinrich et al., 2008 참조). 특정 구현예에서, 본 개시의 RasP 폴리펩티드는 효소 번호(Enzyme Commission, EC) 클래스 3.4.24(EC 3.4.24)에 속하는 하이드롤라아제(예를 들어, 펩티다아제), 더욱 구체적으로 메탈로엔도펩티다아제로서 추가로 정의된다.
본원에 기술된 변형 박테리아 세포, 이의 조성물 및 이의 방법을 고려하여, 하기 용어 및 어구를 정의한다. 본원에서 정의되지 않은 용어는 본 기술 분야에서 사용되는 통상적인 의미를 따를 것이다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에서 기술되는 것과 유사하거나 동등한 임의의 방법 및 재료가 본 발명의 조성물 및 방법의 실시 또는 시험에 또한 사용될 수 있지만, 대표적인 예시적 방법 및 재료가 이제 기술된다. 본원에 인용된 모든 공보 및 특허는 참고로 포함된다.
청구범위는 임의의 선택적 요소를 제외하도록 작성될 수 있다는 것이 또한 주목된다. 이와 같이, 이러한 서술은 청구항 요소의 설명과 관련하여 "단독의", "단지", "제외하는" 등과 같은 배타적인 용어의 사용, 또는 "부정적" 제한의 사용에 대한 선행적 근거로서의 역할을 하기 위한 것이다.
본 개시 내용을 읽을 때 당업자에게 명백한 바와 같이, 본원에 기술되고 예시된 각각의 개별적인 구현예는 본원에 기술된 본 발명의 조성물 및 방법의 범주 또는 사상으로부터 벗어나지 않고서 임의의 다른 몇몇 구현예의 특징과 쉽게 구별되거나 조합될 수 있는 별개의 구성요소 및 특징을 갖는다. 임의의 언급된 방법은 열거된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 실시될 수 있다.
본원에서 정의되는 바와 같이, "변형 세포", "변형 박테리아 세포" 또는 "변형 숙주 세포"는 상호 교환 가능하게 사용될 수 있고 rasP 유전자 발현을 증가시키는 변형(예를 들어, 유전적 변형)을 포함하는 재조합 그람 양성 박테리아(숙주) 세포를 의미할 수 있다. 예를 들어, 본 개시의 "변형" 그람 양성 박테리아 세포는 모 박테리아 세포로부터 유래된 "변형(숙주) 세포"로서 추가로 정의될 수 있는데, 여기에서 변형(딸) 세포는 rasP 유전자 발현을 증가시키는 변형을 포함한다.
본원에서 정의되는 바와 같이, "비변형 세포", "비변형 박테리아 세포" 또는 "비변형 숙주 세포"는 상호 교환 가능하게 사용될 수 있고 rasP 유전자 발현을 증가시키는 변형을 포함하지 않는 "비변형"(모) 그람 양성 박테리아 세포를 의미할 수 있다.
본원에서 사용되는 바와 같이, "비변형"(모) 세포에서의 POI의 발현 및/또는 생산 및/또는 분비가 "변형"(딸) 세포에서의 동일한 POI의 발현 및/또는 생산 및/또는 분비와 비교될 때, "변형" 세포 및 "비변형" 세포는 본질적으로 동일한 조건(예를 들어, 동일한 배지, 온도, pH 등과 같은 조건) 하에 성장/배양/발효된다는 것이 이해될 것이다.
마찬가지로, 본원에서 정의되는 바와 같이, "증가된 생산", "향상된 생산", "증가된 POI의 생산", "향상된 POI의 생산" 등의 용어는 rasP 유전자 발현을 증가시키는 변형을 포함하는 "변형"(딸) 세포를 의미하는데, 여기에서 "증가"는 항상 동일한 POI를 발현하는 "비변형"(모) 세포와 비교한(이에 대한) 것이다.
본원에서 사용되는 바와 같이, "핵산"은 센스 가닥을 나타내든지 안티센스 가닥을 나타내든지 간에, 이중 가닥 또는 단일 가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA, 및 RNA뿐만 아니라 뉴클레오티드 또는 폴리뉴클레오티드 서열, 및 이의 단편 또는 일부도 나타낸다. 유전자 코드의 축퇴성의 결과로서, 다수의 뉴클레오티드 서열이 주어진 단백질을 암호화할 수 있음이 이해될 것이다.
본원에 기술된 폴리뉴클레오티드(또는 핵산 분자)는 "유전자", "벡터" 및 "플라스미드"를 포함하는 것이 이해된다. 따라서, 용어 "유전자"는 단백질 코딩 서열의 전부 또는 일부를 포함하는 아미노산의 특정 서열을 암호화하는 폴리뉴클레오티드를 나타내며, 예를 들어 유전자가 발현되는 조건을 결정하는 프로모터 서열과 같은 조절(비-전사) DNA 서열을 포함할 수 있다. 유전자의 전사 영역은 코딩 서열뿐만 아니라 인트론, 5'-비번역 영역(UTR), 및 3'-UTR을 포함하는 비번역 영역(UTR)도 포함할 수 있다.
본원에서 사용되는 바와 같이, 용어 "코딩 서열"은 (암호화된) 단백질 생성물의 아미노산 서열을 직접적으로 특정하는 뉴클레오티드 서열을 나타낸다. 코딩 서열의 경계는 일반적으로 오픈 리딩 프레임에 의해 결정되는데, 이는 보통 ATG 개시 코돈으로 시작된다. 전형적으로 코딩 서열은 DNA, cDNA, 및 재조합 뉴클레오티드 서열을 포함한다.
본원에서 정의되는 바와 같이, "오픈 리딩 프레임"(이하, "ORF")이라는 용어는 (i) 개시 코돈, (ii) 아미노산을 나타내는 일련의 둘(2) 이상의 코돈, 및 (iii) 종결 코돈으로 구성되는 연속된(uninterrupted) 리딩 프레임을 포함하는 핵산 또는 핵산 서열(천연적으로 존재하거나, 비-천연적으로 존재하거나, 합성이든 간에)을 의미하며, ORF는 5'에서 3' 방향으로 판독(또는 번역)된다. 예를 들어, 특정 구현예에서, "rasP 유전자 발현을 증가시키는" 변형을 포함하는 변형 세포, 변형 박테리아 세포 또는 변형 숙주 세포는 RasP 폴리펩티드를 암호화하는 ORF를 포함하는 재조합 그람 양성 박테리아 세포를 포함하는데, 여기에서 RasP 폴리펩티드를 암호화하는 ORF 서열의 발현은 구성적 프로모터, 유도 가능한 프로모터, 조건부 프로모터 등에 작동 가능하게 연결되고 그의 제어 하에 있으며; 선택적으로 5' 및 3' 조절(비-전사) 핵산 서열을 포함한다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는 코딩 서열 또는 기능성 RNA의 발현을 제어할 수 있는 핵산 서열을 나타낸다. 일반적으로, 코딩 서열은 프로모터 서열에 대하여 3'(하류)에 위치한다. 프로모터는 천연 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터들로부터 유래되는 상이한 요소들로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터들은 상이한 세포 유형에서, 또는 상이한 발달 단계에서, 또는 상이한 환경 조건 또는 생리적 조건에 응답하여 유전자의 발현을 지시할 수 있음이 당업자에 의해 이해된다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터는 일반적으로 "구성적 프로모터(constitutive promoter)"로 칭해진다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편들이 동일한 프로모터 활성을 가질 수 있는 것으로 인식된다.
본원에서 사용되는 바와 같이, "작동 가능하게 연결된"이라는 용어는 하나의 기능이 다른 하나에 의해 영향을 받도록 된 단일 핵산 단편 상에서의 핵산 서열들의 회합을 나타낸다. 예를 들어, 프로모터는 이것이 코딩 서열(예를 들어, ORF)의 발현에 영향을 줄 수 있을 때(즉, 그 코딩 서열은 프로모터의 전사 제어 하에 있음) 그 코딩 서열과 작동 가능하게 연결된 것이다. 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다.
본원에서 정의되는 바와 같이, "적합한 조절 서열"은 코딩 서열의 상류(5' 비-코딩 서열), 내부, 또는 하류(3' 비-코딩 서열)에 위치하고, 회합된 코딩 서열의 전사, RNA 프로세싱(processing) 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오티드 서열을 나타낸다. 조절 서열에는 프로모터, 번역 리더 서열, RNA 프로세싱 부위, 효과인자 결합 부위, 스템-루프 구조 등이 포함될 수 있다.
본원에서 정의되는 바와 같이, 적어도 하나의 폴리뉴클레오티드 오픈 리딩 프레임(ORF), 또는 이의 유전자, 또는 이의 벡터를 "박테리아 세포 내로 도입하는"과 같은 어구에서 사용될 때, "도입하는"이라는 용어는 원형질 융합, 형질전환(예를 들어, 염화칼슘, 전기천공법), 형질도입, 형질감염, 콘쥬게이션 등을 포함하지만 이로 한정되는 것은 아닌, 폴리뉴클레오티드를 세포 내로 도입하기 위한 본 기술 분야에 공지된 방법을 포함한다(예를 들어, Ferrari et al., 1989 참조).
본원에서 사용되는 바와 같이, "형질전환된" 또는 "형질전환"은 세포가 재조합 DNA 기법을 사용하여 형질전환된 것을 의미한다. 전형적으로 형질전환은 하나 이상의 뉴클레오티드 서열(예를 들어, 폴리뉴클레오티드, ORF 또는 유전자)을 세포 내로 삽입함으로써 일어난다. 삽입되는 뉴클레오티드 서열은 이종 뉴클레오티드 서열(즉, 형질전환되는 세포에 천연적으로 존재하지 않는 서열)일 수 있다. 본원에서 사용되는 바와 같이, "형질전환"은 이전된 핵산 분자의 유전적으로 안정한 유전을 야기하는, 숙주 유기체의 게놈으로의 핵산 분자의 이전을 나타낸다.
본원에서 정의되는 바와 같이, 숙주 세포 "게놈", 박테리아(숙주) 세포 "게놈", 또는 그람 양성 박테리아(숙주) 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.
본원에서 사용되는 바와 같이, 용어 "플라스미드", "벡터" 및 "카세트"는 염색체외 요소를 나타내며, 이는 종종 전형적으로 세포의 중추적인 대사의 일부가 아니고 대개 원형 이중 가닥 DNA 분자의 형태로 존재하는 유전자를 지닌다. 이러한 요소는 임의의 공급원으로부터 유래되는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형의, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열일 수 있으며, 여기서, 다수의 뉴클레오티드 서열은 선택된 유전자 생성물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포 내로 도입할 수 있는 독특한 구축물로 연결되거나 재조합된다.
"형질전환 카세트"는 외래 유전자(또는 이의 ORF)를 포함하며 이 외래 유전자에 더하여 특정한 숙주 세포의 형질전환을 촉진하는 요소를 갖는 특이적 벡터를 나타낸다.
"발현 카세트"는 외래 유전자(또는 이의 ORF)를 포함하며 이 외래 유전자에 더하여 숙주 세포에서 이 외래(이종) 유전자의 "증가된" 발현을 허용하는 요소를 갖는 특이적 벡터를 나타낸다.
많은 원핵 및 진핵 발현 벡터가 구매 가능하고 본 기술 분야에 잘 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에 있다.
본원에서 사용되는 바와 같이, 용어 "벡터"는 핵산을 유기체들, 세포들 또는 세포 성분들 사이에 전파 및/또는 이전시킬 수 있는 임의의 수단이다. 벡터는 바이러스, 박테리오파지, 프로-바이러스(pro-virus), 플라스미드, 파지미드(phagemid), 트랜스포존(transposon), 및 인공 염색체, 예를 들어 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), 및 PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"으로서, 즉, 자율적으로 복제되거나 숙주 미생물의 염색체 내에 통합될 수 있다.
"발현 벡터"는 이종 DNA를 외래 세포 내에 포함시키고 외래 세포에서 발현시키는 능력을 갖는 벡터를 나타낸다. 많은 원핵 및 진핵 발현 벡터가 구매 가능하다.
"표적화 벡터"는 이것이 형질전환시키는 숙주 세포의 염색체 내의 영역에 상동성이고 그 영역에서 상동 재조합을 구동시킬 수 있는 폴리뉴클레오티드 서열을 포함하는 벡터이다. 표적화 벡터는 상동 재조합을 통하여 세포의 염색체 내에 돌연변이 또는 외인성 유전자 서열을 도입하는 데 있어서 그 용도가 발견된다. 일부 구현예에서, 표적화 벡터는, 예를 들어 말단에 부가된 다른 비-상동성 서열(즉, 스터퍼(stuffer) 서열 또는 측면(flanking) 서열)을 포함한다. 말단은 표적화 벡터가, 예를 들어 벡터 내로의 삽입과 같이, 폐쇄된 원을 형성하도록 폐쇄될 수 있다. 적절한 벡터의 선택 및/또는 구축은 당업자의 지식 내에 있다.
본원에서 사용되는 바와 같이, 용어 "플라스미드"는 클로닝 벡터로서 사용되는, 그리고 많은 박테리아 및 일부 진핵 생물에서 염색체외 자가-복제 유전 요소를 형성하는 원형 이중 가닥(ds) DNA 구축물을 나타낸다. 일부 구현예에서, 플라스미드는 숙주 세포의 게놈 내로 포함되게 된다.
본원에서 사용되는 바와 같이, 용어 "관심 대상 단백질(protein of interest)" 또는 "POI"는 변형 그람 양성 박테리아 세포(예를 들어, "숙주" 세포)에서 발현시키기를 원하는 관심 대상 폴리펩티드를 나타내는데, 여기에서 POI는 증가된 수준으로(즉, 비변형(모) 그람 양성 박테리아 세포에 비해) 생산된다. 따라서, 본원에서 사용되는 바와 같이, POI는 효소, 기질-결합 단백질, 표면-활성 단백질, 구조 단백질, 수용체 단백질, 항체 등일 수 있다.
유사하게, 본원에서 정의되는 바와 같이, "관심 대상 유전자(gene of interest)" 또는 "GOI"는 POI를 암호화하는 핵산 서열(예를 들어, 폴리뉴클레오티드, 유전자 또는 오픈 리딩 프레임)을 나타낸다. POI를 암호화하는 GOI는 천연적으로 존재하는 유전자, 돌연변이된 유전자 또는 합성 유전자일 수 있다.
본원에서 사용되는 바와 같이, 용어 "폴리펩티드" 및 "단백질"은 상호 교환 가능하게 사용되고, 펩티드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 나타낸다. 아미노산 잔기에 대한 통상적인 한(1) 문자 또는 세(3) 문자 코드가 본원에서 사용된다. 폴리펩티드는 선형 또는 분지형일 수 있고, 이것은 변형 아미노산을 포함할 수 있으며, 비-아미노산이 개재될 수 있다.
폴리펩티드라는 용어는 또한 자연적으로 또는 개입에 의해; 예를 들어 디술피드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 임의의 다른 조작 또는 변형, 예를 들어 표지(labeling) 성분과의 콘쥬게이션에 의해 변형된 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등을 포함함)뿐만 아니라 본 기술 분야에 공지된 다른 변형도 포함하는 폴리펩티드가 이 정의 내에 또한 포함된다.
특정 구현예에서, 본 개시의 유전자는 상업적으로 관련된 산업용 관심 대상 단백질, 예를 들어 효소(예를 들어, 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이들의 조합)를 암호화한다.
본원에서 정의되는 바와 같이, "내인성 유전자"는 유기체의 게놈 내 이의 자연적인 위치의 유전자를 나타낸다.
본원에서 정의되는 바와 같이, "이종" 유전자, "비-내인성" 유전자, 또는 "외래" 유전자는 숙주 유기체에서 정상적으로는 발견되지 않고, 유전자 전달(gene transfer)에 의해 숙주 유기체 내로 도입되는 유전자(또는 ORF)를 나타낸다. 외래(이종) 유전자는 비-천연 유기체 내로 삽입된 천연 유전자(또는 ORF) 및/또는 천연 또는 비-천연 유기체 내로 삽입된 키메라 유전자를 포함한다.
본원에서 사용되는 바와 같이, 용어 "발현"은 본 개시의 핵산 분자로부터 유래된 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 나타낸다. 발현은 또한 mRNA의 폴리펩티드로의 번역을 나타낼 수 있다. 따라서, 용어 "발현"은 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하지만 이로 한정되는 것은 아닌, 폴리펩티드의 생산에 연루된 임의의 단계를 포함한다.
본원에서 사용되는 바와 같이, "변이형" 폴리펩티드는, 전형적으로 재조합 DNA 기법에 의해 하나 이상의 아미노산의 치환, 부가, 또는 결실에 의해 모(또는 기준) 폴리펩티드로부터 유래되는 폴리펩티드를 나타낸다. 변이형 폴리펩티드들은 적은 수의 아미노산 잔기가 모 폴리펩티드와 상이할 수 있으며, 모(기준) 폴리펩티드와의 일차 아미노산 서열 상동성/동일성 수준에 의해 정의될 수 있다.
바람직하게는, 변이형 폴리펩티드는 모(기준) 폴리펩티드 서열과의 아미노산 서열 동일성이 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 심지어 적어도 99%이다. 본원에서 사용되는 바와 같이, "변이형" 폴리뉴클레오티드는 변이형 폴리펩티드를 암호화하는 폴리뉴클레오티드를 나타내는데, 여기에서 "변이형 폴리뉴클레오티드"는 모 폴리뉴클레오티드와 특정한 정도의 서열 상동성/동일성을 갖거나, 엄격한 혼성화 조건 하에 모 폴리뉴클레오티드(또는 이의 상보체)와 혼성화된다. 바람직하게는, 변이형 폴리뉴클레오티드는 모(기준) 폴리뉴클레오티드 서열과의 뉴클레오티드 서열 동일성이 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 심지어 적어도 99%이다.
본원에서 사용되는 바와 같이, "돌연변이"는 핵산 서열에서의 임의의 변화 또는 변경을 나타낸다. 점 돌연변이, 결실 돌연변이, 침묵(silent) 돌연변이, 프레임 이동 돌연변이, 스플라이싱 돌연변이 등을 포함하는 몇몇 유형의 돌연변이가 존재한다. 돌연변이는 특이적으로(예를 들어, 부위 지정 돌연변이 유발을 통하여) 또는 무작위로(예를 들어, 화학 물질, 복구 결핍된 박테리아 주를 통한 계대를 통하여) 수행될 수 있다.
본원에서 사용되는 바와 같이, 폴리펩티드 또는 이의 아미노산 서열의 맥락에서, 용어 "치환"은 하나의 아미노산을 또 다른 아미노산으로 대체하는 것(즉, 치환하는 것)을 의미한다.
본원에서 정의되는 바와 같이, "이종" 핵산 구축물 또는 "이종" 핵산 서열은 그 서열이 발현되는 세포에 대하여 천연적인 것이 아닌 일부분의 서열을 갖는다.
본원에서 정의되는 바와 같이, "이종 제어 서열"은 자연에서 GOI의 발현을 조절하는(제어하는) 기능을 하지 않는 유전자 발현 제어 서열(예를 들어, 프로모터 또는 인핸서)을 나타낸다. 일반적으로, 이종 핵산 서열은 이들이 존재하는 세포 또는 게놈의 일부에 대하여 내인성(천연)이 아니고, 감염, 형질감염, 형질전환, 미세주입, 전기천공, 원형질 융합 등에 의해 세포에 부가된다. "이종" 핵산 구축물은 천연 숙주 세포에서 발견되는 제어 서열/DNA 코딩 서열 조합과 동일하거나 상이한 제어 서열/DNA 코딩(ORF) 서열 조합을 함유할 수 있다.
본원에서 사용되는 바와 같이, 용어 "신호 서열" 및 "신호 펩티드"는 성숙 단백질 또는 전구체 형태의 단백질의 분비에 참여하거나 이의 수송을 지시할 수 있는 아미노산 잔기의 서열을 나타낸다. 신호 서열은 전구체 또는 성숙 단백질 서열에 대해 전형적으로 N-말단에 위치한다. 신호 서열은 내인성 또는 외인성일 수 있다. 신호 서열은 보통 성숙 단백질에 부재한다. 신호 서열은 전형적으로 단백질이 수송된 후 신호 펩티다아제에 의해 단백질로부터 절단된다.
본원에서 사용되는 바와 같이, "모(parental)" 세포는 변형 "딸" 세포를 생성하도록 "모" 세포의 게놈이 변형되는(예를 들어, 하나 이상의 돌연변이가 모 세포로 도입되거나 하나 이상의 유전자 또는 ORF가 모 세포로 도입됨) 임의의 세포 또는 미생물의 균주를 나타낸다.
용어 "유래된"은 용어 "기인된", "수득된", "수득 가능한" 및 "생성된"을 포함하며, 일반적으로 하나의 특정된 물질 또는 조성물이 또 다른 특정된 물질 또는 조성물에서 이의 기원을 찾거나, 또 다른 특정된 물질 또는 조성물과 관련하여 기술될 수 있는 특징을 가짐을 나타낸다.
본원에서 사용되는 바와 같이, 단백질 생산을 "증가시키는 것"은 증가된 양의 단백질이 생산됨을 의미한다. 단백질은 숙주 세포 내에서 생산되거나, 또는 배양 배지 내로 분비될(또는 수송될) 수 있다. 특정 구현예에서, 관심 대상 단백질은 배양 배지 내로 생산된다.
증가된 단백질 생산은 예를 들어, 비변형(모) 세포와 비교하여 변형(딸) 세포에 의해 생산된 전체 세포외 단백질, 또는 단백질 또는 효소 활성, 예를 들어 프로테아제 활성, 아밀라아제 활성, 셀룰라아제 활성, 헤미셀룰라아제 활성 등의 더 높은 최대 수준으로서 검출될 수 있다.
본원에서 사용되는 바와 같이, 용어 "상동성"은 상동 폴리뉴클레오티드 또는 폴리펩티드와 관련된다. 둘 이상의 폴리뉴클레오티드 또는 둘 이상의 폴리펩티드가 상동성일 경우, 이것은 상동 폴리뉴클레오티드 또는 폴리펩티드가 적어도 60%, 더 바람직하게는 적어도 70%, 한층 더 바람직하게는 적어도 85%, 훨씬 더 바람직하게는 적어도 90%, 더욱 바람직하게는 적어도 95%, 그리고 가장 바람직하게는 적어도 98%의 "동일성 정도"를 갖는 것을 의미한다. 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 본원에서 정의된 바와 같이 상동성이기에 충분히 높은 정도의 동일성을 갖는지 여부는 본 기술 분야에 공지된 컴퓨터 프로그램, 예를 들어 GCG 프로그램 패키지(위스콘신 패키지용 프로그램 매뉴얼(Program Manual for the Wisconsin Package), 버전 8, 1994년 8월, 미국 53711 위스콘신주 매디슨 사이언스 드라이브 575 소재의 제네틱스 컴퓨터 그룹(Genetics Computer Group))에 제공된 "GAP"을 사용하여 두 서열을 정렬함으로써 적합하게 조사될 수 있다(Needleman and Wunsch, 1970).
본원에서 사용되는 바와 같이, 용어 "동일성 백분율(%)"은, 서열 정렬 프로그램을 사용하여 정렬될 때, 폴리펩티드를 코딩하는 핵산 서열들 또는 그 폴리펩티드의 아미노산 서열들 사이의 핵산 또는 아미노산 서열 동일성의 수준을 나타낸다.
본원에서 사용되는 바와 같이, 용어 "비생산성(specific productivity)"은 주어진 기간에 걸쳐 시간 당 세포 당 생산된 단백질의 총량이다.
본원에서 정의되는 바와 같이, "정제된", "단리된" 또는 "풍부화된"이라는 용어는 생체분자(예를 들어, 폴리펩티드 또는 폴리뉴클레오티드)가 자연에서 이것이 회합되어 있는 천연적으로 존재하는 구성 성분의 일부 또는 이들 전부로부터 이를 분리하는 것에 의해 그의 자연 상태로부터 변경됨을 의미한다. 이러한 단리 또는 정제는 최종 조성물에서 요망되지 않는 전 세포, 세포 잔사, 불순물, 외부 단백질, 또는 효소를 제거하기 위한 이온 교환 크로마토그래피, 친화성 크로마토그래피, 소수성 분리, 투석, 프로테아제 처리, 황산암모늄 침전 또는 기타 단백질 염 침전, 원심분리, 크기 배제 크로마토그래피, 여과, 미세여과, 겔 전기영동 또는 구배에서의 분리와 같은 본 기술 분야에서 인정된 분리 기법에 의해 성취될 수 있다. 그 후 추가 이득을 제공하는 구성 성분, 예를 들어 활성화제, 항-저해제, 바람직한 이온, pH를 제어하기 위한 화합물 또는 기타 효소 또는 화학물질을 정제되거나 단리된 생체분자 조성물에 첨가하는 것이 추가로 가능하다.
I.
RasP
폴리펩티드 및 이를 암호화하는 유전자
위에 앞서 제시된 바와 같이, rasP 유전자는 "항-시그마 인자 조절 프로테아제(regulating anti-sigma factor protease)" 또는 "RasP"(이전에 YluC로서 알려짐)를 암호화하는데; 이는 아연-의존성 막내 절단 프로테아제(또는 "iClips)의 군에 속하고, 본원에서 부위-2 프로테아제(S2P) 또는 부위-2 아연 메탈로프로테아제로 추가로 정의된다(예를 들어, Saito et al., 2011; Heinrich et al., 2008 참조). 본원에서 정의되는 바와 같이, "rasP" 유전자(또는 이의 ORF)는 "RasP" 폴리펩티드를 암호화하고, 특정 RasP 폴리펩티드 서열(또는 이를 암호화하는 rasP 유전자 또는 ORF 서열)로 제한되는 것을 의미하지 않는다.
따라서, 특정 구현예에서, 본 개시의 rasP 유전자(또는 이의 ORF)는, rasP 핵산 또는 이의 상동 또는 오르소로그 핵산 서열이 본 개시의 변형 그람 양성 세포에서 발현 또는 과발현될 때 이러한 암호화된 폴리펩티드(S2P Zn2 + 메탈로프로테아제 활성을 가짐)가 POI의 생산을 증가시키는 한, S2P Zn2 + 메탈로프로테아제 활성을 갖는 것을 특징으로 하는 폴리펩티드를 암호화하는 임의의 핵산(폴리뉴클레오티드) 또는 이의 임의의 상동 또는 오르소로그 핵산 서열일 수 있다.
예를 들어, B. 서브틸리스 균주 168(예를 들어, UniProtKB; RASP_BACSU; Accession No. O31754 참조)로부터 단리된 RasP 폴리펩티드는 서열번호: 2로 제시되는 422개 아미노산을 포함하는데(약 46.7 kDa), 여기에서 위치 20 및 24의 히스티딘 아미노산 잔기는 Zn2 + 배위/결합 부위로 추정되고 위치 21의 글루탐산 잔기는 단백질 가수분해 활성 부위이다.
따라서, 특정 구현예에서, 본 개시의 RasP 폴리펩티드를 암호화하는 유전자(또는 이의 ORF)는 서열번호: 2로 제시되는 RasP 폴리펩티드에 대하여 약 60%의 서열 동일성을 포함하는 폴리펩티드를 암호화하는 유전자 또는 ORF이다. 예를 들어, UniProtKB 데이터베이스에서 BLAST 검색(대상 서열로서 서열번호: 2의 B. 서브틸리스 RasP 폴리펩티드 서열 및 다음 검색 파라미터: E-threshold = 10; Matrix = auto; gapped = yes를 사용함)에서는 서열번호: 2에 대하여 100% 내지 약 60%의 서열 동일성을 포함하는 다양한 RasP 폴리펩티드를 확인하였다.
다른 특정 구현예에서, 본 개시의 RasP 폴리펩티드를 암호화하는 유전자(또는 이의 ORF)는 서열번호: 6의 근접 활성 부위 공통 서열(LVFFH ELGHLL; 여기에서 밑줄 친 히스티딘 아미노산은 Zn2 + 결합 부위이고 굵은 활자체의 글루탐산 잔기는 활성 부위 잔기임)을 포함하는 폴리펩티드인데, 여기에서 서열번호: 6의 RasP 폴리펩티드 공통 서열의 아미노산 서열은 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 16 내지 26과 정렬될 수 있고 적어도 60%의 서열 상동성을 생성할 수 있다.
다른 구현예에서, 본 개시의 RasP 폴리펩티드를 암호화하는 유전자(또는 이의 ORF)는 서열번호: 7의 활성 부위 공통 서열(H EXXH; 여기에서 밑줄 친 히스티딘 아미노산은 Zn2 + 결합 부위이고 굵은 활자체의 글루탐산 잔기는 활성 부위 잔기이고 X는 임의의 아미노산임)을 포함하는 폴리펩티드인데, 여기에서 서열번호: 7의 RasP 폴리펩티드 공통 서열의 아미노산 서열은 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 20 내지 24와 정렬될 수 있고 적어도 80%의 서열 상동성을 생성할 수 있다.
특정 구현예에서, 본 개시의 RasP 폴리펩티드는 EC 클래스 3.4.24(EC 3.4.24)에 속하는 메탈로엔도펩티다아제로 추가로 정의된다.
II. 박테리아 세포 및 사용 방법
일반적으로 본 개시는 증가된 양의 하나 이상의 관심 대상 단백질(들)을 생산하는 변형 그람 양성 박테리아 세포에 관한 것이다. 따라서, 본 개시의 특정 구현예는 비변형(즉, 모) 그람 양성 박테리아 세포에 비해 증가된 양의 POI를 발현하는 변형 그람 양성 박테리아 세포에 관한 것으로, 여기에서 변형(즉, 딸) 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함한다.
특정 구현예에서, 본 개시는 변형(딸) 세포가 증가된 수준의 관심 대상 단백질을 생산하도록 박테리아 세포를 변형시키는 방법에 관한 것이다. 다른 구현예에서, 본 개시는 본 개시의 변형 박테리아 세포를 발효시킴으로써 생산된 관심 대상 단백질에 관한 것이다. 본 개시의 다른 특정 구현예는 그렇게 만들어진 하나 이상의 관심 대상 단백질(들)을 포함하는 하나 이상의 단백질성 조성물에 관한 것이다. 또 다른 구현예에서, 본 개시는 본원에 제시된 변형 박테리아 세포를 이용한 하나 이상의 관심 대상 단백질(들)의 생산 방법뿐 아니라, 하나 이상의 관심 대상 단백질(들)을 포함하는 하나 이상의 단백질성 조성물의 생산 및 사용 방법에 관한 것이다.
특정 구현예에서, rasP 유전자 발현을 증가시키는 박테리아 세포의 변형은 변형 숙주에서 rasP 유전자(또는 이의 ORF)의 발현을 향상 또는 증가시키는 임의 유형의 유전적 변형일 수 있다. 예를 들어, 특정 구현예에서, rasP 유전자 발현을 증가시키는 박테리아 세포의 변형은 요망되는 숙주 세포에서 향상된 발현을 위한 rasP 유전자(또는 이의 ORF)의 코돈 최적화를 포함한다. 다른 구현예에서, rasP 유전자 발현을 증가시키는 숙주 세포의 변형은 RasP 폴리펩티드를 암호화하는 발현 카세트로, 여기에서 발현 카세트는 (변형) 세포 내로 도입된다. 다른 특정 구현예에서, RasP 폴리펩티드를 암호화하는 유전자 또는 ORF를 포함하는 발현 카세트는 유도 가능한 프로모터, 구성적 프로모터, 조건부 프로모터 등의 제어 하에 있다.
특정 구현예에서, POI 또는 RasP 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열의 전사를 지시하는 프로모터는 야생형 aprE 프로모터, 돌연변이 aprE 프로모터 또는 공통(consensus) aprE 프로모터(PCT 국제 공개 WO2001/51643에 제시됨)이다. 다른 특정 구현예에서, POI 또는 RasP 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열의 전사를 지시하는 프로모터는 야생형 spoVG 프로모터, 돌연변이 spoVG 프로모터 또는 공통 spoVG 프로모터이다(Frisby and Zuber, 1991).
특정 구현예에서, 본 개시의 변형 박테리아 세포는 바실라세아에 패밀리의 구성원이다. 다른 구현예에서, 본 개시의 변형 박테리아 세포는 바실루스 속의 구성원이다. 특정 구현예에서, 본 개시의 변형 박테리아 세포는 B. 서브틸리스, B. 리케니포르미스, B. 렌투스, B. 브레비스, B. 스테아로서모필루스, B. 알칼로필 루스, B. 아밀로리쿠에파시엔스, B. 클라우시이, B. 소노렌시스 , B. 할로두란스 , B. 푸밀루스 , B. 라우투스 , B. 파불리 , B. 세레우스, B. 아가라드하에렌스 , B 아키 바이, B. 클라르키이 , B. 슈도피르무스 , B. 레헨시스 , B. 메가테륨, B. 코아굴란스, B. 서쿨란스, B. 깁소니이 및 B. 투린기엔시스 , B. 마르마렌시스로부터 선택되는 바실루스 세포이다. 다른 구현예에서, 바실루스 세포는 바실루스 서브틸리스 또는 바실루스 리케니포르미스이다.
본 기술 분야에서 바실루스 속은 분류학적 재편성을 계속 겪고 있음이 인정된다. 따라서, 이 속은 현재 "지오바실루스 스테아로서모필루스(Geobacillus stearothermophilus)"로 명명된 B. 스테아로서모필루스, 또는 현재 "파에니바실루 스 폴리믹사 ( Paenibacillus polymyxa)인 B. 폴리믹사와 같은 유기체를 포함하지만 이로 한정되는 것은 아닌, 재분류된 종을 포함하는 것으로 본다.
III.
증가된
수준의 관심 대상 단백질을 생산하는 변형 세포
변형 그람 양성 박테리아 세포가 증가된 수준의 POI를 생산함을 확인하기 위하여, 다양한 스크리닝 방법이 적용될 수 있다. 예를 들어, 발현 벡터는 표적 단백질에의 폴리펩티드 융합물을 암호화할 수 있고, 검출 가능한 표지체로서의 역할을 하거나, 또는 대안적으로, 표적 단백질 그 자체가 선택 가능하거나 스크리닝 가능한 마커로서의 역할을 할 수 있다. 표지된 단백질은 또한 웨스턴 블로팅(Western blotting), 도트 블로팅(dot blotting)(이러한 방법의 상세한 설명은 콜드 스프링 하버 프로토콜즈(Cold Spring Harbor Protocols)의 웹사이트에서 입수 가능함), ELISA, 또는, 표지체가 GFP일 경우, 전 세포 형광(whole cell fluorescence) 또는 FACS를 사용하여 검출될 수 있다.
예를 들어, 6-히스티딘 태그를 포함시켜 표적 단백질에의 융합물을 만들 수 있고, 웨스턴 블롯을 사용하여 이러한 태그를 검출할 수 있다. 게다가, 표적 단백질이 충분히 높은 수준으로 발현될 경우, 쿠마시(Coomassie)/은 염색과 조합된 SDS-PAGE를 수행하여 야생형에 대비한 돌연변이체 발현의 증가를 적절히 검출할 수 있으며; 이러한 경우에, 분자의 표지는 전혀 필요하지 않을 것이다.
다른 구현예에서, 비변형(모) 세포에 대한 변형(숙주) 세포에서의 POI의 발현을 mRNA 전사체 수준과 상관시킨다. 예를 들어, 특정 구현예는 POI를 암호화하는 유전자 또는 ORF의 분자적 특성화에 관한 것으로, 이는 대개 RNA 발현의 시간적 및 공간적 분포의 철저한 분석을 포함한다. 다수의 널리 사용되는 절차가 존재하고 본 기술 분야에 공지되어 있으며, 이는 전체 또는 폴리(A) RNA 샘플에서의 특정 mRNA의 풍부도의 검출 및 결정을 위한 것이다. 비제한적 예는 노던 블롯(Northern blot) 분석, 뉴클레아제 보호 분석법(nuclease protection assay; NPA), 원위치 혼성화, 및 역전사-폴리머라아제 연쇄 반응(reverse transcription-polymerase chain reaction; RT-PCR)과 같은 방법을 포함한다.
예를 들어, 세포 당 단백질의 활성 또는 양, 배지 1 밀리리터 당 단백질의 활성 또는 양의 증가의 검출을 비롯하여, 배양 또는 발효가 더 오랜 기간 동안 효율적으로 계속되도록 하는 다른 방법, 또는 이들 방법의 조합을 통한 다른 방법이 개선된 수준의 관심 대상 단백질을 확인하기 위해 이용될 수 있다.
비생산성의 검출은 단백질 생산의 평가에 적합한 또 다른 방법이다. 비생산성(Qp)은 다음 식을 사용하여 결정될 수 있다:
Qp = gP/gDCW·hr
여기에서, "gP"는 탱크에서 생산된 단백질의 그램수이고, "gDCW"는 탱크 내 건조 세포 중량(DCW)의 그램수이고, "hr"은 접종 시점으로부터의 발효 시간(hour)으로, 이는 생산 시간 및 성장 시간을 포함한다.
특정 구현예에서, 본 개시의 변형 박테리아 세포는 이의 비변형(모) 세포와 비교하여 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 POI를 생산한다.
IV. 관심 대상 단백질의 생산을 위한 변형 세포의 배양
다른 구현예에서, 본 개시는 비변형(모) 세포와 비교하여(즉, 이에 비해) 변형 박테리아 세포의 단백질 생산성을 증가시키는 방법을 제공한다. 더욱 구체적으로, 특정 구현예에서, 변형 박테리아 세포의 단백질 생산성을 증가시키는 방법은 변형 박테리아 세포를 적합한 발효 조건 하에 배양시키는 단계를 포함하는데, 여기에서 변형 세포는 rasP 유전자 발현을 증가시키는 변형을 포함한다.
따라서, 숙주 세포 및 형질전환된 세포는 통상적인 영양 배지에서 배양될 수 있다. 형질전환된 숙주 세포용 배양 배지는 프로모터의 활성화 및 형질전환체의 선택을 위하여 적절할 경우 변형될 수 있다. 특정 배양 조건, 예를 들어 온도, pH 등은 발현을 위해 선택되는 숙주 세포에 사용되는 것일 수 있으며, 이는 당업자에게 명백할 것이다. 게다가, 배양 조건은 과학 문헌, 예를 들어 Sambrook (1982; 2001), Harwood et al. (1990) 및 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection; ATCC)에서 발견될 수 있다.
따라서, 특정 구현예에서, 본 개시는 변형 박테리아 세포를 발효시키는 단계를 포함하는 POI의 생산 방법에 관한 것으로, 여기에서 변형 세포는 POI를 배양 배지 내로 분비한다. 본 기술 분야에 잘 알려진 발효 방법을 적용하여 변형 및 비변형 박테리아 세포를 발효시킬 수 있다.
일부 구현예에서, 박테리아 세포는 배치식 또는 연속식 발효 조건 하에서 배양된다. 전통적인 배치식 발효는 발효 초반에 배지의 조성을 설정하고 발효 동안 변경하지 않는 폐쇄 시스템이다. 발효 초반에, 배지에 요망되는 유기체(들)가 접종된다. 이 방법에서는, 임의의 구성요소를 이 시스템에 추가하지 않고 발효가 일어나도록 허용된다. 전형적으로, 배치식 발효는 탄소원의 첨가와 관련하여 "배치"로서의 자격이 있으며, pH 및 산소 농도와 같은 인자를 제어하기 위한 시도가 종종 이루어진다. 배치식 시스템의 대사 산물 및 바이오매스의 조성은 발효가 중단되는 시점까지 지속적으로 변화한다. 전형적인 배치식 배양 내에서, 세포는 정적 지체기를 통하여 고성장 대수기까지, 그리고 마지막으로 성장 속도가 감소되거나 중지되는 정지기까지 진행될 수 있다. 비처리될 경우, 정지기에 있는 세포는 결국 사멸한다. 일반적으로, 대수기에 있는 세포가 생산물의 대량 생산의 원인이 된다.
표준 배치식 시스템에 대한 적합한 변동으로는 "유가식 발효" 시스템이 있다. 전형적인 배치식 시스템의 이러한 변동에서는, 발효가 진행됨에 따라 기질이 증분 첨가된다. 유가식 시스템은 이화대사 억제가 세포의 대사를 저해할 가능성이 있을 때, 그리고 배지 중에 제한된 양의 기질이 있는 것이 바람직한 경우 유용하다. 유가식 시스템에서 실제 기질 농도를 측정하는 것은 어렵고, 따라서 pH, 용존 산소 및 폐가스, 예컨대 CO2의 분압과 같은 측정 가능한 인자의 변화에 기초하여 개산된다. 배치식 및 유가식 발효는 본 기술 분야에서 일반적이며 공지되어 있다.
연속식 발효는 규정 발효 배지가 생물 반응기에 연속적으로 첨가되고, 동량의 조정 배지(conditioned medium)가 프로세싱을 위하여 동시에 제거되는 개방 시스템이다. 연속식 발효는 일반적으로 배양물을 일정한 고밀도로 유지하는데, 이때 세포는 주로 대수기 성장에 있다. 연속식 발효는 세포 성장 및/또는 생성물 농도에 영향을 미치는 하나 이상의 인자의 조절을 허용한다. 예를 들어, 일 구현예에서, 탄소원 또는 질소원과 같은 제한 영양소는 고정된 비율로 유지되고 다른 모든 파라미터는 적정 수준이 되도록 한다. 다른 시스템에서는, 배지 탁도에 의해 측정되는 세포 농도를 일정하게 유지하면서, 성장에 영향을 미치는 다수의 인자를 계속 변경할 수 있다. 연속식 시스템은 정상 상태의 성장 조건을 유지하려고 한다. 따라서, 배지의 배출로 인한 세포 손실은 발효에서 세포 성장 속도와 균형을 이룰 것이다. 연속식 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법뿐만 아니라, 생성물 형성 속도를 최대화하기 위한 기법은 산업 미생물학 분야에 잘 알려져 있다.
이러한 특정 구현예에서, 형질전환된(변형) 숙주 세포에 의해 생산된 POI는 숙주 세포를 원심분리 또는 여과에 의해 배지로부터 분리하는 것, 또는 필요할 경우 세포를 파괴하는 것 및 상청액을 세포 분획 및 잔사로부터 제거하는 것을 포함하는 통상적인 절차에 의해 배양 배지로부터 회수될 수 있다. 전형적으로, 청징화 후 상청액 또는 여액의 단백질성 성분을 염, 예를 들어 황산암모늄에 의해 침전시킨다. 그 후, 침전된 단백질은 가용화되고, 다양한 크로마토그래피 절차, 예를 들어, 이온 교환 크로마토그래피, 겔 여과에 의해 정제될 수 있다.
V. 형질전환
본 개시의 RasP 폴리펩티드 또는 POI를 암호화하는 핵산을 포함하는 폴리뉴클레오티드 구축물은 숙주 세포에 의해 발현되도록 구축될 수 있다. 공지된 유전자 코드 축퇴성 때문에, 동일 아미노산 서열을 암호화하는 상이한 폴리뉴클레오티드들이 본 기술 분야에서의 일상적인 기술을 이용하여 설계되고 만들어질 수 있다. 예를 들어, 특정 숙주 세포에서의 생산을 최적화하기 위하여 코돈 최적화가 적용될 수 있다.
관심 대상 단백질을 암호화하는 핵산이 벡터 내로 포함될 수 있는데, 여기에서 벡터는 잘 알려진 형질전환 기법, 예를 들어 본원에 개시된 것을 사용하여 숙주 세포 내로 전달될 수 있다.
벡터는 숙주 세포를 형질전환시키고 그 안에서 복제될 수 있는 임의의 벡터일 수 있다. 예를 들어, POI를 암호화하는 핵산을 포함하는 벡터는 벡터의 증식(propagating) 및 증폭의 수단으로서의 박테리아 숙주 세포를 형질전환시키고 숙주 세포에서 복제될 수 있다. 벡터는 또한, 단백질 암호화 핵산(즉, ORF)이 기능성 단백질로서 발현될 수 있도록, 발현 숙주를 형질전환시킬 수 있다. 발현 숙주로서의 역할을 하는 박테리아 세포(즉, 변형 박테리아 "숙주" 세포)는 바실라세아에 패밀리의 구성원 및 바실루스 속의 구성원을 포함한다.
POI를 암호화하는 핵산을 포함하고 발현하도록 일상적인 기술로 변형될 수 있는 대표적인 벡터로는 벡터 p2JM103BBI가 있다(Vogtentanz, 2007 참조).
위에 간략하게 명시된 바와 같이, RasP 폴리펩티드 또는 POI를 암호화하는 폴리뉴클레오티드는 숙주 세포에서 전사를 허용하는 적합한 프로모터에 작동 가능하게 연결될 수 있다. 프로모터는 선택된 숙주 세포에서 전사 활성을 나타내는 임의의 핵산 서열일 수 있으며, 숙주 세포에 대하여 동종성이거나 이종성인 단백질을 암호화하는 유전자로부터 유래될 수 있다. 예를 들어, 특정 구현예에서, rasP 유전자의 발현을 증가시키는 변형은 천연 rasP 유전자 프로모터를 천연 rasP 프로모터보다 더 높은 활성을 갖는 임의의 프로모터로 교체하는 것을 포함한다. 프로모터 활성/강도를 평가하는 수단은 당업자에게 일상적이다.
본 개시의 POI 또는 RasP 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열의 전사를, 특히 박테리아 숙주에서 지시하기에 적합한 프로모터의 예는 E. 콜라이의 lac 오페론의 프로모터, 스트렙토마이세스 코엘리컬러(Streptomyces coelicolor) 아가라아제 유전자 dagA 또는 celA 프로모터, 바실루스 리케니포르미스 알파-아밀라아제 유전자(amyL)의 프로모터, 바실루스 스테아로서모필루스 말토게닉 아밀라아제 유전자(amyM)의 프로모터, 바실루스 아밀로리쿠에파시엔스 알파-아밀라아제(amyQ)의 프로모터, 바실루스 서브틸리스 xylA 및 xylB 유전자의 프로모터 등을 포함한다.
특정 구현예에서, POI 또는 RasP 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열의 전사를 지시하는 프로모터는 야생형 aprE 프로모터, 돌연변이 aprE 프로모터 또는 공통 aprE 프로모터(PCT 국제 공개 WO2001/51643에 제시됨)이다. 다른 특정 구현예에서, POI 또는 RasP 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열의 전사를 지시하는 프로모터는 야생형 spoVG 프로모터, 돌연변이 spoVG 프로모터 또는 공통 spoVG 프로모터이다(Frisby and Zuber, 1991).
특정 구현예에서, aprE 프로모터는 서열번호: 4에 대하여 약 90 내지 95%의 서열 동일성을 포함하는 핵산 서열을 포함한다.
다른 구현예에서, spoVG 프로모터는 서열번호: 3에 대하여 약 90 내지 95%의 서열 동일성을 포함하는 핵산 서열을 포함한다.
다른 구현예에서, RasP 폴리펩티드 또는 POI를 암호화하는 폴리뉴클레오티드 서열의 전사를 지시하는 프로모터는 리보솜 프로모터, 예를 들어 리보솜 RNA 프로모터 또는 리보솜 단백질 프로모터이다. 더욱 구체적으로, 특정 구현예에서, 리보솜 RNA 프로모터는 B. 서브틸리스로부터 유래된 rrn 프로모터이며, 더욱 구체적으로, rrn 프로모터는 B. 서브틸리스 유래의 rrnB, rrnI 또는 rrnE 리보솜 프로모터이다. 특정 구현예에서, 리보솜 RNA 프로모터는 PCT 국제 공개번호 WO2013/086219에 제시된 B. 서 브틸리스 유래의 P2 rrnI 프로모터이다.
RasP 또는 POI 코딩 서열은 신호 서열에 작동 가능하게 연결될 수 있다. 신호 서열을 암호화하는 핵산 서열은 발현되는 rasP 유전자 또는 GOI(POI를 암호화함)와 천연적으로 회합된 DNA 서열일 수 있거나, 상이한 속 또는 종 유래의 것일 수 있다. 폴리뉴클레오티드 구축물 또는 벡터를 포함하는 신호 서열 및 프로모터 서열은 박테리아 숙주 세포 내로 도입될 수 있으며, 이들 서열은 동일한 공급원 또는 상이한 공급원으로부터 유래될 수 있다. 예를 들어, 특정 구현예에서, 신호 서열은 PCT 국제 공개 WO2001/51643에 제시된 aprE 프로모터에 작동 가능하게 연결된 aprE 신호 서열(예를 들어, Vogtentanz et al., 2007; Wang et al., 1988 참조)이다.
특정 구현예에서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연의 5'-비번역 영역(5'-UTR)의 변형이다. 다른 구현예에서, 천연의 rasP 염색체 5'-UTR은 서열번호: 5의 aprE 5'-UTR에 대하여 약 90 내지 95%의 서열 동일성을 포함하는 5'-UTR로 교체된다.
발현 벡터는 또한 적합한 전사 종결자 및, 진핵 생물에서 특정한 폴리아데닐화 서열이 관심 대상 단백질을 암호화하는 DNA 서열에 작동 가능하게 연결된 것을 포함할 수 있다. 종결 및 폴리아데닐화 서열은 프로모터와 동일한 공급원으로부터 적합하게 유래될 수 있지만, 다른 구현예에서는, 종결 및 폴리아데닐화 서열이 서로 상이한 공급원 및/또는 프로모터와는 상이한 공급원으로부터 잘 유래될 수 있다.
적합한 벡터는 벡터가 숙주 세포에서 복제되는 것을 가능하게 하는 핵산 서열을 추가로 포함할 수 있다. 이와 같이 가능하게 하는 서열의 예는 플라스미드 pUC19, pACYC177, pUB110, pE194, pAMB1, pIJ702 등의 복제 원점을 포함한다.
적합한 벡터는 또한 선택가능 마커, 예를 들어, 유전자 생성물이 단리 숙주 세포에서의 결함을 보완하는 유전자, 예를 들어 B. 서브틸리스 또는 B. 리케니포르 미스 유래의 dal 유전자; 또는 항생제 내성, 예를 들어 암피실린 내성, 카나마이신 내성, 클로람페니콜 내성, 테트라사이클린 내성 등을 부여하는 유전자를 포함할 수 있다.
적합한 발현 벡터는 전형적으로, 예를 들어 선택된 숙주 유기체에서의 벡터의 자율 복제를 가능케 하는 요소, 및 선택 목적을 위한 표현형으로 검출 가능한 하나 이상의 마커와 같은 클로닝 벡터의 구성 요소를 포함한다. 전형적으로 발현 벡터는 또한, 예를 들어 프로모터, 오퍼레이터, 리보솜 결합 부위, 번역 개시 신호 및 선택적으로, 리프레서 유전자, 하나 이상의 활성화 유전자(activator gene) 서열 등과 같은 제어 뉴클레오티드 서열을 포함한다.
부가적으로, 적합한 발현 벡터는 관심 대상 단백질을 숙주 세포 소기관, 예컨대 퍼옥시좀으로, 또는 특정 숙주 세포 구획으로 표적화할 수 있는 아미노산 서열을 암호화하는 서열을 추가로 포함할 수 있다. 이러한 표적화 서열은, 예를 들어 아미노산 서열 "SKL"일 수 있다. 제어 서열의 지시 하의 발현을 위하여, 관심 대상 단백질의 핵산 서열은 발현이 일어나도록 하는 적합한 방식으로 제어 서열에 작동가능하게 연결될 수 있다.
관심 대상 단백질을 암호화하는 DNA 구축물, 프로모터, 종결자 및/또는 기타 요소를 라이게이션하고, 이들을 복제에 필요한 정보를 포함하는 적합한 벡터 내로 삽입하는 데 사용되는, 본원에 개시된 것과 같은 프로토콜은 당업자에게 잘 알려져 있다(예를 들어, Sambrook et al., 1989, and 3rd edition 2001 참조).
폴리뉴클레오티드 구축물 또는 발현 벡터 중 어느 하나를 포함하는 단리된 세포는 POI의 재조합 생산에서 숙주 세포로서 유리하게 사용된다. 세포는 편리하게는 POI를 암호화하는 DNA 구축물(하나 이상의 카피)을 숙주 염색체 내로 통합시킴으로써 이 구축물로 형질전환될 수 있다. 일반적으로 통합은 이점으로 여겨지는데, 이와 같이 도입된 DNA 서열은 세포 내에서 안정하게 유지될 가능성이 더 크기 때문이다. DNA 구축물의 숙주 염색체 내로의 통합은 통상적인 방법을 적용하여, 예를 들어 상동 재조합 또는 이종 재조합에 의해 수행될 수 있다. 대안적으로, 세포는 상이한 유형의 숙주 세포들과 관련하여 위에 기술한 바와 같은 발현 벡터로 형질전환될 수 있다.
다른 구현예에서, 발현 숙주로부터 유전자를 결실시키는 것이 유리한데, 여기에서 유전자 결핍은 발현 벡터에 의해 큐어링될(cured) 수 있다. 공지된 방법을 사용하여 하나 이상의 불활성화 유전자를 갖는 박테리아 숙주 세포를 수득할 수 있다. 유전자 불활성화는 완전 또는 부분 결실에 의해, 삽입에 의한 불활성화에 의해, 또는 유전자가 그의 의도된 목적을 위해 비기능성이 되게 하는 임의의 다른 수단에 의해, 유전자가 기능성 단백질을 발현하는 것이 방지되도록 하여 성취될 수 있다.
박테리아의 형질전환 및 박테리아의 배양을 위한 기법은 표준으로서 본 기술 분야에 잘 알려져 있다. 이는 관심 대상 재조합 단백질의 생산을 위하여 본 개시의 개선된 숙주를 형질전환시키는 데 사용될 수 있다. DNA 구축물 또는 벡터를 숙주 세포 내로 도입하는 것은 형질전환; 전기천공법; 핵 미세주입법; 형질도입; 형질감염, 예를 들어, 리포펙션 매개 및 DEAE-덱스트린 매개 형질감염; 인산칼슘을 이용한 인큐베이션에 의한 DNA 침전; DNA-코팅된 미세발사체(microprojectile)를 이용한 고속 충격(bombardment); 유전자 총 또는 바이오리스틱 형질전환(biolistic transformation) 및 원형질 융합 등과 같은 기법을 포함한다. 박테리아의 형질전환 및 발현 방법은 또한 Brigidi et al. (1990)에 개시되어 있다. 프로테아제 결실된 바실루스 주에 바람직한 일반 형질전환 및 발현 프로토콜은 페라리(Ferrari) 등의 미국 특허 제5,264,366호에 제공된다.
VI. 변형 세포에 의해 생산된 관심 대상 단백질
다른 구현예에서, 본 개시는 증가된 양의 POI를 발현하는 변형 그람 양성 박테리아 세포를 수득하는 단계(여기에서 변형 박테리아 세포는 rasP 유전자(또는 이의 ORF)의 발현을 증가시키는 변형을 포함함), 및 변형 세포를 POI가 발현되는 조건 하에 배양하는 단계(여기에서, 증가된 양의 POI를 발현하는 변형 박테리아 세포는 비변형 그람 양성 박테리아 세포에서의 POI의 발현과 비교됨)를 포함하는, 증가된 수준의 POI의 생산 방법을 제공한다.
POI는 임의의 내인성 또는 이종 단백질일 수 있고, 이러한 POI의 변이형일 수 있다. 단백질은 하나 이상의 디술피드 가교체를 함유할 수 있거나 기능적 형태가 단량체 또는 다량체인 단백질로, 즉, 단백질은 4차 구조를 갖고 복수의 동일한(상동성) 또는 동일하지 않은(이종) 서브유닛으로 구성되는데, 여기에서 POI 또는 이의 변이형 POI는 바람직하게는 관심 대상의 특성을 갖는 것이다.
특정 구현예에서, POI 또는 이의 변이형 POI는 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이들의 조합으로 구성되는 군으로부터 선택된다.
POI 또는 변이형 POI는 또한 펩티드, 펩티드 호르몬, 성장 인자, 응고 인자, 케모카인, 사이토카인, 림포카인, 항체, 수용체, 유착 분자, 미생물 항원(예를 들어, HBV 표면 항원, HPV E7 등), 및 이들의 변이형 또는 이들의 단편일 수 있다.
관심 대상 단백질(또는 변이형)의 다른 유형은 식품 또는 작물에 영양적 가치를 제공할 수 있는 것일 수 있다. 비제한적인 예는 항-영양성 인자의 형성을 저해할 수 있는 식물성 단백질 및 더 바람직한 아미노산 조성(예를 들어, 비-형질전환 식물보다 더 높은 라이신 함량)을 갖는 식물성 단백질을 포함한다.
VII. 단백질성 조성물의 용도
다른 구현예에서, 본 개시는 하나 이상의 관심 대상 단백질(들)을 포함하는 단백질성 조성물을 제공한다. 단백질성 조성물은 적합하게는 본원에 제공된 방법을 사용하여 생산된다. 단백질성 조성물은 관심 대상 유전자에 의해 암호화되고 본원에 기술된 방법을 사용하여 발현되는 관심 대상 단백질을 포함한다. 이 조성물은, 예를 들어 바이오매스 가수분해, 세척(cleaning) 응용, 곡물 가공, 동물 영양, 식품 조성물, 직물 처리, 개인 케어(care) 제품 등에서와 같은 다양한 유용한 산업적 응용에서 사용될 수 있다.
예를 들어, 이와 같이 생산된 단백질성 조성물은 세척 응용에서 사용될 수 있다. 효소적 세척 성분은 종래의 화학 세제로는 쉽게 제거되지 않는 오염물(soil), 얼룩 및 기타 잔사를 분해하는 능력 때문에 인기가 있다. 세척에 유용한 주지의 효소는 리파아제, 펙티나아제, 만나나아제, 심지어 특정 셀룰라아제와 같은 다른 효소와 함께 프로테아제 및 아밀라아제를 포함하며, 이들 각각은 일련의 상이한 기능성을 제공한다. 예를 들어, 프로테아제는 단백질 기반의 얼룩에 대항하고; 아밀라아제는 탄수화물 및 전분에 작용하고; 리파아제는 지질 또는 지방을 분해한다. 본 개시는 변형 박테리아 세포를 제공하는데, 이는 세척 응용에서 관심 대상 산업용 효소, 변이형, 및 혼합물의 생산자로서 이러한 사용에 적합하고 유리한 개선된 단백질 생산을 보여주었다.
또 다른 예에서, 이와 같이 제조된 단백질성 조성물은 곡물 가공에서 사용될 수 있다. 전분은 식물에서 가장 흔한 저장 탄수화물로, 식물 그 자신뿐만 아니라 미생물 및 고등 유기체에 의해서도 사용된다. 매우 다양한 효소가 전분 가수분해에 촉매 반응을 할 수 있다. 모든 식물 공급원으로부터의 전분은 과립 형태로 존재하지만, 식물 공급원의 종에 따라 전분은 현저하게 상이한 크기 및 물리적 특성으로 존재한다. 전분의 산 가수분해는 과거에는 광범위한 용도를 가졌지만, 이러한 공정은 현재 대부분 효소적 공정으로 대체되었으며, 이는 더 적은 내-부식성 재료 및 다른 혜택을 요구하는 것으로 알려져 있고, 가열에 더 적은 에너지가 필요하고 제어가 산 공정보다 상대적으로 더 쉽다. 본 개시는 엔지니어링된, 형질전환된, 또는 유도된 진정세균 세포를 제공하는데, 이는 전분 분해 및 곡물 가공에서 관심 대상 산업용 효소, 변이형, 및 혼합물의 생산자로서 이러한 사용에 적합하고 유리한 개선된 단백질 생산을 보여주었다.
또 다른 예에서, 이와 같이 제조된 단백질성 조성물은 식품 응용에서 사용될 수 있다. 박테리아, 효모 및 곰팡이에 의해 생산된 효소는 수천 년 동안 빵, 치즈, 맥주 및 포도주와 같은 식품의 제조를 위하여 식품 응용에서 사용되어 왔다. 오늘날 효소는 베이커리, 치즈 제조, 전분 가공 및 과일 주스 및 기타 음료의 생산에 사용되어 개선된 질감, 외관 및 영양적 가치와 같은 다양한 혜택을 제공하며, 바람직한 풍미 및 방향 등을 생성한다. 전형적으로, 식품용 효소는 일련의 유익한 미생물로부터 기원할 뿐만 아니라 동물 및 식물에서도 기원한다(예를 들어, 전분-소화 효소인 아밀라아제는 발아 중인 보리 종자로부터 수득될 수 있다). 효소는 많은 공정에서 합성 화학물질을 대체하는, 전통적인 화학-기반 기술에 대한 실행 가능하고 바람직한 대안으로 여겨진다. 효소는 식품 생산 공정의 환경 성능의 개선을 도와서 에너지 소비를 감소시키고 폐기물 또는 부산물의 생분해성을 개선할 수 있다. 효소는 그 작용에 있어서 합성 화학물질보다 더 특이적인 경향이 있으며, 따라서, 효소 공정은 더 적은 부반응 및 폐기물 또는 부산물을 제공하는 경향이 있고, 그 결과 더 높은 품질의 제품을 생산하고 오염 가능성을 감소시킨다. 흔히 효소 공정은 유일하게 가능한 공정이기도 하다. 이의 예는 투명 사과 주스 농축액의 생산에 있는데, 이는 펙티나아제라는 효소의 사용에 의존한다. 대부분의 식품용 효소는 바실루스, 아스페르길루스(Aspergillus), 스트렙토마이세스(Streptomyces) 또는 클루이 베로마이세스(Kluyveromyces)와 같은 미생물로부터 생산된다. 본 개시는 엔지니어링된, 형질전환된, 또는 유도된 진정세균 세포를 제공하는데, 이는 식품 응용에서 관심 대상 산업용 효소, 변이형, 및 혼합물의 생산자로서 이러한 사용에 적합하고 유리한 개선된 단백질 생산을 보여주었다.
또 다른 예에서, 이와 같이 제조된 단백질성 조성물은 동물 사료 첨가제에서 사용될 수 있다. 셀룰라아제, 자일라나아제, β-글루카나아제, 프로테아제, 리파아제, 피타아제 및 다른 관심 대상 탄수화물 분해효소가 동물 사료 산업에 널리 사용되고 있다. 많은 식물 기반 사료가 동물 성장을 감소시키는 항-영양 인자를 갖는 물질을 함유하기 때문에, 이러한 사료에 첨가되는 효소는 섬유, 단백질, 전분 및 피테이트를 분해시킴으로써 이들 항-영양 인자의 소화성을 개선시켜, 이들이 동물에 의해 더 많이 분해될 수 있게 하고, 더 저렴한 그리고 흔히 현지 생산된 사료의 사용을 가능하게 하는 한편 고기, 난류 또는 우유 생산성을 최대화한다. 이와 동시에, 이러한 사료에 첨가된 효소는 또한 소화기관 건강 및 향상된 동물 능력을 지원하는 혜택을 제공할 수 있다. 본 개시는 엔지니어링된, 형질전환된, 또는 유도된 진정세균 세포를 제공하는데, 이는 동물 사료 응용에서 관심 대상 산업용 효소, 변이형, 및 혼합물의 생산자로서 이러한 사용에 적합하고 유리한 개선된 단백질 생산을 보여주었다.
또한 추가의 예에서, 이와 같이 제조된 단백질성 조성물은 직물 응용에서 사용될 수 있다. 효소는 직물 가공의 필수적인 부분이 되었다. 직물 산업에는 두 가지 잘 확립된 효소 응용이 있다. 첫째, 아밀라아제와 같은 효소는 보통 발호(desizing)를 위한 예비적 마감 영역에서 사용된다. 둘째, 셀룰라아제와 같은 효소는 보통 면 제품의 유연화, 바이오-스토닝(bio-stoning) 및 보풀(pilling) 경향 감소를 위한 마감 영역에서 사용된다.
예를 들어, 펙티나아제, 리파아제, 프로테아제, 카탈라아제, 자일라나아제 등과 같은 다른 효소도 직물 가공에서 사용된다. 게다가, 데님 및 비-데님의 효소 포함된 색바램, 바이오-스코어링(bio-scouring), 바이오-폴리싱(bio-polishing), 울 피니싱(wool finishing), 과산화물 제거, 염료의 탈색 등을 수반하는 다양한 응용이 있다. 따라서, 특정 구현예에서, 본 개시는 직물 응용에서 관심 대상 산업용 효소, 변이형, 및 혼합물의 생산자로서 이러한 사용에 변형 그람 양성 박테리아 세포(이는 본원에서 개선된 단백질 생산을 갖는 것으로 입증됨)를 제공한다.
본원에 개시된 조성물 및 방법의 비제한적인 예는 다음과 같다:
1. 비변형(모) 그람 양성 박테리아 세포에 비해 증가된 양의 관심 대상 단백질(POI)을 생산하는 변형 그람 양성 박테리아 세포로서, 여기에서 변형 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함하는 변형 세포.
2. 제1항에 있어서, rasP 유전자 발현을 증가시키는 변형은 내인성 염색체 rasP 유전자에 대한 변형인 변형 세포.
3. 제2항에 있어서, 내인성 염색체 rasP 유전자의 천연 프로모터는 천연 rasP 프로모터보다 더 높은 활성을 갖는 임의의 프로모터로 교체된 변형 세포.
4. 제2항에 있어서, 내인성 염색체 rasP 유전자의 천연 프로모터는 spoVG 프로모터 또는 aprE 프로모터로 교체된 변형 세포.
5. 제4항에 있어서, spoVG 프로모터는 서열번호: 3에 대하여 95%의 서열 동일성을 포함하는 뉴클레오티드 서열을 포함하는 변형 세포.
6. 제4항에 있어서, aprE 프로모터는 서열번호: 4에 대하여 95%의 서열 동일성을 포함하는 뉴클레오티드 서열을 포함하는 변형 세포.
7. 제2항에 있어서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 5'-비번역 영역(5'-UTR)의 변형인 변형 세포.
8. 제7항에 있어서, 천연 rasP 염색체 5'-UTR은 서열번호: 5의 aprE 5'-UTR에 대하여 95%의 서열 동일성을 포함하는 5'-UTR로 교체된 변형 세포.
9. 제2항에 있어서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 프로모터 및 천연 5'-UTR 둘 다의 변형인 변형 세포.
10. 제1항에 있어서, rasP 유전자 발현을 증가시키는 변형은 rasP 유전자를 포함하는 외인성 폴리뉴클레오티드인 변형 세포.
11. 제10항에 있어서, rasP 유전자를 포함하는 외인성 폴리뉴클레오티드는 염색체외 플라스미드 내에 포함되는 변형 세포.
12. 제11항에 있어서, 염색체외 플라스미드는 발현 카세트인 변형 세포.
13. 제11항에 있어서, 염색체외 플라스미드는 통합 플라스미드인 변형 세포.
14. 제13항에 있어서, 플라스미드는 변형 세포의 염색체로 안정적으로 통합되는 변형 세포.
15. 제1항에 있어서, rasP 발현을 증가시키는 유전적 변형은 외인성 rasP 오픈 리딩 프레임(ORF)을 포함하는 폴리뉴클레오티드이며, 여기에서 ORF는 구성적 프로모터, 유도 가능한 프로모터 또는 조건부 프로모터에 작동 가능하게 연결되고 그의 제어 하에 있는 변형 세포.
16. 제15항에 있어서, rasP ORF를 포함하는 외인성 폴리뉴클레오티드는 염색체외 플라스미드 내에 포함되는 변형 세포.
17. 제16항에 있어서, 염색체외 플라스미드는 발현 카세트인 변형 세포.
18. 제16항에 있어서, 염색체외 플라스미드는 통합 플라스미드인 변형 세포.
19. 제18항에 있어서, 플라스미드는 변형 세포의 염색체로 통합되는 변형 세포.
20. 제1항에 있어서, rasP 유전자는 서열번호: 1의 오픈 리딩 프레임(ORF) 핵산 서열에 대하여 적어도 60%의 서열 동일성을 포함하는 핵산 서열을 포함하는 변형 세포.
21. 제20항에 있어서, 서열번호: 1의 ORF는 RasP 폴리펩티드를 암호화하는데, 여기에서 RasP 폴리펩티드는 부위-2 프로테아제(S2P) 활성을 갖는 Zn2 + 메탈로프로테아제로서 추가로 정의되는 변형 세포.
22. 제1항에 있어서, rasP 유전자는 서열번호: 2의 RasP 폴리펩티드에 대하여 60%의 아미노산 서열 동일성을 포함하는 RasP 폴리펩티드를 암호화하고 서열번호: 6의 활성 부위 공통 서열을 포함하는데, 이는 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 16 내지 26과 정렬되는 변형 세포.
23. 제1항에 있어서, rasP 유전자는 서열번호: 2의 RasP 폴리펩티드에 대하여 80%의 아미노산 서열 동일성을 포함하는 RasP 폴리펩티드를 암호화하고 서열번호: 7의 활성 부위 공통 서열(HEXXH)을 포함하는데, 이는 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 20 내지 24와 정렬되는 변형 세포.
24. 제1항에 있어서, 생산된 POI의 증가된 양은 비변형(모) 그람 양성 세포에 비해 적어도 5% 증가인 변형 세포.
25. 제1항에 있어서, 생산된 POI의 증가된 양은 비변형(모) 그람 양성 세포에 비해 적어도 10% 증가인 변형 세포.
26. 제1항에 있어서, 그람 양성 박테리아 세포는 바실루스(Bacillus) 속의 구성원인 변형 세포.
27. 제26항에 있어서, 바실루스는 B. 서브틸리스 ( subtilis ), B. 리케니포르미스(licheniformis), B. 렌투스 ( lentus ), B. 브레비스 ( brevis ), B. 스테아로서모필루스 (stearothermophilus), B. 알칼로필루스 ( alkalophilus ), B. 아밀로리쿠에파시엔스 (amyloliquefaciens), B. 클라우시이 ( clausii ), B. 소노렌시스 (sonorensis), B. 할로두란스 ( halodurans ), B. 푸밀루스 ( pumilus ), B. 라우투스 (lautus), B. 파불리 ( pabuli ), B. 세레우스( cereus ), B. 아가라드하에렌스 (agaradhaerens), B 아키바이 ( akibai ), B. 클라르키이 ( clarkii ), B. 슈도피르무스 (pseudofirmus), B. 레헨시스 ( lehensis ), B. 메가테륨 ( megaterium ), B. 코아굴란스 (coagulans), B. 서쿨란스 ( circulans ), B. 깁소니이 ( gibsonii ), B. 마르마렌시스 (marmarensis), 및 B. 투린 기엔시스(thuringiensis)로부터 선택되는 변형 세포.
28. 제27항에 있어서, 바실루스는 B. 서브틸리스 또는 B. 리케니포르미스인 변형 세포.
29. 제1항에 있어서, POI는 변형 박테리아 세포에 대하여 외인성인 유전자 또는 변형 박테리아 세포에 대하여 내인성인 유전자에 의해 암호화되는 변형 세포.
30. 제1항에 있어서, POI는 세포외로 분비되거나 수송되는 변형 세포.
31. 제30항에 있어서, 세포외로 분비되거나 수송된 POI는 추가로 단리 및 정제되는 변형 세포.
32. 제1항에 있어서, POI는 효소인 변형 세포.
33. 제32항에 있어서, 효소는 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 람노-갈락투로나아제, 리보뉴클레아제, 타우마틴, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이들의 조합으로 구성되는 군으로부터 선택되는 변형 세포.
34. 제1항의 변형 세포에 의해 생산되는 단리된 POI.
35. (a) 증가된 양의 POI를 생산하는 변형 그람 양성 박테리아 세포를 얻는 단계(여기에서 변형 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함함), 및
(b) POI가 발현되도록 하는 조건 하에 변형 세포를 배양하는 단계(여기에서 증가된 양의 POI를 생산하는 변형 박테리아 세포는 비변형(모) 그람 양성 박테리아 세포에서의 동일한 POI의 생산과 비교됨)를 포함하는,
그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법.
36. 제35항에 있어서, rasP 유전자 발현을 증가시키는 변형은 내인성 염색체 rasP 유전자에 대한 변형인 방법.
37. 제36항에 있어서, 내인성 염색체 rasP 유전자의 천연 프로모터는 천연 rasP 프로모터보다 더 높은 활성을 갖는 임의의 프로모터로 교체되는 방법.
38. 제35항에 있어서, 내인성 염색체 rasP 유전자의 천연 프로모터는 spoVG 프로모터 또는 aprE 프로모터로 교체되는 방법.
39. 제38항에 있어서, spoVG 프로모터는 서열번호: 3에 대하여 95%의 서열 동일성을 포함하는 뉴클레오티드 서열을 포함하는 방법.
40. 제38항에 있어서, aprE 프로모터는 서열번호: 4에 대하여 95%의 서열 동일성을 포함하는 뉴클레오티드 서열을 포함하는 방법.
41. 제35항에 있어서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 5'-비번역 영역(5'-UTR)의 변형인 방법.
42. 제41항에 있어서, 천연 rasP 염색체 5'-UTR은 서열번호: 5의 aprE 5'-UTR에 대하여 95%의 서열 동일성을 포함하는 5'-UTR로 교체되는 방법.
43. 제35항에 있어서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 프로모터 및 천연 5'-UTR 둘 다의 변형인 방법.
44. 제35항에 있어서, rasP 유전자 발현을 증가시키는 변형은 rasP 유전자를 포함하는 외인성 폴리뉴클레오티드인 방법.
45. 제44항에 있어서, rasP 유전자를 포함하는 외인성 폴리뉴클레오티드는 염색체외 플라스미드 내에 포함되는 방법.
46. 제45항에 있어서, 염색체외 플라스미드는 발현 카세트인 방법.
47. 제45항에 있어서, 염색체외 플라스미드는 통합 플라스미드인 방법.
48. 제47항에 있어서, 플라스미드는 변형 세포의 염색체로 통합되는 방법.
49. 제35항에 있어서, rasP 발현을 증가시키는 유전적 변형은 외인성 rasP 오픈 리딩 프레임(ORF)을 포함하는 폴리뉴클레오티드이며, 여기에서 ORF는 구성적 프로모터, 유도 가능한 프로모터 또는 조건부 프로모터에 작동 가능하게 연결되고 그의 제어 하에 있는 방법.
50. 제49항에 있어서, rasP ORF를 포함하는 외인성 폴리뉴클레오티드는 염색체외 플라스미드 내에 포함되는 방법.
51. 제50항에 있어서, 염색체외 플라스미드는 발현 카세트인 방법.
52. 제50항에 있어서, 염색체외 플라스미드는 통합 플라스미드인 방법.
53. 제52항에 있어서, 플라스미드는 변형 세포의 염색체로 통합되는 방법.
54. 제35항에 있어서, rasP 유전자는 서열번호: 1의 오픈 리딩 프레임(ORF) 핵산 서열에 대하여 적어도 60%의 서열 동일성을 포함하는 핵산 서열을 포함하는 방법.
55. 제54항에 있어서, 서열번호: 1의 ORF는 RasP 폴리펩티드를 암호화하는데, 여기에서 RasP 폴리펩티드는 부위-2 프로테아제(S2P) 활성을 갖는 Zn2 + 메탈로프로테아제로서 추가로 정의되는 방법.
56. 제35항에 있어서, rasP 유전자는 서열번호: 2의 RasP 폴리펩티드에 대하여 60%의 아미노산 서열 동일성을 포함하는 RasP 폴리펩티드를 암호화하고 서열번호: 7의 활성 부위 공통 서열을 포함하는데, 이는 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 16 내지 26과 정렬되는 방법.
57. 제35항에 있어서, rasP 유전자는 서열번호: 2의 RasP 폴리펩티드에 대하여 80%의 아미노산 서열 동일성을 포함하는 RasP 폴리펩티드를 암호화하고 서열번호: 7의 활성 부위 공통 서열을 포함하는데, 이는 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 20 내지 24와 정렬되는 방법.
58. 제35항에 있어서, 생산된 POI의 증가된 양은 비변형(모) 그람 양성 세포에 비해 적어도 5% 증가인 방법.
59. 제35항에 있어서, 생산된 POI의 증가된 양은 비변형(모) 그람 양성 세포에 비해 적어도 10% 증가인 방법.
60. 제35항에 있어서, 그람 양성 박테리아 세포는 바실루스(Bacillus) 속의 구성원인 방법.
61. 제60항에 있어서, 바실루스는 B. 서브틸리스 ( subtilis ), B. 리케니포르미스(licheniformis), B. 렌투스 ( lentus ), B. 브레비스 ( brevis ), B. 스테아로서모필루스 (stearothermophilus), B. 알칼로필루스 ( alkalophilus ), B. 아밀로리쿠에파시엔스 (amyloliquefaciens), B. 클라우시이 ( clausii ), B. 소노렌시스 ( sonorensis ), B. 할로두란스(halodurans), B. 푸밀루스 ( pumilus ), B. 라우투스 ( lautus ), B. 파불리 (pabuli), B. 세레우스( cereus ), B. 아가라드하에렌스 ( agaradhaerens ), B 아키바이 (akibai), B. 클라르키이 ( clarkii ), B. 슈도피르무스 ( pseudofirmus ), B. 레헨시스 (lehensis), B. 메가테륨 ( megaterium ), B. 코아굴란스 ( coagulans ), B. 서쿨란스 (circulans), B. 깁소니이 ( gibsonii ), B. 마르마렌시스 ( marmarensis ), 및 B. 투린 기엔시스(thuringiensis)로부터 선택되는 방법.
62. 제61항에 있어서, 바실루스는 B. 서브틸리스 또는 B. 리케니포르미스인 방법.
63. 제35항에 있어서, POI는 변형 박테리아 세포에 대하여 외인성인 유전자 또는 변형 박테리아 세포에 대하여 내인성인 유전자에 의해 암호화되는 방법.
64. 제35항에 있어서, POI는 세포외로 분비되거나 수송되는 방법.
65. 제64항에 있어서, 세포외로 분비되거나 수송된 POI는 추가로 단리 및 정제되는 방법.
66. 제35항에 있어서, POI는 효소인 방법.
67. 제66항에 있어서, 효소는 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 람노-갈락투로나아제, 리보뉴클레아제, 타우마틴, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이들의 조합으로 구성되는 군으로부터 선택되는 방법.
68. 제35항의 방법에 의해 생산되는 단리된 POI.
69. (a) 모 그람 양성 박테리아 세포로 rasP 유전자 발현을 증가시키는 적어도 하나의 유전자 변형을 도입하는 단계, 및
(b) 증가된 양의 POI를 발현하는 하나 이상의 딸 세포를 선택하는 단계(여기에서 증가된 양의 POI를 생산하기 위해 선택된 하나 이상의 딸 세포는 변형(딸) 그람 양성 박테리아 세포로 정의됨)를 포함하는,
증가된 양의 POI를 생산하는 변형 그람 양성 박테리아 세포를 수득하는 방법.
실시예
본 개시의 특정 양태는 다음 실시예를 고려하여 추가로 이해될 수 있는데, 이는 제한하는 것으로 해석되어서는 안된다. 재료 및 방법에 대한 변형은 당업자에게 명백할 것이다.
실시예
1
변형
바실루스
서브틸리스
숙주 세포의 구축
Taq 폴리머라아제, dNTP 및 완충액은 Takara Bio Inc.(Clontech Laboratories, Inc.; Mountain View, CA)에서 구입하였고 아래 기술된 돌연변이체 B. 서브틸리스 세포의 구축에 사용하였다. Phusion High Fidelity DNA 폴리머라아제(New England Biolabs; Ipswich, MA)는 벡터의 구축에 사용하였다. 프라이머는 Eurogentec(Liege, Belgium)으로부터 입수하였다.
A. 결실된
rasP
유전자를 포함하는 변형
B.
서브틸리스
숙주의 구축.
B. 서브틸리스 세포에서 rasP 결실 돌연변이체("ΔrasP")의 구축은 Fabret et al. (2002)에 의하여 기술된 변형 돌연변이 전달 방법을 사용하여 수행하였는데, 여기에서 모 B. 서브틸리스 세포는 Fabret et al. (2002)에 제시된 바와 같이 결실된 upp 유전자("Δupp")를 포함한다. B. 서브틸리스(Δupp) 세포에서 rasP 유전자를 완전히 교체(결실)시키기 위해, rasP 유전자의 5' 및 3' 측면(flanking) 영역을 서열번호: 44 및 서열 번호: 45의 PCR 프라이머 쌍을 사용하여 증폭시켰다.
증폭된 rasP 단편을 upp 유전자 및 cI 유전자를 포함하는 플레오마이신 저항성 카세트에 융합시켰다(Fabret et al., 2002 참조). 생성된 융합 생성물을 사용하여 컴피턴트(competent) B. 서브틸리스 Δupp :: neoR(모) 세포를 형질전환시켰는데, 여기에서 컴피턴스(competence)는 0.3% 자일로오스로 유도되었다. 이것은 표적 rasP 유전자가 결여된 플레오마이신 저항성 및 네오마이신 민감성 (딸) 세포를 생성하였다. PCR 반응은 표적 rasP 유전자의 정확한 결실을 확인하기 위해 서열번호: 10/서열번호: 9의 올리고뉴클레오티드 쌍 및 서열번호: 10/서열번호: 11의 올리고뉴클레오티드 프라이머를 사용하여 수행하였다.
B. 결실된
tepA
유전자를 포함하는 변형
B.
서브틸리스
숙주의 구축
Fabret et al. (2002)의 변형 돌연변이 전달 방법을 추가로 이용하여 B. 서 브틸리스(Δupp) 세포에서 tepA 유전자의 결실 돌연변이체("ΔtepA")를 구축하였다. 이에 따라, tepA 유전자를 완전히 교체하기 위해, 이들 유전자의 5' 및 3' 측면 영역을 서열번호: 12/서열번호: 13 및 서열번호: 14/서열번호: 15의 PCR 프라이머 쌍을 사용하여 증폭시켰다. 다음에 증폭된 단편을 upp 및 cI 유전자를 포함하는 플레오마이신 저항성 카세트에 융합시켰다(Fabret et al., 2002 참조). 다음에 생성된 융합 생성물을 사용하여 컴피턴트 B. 서브틸리스 Δupp :: neoR(모) 세포를 형질전환시켰는데, 여기에서 컴피턴스는 0.3% 자일로오스로 유도되었다. 이것은 표적 tepA 유전자가 결여된 플레오마이신 저항성 및 네오마이신 민감성 균주를 생성하였다. PCR 반응은 tepA 유전자의 정확한 결실을 확인하기 위해 서열번호: 16/서열번호: 15 및 서열번호: 16/서열번호: 11의 프라이머 조합을 사용하여 수행하였다.
C.
rasP
유전자를 과발현하는 변형
B.
서브틸리스
세포의 구축
1. 통합 벡터
pRS
-
spoIIIAA
~AG
의 구축.
spoIIIAA ~AB 유전자의 1,040 염기쌍 DNA 단편(서열번호: 17)을 서열번호: 18/서열번호: 19의 프라이머 쌍을 사용하여 증폭시켰다. 스펙티노마이신 저항성 마커는 두 개의 lox 서열을 측면으로 하여(즉, 서열번호: 20), IDT(Integrated DNA Technologies)로부터 g-Block으로서 주문 합성하였다. spoIIIAF ~AG 유전자에서 981 염기쌍 DNA 서열(즉, 서열번호: 21)은 서열번호: 22 및 서열 번호: 23의 올리고뉴클레오티드를 사용하여 증폭시켰다. 상업적으로 입수 가능한 플라스미드 "pRS426"을 서열번호: 24 및 서열 번호: 25의 올리고뉴클레오티드를 사용하여 증폭시켰다. 이어서, 위의 DNA 서열(즉, 서열번호: 17, 서열번호: 20, 서열번호: 21) 및 pRS426 증폭된 벡터를 Gibson Assembly® HiFi 1 Step Kit(SGI)를 사용하여 시험관내 조립하여 통합 벡터 "pRS-spoIIIAA~AG"를 생성하였다.
2. 플라스미드
pRS
-
spoIIIAA
~AG-
PspoVG
-
rasP
의
구축.
본원에 기술된 특정 rasP 과발현 실험을 위해, B. 서브틸리스 spoVG 유전자의 프로모터를 사용하여 rasP 유전자를 구동(과발현)시켰다. 예를 들어, spoVG 프로모터의 서열을 포함하는 합성 g-Block(서열번호: 3)을 IDT(Integrated DNA Technologies)로부터 주문하였다. rasP 코딩 서열을 서열번호: 26 및 서열 번호: 27의 올리고뉴클레오티드를 사용하여 PCR에 의해 증폭시켰다. "pRS-spoIIIAA ~AG"로 지칭된 플라스미드를 서열번호: 28 및 서열 번호: 29의 올리고뉴클레오티드를 사용하여 증폭시켰다. 플라스미드 "pRS-spoIIIAA ~AG- PspoVG - rasP"는 Gibson Assembly® HiFi 1 Step Kit(SGI)를 사용하여 spoVG 프로모터 서열, rasP 코딩 서열 및 플라스미드 pRS-spoIIIAA ~AG의 조립에 의해 제작하였다. RasP 폴리펩티드의 발현 및 생산을 더욱 증가시키기 위해, 서열번호: 5의 aprE(유전자) 리더 서열(즉, 5'-UTR)을 rasP 유전자의 앞(5')으로 클로닝하여, 플라스미드 "pRS-spoIIIAA ~AG- PspoVG - UTR -rasP"를 생성하였다.
3. 플라스미드
pRS
-
spoIIIAA
~AG-
PaprE
-
rasP
의
구축.
본원에서 "pRS-spoIIIAA ~AG- PaprE - rasP"로 칭한 rasP(유전자) 과발현 플라스미드를 구축하기 위해, B. 서브틸리스 aprE(유전자) 프로모터("PaprE"; 서열번호: 4)를 벡터 내에 5'로 포함시키고 rasP 코딩 서열에 작동 가능하게 연결하였다. B. 서브틸리스 aprE 프로모터의 뉴클레오티드 서열을 PCR에 의해 B. 서브틸리스의 게놈으로부터 서열번호: 30 및 서열번호: 31의 올리고뉴클레오티드를 사용하여 증폭시켰다. 플라스미드 "pRS-spoIIIAA ~AG- PspoVG - rasP"를 PCR에 의해 서열번호: 32 및 서열번호: 33의 올리고뉴클레오티드를 사용하여 증폭시켰다. aprE 프로모터(PaprE) 및 플라스미드를 Gibson Assembly® HiFi 1 Step Kit(SGI)로 연결시켰다.
4. 플라스미드
pRS
-
spoIIIAA
~AG-
PspoVG
-
tepA
의
구축.
신호 펩티드 펩티다아제 tepA의 뉴클레오티드 서열을 B. 서브틸리스 게놈 DNA로부터 서열번호: 34 및 서열번호: 35의 올리고뉴클레오티드를 사용하여 증폭시켰다. pRS-spoIIIAA~AG-PspoVG-rasP의 플라스미드 골격을 PCR에 의해 서열번호: 36/서열번호: 37의 올리고뉴클레오티드 쌍을 사용하여 증폭시켰다. tepA 유전자 서열 및 증폭된 플라스미드를 Gibson Assembly® HiFi 1 Step Kit(SGI)로 연결시켰다. 생성된 플라스미드를 pRS-spoIIIAG-PspoVG-tepA로 명명하였다.
실시예
2
이종
rasP
또는
tepA
유전자 구축물로
B.
서브틸리스
숙주 세포의 형질전환
플라스미드 pRS-spoIIIAA ~AG- PspoVG - rasP(실시예 1.C.2 참조), pRS-spoIIIAA~AG-PspoVG-UTR-rasP(실시예 1.C.2 참조), pRS-spoIIIAA ~AG- PaprE - rasP(실시예 1.C.3 참조) 및 pRS-spoIIIAA ~AG- PspoVG - tepA(실시예 1.C.4 참조)를 각각 제한 엔도뉴클레아제 ScaI로 선형으로 하고 각각의 플라스미드를 별개로 컴피턴트 바실루스 서브틸리스 세포를 형질전환시켰다. 양성 콜로니를 100 ㎍/mL의 스펙티노마이신을 함유하는 루리아(Luria) 한천 플레이트에서 선택하였다. 생성된(형질전환된) B. 서브틸리 스(딸) 세포는 본원에서 "PspoVG-rasP", "PspoVG-UTR-rasP", "PaprE-rasP" 및 PspoVG-tepA로서 언급된다.
실시예
3
관심 대상 단백질을 암호화하는 이종 유전자(발현 구축물)로의 변형
B.
서브틸리스
(숙주) 세포의 형질전환
A.
AmyL
발현 구축물
B. 서브틸리스 aprE 프로모터("PaprE") 및 aprE 신호 서열("aprE UTR", 이하 "UTR"; 실시예 1.C.2 참조)을 사용하여 바실루스 리케니포르미스 "AmyL" 아밀라아제(성숙 서열 서열번호: 38)의 발현을 구동하였다. 본원에서 "PaprE-AmyL-catR"(클로람페니콜 아세틸트랜스퍼라아제 저항성("catR") 마커 유전자를 포함함)로서 지칭되는 발현 구축물로 (1) B. 서브틸리스 야생형("wt") 세포(즉, 모 세포)를, (2) rasP 결실(ΔrasP)을 포함하는 변형(딸) B. 서브틸리스 세포를, 그리고 (3) tepA 결실(ΔtepA)을 포함하는 변형(딸) B. 서브틸리스 세포를 형질전환시켰다. 형질전환체를 5 ㎍/mL의 클로람페니콜을 함유하는 루리아 한천 플레이트 상에서 선택하였다.
B. 아밀라아제
PcuAmy1
-v6를 위한 발현 구축물
B. 서브틸리스 aprE 프로모터("PaprE") 및 aprE 신호 서열("UTR")을 사용하여 PcuAmy1-v6로 지칭된 파에니바실루스 쿠르들라놀리티쿠스(Paenibacillus curdlanolyticus) 아밀라아제(성숙 서열 서열번호: 39) 변이형의 발현을 구동시켰다. "PaprE-PcuAmy1-v6-catR"(클로람페니콜 아세틸트랜스퍼라아제 저항성(catR) 마커 유전자를 포함함)로 지칭된 발현 카세트로 (1) rasP 유전자를 포함하고 "PspoVG" 프로모터의 제어 하에 발현/과발현하는 변형 B. 서브틸리스(딸) 세포(즉, 위의 실시예 2에 기술된 "PspoVG-rasP" 세포)를, (2) rasP 유전자를 포함하고 PaprE 프로모터의 제어 하에 발현/과발현하는 변형 B. 서브틸리스(딸) 세포(즉, 위의 실시예 2에 기술된 "PaprE-rasP" 세포)를, (3) tepA 유전자를 포함하고 "PspoVG" 프로모터의 제어 하에 발현/과발현하는 변형 B. 서브틸리스(딸) 세포(즉, 위의 실시예 2에 기술된 "PspoVG-tepA" 세포)를, 그리고 (4) B. 서브틸리스(모) 세포를 형질전환시켰다. 양성 콜로니를 5 ㎍/mL의 클로람페니콜을 함유하는 루리아 한천 플레이트 상에서 선택하였다.
C.
AmyE
발현 구축물
B. 서브틸리스 aprE 프로모터("PaprE")를 사용하여 B. 서브틸리스 "AmyE" 아밀라아제(성숙 서열 서열번호: 40)의 발현을 구동시켰다. "PaprE-amyE-catR"(클로람페니콜 아세틸트랜스퍼라아제 저항성(catR) 마커 유전자를 포함함)로 지칭된 발현 카세트를 (1) rasP 유전자를 포함하고 "PspoVG" 프로모터의 제어 하에 발현/과발현하는 변형 B. 서브틸리스 세포(즉, 위의 실시예 2에 기술된 "PspoVG-rasP" 세포)로, (2) rasP 유전자를 포함하고 "PspoVG" 프로모터 및 aprE UTR의 제어 하에 발현/과발현하는 변형 B. 서브틸리스 세포(즉, 위의 실시예 2에 기술된 "PspoVG-UTR-rasP" 세포)로, (3) rasP 유전자를 포함하고 "PaprE" 프로모터의 제어 하에 발현/과발현하는 변형 B. 서브틸리스 세포(즉, 위의 실시예 2에 기술된 "PaprE-rasP" 세포)로, (4) tepA 유전자를 포함하고 "PspoVG" 프로모터의 제어 하에 발현/과발현하는 변형 B. 서브틸리스 세포(위의 실시예 2에 기술된 "PspoVG-tepA" 세포)로, (5) rasP(ΔrasP) 유전자 결실을 포함하는 변형 B. 서브틸리스 세포(실시예 1.A 참조)로, (6) tepA(ΔtepA) 유전자 결실을 포함하는 변형 B. 서브틸리스 세포(실시예 1.B 참조)로, 그리고 (7) 비변형(모) B. 서브틸리스 대조 세포의 게놈 aprE 유전자좌로 도입하였다. 양성 콜로니를 5 ㎍/mL의 클로람페니콜을 함유하는 루리아 한천 플레이트 상에서 선택하였다.
D.
BglC
발현 구축물
B. 서브틸리스 β-D-글루코시다아제(이하, "BglC"; 성숙 서열 서열번호: 41)를 암호화하는 발현 구축물(이의 발현은 aprE 프로모터(PaprE)의 제어 하에 있음)을 구축하고 "PaprE - BglC - catR"로 지칭하였다. PaprE - BglC - catR 구축물을 (1) 야생형(비변형; 모) B. 서브틸리스 세포, (2) "PspoVG-rasP"를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포, (3) "PaprE-rasP"를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포, 및 (4) "PspoVG-tepA"를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포의 aprE 유전자좌로 도입하였다. 양성 콜로니를 5 ㎍/mL의 클로람페니콜을 함유하는 루리아 한천 플레이트 상에서 선택하였다.
E.
프로페라아제
발현 구축물
프로테아제인 프로페라아제(성숙 서열 서열번호: 42)를 암호화하는 발현 구축물(이의 발현은 aprE 프로모터(PaprE)의 제어 하에 있음)을 구축하고 "PaprE -Properase-catR"로 지칭하였다. PaprE - Properase - catR 발현 구축물을 (1) "PspoVG-rasP"를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포, (2) "PaprE-rasP"를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포, (3) "PspoVG-tepA"를 포함하고 발현/과발현하는 변형 B. 서브틸리스 세포, 및 (4) 야생형(비변형; 모) B. 서브 틸리스 세포의 aprE 유전자좌로 도입하였다. 양성 콜로니를 5 ㎍/mL의 클로람페니콜을 함유하는 루리아 한천 플레이트 상에서 선택하였다. 클로람페니콜 저항성 콜로니를 25 ㎍/mL의 클로람페니콜을 함유하는 루리아 한천 플레이트 상에서 증폭시켰다.
F.
BPN
'-
Y217L
발현 구축물
바실루스 아밀로리쿠에파시엔스 프로테아제 BPN'-Y217L(서열번호: 43)를 암호화하는 발현 구축물(이의 발현은 aprE 프로모터(PaprE)의 제어 하에 있음)을 구축하고 "PaprE-BPN'-Y217L-catR"로 지칭하였다. PaprE-BPN'-Y217L-catR 발현 카세트로 (1) rasP(ΔrasP) 유전자 결실을 포함하는 변형 바실루스 서브틸리스 세포, (2) tepA(ΔtepA) 유전자 결실을 포함하는 변형 바실루스 서브틸리스 세포, 및 (3) 야생형(비변형; 모) B. 서브틸리스 세포를 형질전환시켰다. PaprE-BPN'-Y217L-catR 구축물을 갖는 콜로니를 5 ㎍/mL의 클로람페니콜을 함유하는 루리아 한천 플레이트 상에서 선택하였다.
실시예 4
관심 대상 단백질의 발현 및 생산
A. 재료 및 방법
박테리아 성장 조건. B . 서브틸리스 세포를 용원성 브로스(Lysogeny Broth, LB; Oxoid Limited) 또는 MBU 배지에서 37℃, 280 rpm으로 성장시켰다. MBU 배지는 Vogtentanz et al., (2007)에 기술된 바와 같이 MBD 배지와 유사하지만 소이톤이 결여되고, 7.5% 글루코오스 대신 2.1% 글루코오스 및 3.5% 말토덱스트린 DE13-17을 함유한다. 필요시, 배지는 돌연변이의 선택을 위해 네오마이신 15 ㎍/mL 또는 플레오마이신 4 ㎍/mL, 또는 아밀라아제 또는 프로테아제 유전자의 선택 또는 증폭을 위해 (각각) 클로람페니콜 5 ㎍/mL 또는 25 ㎍/mL로 보충되었다. MBU 배지 상에서의 펄스-추적 표지 실험에서 2.5 ㎍/mL 클로람페니콜이 사용되었다.
성장의 분석. B. 서브틸리스 세포를 LB 중 2.5 ㎍/mL 클로람페니콜과 함께 37℃, 250 rpm으로 밤새 성장시켰다. 배양액을 96-웰 미세적정 플레이트에서 LB 중에 50배 희석하고 미세적정 플레이트 인큐베이터(Grant-bio PHMP-4, Grant Instruments Ltd)에서 37℃, 800 rpm으로 대략 3시간 동안 성장시켰다. 다음에 배양액을 MBU 중에 50배 희석하고 미세적정 플레이트 인큐베이터에서 37℃, 800 rpm으로 3시간 동안 성장시켰다. 신선한 MBU 중에 최종 50배 희석을 하고 PowerWave HT 마이크로플레이트 분광 광도계(Biotek)에서 OD600 측정에 의해 성장을 모니터링하였다.
단백질 발현 및 분비의 분석. B. 서브틸리스 배양물을 25 ㎍/mL 클로람페니콜을 함유하는 LB 플레이트에 접종하고 25 ㎍/mL 클로람페니콜을 함유하는 LB 브로스에서 대략 8시간 동안 성장시켰다. 이들 배양물을 2.5 ㎍/mL 클로람페니콜을 함유하는 MBU 배지로 진탕 플라스크에서 1000배 희석하고 Multitron 궤도 진탕기(Infors)에서 고습도 중 37℃, 280 rpm으로 대략 16시간 동안 인큐베이션하였다. OD600을 측정 및 보정한 후, 동량의 세포를 원심분리에 의해 배양 배지로부터 분리하였다. 세포외 단백질의 분석을 위해, 배양 배지의 단백질을 트리클로로아세트산(TCA; 10% w/v 최종 농도)으로 침전시키고, LDS 완충액(Life Technologies)에 용해하여 95℃에서 10분 동안 가열하였다. 다음에, 단백질을 10% NuPage 겔(Life Technologies) 상에서 LDS-PAGE에 의해 분리하고 SimplyBlueTM SafeStain(Life Technologies)으로 염색하였다.
펄스-추적 단백질 표지 실험. B. 서브틸리스 단백질의 펄스-추적 표지는 Easy 태그 35S 메티오닌(PerkinElmer Inc.)을 사용하여 수행하였다. 면역침전 및 LDS-PAGE는 이전에 기술된 바와 같이(Van Dijl et al., 1991) 다음 조정을 사용하여 수행하였다. 세포를 이전에 기술된 바와 같이 2.5 ㎍/mL 클로람페니콜이 함유된 MBU에서 16시간 동안 성장시키고 실제 표지 1시간 전에 대략 0.7의 OD600까지 2.5 ㎍/mL 클로람페니콜을 함유하는 신선한 MBU 중에 희석하였다. 표지를 25 μCi 35S Met으로 30초 동안 수행한 후 과량의 비표지 메티오닌(추적; 0.625 mg/mL 최종 농도)을 첨가하였다. 샘플을 수 회의 시점에서 수집한 다음, 얼음 상에서 10% TCA로 단백질의 직접 침전이 이어졌다. 침전을 용해 완충액(10 mM Tris pH 8.0, 25 mM MgCl2, 200 mM NaCl 및 5 mg/mL 리소자임)에 재현탁하였다. 37℃에서 10 내지 15분의 인큐베이션 후, 1%(w/v) SDS를 첨가하고 100℃에서 10분 동안 가열함으로써 용해를 달성하였다.
AmyE 또는 AmyL에 대한 특이적 다클론 항체가 단백질-A 친화성 배지(Mabselect Sule, GE Healthcare Life Sciences)의 지원으로 STD-트리스 완충액(10 mM 트리스 pH 8.2, 0.9% (w/v) NaCl, 1.0% (v/v) 트리톤 X-100, 0.5% (w/v) 데옥시콜산나트륨)에서 각각의 표지된 단백질의 면역침전을 위해 사용되었다. 이 또한 항체를 분해시키는 BPN'-Y217L의 높은 단백질분해 활성 때문에, BPN'-Y217L의 면역침전은 특이적 세린 프로테아제 저해제(4 mM, Pefablock SC, Roche)의 존재 중에 수행되었다. B. 서브틸리스의 미확인 세포 단백질에 대한 BPN'-Y217L 항체의 특이적 결합으로 인해, BPN'-Y217L의 면역침전은 TCA-침전 배양 배지 샘플에서 분비된 BPN'-Y217L 분석에 대해서만 수행되었다. 표지된 단백질을 10% NuPage 겔(Life Technologies)을 사용하여 LDS-PAGE에 의해 분리하고 Cyclon Plus Phosphor Imager(Perkin Elmer)를 사용하여 가시화하였다.
B. 서브틸리스 에서 프로페라아제의 발현 및 생산. B. 서브틸리스 프로페라아제 발현을 시험하기 위해, RasP를 과발현하는 B. 서브틸리스 세포(예를 들어, 실시예 1.C 참조) 및 야생형(비변형; 모) B. 서브틸리스 세포를 5 mL LB에서 5시간 동안 성장시켰다. 1.5 OD의 예비-배양물을 사용하여 진탕 플라스크에서 25 mL의 MBU 배지에 접종하고 세포를 37℃, 250 rpm, 70% 습도에서 성장시켰다. 샘플을 성장 18, 25, 41, 48 및 65시간에 채취하였다. 세포 밀도를 SpectraMax 분광 광도계(Molecular Devices, Downington, PA, USA)를 사용하여 OD600nm에서 측정하고 600 nm에서의 흡광도를 시간의 함수로서 도시하였다. 프로페라아제 효소 발현을, WO 2010/144283에 기술된 바와 같이, N-suc-AAPF-pNA 기질(본원에서, "AAPF"; Sigma Chemical Co.로부터)를 사용하여 모니터링하였다. 간략하게는, 전 브로스를 분석용 완충액(100 mM 트리스, 0.005% 트윈(Tween) 80, pH 8.6)에서 400배 희석시키고, 10 μL의 희석 샘플을 미세적정 플레이트에 배열시켰다. AAPF 스톡을 희석시키고, 분석용 완충액(DMSO 중 100 mg/mL AAPF 스톡의 100배 희석물) 및 190 μL의 이 용액을 미세적정 플레이트에 첨가하고 용액의 흡광도를 SpectraMax 분광 광도계를 사용하여 405 nm에서 측정하였다. 405 nm에서의 흡광도를 시간의 함수로서 도시하였다.
B. 야생형 및 변형
B.
서브틸리스
세포에서
AmyE
,
AmyL
및
BPN
'-
Y217L
단백질 생산 분석.
rasP 또는 tepA 분비 시스템 요소가 결여된 각각의 변형 B. 서브틸리스 세포(즉, ΔrasP 세포 또는 ΔtepA 세포)에서 AmyE, AmyL 또는 BPN'-Y217L의 생산을 2.5 ㎍/mL 클로람페니콜이 함유된 MBU에서 16시간의 성장 이후 LDS-PAGE에 의해 분석하였다. 이 목적으로 세포를 원심분리에 의해 성장 배지로부터 분리하고, 세포 밀도로 수정된 동량의 성장 배지를 겔 상에 로딩하였다. 각각의 돌연변이체 B. 서브틸리스 세포(즉, ΔrasP 세포 또는 ΔtepA 세포)에 의해 분비된 세포외 AmyE, AmyL 또는 BPN'-Y217L의 양을, 완전한 분비 시스템을 갖는 상응하는 B. 서브틸리스(야생형) 대조 세포(즉, 천연 rasP 또는 tepA 유전자를 포함하는 B. 서브틸리스 세포)에 의해 분비된 이들 단백질 각각의 양과 비교하였다. 분비된 효소의 정량화는 ImageJ 분석 소프트웨어를 사용하여 수행되었다.
도 1a 및 도 1b에 제시된 바와 같이, LDS-PAGE 겔 및 막대그래프 플롯은 각각 AmyE, AmyL 및 BPN'-Y217L의 생산이 야생형(모) 세포에 비해 ΔrasP 돌연변이체 세포에서 저하되는 것을 보여준다. 도 1a 및 도 1b에 제시된 ΔtepA 돌연변이체 세포는 tepA 결실이 야생형(모) 세포와 비교할 때 AmyE 또는 BPN'-Y217L의 생산에 영향을 미치지 않는 것을 나타낸다.
C. 야생형
B.
서브틸리스
세포 및
rasP
를
발현/과발현하는 발현 카세트로 변형된
B. 서브틸리스
세포에서 AmyE의 발현.
각각 AmyE 아밀라아제 구축물("PaprE-amyE-catR")을 포함하는 B. 서브틸리스 야생형 세포, "PspoVG-rasP"를 포함하는 변형 B. 서브틸리스 세포, 및 "PspoVG-UTR-rasP"를 포함하는 변형 B. 서브틸리스 세포를 5 ppm의 클로람페니콜이 함유된 5 mL의 루리아 브로스에 밤새 접종하였다. 일(1) mL의 예비-배양물을 사용하여 진탕 플라스크에서 25 mL의 BHI(뇌-심근 침출) 배지에 접종하였다. 실험은 37℃, 250 rpm에서 Infors 진탕기를 사용하여 수행하였다. 성장 중에 시점을 선택하고, 세포 성장은 600 nm에서 측정하였다.
전 브로스의 AmyE 아밀라아제 활성을 세랄파(Ceralpha) HR 키트(Megazyme, Wicklow, Ireland)로부터 세랄파 시약을 사용하여 측정하였다. 세랄파 시약 믹스를 처음에 10 mL의 밀리큐(MilliQ) 물에 용해시키고, 이어서 30 mL의 50 mM 말레이트 완충액, pH 5.6을 첨가하였다. 배양 상청액을 밀리큐 물에 40배 희석하고 10 μL의 샘플을 55 μL의 희석된 표준 기질 용액(working substrate solution)에 첨가하였다. MTP 플레이트를 진탕 후 실온에서 4분 동안 인큐베이션하였다. 70 μL의 200 mM 보레이트 완충액, pH 10.2(정지 용액)의 첨가에 의해 반응을 정지시켰다. 용액의 흡광도를 400 nm에서 SpectraMax 분광 광도계를 사용하여 측정하고, 400 nm에서 흡광도를 시간의 함수로서 도시하였다.
도 2a에 제시된 바와 같이, rasP 유전자를 포함하고 PspoVG 프로모터 및 aprE 5' UTR의 제어 하에 발현/과발현하는 변형 B. 서브틸리스 세포(즉, PspoVG-UTR-rasP)는 개선된 세포 성장을 나타내어, 최고 수준의 rasP 발현이 시험된 조건에서 세포 성장에 양성적으로 영향을 미치는 것을 시사한다. 도 2b에 제시된 데이터는 추가로, 야생형 B. 서브틸리스 대조 세포와 비교할 때 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 세포 및 "PspoVG-UTR-rasP" 세포)에서 AmyE 아밀라아제의 증가된 생산을 나타낸다.
D. 야생형
B.
서브틸리스
세포 및
rasP
를
발현/과발현하는 발현 카세트로 변형된
B. 서브틸리스
세포에서 변이형 PcuAmy1-v6 아밀라아제의 발현.
각각 변이형 "PaprE-PcuAmy1-v6-catR" 구축물을 포함하는, B. 서브틸리스 야생형 세포 및 "PspoVG-rasP"를 포함하는 변형 B. 서브틸리스 세포를 25 ppm의 클로람페니콜을 함유하는 5 mL의 루리아 브로스에 수일에 걸쳐 접종하였다. 일(1) mL의 예비-배양물을 사용하여 진탕 플라스크에서 25 mL의 적절한 배지에 접종하였다. 실험은 37℃, 250 RPM에서 Infors 진탕기를 사용하여 수행하였다. 성장 동안 아밀라아제의 활성을 측정하기 위해 성장 중 시점을 선택하였다.
전 브로스에서 PcuAmy1-v6 아밀라아제 활성을 세랄파 HR 키트(Megazyme, Wicklow, Ireland)로부터 세랄파 시약을 사용하여 측정하였다. 세랄파 시약 믹스를 처음에 10 mL의 밀리큐 물에 용해시키고, 이어서 30 mL의 50 mM 말레이트 완충액, pH 5.6을 첨가하였다. 배양 상청액을 밀리큐 물에 40배 희석시키고, 10 μL의 샘플을 55 μL의 희석된 표준 기질 용액에 첨가하였다. MTP 플레이트를 진탕 후 실온에서 4분 동안 인큐베이션하였다. 70 μL의 200 mM 보레이트 완충액 pH 10.2(정지 용액)을 첨가하여 반응을 정지시켰다. 용액의 흡광도를 400 nm에서 SpectraMax 분광 광도계를 사용하여 측정하고 400 nm에서의 흡광도를 시간의 함수로서 도시하였다.
도 3에 제시된 바와 같이, 진탕 플라스크에서 PcuAmy1-v6 아밀라아제의 생산(OD600 nm에서의 세포 밀도로 보정됨)은 야생형 B. 서브틸리스 대조 세포와 비교할 때 변형 B. 서브틸리스 세포(즉, rasP 과발현)에서 아밀라아제의 증가된 분비를 나타낸다.
E. 야생형
B.
서브틸리스
세포 및
tepA
를
발현/과발현하는 발현 카세트로 변형된
B. 서브틸리스
세포에서 변이형 PcuAmy1-v6 아밀라아제의 발현
각각 변이형 "PaprE-PcuAmy1-v6-catR" 구축물을 포함하는, B. 서브틸리스 야생형 세포 및 "PspoVG-tepA"를 포함하는 변형 B. 서브틸리스 세포를 또한, TepA 신호 펩티드 펩티다아제를 과발현하는 효과를 결정하기 위해 진탕 플라스크에서 시험하였다. 따라서, 야생형 B. 서브틸리스 세포 및 "PspoVG-tepA"를 포함하는 변형 B. 서 브틸리스 세포를 루리아 브로스 배지에서 37℃로 밤새 성장시켰다. 일(1) mL의 예비-배양물을 사용하여 진탕 플라스크에서 25 mL의 BHI(뇌-심근 침출) 배지에 접종하였다. 실험은 37℃, 250 RPM에서 Infors 진탕기를 사용하여 수행하였다. 세포 성장을 600 nm에서 측정하고 성장 동안 시점을 선택하였다. 아밀라아제 분석은 위 실시예 5.D에 기술된 바와 같이 수행하였다.
도 4a에서 보여주는 바와 같이, 야생형 B. 세포 및 변형 B. 세포의 세포 밀도는 이들 세포가 유사한 성장 프로파일을 갖는 것을 나타낸다. 도 4b에서 보여주는 바와 같이, 변형 B. 서브틸리스 세포(즉, tepA 과발현)에서 아밀라아제의 생산은 야생형 B. 서브틸리스 세포에 비해 약간 저하되었다.
F. 야생형
B.
서브틸리스
세포 및
rasP
를
발현/과발현하는 발현 카세트로 변형된
B. 서브틸리스
세포에서 베타-D-글루카나아제(BglC)의 발현
각각 "PaprE - BglC - catR" 구축물을 포함하는, B. 서브틸리스 야생형 세포 및 "PspoVG-rasP"를 포함하는 변형 B. 서브틸리스 세포를 5 mL의 루리아 브로스에서 밤새 성장시켰다. 일(1) mL의 예비-배양물을 사용하여 진탕 플라스크에서 25 mL의 BHI 배지에 접종하고, 분비된 β-D-글루카나아제의 발현을 시험하기 위해 배양물을 37℃, 250 rpm에서 성장시켰다. 20배 희석된 전 브로스의 세포 밀도를 600 nm에서 1시간 간격으로 SpectraMax 분광 광도계를 사용하여 측정하고, 흡광도(600 nm에서)를 시간의 함수로서 도시하였으며, 이는 야생형 및 변형 B. 서브틸리스 세포가 유사한 세포 밀도를 갖는 것을 나타내었다.
β-D-글루카나아제 발현(즉, 활성)은 4-니트로페닐-β-D-셀로비오사이드 기질(Sigma Chemicals, St. Louis, MO, USA, Catalogue No. N57590)을 사용하여 모니터링하였다. 기질을 1 mL의 DMSO에 용해하여 100 mg/mL로 스톡 용액을 생성하였다. 표준 기질 용액은 35 μL의 스톡 용액을 10 mL의 분석용 완충액(100 mM 트리스, 0.005% 트윈 80, pH 8.6)에 희석하여 조제하였다. 사십(40) 마이크로리터의 각 배양액을 96 웰 미세적정 플레이트로 옮기고 180 μL의 표준 기질 용액을 각 웰로 첨가하였다. 미세적정 플레이트를 실온에서 2시간 동안 인큐베이션하고 인큐베이션 시기 종결시 용액의 흡광도를 405 nm에서 SpectraMax 분광 광도계를 사용하여 측정하였다. 405 nm에서의 흡광도를 시간의 함수로서 도시하였다(도 5). 도 5에 제시된 바와 같이, 변형 B. 서브틸리스 세포(즉, "PspoVG-rasP" 발현 구축물을 포함)는 야생형 B. 서브틸리스 세포에 비해 β-D-글루카나아제의 생산에서 증가를 나타내었다.
G. 야생형
B.
서브틸리스
세포 및
rasP
를
발현/과발현하는 발현 카세트로 변형된
B.
서브틸리스
세포에서
프로페라아제의
발현
각각 "PaprE - Properase - catR" 구축물을 포함하는, B. 서브틸리스 야생형 세포 및 "PspoVG-rasP"를 포함하는 변형 B. 서브틸리스 세포를 5 mL의 루리아 브로스에서 5시간 동안 성장시켰다. 1.5 OD의 예비-배양물을 사용하여 진탕 플라스크에서 25 mL의 적절한 배지에 접종하고 세포를 37℃, 250 rpm, 70% 습도에서 배양하였다. 샘플을 성장 18, 25, 41, 48 및 65시간에 채취하였다. 40배 희석된 전 브로스의 세포 밀도를 600 nm에서 SpectraMax 분광 광도계를 사용하여 측정하고, 600 nm에서의 흡광도를 시간의 함수로서 도시하였다(도 6a). 도 6a에 제시된 바와 같이, 변형 B. 서브틸리스 세포는 야생형 B. 서브틸리스 세포에 비해 증가된 세포 밀도를 나타내었다.
프로페라아제 발현(즉, 활성)을 WO 2010/144283에 기술된 바와 같이 N-suc-AAPF-pNA 기질("AAPF"; Sigma Chemical Co.)을 사용하여 모니터링하였다. 간략하게는, 전 브로스를 분석용 완충액(100 mM 트리스, 0.005% 트윈 80, pH 8.6)에서 40배 희석시키고, 10 μL의 희석 샘플을 미세적정 플레이트에 배열시켰다. AAPF 스톡을 희석시키고, 분석용 완충액(DMSO 중 100 mg/mL AAPF 스톡의 100배 희석물) 및 190 μL의 이 용액을 미세적정 플레이트에 첨가하고 용액의 흡광도를 SpectraMax 분광 광도계를 사용하여 405 nm에서 측정하였다. 405 nm에서의 흡광도를 시간의 함수로서 도시하였으며, 도 6b에 제시된다. 도 6b에 제시된 바와 같이, 변형 B. 서 브틸리스 세포에서 프로테아제인 프로페라아제의 생산은 야생형 B. 서브틸리스 대조 세포에서의 프로페라아제 생산보다 대략 5배 더 컸다.
실시예
5
rasP
폴리펩티드를 과발현하는
B.
서브틸리스
숙주 세포에서
AmyAc
패밀리
α-아밀라아제의 발현
AmyAc 패밀리에 속하는 박테리아 α-아밀라아제(예를 들어, (www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi?RID=CARRMWTZ01N&mode=all 참조)를 B. 서브틸리스 야생형 숙주 세포(즉, 비변형; 모 세포) 및 변형 B. 서브틸리스 숙주 세포(즉, 변형 딸 세포)에서 발현시켰는데, 여기에서 변형 세포는 위의 실시예에 개괄적으로 기술한 바와 같이, rasP의 과발현을 위한 발현 카세트(spoIIIAH::PspoVG-rasP)를 포함한다. 더욱 구체적으로, aprE의 프로모터를 사용하여 (AmyAc 패밀리) α-아밀라아제(예를 들어, Pro aprE-α-아밀라아제)의 발현을 구동시켰는데, 여기에서 아세틸트랜스퍼라아제 유전자(catR)를 포함하는 발현 카세트를 25 μg/mL의 클로람페니콜을 함유하는 LB 플레이트에서 증폭시켰다. 각각의 균주(즉, 야생형 모 숙주 세포 및 rasP를 과발현하는 변형 딸 숙주 세포)로부터 네(4) 개의 콜로니를 사용하여 25 μg/mL의 클로람페니콜을 함유하는 LB 여덟(8) 개 튜브에 접종하고 37℃에서 네(4) 시간 동안 성장시켰다. 0.075 OD를 사용하여 이(2) mL의 5SM12 배지를 이십사(24) 웰 딥 미세적정 플레이트에서 접종시켰으며, 여기에서 B. 서브틸리스 숙주 세포를 사십팔(48) 시간 동안 성장시켰다. 시점은 18, 25, 41 및 48 시간으로 선택하였다. OD600 측정은 배양물을 실험에 사용된 배지 중에 40배 희석하여 실시하였다.
5SM12(5% 소이톤, 12% 말토덱스트린) 배지는 일반적으로 다음과 같이 제조된다: 1 mM 시트르산나트륨, 0.03 mM CaCl2, 0.0053% 시트르산 제2철 암모늄, 0.2 mM MnCl2, 0.5 mM MgSO4, 75 mM K2HPO4, 25 mM NaH2PO4, 12% 말토덱스트린 및 5% Difco Bacto 소이톤. 배지의 pH를 BPN 프로테아제에서는 pH 7.4로 조정하고(KOH로) 아밀라아제에서는 pH 7.7로 조정하였다(KOH로). 진탕 플라스크 조건은 다음과 같다: 배양액(32 내지 35 mL)을 Thomason AirOtop 향상된 밀봉(카탈로그 no. 899423)이 구비된 250 mL Thomson Ultra Yield Flasks(카탈로그 no. 931144)에서 성장시켰다. 성장을 위해, 배양액을 280 rpm, 37℃, 70% 습도(증발을 감소시키기 위함)에서 50 mm 스로(throw)로 Infors MultiTron 진탕기를 사용하여 진탕시켰다.
전 브로스의 아밀라아제 활성은 세랄파 HR 키트(Megazyme, Wicklow, Ireland)로부터 세랄파 시약을 사용하여 측정하였다. 세랄파 시약 믹스를 처음에 10 mL의 밀리큐 물에 용해시키고, 이어서 30 mL의 50 mM 말레이트 완충액, pH 5.6을 첨가하였다. 배양 상청액을 밀리큐 물에 40배 희석하고 10 μL의 샘플을 55 μL의 희석된 표준 기질 용액에 첨가하였다. MTP 플레이트를 진탕 후 실온에서 사(4) 분 동안 인큐베이션하였다. 70 μL의 200 mM 보레이트 완충액, pH 10.2(정지 용액)의 첨가에 의해 반응을 정지시켰다. 용액의 흡광도를 400 nm에서 SpectraMax 분광 광도계를 사용하여 측정하고, 400 nm에서의 흡광도를 시간의 함수로서 도시하였다(도 7b). 도 7b에 제시된 바와 같이, 변형 B. 서브틸리스 세포(즉, rasP 구축물을 발현)로부터의 아밀라아제 생산은 비변형(모) B. 서브틸리스 세포에 비해 아밀라아제 생산성에서 대략 2.5배 증가를 포함하였다.
참고문헌
PCT 국제 공개 번호 WO2001/51643
PCT 국제 공개 번호 WO2013/086219
U.S Patent 5,264,366
Bolhuis et al., "Signal peptide peptidase and ClpP-like proteins of Bacillus subtilis required for efficient translocation and processing of secretory proteins", J. Biol. Chem., 274(35):24585-24592, 1999.
Brigidi et al., FEMS Microbiol. Lett., 55: 135-138, 1990.
Brode et al., "Subtilisin BPN' variants: increased hydrolytic activity on surface-bound substrates via decreased surface activity", Biochemistry, 35(10):3162-3169, 1996.
Caspers et al., "Improvement of Sec-dependent secretion of a heterologous model protein in Bacillus subtilis by saturation mutagenesis of the N-domain of the AmyE signal peptide", Appl . Microbiol . Biotechnol ., 86(6):1877-1885, 2010.
Chen et al., "Combinatorial Sec pathway analysis for improved heterologous protein secretion in Bacillus subtilis: identification of bottlenecks by systematic gene overexpression", Microb. Cell Fact. 14/920282-02892015.
Earl et al., "Ecology and genomics of Bacillus subtilis", Trends in Microbiology.,16(6):269-275, 2008.
Fabret et al., "A New Mutation Delivery System for Genome-Scale Approaches in Bacillus subtilis", Molecular Miocrobiology, 46(1):25-36, 2002.
Ferrari et al., "Genetics," in Hardwood et al, (eds.), Bacillus, Plenum Publishing Corp., pages 57-72, 1989.
Frisby and Zuber, "Analysis of the upstream activating sequence and site of carbon and nitrogen source repression in the promoter of an early-induced sporulation gene of Bacillus subtilis", J. Bacteriology, 173(23): 7557 -7556, 1991.
Goosens et al., "The Tat system of Gram-positive bacteria", Biochim . Biophys. Acta., 1843(8):1698-1706, 2014.
Harwood and Cranenburgh, "Bacillus protein secretion: an unfolding story" Trends in Microbiology, 16(2):73-79, 2007.
Harwood et al., Molecular Biological Methods For Bacillus, John Wiley, 1990.
Heinrich et al., "The Bacillus subtilis ABC transporter EcsAB influences intramembrane proteolysis through RasP", Microbiology, 154: 1989-1997, 2008.
Jensen et al., "Cell-associated degradation affects the yield of secreted engineered and heterologous proteins in the Bacillus subtilis expression system" Microbiology, 146 (Pt 10:2583-2594, 2000.
Kang et al., "Molecular engineering of secretory machinery components for high-level secretion of proteins in Bacillus species", J. Ind . Microbiol . Biotechnol., 41(11):1599-1607, 2014.
Kontinen and Sarvas, "The PrsA lipoprotein is essential for protein secretion in Bacillus subtilis and sets a limit for high-level secretion", Mol. Microbiol. 8/4727-7371993.
Olempska-Beer et al., "Food-processing enzymes from recombinant microorganisms--a review"' Regul. Toxicol. Pharmacol., 45(2):144-158, 2006.
Raul et al., "Production and partial purification of alpha amylase from Bacillus subtilis (MTCC 121) using solid state fermentation", Biochemistry Research International, 2014.
Saito et al., "Post-liberation cleavage of signal peptidase is catalyzed by the site-21 protease (S2P) in bacteria", PNAS, 108(33): 13740-13745, 2011.
Sambrook et al., MOLECULAR CLONING: A LABORATORY MANUAL, 2nd ed., Cold Spring Harbor, 1989, and 3rd ed., 2001.
Tjalsma et al., "Bacillus subtilis contains four closely related type I signal peptidases with overlapping substrate specificities", J. Biol . Chem ., 272(41):25983-25992, 1997.
Tjalsma et al., "Proteomics of protein secretion by Bacillus subtilis: Separating the 'secrets' of the secretome", Microbiology and Molecular Biology Reviews, 68(2):207-233, 2004.
Van Dijl and Hecker, "Bacillus subtilis: from soil bacterium to super-secreting cell factory", Microbial Cell Factories, 12(3). 2013.
Van Dijl et al., "Non-functional expression of Escherichia coli signal peptidase I in Bacillus subtilis", Journal of General Microbiology, 137:2073-83, 1991.
Vogtentanz et al., "A Bacillus subtilis fusion protein system to produce soybean Bowman-Birk protease inhibitor", Protein Expr Purif. 55/140-522007.
Wang et al., "Expression and secretion of human atrial natriuretic alpha-factor in Bacillus subtilis using the subtilisin signal peptide", Gene , 69(1):39-47, 1988.
Westers et al., "Bacillus subtilis as cell factory for pharmaceutical proteins: a biotechnological approach to optimize the host organism", Biochimica et Biophysica Acta., 1694:299-310, 2004.
SEQUENCE LISTING
<110> DANISCO
<120> ENHANCED PROTEIN PRODUCTION AND METHODS THEREOF
<130> 40883-WO-PCT
<150> US62/387,578
<151> 2015-12-23
<150> US62/308,440
<151> 2016-03-15
<160> 46
<170> PatentIn version 3.5
<210> 1
<211> 1269
<212> DNA
<213> Bacillus subtilis
<400> 1
atgttcgtga atacagttat agcgtttatc attattttcg gaacgctcgt tttcttccat 60
gaactgggcc atttattgct agcccaaaga gcgggaattc tctgccgtga atttgcgatc 120
ggcttcggtc caaagatttt ttctttcaaa aaaaatgaaa cagtttatac gatcaggctg 180
cttccggtcg gcggatttgt tcgtatggcc ggcgaagatc cggaaatgat tgaggtgaaa 240
cccggataca cggtcgggct tctgtttaat aaggaagatc aagttgagaa agtcatcatc 300
aatcaaaagg aaaaatatcc ggatgcttta gtcattgaag tggaaacagc ggatctagag 360
catgacatga agatcaccgg ttatgaacag gggaaagagg acgaactttc cagctttact 420
gtcagcgaaa catccttttt tattgtagac ggagaagaag tgcagattgc gccgtataat 480
cgccaatttg gttccaaacc tgtatggcag cggattaaag caattgctgc agggccgatt 540
atgaacttta ttttagctta cgtcatttta gtgatgcttg ggctgattca aggcgtaccg 600
tcaaatgaac ctatgctcgg gcagctgaca gacaatggac gggcggctga agcagggcta 660
aaagaagggg attatatcca aagcattaac ggagagaaaa tgaggtcttg gactgacatt 720
gtctccgctg taaaagaaaa cccggagaaa gaaatggacg ttgcagtaaa aagagataac 780
aaaacgcttc atatttcggt gactccggaa gctgttaaag atgagaacaa aaaaacaatc 840
ggacgtttcg gttcctatgc gccgactgaa aaaggcgtac tctcagcggt tgcttacggc 900
gcgacatcaa cagttgatgt caccaaagcc attttaacca atctgagcaa attagtaaca 960
ggccaattta aactcgatat gctgtcaggt cctgtcggca tatatgacat gacagaccaa 1020
gtggcgaaaa cagggatcgt gaacttattt cagtttgcgg cgtttttaag cattaacctt 1080
gggattgtca acctgcttcc gattccggca cttgacggag gaagactgtt gtttctattt 1140
attgaagcga ttcggggcaa accgattaac agggaaaaag aagcatttgt tgtgtttatc 1200
ggagtagctt tcttaatgct tcttatgctg gttgtcacat ggaacgatat ccagcggctg 1260
tttttgtaa 1269
<210> 2
<211> 422
<212> PRT
<213> Bacillus subtilis
<400> 2
Met Phe Val Asn Thr Val Ile Ala Phe Ile Ile Ile Phe Gly Thr Leu
1 5 10 15
Val Phe Phe His Glu Leu Gly His Leu Leu Leu Ala Gln Arg Ala Gly
20 25 30
Ile Leu Cys Arg Glu Phe Ala Ile Gly Phe Gly Pro Lys Ile Phe Ser
35 40 45
Phe Lys Lys Asn Glu Thr Val Tyr Thr Ile Arg Leu Leu Pro Val Gly
50 55 60
Gly Phe Val Arg Met Ala Gly Glu Asp Pro Glu Met Ile Glu Val Lys
65 70 75 80
Pro Gly Tyr Thr Val Gly Leu Leu Phe Asn Lys Glu Asp Gln Val Glu
85 90 95
Lys Val Ile Ile Asn Gln Lys Glu Lys Tyr Pro Asp Ala Leu Val Ile
100 105 110
Glu Val Glu Thr Ala Asp Leu Glu His Asp Met Lys Ile Thr Gly Tyr
115 120 125
Glu Gln Gly Lys Glu Asp Glu Leu Ser Ser Phe Thr Val Ser Glu Thr
130 135 140
Ser Phe Phe Ile Val Asp Gly Glu Glu Val Gln Ile Ala Pro Tyr Asn
145 150 155 160
Arg Gln Phe Gly Ser Lys Pro Val Trp Gln Arg Ile Lys Ala Ile Ala
165 170 175
Ala Gly Pro Ile Met Asn Phe Ile Leu Ala Tyr Val Ile Leu Val Met
180 185 190
Leu Gly Leu Ile Gln Gly Val Pro Ser Asn Glu Pro Met Leu Gly Gln
195 200 205
Leu Thr Asp Asn Gly Arg Ala Ala Glu Ala Gly Leu Lys Glu Gly Asp
210 215 220
Tyr Ile Gln Ser Ile Asn Gly Glu Lys Met Arg Ser Trp Thr Asp Ile
225 230 235 240
Val Ser Ala Val Lys Glu Asn Pro Glu Lys Glu Met Asp Val Ala Val
245 250 255
Lys Arg Asp Asn Lys Thr Leu His Ile Ser Val Thr Pro Glu Ala Val
260 265 270
Lys Asp Glu Asn Lys Lys Thr Ile Gly Arg Phe Gly Ser Tyr Ala Pro
275 280 285
Thr Glu Lys Gly Val Leu Ser Ala Val Ala Tyr Gly Ala Thr Ser Thr
290 295 300
Val Asp Val Thr Lys Ala Ile Leu Thr Asn Leu Ser Lys Leu Val Thr
305 310 315 320
Gly Gln Phe Lys Leu Asp Met Leu Ser Gly Pro Val Gly Ile Tyr Asp
325 330 335
Met Thr Asp Gln Val Ala Lys Thr Gly Ile Val Asn Leu Phe Gln Phe
340 345 350
Ala Ala Phe Leu Ser Ile Asn Leu Gly Ile Val Asn Leu Leu Pro Ile
355 360 365
Pro Ala Leu Asp Gly Gly Arg Leu Leu Phe Leu Phe Ile Glu Ala Ile
370 375 380
Arg Gly Lys Pro Ile Asn Arg Glu Lys Glu Ala Phe Val Val Phe Ile
385 390 395 400
Gly Val Ala Phe Leu Met Leu Leu Met Leu Val Val Thr Trp Asn Asp
405 410 415
Ile Gln Arg Leu Phe Leu
420
<210> 3
<211> 159
<212> DNA
<213> Artificial Sequence
<220>
<223> OLIGO
<400> 3
taagaaaagt gattctggga gagccgggat cactttttta tttaccttat gcccgaaatg 60
aaagctttat gacctaattg tgtaactata tcctattttt tcaaaaaata ttttaaaaac 120
gagcaggatt tcagaaaaaa tcgtggaatt gatacacta 159
<210> 4
<211> 568
<212> DNA
<213> Bacillus subtilis
<400> 4
aattcctcca ttttcttctg ctatcaaaat aacagactcg tgattttcca aacgagcttt 60
caaaaaagcc tctgcccctt gcaaatcgga tgcctgtcta taaaattccc gatattggct 120
taaacagcgg cgcaatggcg gccgcatctg atgtctttgc ttggcgaatg ttcatcttat 180
ttcttcctcc ctctcaataa ttttttcatt ctatcccttt tctgtaaagt ttatttttca 240
gaatactttt atcatcatgc tttgaaaaaa tatcacgata atatccattg ttctcacgga 300
agcacacgca ggtcatttga acgaattttt tcgacaggaa tttgccggga ctcaggagca 360
tttaacctaa aaaagcatga catttcagca taatgaacat ttactcatgt ctattttcgt 420
tcttttctgt atgaaaatag ttatttcgag tctctacgga aatagcgaga gatgatatac 480
ctaaatagag ataaaatcat ctcaaaaaaa tgggtctact aaaatattat tccatctatt 540
acaataaata atactcacat aaggtggt 568
<210> 5
<211> 58
<212> DNA
<213> Bacillus subtilis
<400> 5
acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag ggtaaaga 58
<210> 6
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> 12-amino acid residue active site consensus sequence, which
aligns with amino acid residues 16-26 of SEQ ID NO: 2.
<220>
<221> ACT_SITE
<222> (1)..(11)
<223> 11-amin acod residue consensus sequence qhich aligns to amino
acid residues 16-26 of SEQ ID NO: 2.
<400> 6
Leu Val Phe Phe His Glu Leu Gly His Leu Leu
1 5 10
<210> 7
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Active site consnesus sequence, aligns to amino acid residues
20-24 of SEQ ID NO:2
<220>
<221> ACT_SITE
<222> (1)..(5)
<223> 5-amino acid consensus sequence which aligns with amino acid
residues 20-24 of SEQ ID NO: 2.
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa is any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is any amino acid
<400> 7
His Glu Xaa Xaa His
1 5
<210> 8
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 8
cgagctcgaa ttcactggcc gtcgggatac gtcaattcaa tactcacata aggtggtacg 60
aaaagtaaat caatcagagg tgc 83
<210> 9
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 9
gatcgtacgg cgcaacg 17
<210> 10
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 10
gctcttcaag gcgaacagg 19
<210> 11
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 11
cttcaacgct aactttgag 19
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 12
ctgtccgttc cagtgtacgg 20
<210> 13
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 13
cgacctgcag gcatgcaagc tctcgctttc atcctttccg 40
<210> 14
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 14
cgagctcgaa ttcactggcc gtcgcaaaga gaaactcgga aaggatgaaa gcgagttctt 60
tataccgtga tgcctcag 78
<210> 15
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 15
ggtctgtcat tcaatttaga ctccag 26
<210> 16
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 16
cgcacgggca cgatg 15
<210> 17
<211> 1040
<212> DNA
<213> Bacillus subtilis
<400> 17
tcgctgaggt tctccctgaa tccatgaaaa acgccctttc tgaaataccg gaacaacaat 60
ggctggaaat cgaagaagtc agaattcgga tcaaccgccc tgttgaattg attcgaagag 120
gacaacctgt ttatttgtcc tatgcgggca cggccgagga tgcccatctg atcctgagcc 180
ggctcagcaa ctatagtatg tatacacttg aagaagagct gaagaaaggg tatgtcacga 240
tcagaggcgg ccacagagtc ggactggcgg gcagagtcat tacggaaaac ggaggtgtga 300
aaggcctccg tgacatcgca tcttttaata tacgaattgc ccggcaaaag ctggggattg 360
cggagccgct gcttccatac ttatatcaaa acagctggct gaatacgctg attatcggac 420
cgccccaaac cggcaaaaca acacttctcc gggaccttgc gaggctctca agcaccggca 480
aaaaaaacat gctgcccgta aagacaggga tcgtcgatga acggtcagag attgccggat 540
gtcttcgcgg tattccgcag catcaatttg gtcagagaat tgacgtgtta gacgcctgtc 600
caaaagctga agggctgatg atgatgattc gatccatgag ccctgaggtg atgattgtcg 660
atgaaatcgg gcgtatggaa gatacagatg cacttctgga ggcgctgcat gccggtgttt 720
cagtaatcgt atcggcgcat ggctggagta tatccgacct gatgaagcgg ccttcattga 780
agcgtttgtg ggaagaaaga gcctttgacc gctatttgga attatcaaga gcaaaagggc 840
cgggcacagt gagccaaatt tatgacaaag acggaaatgt gctgtctagg acgacgggcg 900
tgaaaacatg ctgaagctgc tgggcgctgt attcattgtg gtagcgacaa catggacagg 960
ttttgagatg gcgaagattt atacagaacg gccgcggcaa atccgccagc tgcgtgcggc 1020
gcttcaatcc ctcgaggctg 1040
<210> 18
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 18
cgagaaagga agggaagaaa gcgaaatcgc tgaggttctc cctgaatcca tg 52
<210> 19
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 19
cagcctcgag ggattgaagc gc 22
<210> 20
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> SpcR
<400> 20
gcgcttcaat ccctcgaggc tgtcgacggt atcttattgc ggatccataa cttcgtataa 60
tgtatgctat acgaagttat ctagataaaa aatttagaag ccaatgaaat ctataaataa 120
actaaattaa gtttatttaa ttaacaacta tggatataaa ataggtacta atcaaaatag 180
tgaggaggat atatttgaat acatacgaac aaattaataa agtgaaaaaa atacttcgga 240
aacatttaaa aaataacctt attggtactt acatgtttgg atcaggagtt gagagtggac 300
taaaaccaaa tagtgatctt gactttttag tcgtcgtatc tgaaccattg acagatcaaa 360
gtaaagaaat acttatacaa aaaattagac ctatttcaaa aaaaatagga gataaaagca 420
acttacgata tattgaatta acaattatta ttcagcaaga aatggtaccg tggaatcatc 480
ctcccaaaca agaatttatt tatggagaat ggttacaaga gctttatgaa caaggataca 540
ttcctcagaa ggaattaaat tcagatttaa ccataatgct ttaccaagca aaacgaaaaa 600
ataaaagaat atacggaaat tatgacttag aggaattact acctgatatt ccattttctg 660
atgtgagaag agccattatg gattcgtcag aggaattaat agataattat caggatgatg 720
aaaccaactc tatattaact ttatgccgta tgattttaac tatggacacg ggtaaaatca 780
taccaaaaga tattgcggga aatgcagtgg ctgaatcttc tccattagaa catagggaga 840
gaattttgtt agcagttcgt agttatcttg gagagaatat tgaatggact aatgaaaatg 900
taaatttaac tataaactat ttaaataaca gattaaaaaa attataaaaa aattgaaaaa 960
atggtggaaa cacttttttc aatttttttg ttttattatt taatatttgg gaaatattca 1020
ttctaattgg taatcagatt ttagaaaaca ataaaccctt gcatatgtct agataacttc 1080
gtataatgta tgctatacga agttatgcgg ccgccatatg catcctaggc c 1131
<210> 21
<211> 981
<212> DNA
<213> Bacillus subtilis
<400> 21
aagcttccca gcgcgcatat attctagaag aaatggctgt ccaactaaaa aagaaagcgg 60
aggagagatt cagtcatgat gaatataaag taggccgcat caaactcacg gcaggagaaa 120
aggtagattc agaagaggat attaaaacaa tcagcgtgta tatggccccg tcttctgaaa 180
aaacggtcca aacggtcgcg ccggtccaca ttgatacaga tcatgcatac gtaacaaaag 240
aagcagccga acaaaaagaa gccaaacaga tacaaacgca gctcgcggac atttgggaaa 300
tcggaagtga gaaaattacg gttcatatgg aaggcgggga gagtgtcggc aatgaataaa 360
aacggattat ggaatgtatt gaaaaagcag tttcttccgg gacaaacgaa ggacggcgaa 420
aagccgaagc tgaccaaata tcattacttt ctattcgttt ttgttctcgg agtttccttt 480
atgcttgtca gccagctgtt ttcttcacct gagaaaactg aaaacgccaa aacgataacg 540
gccgtatcat cacaacattc cgcagacagc aaagagaaaa cagccgaagt gtttaaagcc 600
tcaaaatctg ataaacctaa agactcgatc gatgactatg aaaaagaata cgaaaatcaa 660
ctgaaagaaa ttcttgaaac aatcattggt gtggacgatg tctcggttgt cgtgaatgta 720
gatgcaacgt cgctgaaagt atacgaaaaa aacaaatcaa acaaaaatac aaccactgaa 780
gaaactgaca aagaaggcgg aaaaagaagc gttacagacc aatcatcgga ggaagaaatc 840
gtcatgatca aaaacggcga taaagaaaca cctgtcgtcg tccaaacgaa aaaacctgat 900
atacgcggtg tactcgttgt tgctcaagga gtggacaacg ttcaaataaa acaaaccatt 960
atcgaagcgg tgacacgggt c 981
<210> 22
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 22
gcggccgcca tatgcatcct aggccaagct tcccagcgcg catatattc 49
<210> 23
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 23
tcattaggca ccccaggctt tacacgaccc gtgtcaccgc ttcgataatg 50
<210> 24
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 24
catggattca gggagaacct cagcgatttc gctttcttcc cttcctttct cg 52
<210> 25
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 25
cattatcgaa gcggtgacac gggtcgtgta aagcctgggg tgcctaatga 50
<210> 26
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 26
cagaaaaaat cgtggaattg atacactaca atactcacat aaggtggtat gttcg 55
<210> 27
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 27
ggacggaagt ccgggttatc ggtcgtttac aaaaacagcc gctggatatc g 51
<210> 28
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 28
cagcctcgag ggattgaagc gc 22
<210> 29
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 29
cgatatccag cggctgtttt tgtaaacgac cgataacccg gacttccgtc c 51
<210> 30
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 30
gatttataca gaacggccgc ggcaaatccg gaattcctcc attttcttct g 51
<210> 31
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 31
gataaacgct ataactgtat tcacgaacat accaccttat gtgagtatta tttattg 57
<210> 32
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 32
cagaagaaaa tggaggaatt ccggatttgc cgcggccgtt ctgtataaat c 51
<210> 33
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 33
caataaataa tactcacata aggtggtatg ttcgtgaata cagttatagc gtttatc 57
<210> 34
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 34
cagaaaaaat cgtggaattg atacactaac aaagagaaac tcggaaagga tgaaagc 57
<210> 35
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 35
ggacggaagt ccgggttatc ggtcgtacac aatttcctga ggcatcacgg tat 53
<210> 36
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 36
gctttcatcc tttccgagtt tctctttgtt agtgtatcaa ttccacgatt ttttctg 57
<210> 37
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 37
ataccgtgat gcctcaggaa attgtgtacg accgataacc cggacttccg tcc 53
<210> 38
<211> 483
<212> PRT
<213> Bacillus licheniformis
<400> 38
Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro
1 5 10 15
Asn Asp Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala Tyr Leu
20 25 30
Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly
35 40 45
Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu
50 55 60
Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys
65 70 75 80
Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn
85 90 95
Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr
100 105 110
Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val
115 120 125
Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro
130 135 140
Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe
145 150 155 160
Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys
165 170 175
Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn
180 185 190
Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val
195 200 205
Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln
210 215 220
Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe
225 230 235 240
Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met
245 250 255
Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn
260 265 270
Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu
275 280 285
His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met
290 295 300
Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser
305 310 315 320
Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu
325 330 335
Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu
340 345 350
Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly
355 360 365
Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile
370 375 380
Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His
385 390 395 400
Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp
405 410 415
Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr
435 440 445
Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser
450 455 460
Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr
465 470 475 480
Val Gln Arg
<210> 39
<211> 478
<212> PRT
<213> Paenibacillus curdlanolyticus
<400> 39
Ala Asp Asn Gly Thr Ile Met Gln Tyr Phe Glu Trp Tyr Leu Pro Asn
1 5 10 15
Asp Gly Ala His Trp Asn Arg Leu Asn Asn Asp Ala Gln Asn Leu Lys
20 25 30
Asn Val Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Gly
35 40 45
Ser Ser Ala Asp Val Gly Tyr Gly Val Tyr Asp Thr Tyr Asp Leu Gly
50 55 60
Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Ser
65 70 75 80
Glu Leu Ile Ser Ala Val Asn Asn Leu His Ala Lys Gly Ile Ala Val
85 90 95
Tyr Gly Asp Val Val Leu Asn His Arg Met Asn Ala Asp Ala Thr Glu
100 105 110
Leu Val Asp Ala Val Glu Val Asp Pro Asn Asn Arg Tyr Val Glu Thr
115 120 125
Thr Ser Thr Tyr Gln Ile Gln Ala Trp Thr Gln Tyr Asp Phe Pro Gly
130 135 140
Arg Gly Asn Thr Tyr Ser Ser Trp Lys Trp Arg Trp Tyr His Phe Asp
145 150 155 160
Gly Val Asp Trp Asp Gln Ser Arg Gly Leu Asn Arg Ile Tyr Lys Leu
165 170 175
Asp Gly Lys Asp Trp Asp Trp Pro Val Asp Ser Glu Tyr Gly Asn Tyr
180 185 190
Asp Tyr Leu Met Gly Ala Asp Leu Asp Phe Asn His Pro Asp Val Val
195 200 205
Asn Glu Thr Lys Thr Trp Gly Lys Trp Phe Val Asn Thr Val Asn Leu
210 215 220
Asp Gly Val Arg Leu Asp Ala Val Lys His Ile Lys Phe Asp Phe Met
225 230 235 240
Arg Asp Trp Val Asn Asn Val Arg Ser Thr Thr Gly Lys Asn Leu Phe
245 250 255
Ala Val Gly Glu Tyr Trp His Tyr Asp Val Asn Lys Leu Asn Ser Tyr
260 265 270
Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp Val Pro Leu His
275 280 285
Phe Arg Phe Tyr Asp Ala Ser Asn Gly Gly Gly Gly Tyr Asp Met Arg
290 295 300
Asn Leu Leu Asn Asn Thr Leu Met Ser Ser Asn Pro Met Lys Ala Val
305 310 315 320
Thr Phe Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu Ser
325 330 335
Thr Val Gln Ser Trp Phe Lys Pro Leu Ala Tyr Ala Thr Ile Leu Thr
340 345 350
Arg Glu Gln Gly Tyr Pro Cys Val Phe Tyr Gly Asp Tyr Tyr Gly Thr
355 360 365
Ser Asp Gly Lys Ile Ser Ser Tyr Lys Pro Ile Met Asp Lys Leu Leu
370 375 380
Asn Ala Arg Lys Val Tyr Ala Tyr Gly Thr Gln Arg Asp Tyr Phe Asp
385 390 395 400
His Pro Asp Ile Val Gly Trp Thr Arg Glu Gly Asp Ala Ala His Ala
405 410 415
Gly Ser Gly Leu Ala Thr Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys
420 425 430
Trp Met Tyr Val Gly Thr Ser Lys Ala Gly Gln Val Trp Thr Asp Lys
435 440 445
Thr Gly Asn Arg Ser Gly Thr Val Thr Ile Asp Ala Asn Gly Trp Gly
450 455 460
Asn Phe Trp Val Asn Lys Gly Ser Val Ser Val Trp Ala Lys
465 470 475
<210> 40
<211> 425
<212> PRT
<213> Bacillus subtilis
<400> 40
Leu Thr Ala Pro Ser Ile Lys Ser Gly Thr Ile Leu His Ala Trp Asn
1 5 10 15
Trp Ser Phe Asn Thr Leu Lys His Asn Met Lys Asp Ile His Asp Ala
20 25 30
Gly Tyr Thr Ala Ile Gln Thr Ser Pro Ile Asn Gln Val Lys Glu Gly
35 40 45
Asn Gln Gly Asp Lys Ser Met Ser Asn Trp Tyr Trp Leu Tyr Gln Pro
50 55 60
Thr Ser Tyr Gln Ile Gly Asn Arg Tyr Leu Gly Thr Glu Gln Glu Phe
65 70 75 80
Lys Glu Met Cys Ala Ala Ala Glu Glu Tyr Gly Ile Lys Val Ile Val
85 90 95
Asp Ala Val Ile Asn His Thr Thr Ser Asp Tyr Ala Ala Ile Ser Asn
100 105 110
Glu Val Lys Ser Ile Pro Asn Trp Thr His Gly Asn Thr Gln Ile Lys
115 120 125
Asn Trp Ser Asp Arg Trp Asp Val Thr Gln Asn Ser Leu Leu Gly Leu
130 135 140
Tyr Asp Trp Asn Thr Gln Asn Thr Gln Val Gln Ser Tyr Leu Lys Arg
145 150 155 160
Phe Leu Asp Arg Ala Leu Asn Asp Gly Ala Asp Gly Phe Arg Phe Asp
165 170 175
Ala Ala Lys His Ile Glu Leu Pro Asp Asp Gly Ser Tyr Gly Ser Gln
180 185 190
Phe Trp Pro Asn Ile Thr Asn Thr Ser Ala Glu Phe Gln Tyr Gly Glu
195 200 205
Ile Leu Gln Asp Ser Ala Ser Arg Asp Ala Ala Tyr Ala Asn Tyr Met
210 215 220
Asp Val Thr Ala Ser Asn Tyr Gly His Ser Ile Arg Ser Ala Leu Lys
225 230 235 240
Asn Arg Asn Leu Gly Val Ser Asn Ile Ser His Tyr Ala Ser Asp Val
245 250 255
Ser Ala Asp Lys Leu Val Thr Trp Val Glu Ser His Asp Thr Tyr Ala
260 265 270
Asn Asp Asp Glu Glu Ser Thr Trp Met Ser Asp Asp Asp Ile Arg Leu
275 280 285
Gly Trp Ala Val Ile Ala Ser Arg Ser Gly Ser Thr Pro Leu Phe Phe
290 295 300
Ser Arg Pro Glu Gly Gly Gly Asn Gly Val Arg Phe Pro Gly Lys Ser
305 310 315 320
Gln Ile Gly Asp Arg Gly Ser Ala Leu Phe Glu Asp Gln Ala Ile Thr
325 330 335
Ala Val Asn Arg Phe His Asn Val Met Ala Gly Gln Pro Glu Glu Leu
340 345 350
Ser Asn Pro Asn Gly Asn Asn Gln Ile Phe Met Asn Gln Arg Gly Ser
355 360 365
His Gly Val Val Leu Ala Asn Ala Gly Ser Ser Ser Val Ser Ile Asn
370 375 380
Thr Ala Thr Lys Leu Pro Asp Gly Arg Tyr Asp Asn Lys Ala Gly Ala
385 390 395 400
Gly Ser Phe Gln Val Asn Asp Gly Lys Leu Thr Gly Thr Ile Asn Ala
405 410 415
Arg Ser Val Ala Val Leu Tyr Pro Asp
420 425
<210> 41
<211> 470
<212> PRT
<213> Bacillus subtilis
<400> 41
Ala Gly Thr Lys Thr Pro Val Ala Lys Asn Gly Gln Leu Ser Ile Lys
1 5 10 15
Gly Thr Gln Leu Val Asn Arg Asp Gly Lys Ala Val Gln Leu Lys Gly
20 25 30
Ile Ser Ser His Gly Leu Gln Trp Tyr Gly Glu Tyr Val Asn Lys Asp
35 40 45
Ser Leu Lys Trp Leu Arg Asp Asp Trp Gly Ile Thr Val Phe Arg Ala
50 55 60
Ala Met Tyr Thr Ala Asp Gly Gly Tyr Ile Asp Asn Pro Ser Val Lys
65 70 75 80
Asn Lys Val Lys Glu Ala Val Glu Ala Ala Lys Glu Leu Gly Ile Tyr
85 90 95
Val Ile Ile Asp Trp His Ile Leu Asn Asp Gly Asn Pro Asn Gln Asn
100 105 110
Lys Glu Lys Ala Lys Glu Phe Phe Lys Glu Met Ser Ser Leu Tyr Gly
115 120 125
Asn Thr Pro Asn Val Ile Tyr Glu Ile Ala Asn Glu Pro Asn Gly Asp
130 135 140
Val Asn Trp Lys Arg Asp Ile Lys Pro Tyr Ala Glu Glu Val Ile Ser
145 150 155 160
Val Ile Arg Lys Asn Asp Pro Asp Asn Ile Ile Ile Val Gly Thr Gly
165 170 175
Thr Trp Ser Gln Asp Val Asn Asp Ala Ala Asp Asp Gln Leu Lys Asp
180 185 190
Ala Asn Val Met Tyr Ala Leu His Phe Tyr Ala Gly Thr His Gly Gln
195 200 205
Phe Leu Arg Asp Lys Ala Asn Tyr Ala Leu Ser Lys Gly Ala Pro Ile
210 215 220
Phe Val Thr Glu Trp Gly Thr Ser Asp Ala Ser Gly Asn Gly Gly Val
225 230 235 240
Phe Leu Asp Gln Ser Arg Glu Trp Leu Lys Tyr Leu Asp Ser Lys Thr
245 250 255
Ile Ser Trp Val Asn Trp Asn Leu Ser Asp Lys Gln Glu Ser Ser Ser
260 265 270
Ala Leu Lys Pro Gly Ala Ser Lys Thr Gly Gly Trp Arg Leu Ser Asp
275 280 285
Leu Ser Ala Ser Gly Thr Phe Val Arg Glu Asn Ile Leu Gly Thr Lys
290 295 300
Asp Ser Thr Lys Asp Ile Pro Glu Thr Pro Ser Lys Asp Lys Pro Thr
305 310 315 320
Gln Glu Asn Gly Ile Ser Val Gln Tyr Arg Ala Gly Asp Gly Ser Met
325 330 335
Asn Ser Asn Gln Ile Arg Pro Gln Leu Gln Ile Lys Asn Asn Gly Asn
340 345 350
Thr Thr Val Asp Leu Lys Asp Val Thr Ala Arg Tyr Trp Tyr Lys Ala
355 360 365
Lys Asn Lys Gly Gln Asn Phe Asp Cys Asp Tyr Ala Gln Ile Gly Cys
370 375 380
Gly Asn Val Thr His Lys Phe Val Thr Leu His Lys Pro Lys Gln Gly
385 390 395 400
Ala Asp Thr Tyr Leu Glu Leu Gly Phe Lys Asn Gly Thr Leu Ala Pro
405 410 415
Gly Ala Ser Thr Gly Asn Ile Gln Leu Arg Leu His Asn Asp Asp Trp
420 425 430
Ser Asn Tyr Ala Gln Ser Gly Asp Tyr Ser Phe Phe Lys Ser Asn Thr
435 440 445
Phe Lys Thr Thr Lys Lys Ile Thr Leu Tyr Asp Gln Gly Lys Leu Ile
450 455 460
Trp Gly Thr Glu Pro Asn
465 470
<210> 42
<211> 269
<212> PRT
<213> Bacillus clausii
<400> 42
Ala Gln Ser Val Pro Trp Gly Ile Ser Arg Val Gln Ala Pro Ala Ala
1 5 10 15
His Asn Arg Gly Leu Thr Gly Ser Gly Val Lys Val Ala Val Leu Asp
20 25 30
Thr Gly Ile Ser Thr His Pro Asp Leu Asn Ile Arg Gly Gly Ala Ser
35 40 45
Phe Val Pro Gly Glu Pro Ser Thr Gln Asp Gly Asn Gly His Gly Thr
50 55 60
His Val Ala Gly Thr Ile Ala Ala Leu Asn Asn Ser Ile Gly Val Leu
65 70 75 80
Gly Val Ala Pro Asn Ala Glu Leu Tyr Ala Val Lys Val Leu Gly Ala
85 90 95
Ser Gly Gly Gly Ser Asn Ser Ser Ile Ala Gln Gly Leu Glu Trp Ala
100 105 110
Gly Asn Asn Gly Met His Val Ala Asn Leu Ser Leu Gly Ser Pro Ser
115 120 125
Pro Ser Ala Thr Leu Glu Gln Ala Val Asn Ser Ala Thr Ser Arg Gly
130 135 140
Val Leu Val Val Ala Ala Ser Gly Asn Ser Gly Ala Gly Ser Ile Ser
145 150 155 160
Tyr Pro Ala Arg Tyr Ala Asn Ala Met Ala Val Gly Ala Thr Asp Gln
165 170 175
Asn Asn Asn Arg Ala Ser Phe Ser Gln Tyr Gly Ala Gly Leu Asp Ile
180 185 190
Val Ala Pro Gly Val Asn Val Gln Ser Thr Tyr Pro Gly Ser Thr Tyr
195 200 205
Ala Ser Leu Asn Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ala
210 215 220
Ala Ala Leu Val Lys Gln Lys Asn Pro Ser Trp Ser Asn Val Gln Ile
225 230 235 240
Arg Asn His Leu Lys Asn Thr Ala Thr Ser Leu Gly Ser Thr Asn Leu
245 250 255
Tyr Gly Ser Gly Leu Val Asn Ala Glu Ala Ala Thr Arg
260 265
<210> 43
<211> 269
<212> PRT
<213> Bacillus amyloliquefaciens
<400> 43
Ala Gln Ser Val Pro Trp Gly Ile Ser Arg Val Gln Ala Pro Ala Ala
1 5 10 15
His Asn Arg Gly Leu Thr Gly Ser Gly Val Lys Val Ala Val Leu Asp
20 25 30
Thr Gly Ile Ser Thr His Pro Asp Leu Asn Ile Arg Gly Gly Ala Ser
35 40 45
Phe Val Pro Gly Glu Pro Ser Thr Gln Asp Gly Asn Gly His Gly Thr
50 55 60
His Val Ala Gly Thr Ile Ala Ala Leu Asn Asn Ser Ile Gly Val Leu
65 70 75 80
Gly Val Ala Pro Asn Ala Glu Leu Tyr Ala Val Lys Val Leu Gly Ala
85 90 95
Ser Gly Gly Gly Ser Asn Ser Ser Ile Ala Gln Gly Leu Glu Trp Ala
100 105 110
Gly Asn Asn Gly Met His Val Ala Asn Leu Ser Leu Gly Ser Pro Ser
115 120 125
Pro Ser Ala Thr Leu Glu Gln Ala Val Asn Ser Ala Thr Ser Arg Gly
130 135 140
Val Leu Val Val Ala Ala Ser Gly Asn Ser Gly Ala Gly Ser Ile Ser
145 150 155 160
Tyr Pro Ala Arg Tyr Ala Asn Ala Met Ala Val Gly Ala Thr Asp Gln
165 170 175
Asn Asn Asn Arg Ala Ser Phe Ser Gln Tyr Gly Ala Gly Leu Asp Ile
180 185 190
Val Ala Pro Gly Val Asn Val Gln Ser Thr Tyr Pro Gly Ser Thr Tyr
195 200 205
Ala Ser Leu Asn Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ala
210 215 220
Ala Ala Leu Val Lys Gln Lys Asn Pro Ser Trp Ser Asn Val Gln Ile
225 230 235 240
Arg Asn His Leu Lys Asn Thr Ala Thr Ser Leu Gly Ser Thr Asn Leu
245 250 255
Tyr Gly Ser Gly Leu Val Asn Ala Glu Ala Ala Thr Arg
260 265
<210> 44
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 44
cgcctcatca ttacggcatc 20
<210> 45
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> oligo
<400> 45
cgacctgcag gcatgcaagc taccacctta tgtgagtatt gaattgac 48
<210> 46
<211> 29
<212> PRT
<213> Bacillus subtilis
<400> 46
Met Arg Ser Lys Lys Leu Trp Ile Ser Leu Leu Phe Ala Leu Thr Leu
1 5 10 15
Ile Phe Thr Met Ala Phe Ser Asn Met Ser Ala Gln Ala
20 25
Claims (35)
- 비변형(모) 그람 양성 박테리아 세포에 비해 증가된 양의 관심 대상 단백질(POI)을 생산하는 변형 그람 양성 박테리아 세포로서, 여기에서 변형 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함하는 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, rasP 유전자 발현을 증가시키는 변형은 내인성 염색체 rasP 유전자에 대한 변형인, 변형 그람 양성 박테리아 세포.
- 제2항에 있어서, 내인성 염색체 rasP 유전자의 천연 프로모터는 천연 rasP 프로모터보다 더 높은 활성을 갖는 임의의 프로모터로 교체된, 변형 그람 양성 박테리아 세포.
- 제2항에 있어서, 내인성 염색체 rasP 유전자의 천연 프로모터는 spoVG 프로모터 또는 aprE 프로모터로 교체된, 변형 그람 양성 박테리아 세포.
- 제4항에 있어서, spoVG 프로모터는 서열번호: 3에 대하여 95%의 서열 동일성을 포함하는 뉴클레오티드 서열을 포함하는, 변형 그람 양성 박테리아 세포.
- 제4항에 있어서, aprE 프로모터는 서열번호: 4에 대하여 95%의 서열 동일성을 포함하는 뉴클레오티드 서열을 포함하는, 변형 그람 양성 박테리아 세포.
- 제2항에 있어서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 5'-비번역 영역(5'-UTR)의 변형인, 변형 그람 양성 박테리아 세포.
- 제7항에 있어서, 천연 rasP 염색체 5'-UTR은 서열번호: 5의 aprE 5'-UTR에 대하여 95%의 서열 동일성을 포함하는 5'-UTR로 교체된, 변형 그람 양성 박테리아 세포.
- 제2항에 있어서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 프로모터 및 천연 5'-UTR 둘 다의 변형인, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, rasP 유전자 발현을 증가시키는 변형은 rasP 유전자를 포함하는 외인성 폴리뉴클레오티드인, 변형 그람 양성 박테리아 세포.
- 제10항에 있어서, rasP 유전자를 포함하는 외인성 폴리뉴클레오티드는 염색체외 플라스미드 내에 포함되는, 변형 그람 양성 박테리아 세포.
- 제11항에 있어서, 염색체외 플라스미드는 발현 카세트인, 변형 그람 양성 박테리아 세포.
- 제11항에 있어서, 염색체외 플라스미드는 통합 플라스미드인, 변형 그람 양성 박테리아 세포.
- 제13항에 있어서, 플라스미드는 변형 세포의 염색체로 안정적으로 통합되는, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, rasP 발현을 증가시키는 유전적 변형은 외인성 rasP 오픈 리딩 프레임(ORF)을 포함하는 폴리뉴클레오티드이며, 여기에서 ORF는 구성적 프로모터, 유도 가능한 프로모터 또는 조건부 프로모터에 작동 가능하게 연결되고 그의 제어 하에 있는, 변형 그람 양성 박테리아 세포.
- 제15항에 있어서, rasP ORF를 포함하는 외인성 폴리뉴클레오티드는 염색체외 플라스미드 내에 포함되는, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, rasP 유전자는 서열번호: 1의 오픈 리딩 프레임(ORF) 핵산 서열에 대하여 적어도 60%의 서열 동일성을 포함하는 핵산 서열을 포함하는, 변형 그람 양성 박테리아 세포.
- 제17항에 있어서, 서열번호: 1의 ORF는 RasP 폴리펩티드를 암호화하는데, 여기에서 RasP 폴리펩티드는 부위-2 프로테아제(S2P) 활성을 갖는 Zn2 + 메탈로프로테아제로서 추가로 정의되는, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, rasP 유전자는 서열번호: 2의 RasP 폴리펩티드에 대하여 60%의 아미노산 서열 동일성을 포함하는 RasP 폴리펩티드를 암호화하고, 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 16 내지 26과 정렬되는 서열번호: 6의 활성 부위 공통 서열을 포함하는, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, rasP 유전자는 서열번호: 2의 RasP 폴리펩티드에 대하여 80%의 아미노산 서열 동일성을 포함하는 RasP 폴리펩티드를 암호화하고, 서열번호: 2의 RasP 폴리펩티드의 아미노산 잔기 20 내지 24와 정렬되는 서열번호: 7의 활성 부위 공통 서열(HEXXH)을 포함하는, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, 비변형(모) 그람 양성 세포에 비해, 생산된 POI의 증가된 양은 적어도 5% 증가인, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, 그람 양성 박테리아 세포는 바실루스(Bacillus) 속의 구성원인, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, POI는 변형 박테리아 세포에 대하여 외인성인 유전자 또는 변형 박테리아 세포에 대하여 내인성인 유전자에 의해 암호화되는, 변형 그람 양성 박테리아 세포.
- 제1항에 있어서, POI는 효소인, 변형 그람 양성 박테리아 세포.
- 제24항에 있어서, 효소는 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 람노-갈락투로나아제, 리보뉴클레아제, 타우마틴, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이들의 조합으로 구성되는 군으로부터 선택되는, 변형 그람 양성 박테리아 세포.
- 제1항의 변형 그람 양성 박테리아 세포에 의해 생산되는 단리된 POI.
- 그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법으로서, 하기 단계를 포함하는 방법:
(a) 증가된 양의 POI를 생산하는 변형 그람 양성 박테리아 세포를 얻는 단계(여기에서 변형 박테리아 세포는 rasP 유전자 발현을 증가시키는 변형을 포함함), 및
(b) POI가 발현되도록 하는 조건 하에 변형 세포를 배양하는 단계(여기에서 증가된 양의 POI를 생산하는 변형 박테리아 세포는 비변형(모) 그람 양성 박테리아 세포에서의 동일한 POI의 생산과 비교됨). - 제27항에 있어서, rasP 유전자 발현을 증가시키는 변형은 내인성 염색체 rasP 유전자에 대한 변형인, 그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법.
- 제27항에 있어서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 5'-비번역 영역(5'-UTR)의 변형인, 그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법.
- 제27항에 있어서, 내인성 염색체 rasP 유전자에 대한 변형은 내인성 염색체 rasP 유전자의 천연 프로모터 및 천연 5'-UTR 둘 다의 변형인, 그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법.
- 제27항에 있어서, rasP 유전자는 서열번호: 1의 오픈 리딩 프레임(ORF) 핵산 서열에 대하여 적어도 60%의 서열 동일성을 포함하는 핵산 서열을 포함하는, 그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법.
- 제27항에 있어서, 비변형(모) 그람 양성 세포에 비해, 생산된 POI의 증가된 양은 적어도 5% 증가인, 그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법.
- 제27항에 있어서, 그람 양성 박테리아 세포는 바실루스(Bacillus) 속의 구성원인, 그람 양성 박테리아 세포에서 POI의 생산을 증가시키는 방법.
- 제27항의 방법에 의해 생산되는 단리된 POI.
- 증가된 양의 POI를 생산하는 변형 그람 양성 박테리아 세포를 수득하는 방법으로서, 하기 단계를 포함하는 방법:
(a) 모 그람 양성 박테리아 세포로 rasP 유전자 발현을 증가시키는 적어도 하나의 유전자 변형을 도입하는 단계, 및
(b) 증가된 양의 POI를 발현하는 하나 이상의 딸 세포를 선택하는 단계(여기에서 증가된 양의 POI를 생산하기 위해 선택된 하나 이상의 딸 세포는 변형(딸) 그람 양성 박테리아 세포로 정의됨).
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562387578P | 2015-12-23 | 2015-12-23 | |
US62/387,578 | 2015-12-23 | ||
US201662308440P | 2016-03-15 | 2016-03-15 | |
US62/308,440 | 2016-03-15 | ||
PCT/US2016/067936 WO2017112733A1 (en) | 2015-12-23 | 2016-12-21 | Enhanced protein production and methods thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180088915A true KR20180088915A (ko) | 2018-08-07 |
Family
ID=57910120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187021108A KR20180088915A (ko) | 2015-12-23 | 2016-12-21 | 향상된 단백질 생산 및 이의 방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20180371445A1 (ko) |
EP (1) | EP3380496B1 (ko) |
JP (1) | JP6993339B2 (ko) |
KR (1) | KR20180088915A (ko) |
CN (1) | CN108779154B (ko) |
DK (1) | DK3380496T3 (ko) |
WO (1) | WO2017112733A1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201508025D0 (en) | 2015-05-11 | 2015-06-24 | Ucl Business Plc | Fabry disease gene therapy |
KR20200105879A (ko) * | 2018-01-03 | 2020-09-09 | 다니스코 유에스 인크. | 증가된 단백질 생산을 위한 돌연변이체 및 유전자 변형된 바실러스 세포 및 이의 방법 |
US11781147B2 (en) | 2018-11-28 | 2023-10-10 | Danisco Us Inc. | Promoter sequences and methods thereof for enhanced protein production in Bacillus cells |
CN109456929A (zh) * | 2018-12-13 | 2019-03-12 | 江南大学 | 一种产磷脂酶d的重组枯草芽孢杆菌及其应用 |
WO2020156903A1 (en) * | 2019-01-30 | 2020-08-06 | Novozymes A/S | Cognate foldase co-expression |
EP4051793A1 (en) * | 2019-10-28 | 2022-09-07 | Danisco US Inc | Microbial host cells for the production of heterologous cyanuric acid hydrolases and biuret hydrolases |
WO2023104846A1 (en) * | 2021-12-10 | 2023-06-15 | Novozymes A/S | Improved protein production in recombinant bacteria |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5264366A (en) | 1984-05-29 | 1993-11-23 | Genencor, Inc. | Protease deficient bacillus |
US6762039B2 (en) * | 1997-07-15 | 2004-07-13 | Genencor International, Inc. | Bacillus subtillis with an inactivated cysteine protease-1 |
US6509185B1 (en) | 2000-01-07 | 2003-01-21 | Genencor International, Inc. | Mutant aprE promotor |
KR20100098652A (ko) * | 2007-12-21 | 2010-09-08 | 다니스코 유에스 인크. | 바실루스 내에서의 향상된 단백질 생산 |
AR076941A1 (es) | 2009-06-11 | 2011-07-20 | Danisco Us Inc | Cepa de bacillus para una mayor produccion de proteina |
CN102220366B (zh) * | 2011-04-27 | 2013-12-04 | 南京农业大学 | 通过超量表达comA基因提高枯草芽孢杆菌抗菌肽产量的方法 |
DK2788491T3 (en) | 2011-12-09 | 2019-04-01 | Danisco Us Inc | RIBOSOMAL PROMOTERS FROM B. SUBTILIS FOR PROTEIN PRODUCTION IN MICRO-ORGANISMS |
-
2016
- 2016-12-21 WO PCT/US2016/067936 patent/WO2017112733A1/en active Application Filing
- 2016-12-21 EP EP16831675.0A patent/EP3380496B1/en active Active
- 2016-12-21 US US16/064,710 patent/US20180371445A1/en not_active Abandoned
- 2016-12-21 KR KR1020187021108A patent/KR20180088915A/ko not_active Application Discontinuation
- 2016-12-21 CN CN201680082390.9A patent/CN108779154B/zh active Active
- 2016-12-21 DK DK16831675.0T patent/DK3380496T3/da active
- 2016-12-21 JP JP2018533603A patent/JP6993339B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019505196A (ja) | 2019-02-28 |
CN108779154A (zh) | 2018-11-09 |
DK3380496T3 (da) | 2020-08-24 |
EP3380496B1 (en) | 2020-05-20 |
CN108779154B (zh) | 2022-12-27 |
WO2017112733A1 (en) | 2017-06-29 |
EP3380496A1 (en) | 2018-10-03 |
JP6993339B2 (ja) | 2022-02-21 |
US20180371445A1 (en) | 2018-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7025325B2 (ja) | タンパク質発現の増強およびその方法 | |
KR102375732B1 (ko) | 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법 | |
CN108779154B (zh) | 增强的蛋白质产生及其方法 | |
Shin et al. | Extracellular recombinant protein production from an Escherichia coli lpp deletion mutant | |
JP7280269B2 (ja) | タンパク質の産生増加のための変異及び遺伝子改変バチルス属(bacillus)細胞、並びにその方法 | |
US20040005695A1 (en) | Method for producing recombinant proteins by gram-negative bacteria | |
CN113366108A (zh) | 新颖启动子序列及其增强芽孢杆菌属细胞蛋白生产的方法 | |
JP2023524334A (ja) | バチルス・リケニフォルミス(bacillus licheniformis)における強化したタンパク質産生のための組成物及び方法 | |
KR20180117166A (ko) | 미생물에서의 단백질 생산을 위한 유전자 조작 리보솜 프로모터 | |
US20140370569A1 (en) | Expression method | |
CN115335503A (zh) | 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法 | |
CN117769597A (zh) | 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法 | |
WO2024040043A1 (en) | Expression systems for phosphatases | |
CN117881772A (zh) | 编码新型核酸酶的多核苷酸、其组合物及其从蛋白质制剂中消除dna的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |