CZ285533B6 - DNA-fragmenty, plasmidy a mikroorganismy obsahující tyto DNA-fragmenty a plasmidy a způsob biotechnologické výroby biotinu - Google Patents
DNA-fragmenty, plasmidy a mikroorganismy obsahující tyto DNA-fragmenty a plasmidy a způsob biotechnologické výroby biotinu Download PDFInfo
- Publication number
- CZ285533B6 CZ285533B6 CZ95809A CZ80995A CZ285533B6 CZ 285533 B6 CZ285533 B6 CZ 285533B6 CZ 95809 A CZ95809 A CZ 95809A CZ 80995 A CZ80995 A CZ 80995A CZ 285533 B6 CZ285533 B6 CZ 285533B6
- Authority
- CZ
- Czechia
- Prior art keywords
- biotin
- ala
- leu
- gene
- gly
- Prior art date
Links
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 title claims abstract description 185
- 239000013612 plasmid Substances 0.000 title claims abstract description 118
- 239000011616 biotin Substances 0.000 title claims abstract description 93
- 229960002685 biotin Drugs 0.000 title claims abstract description 93
- 235000020958 biotin Nutrition 0.000 title claims abstract description 89
- 239000012634 fragment Substances 0.000 title claims abstract description 85
- 244000005700 microbiome Species 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000008569 process Effects 0.000 title claims abstract description 9
- 238000002360 preparation method Methods 0.000 title description 2
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 144
- 101150029327 bioB gene Proteins 0.000 claims abstract description 53
- 101150076754 bioA gene Proteins 0.000 claims abstract description 50
- 101150023452 bioD gene Proteins 0.000 claims abstract description 46
- 101100218845 Escherichia coli (strain K12) bioH gene Proteins 0.000 claims abstract description 26
- 101100381793 Bacillus subtilis (strain 168) bioK gene Proteins 0.000 claims abstract description 25
- 230000002103 transcriptional effect Effects 0.000 claims abstract description 25
- 238000004519 manufacturing process Methods 0.000 claims abstract description 23
- 101150032820 bioF gene Proteins 0.000 claims abstract description 18
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 17
- 241000305071 Enterobacterales Species 0.000 claims abstract description 6
- 241000588724 Escherichia coli Species 0.000 claims description 93
- 102000004169 proteins and genes Human genes 0.000 claims description 62
- 101710117026 Biotin synthase Proteins 0.000 claims description 61
- 235000018102 proteins Nutrition 0.000 claims description 60
- 150000001413 amino acids Chemical class 0.000 claims description 45
- 229940024606 amino acid Drugs 0.000 claims description 42
- 235000001014 amino acid Nutrition 0.000 claims description 42
- 239000000284 extract Substances 0.000 claims description 36
- 210000004027 cell Anatomy 0.000 claims description 35
- 108010057366 Flavodoxin Proteins 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 27
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 claims description 26
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 claims description 18
- 229910052921 ammonium sulfate Inorganic materials 0.000 claims description 18
- 235000011130 ammonium sulphate Nutrition 0.000 claims description 18
- 101150085692 bioC gene Proteins 0.000 claims description 16
- 108010074122 Ferredoxins Proteins 0.000 claims description 13
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 10
- YXVCLPJQTZXJLH-UHFFFAOYSA-N thiamine(1+) diphosphate chloride Chemical compound [Cl-].CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N YXVCLPJQTZXJLH-UHFFFAOYSA-N 0.000 claims description 10
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 claims description 9
- 235000018417 cysteine Nutrition 0.000 claims description 9
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 9
- 241000589158 Agrobacterium Species 0.000 claims description 8
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 claims description 8
- 229910052799 carbon Inorganic materials 0.000 claims description 8
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 7
- 229960001570 ademetionine Drugs 0.000 claims description 7
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 claims description 7
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 5
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 5
- 241000589187 Rhizobium sp. Species 0.000 claims description 5
- 235000009582 asparagine Nutrition 0.000 claims description 5
- 229960001230 asparagine Drugs 0.000 claims description 5
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 5
- 235000004554 glutamine Nutrition 0.000 claims description 5
- 238000001556 precipitation Methods 0.000 claims description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 4
- 239000001166 ammonium sulphate Substances 0.000 claims description 4
- 235000003704 aspartic acid Nutrition 0.000 claims description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 4
- 235000004400 serine Nutrition 0.000 claims description 4
- 241000588923 Citrobacter Species 0.000 claims description 3
- 241000588722 Escherichia Species 0.000 claims description 3
- 241000607142 Salmonella Species 0.000 claims description 3
- 210000004671 cell-free system Anatomy 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 230000004936 stimulating effect Effects 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 abstract description 8
- 108020004414 DNA Proteins 0.000 description 77
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 38
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 36
- 239000013598 vector Substances 0.000 description 31
- 101150066555 lacZ gene Proteins 0.000 description 24
- 230000000694 effects Effects 0.000 description 23
- 230000014509 gene expression Effects 0.000 description 23
- 239000000203 mixture Substances 0.000 description 23
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 22
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 18
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 17
- 239000000047 product Substances 0.000 description 15
- 238000003776 cleavage reaction Methods 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 14
- 238000006491 synthase reaction Methods 0.000 description 14
- 230000004151 fermentation Effects 0.000 description 13
- 238000011144 upstream manufacturing Methods 0.000 description 13
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 12
- 108091034117 Oligonucleotide Proteins 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 239000002609 medium Substances 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 11
- 230000000692 anti-sense effect Effects 0.000 description 11
- 239000011780 sodium chloride Substances 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 101150000658 RR28 gene Proteins 0.000 description 10
- 239000007983 Tris buffer Substances 0.000 description 10
- 239000000872 buffer Substances 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 10
- 239000002244 precipitate Substances 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 10
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 235000011187 glycerol Nutrition 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 8
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 8
- 239000008103 glucose Substances 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 230000012010 growth Effects 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 229960002363 thiamine pyrophosphate Drugs 0.000 description 8
- 235000008170 thiamine pyrophosphate Nutrition 0.000 description 8
- 239000011678 thiamine pyrophosphate Substances 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 108010042833 7,8-diaminopelargonic acid aminotransferase Proteins 0.000 description 7
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 7
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 7
- 238000005571 anion exchange chromatography Methods 0.000 description 7
- 239000000835 fiber Substances 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 239000006228 supernatant Substances 0.000 description 7
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 7
- 102000012410 DNA Ligases Human genes 0.000 description 6
- 108010061982 DNA Ligases Proteins 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 6
- 239000002253 acid Substances 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 150000007523 nucleic acids Chemical class 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 235000015097 nutrients Nutrition 0.000 description 6
- 210000003705 ribosome Anatomy 0.000 description 6
- 101150060445 uvrB gene Proteins 0.000 description 6
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 5
- 239000002028 Biomass Substances 0.000 description 5
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 5
- 239000007995 HEPES buffer Substances 0.000 description 5
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- 229920005654 Sephadex Polymers 0.000 description 5
- 239000012507 Sephadex™ Substances 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 108010040030 histidinoalanine Proteins 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 239000006916 nutrient agar Substances 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 101150080777 pheS gene Proteins 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 4
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 4
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 4
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- NSTPXGARCQOSAU-VIFPVBQESA-N N-formyl-L-phenylalanine Chemical compound O=CN[C@H](C(=O)O)CC1=CC=CC=C1 NSTPXGARCQOSAU-VIFPVBQESA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 241000589180 Rhizobium Species 0.000 description 4
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 4
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 4
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 4
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- 229960003237 betaine Drugs 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000005194 fractionation Methods 0.000 description 4
- 238000001641 gel filtration chromatography Methods 0.000 description 4
- 229940050410 gluconate Drugs 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 239000011734 sodium Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 108010080629 tryptophan-leucine Proteins 0.000 description 4
- LMSDCGXQALIMLM-UHFFFAOYSA-N 2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid;iron Chemical compound [Fe].OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O LMSDCGXQALIMLM-UHFFFAOYSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 3
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 3
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 3
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 3
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 3
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 3
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 3
- 241000972773 Aulopiformes Species 0.000 description 3
- 101100296545 Caenorhabditis elegans pbo-6 gene Proteins 0.000 description 3
- 235000000638 D-biotin Nutrition 0.000 description 3
- 239000011665 D-biotin Substances 0.000 description 3
- 238000012270 DNA recombination Methods 0.000 description 3
- 101100311938 Dictyostelium discoideum phesA gene Proteins 0.000 description 3
- 101100423325 Dictyostelium discoideum phesB gene Proteins 0.000 description 3
- 101100004473 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) bioDA gene Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 3
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 3
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 3
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 3
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 3
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 3
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 3
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 238000000376 autoradiography Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 102000005936 beta-Galactosidase Human genes 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 3
- 239000008367 deionised water Substances 0.000 description 3
- 229910021641 deionized water Inorganic materials 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000002523 gelfiltration Methods 0.000 description 3
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 238000004255 ion exchange chromatography Methods 0.000 description 3
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 3
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 3
- 108010085203 methionylmethionine Proteins 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000007858 starting material Substances 0.000 description 3
- 238000004809 thin layer chromatography Methods 0.000 description 3
- 239000011573 trace mineral Substances 0.000 description 3
- 235000013619 trace mineral Nutrition 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 150000003722 vitamin derivatives Chemical class 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 2
- OSBLTNPMIGYQGY-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid;boric acid Chemical compound OB(O)O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O OSBLTNPMIGYQGY-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 241000588624 Acinetobacter calcoaceticus Species 0.000 description 2
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 2
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 2
- NFDVJAKFMXHJEQ-HERUPUMHSA-N Ala-Asp-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NFDVJAKFMXHJEQ-HERUPUMHSA-N 0.000 description 2
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 2
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 2
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 2
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- BNODVYXZAAXSHW-IUCAKERBSA-N Arg-His Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BNODVYXZAAXSHW-IUCAKERBSA-N 0.000 description 2
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 2
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 2
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 2
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- DVUFTQLHHHJEMK-IMJSIDKUSA-N Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O DVUFTQLHHHJEMK-IMJSIDKUSA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 2
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 2
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101100148606 Caenorhabditis elegans pst-1 gene Proteins 0.000 description 2
- UUOYKFNULIOCGJ-GUBZILKMSA-N Cys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N UUOYKFNULIOCGJ-GUBZILKMSA-N 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 108030002422 Dethiobiotin synthases Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 2
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 2
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 2
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 2
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 2
- GHHAMXVMWXMGSV-STQMWFEESA-N Gly-Cys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O)=CNC2=C1 GHHAMXVMWXMGSV-STQMWFEESA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 2
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 2
- 101100008681 Glycine max DHPS1 gene Proteins 0.000 description 2
- 239000012630 HPLC buffer Substances 0.000 description 2
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 2
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 2
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- RLAOTFTXBFQJDV-KKUMJFAQSA-N His-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CN=CN1 RLAOTFTXBFQJDV-KKUMJFAQSA-N 0.000 description 2
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 2
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 2
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 2
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 2
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- HONVOXINDBETTI-KKUMJFAQSA-N Lys-Tyr-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CC=C(O)C=C1 HONVOXINDBETTI-KKUMJFAQSA-N 0.000 description 2
- 241000193386 Lysinibacillus sphaericus Species 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 2
- WXJXYMFUTRXRGO-UWVGGRQHSA-N Met-His-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 WXJXYMFUTRXRGO-UWVGGRQHSA-N 0.000 description 2
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 2
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 2
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- YRKFKTQRVBJYLT-CQDKDKBSSA-N Phe-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 YRKFKTQRVBJYLT-CQDKDKBSSA-N 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- HGNGAMWHGGANAU-WHOFXGATSA-N Phe-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HGNGAMWHGGANAU-WHOFXGATSA-N 0.000 description 2
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 2
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 239000012614 Q-Sepharose Substances 0.000 description 2
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 239000012506 Sephacryl® Substances 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 2
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 2
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 239000008051 TBE buffer Substances 0.000 description 2
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 2
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 2
- WQYPAGQDXAJNED-AAEUAGOBSA-N Trp-Cys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N WQYPAGQDXAJNED-AAEUAGOBSA-N 0.000 description 2
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 2
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 2
- YLGQHMHKAASRGJ-WDSOQIARSA-N Trp-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YLGQHMHKAASRGJ-WDSOQIARSA-N 0.000 description 2
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 2
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 2
- 238000005273 aeration Methods 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 230000003698 anagen phase Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 238000011138 biotechnological process Methods 0.000 description 2
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000000909 electrodialysis Methods 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- SLCVBVWXLSEKPL-UHFFFAOYSA-N neopentyl glycol Chemical compound OCC(C)(C)CO SLCVBVWXLSEKPL-UHFFFAOYSA-N 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000012266 salt solution Substances 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- NHGXDBSUJJNIRV-UHFFFAOYSA-M tetrabutylammonium chloride Chemical compound [Cl-].CCCC[N+](CCCC)(CCCC)CCCC NHGXDBSUJJNIRV-UHFFFAOYSA-M 0.000 description 2
- 229960003495 thiamine Drugs 0.000 description 2
- 235000019157 thiamine Nutrition 0.000 description 2
- 239000011721 thiamine Substances 0.000 description 2
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- WIIZWVCIJKGZOK-IUCAKERBSA-N 2,2-dichloro-n-[(1s,2s)-1,3-dihydroxy-1-(4-nitrophenyl)propan-2-yl]acetamide Chemical compound ClC(Cl)C(=O)N[C@@H](CO)[C@@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-IUCAKERBSA-N 0.000 description 1
- PWKSKIMOESPYIA-UHFFFAOYSA-N 2-acetamido-3-sulfanylpropanoic acid Chemical compound CC(=O)NC(CS)C(O)=O PWKSKIMOESPYIA-UHFFFAOYSA-N 0.000 description 1
- 102100027324 2-hydroxyacyl-CoA lyase 1 Human genes 0.000 description 1
- NKDFYOWSKOHCCO-YPVLXUMRSA-N 20-hydroxyecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@](C)(O)[C@H](O)CCC(C)(O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 NKDFYOWSKOHCCO-YPVLXUMRSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- XWHHYOYVRVGJJY-UHFFFAOYSA-N 4-fluorophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-UHFFFAOYSA-N 0.000 description 1
- 108010031096 8-amino-7-oxononanoate synthase Proteins 0.000 description 1
- GUAHPAJOXVYFON-UHFFFAOYSA-N 8-amino-7-oxononanoic acid Chemical compound CC([NH3+])C(=O)CCCCCC([O-])=O GUAHPAJOXVYFON-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 108050003628 Adenosylmethionine-8-amino-7-oxononanoate aminotransferase BioA Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000589159 Agrobacterium sp. Species 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- SITWEMZOJNKJCH-WDSKDSINSA-N Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SITWEMZOJNKJCH-WDSKDSINSA-N 0.000 description 1
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 1
- XAEWTDMGFGHWFK-IMJSIDKUSA-N Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O XAEWTDMGFGHWFK-IMJSIDKUSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 1
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- OARAZORWIMYUPO-FXQIFTODSA-N Ala-Met-Cys Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CS)C(O)=O OARAZORWIMYUPO-FXQIFTODSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- 241000590031 Alteromonas Species 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-IUCAKERBSA-N Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N WYBVBIHNJWOLCJ-IUCAKERBSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- AZHXYLJRGVMQKW-UMPQAUOISA-N Arg-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N)O AZHXYLJRGVMQKW-UMPQAUOISA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 1
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- QDXQWFBLUVTOFL-FXQIFTODSA-N Asn-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)N)N QDXQWFBLUVTOFL-FXQIFTODSA-N 0.000 description 1
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- RRUWMFBLFLUZSI-LPEHRKFASA-N Asp-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N RRUWMFBLFLUZSI-LPEHRKFASA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 1
- 241000589151 Azotobacter Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101100058405 Bordetella avium (strain 197N) bioCD gene Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000589519 Comamonas Species 0.000 description 1
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 1
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 1
- TULNGKSILXCZQT-IMJSIDKUSA-N Cys-Asp Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O TULNGKSILXCZQT-IMJSIDKUSA-N 0.000 description 1
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 1
- BIVLWXQGXJLGKG-BIIVOSGPSA-N Cys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)C(=O)O BIVLWXQGXJLGKG-BIIVOSGPSA-N 0.000 description 1
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 1
- LKUCSUGWHYVYLP-GHCJXIJMSA-N Cys-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N LKUCSUGWHYVYLP-GHCJXIJMSA-N 0.000 description 1
- KVGPYKUIHZJWGA-BQBZGAKWSA-N Cys-Met-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O KVGPYKUIHZJWGA-BQBZGAKWSA-N 0.000 description 1
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 1
- OELDIVRKHTYFNG-WDSKDSINSA-N Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CS OELDIVRKHTYFNG-WDSKDSINSA-N 0.000 description 1
- ZXGDAZLSOSYSBA-IHRRRGAJSA-N Cys-Val-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZXGDAZLSOSYSBA-IHRRRGAJSA-N 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 108020003215 DNA Probes Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 101100494110 Escherichia coli (strain K12) birA gene Proteins 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- SNFUTDLOCQQRQD-ZKWXMUAHSA-N Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SNFUTDLOCQQRQD-ZKWXMUAHSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 1
- QEJKKJNDDDPSMU-KKUMJFAQSA-N Glu-Tyr-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O QEJKKJNDDDPSMU-KKUMJFAQSA-N 0.000 description 1
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- LEGMTEAZGRRIMY-ZKWXMUAHSA-N Gly-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN LEGMTEAZGRRIMY-ZKWXMUAHSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 1
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 1
- RJVZMGQMJOQIAX-GJZGRUSLSA-N Gly-Trp-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(O)=O RJVZMGQMJOQIAX-GJZGRUSLSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- MBSSHYPAEHPSGY-LSJOCFKGSA-N His-Ala-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O MBSSHYPAEHPSGY-LSJOCFKGSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- SYIPVNMWBZXKMU-HJPIBITLSA-N His-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N SYIPVNMWBZXKMU-HJPIBITLSA-N 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 1
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 1
- 108010025076 Holoenzymes Proteins 0.000 description 1
- 101001009252 Homo sapiens 2-hydroxyacyl-CoA lyase 1 Proteins 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- HYXQKVOADYPQEA-CIUDSAMLSA-N Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HYXQKVOADYPQEA-CIUDSAMLSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- WJBOZUVRPOIQNN-KJYZGMDISA-N Ile-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)C1=CN=CN1 WJBOZUVRPOIQNN-KJYZGMDISA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 1
- 240000006024 Lactobacillus plantarum Species 0.000 description 1
- 235000013965 Lactobacillus plantarum Nutrition 0.000 description 1
- HSQGMTRYSIHDAC-BQBZGAKWSA-N Leu-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(O)=O HSQGMTRYSIHDAC-BQBZGAKWSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 1
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 1
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 1
- AZLASBBHHSLQDB-GUBZILKMSA-N Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C AZLASBBHHSLQDB-GUBZILKMSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- MUYQDMBLDFEVRJ-LSJOCFKGSA-N Met-Ala-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 MUYQDMBLDFEVRJ-LSJOCFKGSA-N 0.000 description 1
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 1
- IYXDSYWCVVXSKB-CIUDSAMLSA-N Met-Asn-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IYXDSYWCVVXSKB-CIUDSAMLSA-N 0.000 description 1
- UJDMTKHGWSBHBX-IHRRRGAJSA-N Met-Cys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UJDMTKHGWSBHBX-IHRRRGAJSA-N 0.000 description 1
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 1
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 1
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 1
- PBOUVYGPDSARIS-IUCAKERBSA-N Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C PBOUVYGPDSARIS-IUCAKERBSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 1
- HGCNKOLVKRAVHD-RYUDHWBXSA-N Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-RYUDHWBXSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- MNGBICITWAPGAS-BPUTZDHNSA-N Met-Ser-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MNGBICITWAPGAS-BPUTZDHNSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- TWEWRDAAIYBJTO-ULQDDVLXSA-N Met-Tyr-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N TWEWRDAAIYBJTO-ULQDDVLXSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- ACFIXJIJDZMPPO-NNYOXOHSSA-N NADPH Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 ACFIXJIJDZMPPO-NNYOXOHSSA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- UXQFHEKRGHYJRA-STQMWFEESA-N Phe-Met-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O UXQFHEKRGHYJRA-STQMWFEESA-N 0.000 description 1
- QTVUPXHPSXZJKH-ULQDDVLXSA-N Phe-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N QTVUPXHPSXZJKH-ULQDDVLXSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 1
- NUZHSNLQJDYSRW-BZSNNMDCSA-N Pro-Arg-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NUZHSNLQJDYSRW-BZSNNMDCSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241001240958 Pseudomonas aeruginosa PAO1 Species 0.000 description 1
- 241000589755 Pseudomonas mendocina Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 101150104372 SD17 gene Proteins 0.000 description 1
- 206010039792 Seborrhoea Diseases 0.000 description 1
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- GRRAECZXRONTEE-UBHSHLNASA-N Ser-Cys-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GRRAECZXRONTEE-UBHSHLNASA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- YZMPDHTZJJCGEI-BQBZGAKWSA-N Ser-His Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 YZMPDHTZJJCGEI-BQBZGAKWSA-N 0.000 description 1
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- TYIHBQYLIPJSIV-NYVOZVTQSA-N Ser-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CO)N TYIHBQYLIPJSIV-NYVOZVTQSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfisoxazole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- XVNZSJIKGJLQLH-RCWTZXSCSA-N Thr-Arg-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N)O XVNZSJIKGJLQLH-RCWTZXSCSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 1
- VEWZSFGRQDUAJM-YJRXYDGGSA-N Thr-Cys-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O VEWZSFGRQDUAJM-YJRXYDGGSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- BDYBHQWMHYDRKJ-UNQGMJICSA-N Thr-Phe-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N)O BDYBHQWMHYDRKJ-UNQGMJICSA-N 0.000 description 1
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 1
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 1
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 1
- CUHBVKUVJIXRFK-DVXDUOKCSA-N Trp-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC=3C4=CC=CC=C4NC=3)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CUHBVKUVJIXRFK-DVXDUOKCSA-N 0.000 description 1
- ONPLDNBGWODKKK-TUSQITKMSA-N Trp-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CC5=CN=CN5)C(=O)O)N ONPLDNBGWODKKK-TUSQITKMSA-N 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 1
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 1
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 1
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 229930003779 Vitamin B12 Natural products 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010017893 alanyl-alanyl-alanine Proteins 0.000 description 1
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960004050 aminobenzoic acid Drugs 0.000 description 1
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 108010038083 amyloid fibril protein AS-SAM Proteins 0.000 description 1
- 208000022531 anorexia Diseases 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000010352 biotechnological method Methods 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- 101150031021 birA gene Proteins 0.000 description 1
- 239000007478 blood agar base Substances 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 206010061428 decreased appetite Diseases 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 229960004198 guanidine Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- JDNTWHVOXJZDSN-UHFFFAOYSA-N iodoacetic acid Chemical compound OC(=O)CI JDNTWHVOXJZDSN-UHFFFAOYSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 229940072205 lactobacillus plantarum Drugs 0.000 description 1
- 108010071185 leucyl-alanine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- LPUQAYUQRXPFSQ-UHFFFAOYSA-M monosodium glutamate Chemical compound [Na+].[O-]C(=O)C(N)CCC(O)=O LPUQAYUQRXPFSQ-UHFFFAOYSA-M 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- FTQWRYSLUYAIRQ-UHFFFAOYSA-N n-[(octadecanoylamino)methyl]octadecanamide Chemical compound CCCCCCCCCCCCCCCCCC(=O)NCNC(=O)CCCCCCCCCCCCCCCCC FTQWRYSLUYAIRQ-UHFFFAOYSA-N 0.000 description 1
- 235000005152 nicotinamide Nutrition 0.000 description 1
- 239000011570 nicotinamide Substances 0.000 description 1
- 238000002414 normal-phase solid-phase extraction Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 229940055726 pantothenic acid Drugs 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- LYCRXMTYUZDUGA-UYRKPTJQSA-N pimeloyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCCC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LYCRXMTYUZDUGA-UYRKPTJQSA-N 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- FCHXJFJNDJXENQ-UHFFFAOYSA-N pyridoxal hydrochloride Chemical compound Cl.CC1=NC=C(CO)C(C=O)=C1O FCHXJFJNDJXENQ-UHFFFAOYSA-N 0.000 description 1
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 235000021309 simple sugar Nutrition 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229960000344 thiamine hydrochloride Drugs 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 235000019163 vitamin B12 Nutrition 0.000 description 1
- 239000011715 vitamin B12 Substances 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 101150038987 xylR gene Proteins 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/185—Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system
- C12P17/186—Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system containing a 2-oxo-thieno[3,4-d]imidazol nucleus, e.g. Biotin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Heterocyclic Carbon Compounds Containing A Hetero Ring Having Oxygen Or Sulfur (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Saccharide Compounds (AREA)
Abstract
DNA-fragmenty a plasmidy, které zahrnují geny biosynthesy biotinu bioB, bioF, bioD a bioA nebo jejich funkčně ekvivalentní genetické varianty a mutanty z enterobakterií, ve kterých jsou geny uspořádány v jedné transkripční jednotce. Vynález se dále týká mikroorganismů, které tyto DNA-fragmenty a plasmidy obsahují a způsobu výroby biotinu za použití těchto mikroorganismů.ŕ
Description
Oblast techniky
Vynález se týká rekombinantního genetického materiálu pro expresi genů při látkové přeměně biotinu z enterobakterií, mikroorganizmů, které tento rekombinantní genetický materiál obsahují. Vynález se dále týká použití takovýchto mikroorganizmů při biotechnologickém způsobu výroby biotinu. Vynález se dále týká způsobu výroby biotinu, který zahrnuje přeměnu dethiobiotinu pomocí biotinsynthasy v bezbuněčném systému.
Biotin (vitamin H) je pro člověka a zvíře důležitý vitamin, jehož nedostatek může například vyvolat seborrhoe, dermatitis, nechutenství a únavu. Biotin je proto užitečný jako přídavek do potravin a krmiv.
Dosavadní stav techniky
Výroba biotinu metodami syntetické organické chemie je nákladná a drahá. Z tohoto důvodu se zvyšuje zájem o biotechnologické způsoby, při kterých lze biotin syntetizovat pomocí mikroorganizmů z levných výchozích surovin jako je glukóza.
Escherichia coli (E. coli) ie mikroorganizmus, který je schopný syntetizovat biotin z výchozích jednoduchých zdrojů uhlíku jako je glycerin nebo glukóza (Obr. 1). Geny, které zodpovídají za biosynthesu biotinu v E. coli, jsou v operonu, který už byl klonován a který obsahuje pět genů bioA, bioB, bioC, bioD a bioF (dále označované také jako bio-geny) (Gupta a spol., Gene 1:331-345; 1977). Tyto geny se transkribují do dvou různých směrů pomocí oblasti promotoroperátor, která je mezi geny bioA a bioB. S ohledem na konvenční genovou mapu leží geny bioB, bioF, bioC a bioD vpravo a gen bioA vlevo od oblasti promotor-operátor. DNA vlevo od oblasti promotor-operátor má po směru bioA-genu další gen s označením ORFI (ORF = open reading frame), který kóduje polypeptid se 158 aminokyselinami je transkribován spolu s bioAgenem (Otsuka a spol., J. Biol. Chem., 263:19577-19585; 1988). Funkce tohoto genu je dosud neznámá. Jiné kmeny z čeledi enterobakterií, například rodu Salmonella nebo Citrobacter vykazují analogickou strukturu biotin-operonu (Shiuan a Campbell, Gene 67:203-211; 1988).
Jsou známé biotechnologické způsoby výroby biotinu, které se provádějí pomocí mikroorganizmů, které jsou transformované klonovaným biotin-operonem zE. coli. Tyto způsoby vycházejí z glukózy. EP-B-236 429 popisuje například mikroorganizmy, které jsou transformované biotin-operonem zE. coli. přičemž jsou hostitelské organizmy mutovány v jejich birA/bioR-genu.
VEP-A-316 229 jsou popsány mutanty E. coli, které produkují méně acetátu a také byly transformovány klonovaným biotin-operonem, které dodatečně vykazují mutace, které způsobují nižší spotřebu glukózy.
Z EP-A-266 240 je dále známé klonování genů odpovědných za synthesu biotinu v Bacil lus sphaericus a na to založeném způsobu výroby biotinu. Tento způsob musí jako výchozí látku použít drahou kyselinu pimelinovou, což je podmíněno metabolismem Bacillus sphaericus.
Výtěžky získané dosud známými biotechnologickými způsoby jsou z ekonomického hlediska zatím neuspokojivé.
Podstata vynálezu
Úkolem předloženého vynálezu je tedy poskytnout biotechnologický způsob výroby biotinu, který umožní vyšší výtěžky biotinu a bude tím hospodárnější.
Úkol se řeší použitím DNA-fragmentů a vektorů, které zahrnují geny bioB, bioF. bioC, bioD a bioA nebo jejich funkčně ekvivalentní genetické varianty a mutanty z enterobakterií, přičemž jsou tyto geny organizovány do transkripční jednotky.
Pod pojmem transkripční jednotka se zde rozumí DNA-sekvence, ve které jsou geny uspořádány ve směru transkripce a jsou pod společnou kontrolou transkripce přepisovány do průběžného transkriptu, přičemž DNA sekvence zahrnuje vedle uvedených genů také genetické kontrolní elementy jako promotory a vazebná místa ribosomů, které jsou potřebné pro expresi genů.
Pod pojmem „funkčně ekvivalentní genetické varianty a mutanty“ se rozumí geny, které jsou odvozeny od genů divokého typu původních organizmů, tzn. enterobakterií a vykazují výměnu bází v rámci známé degenerace genetického kódu. Takové výměny bází mohou vzniknout přirozeně nebo mohou být způsobeny uměle, například aby se přizpůsobila sekvence genů nej výhodnějšímu využití kodonu určitého mikroorganizmu, ve kterém má dojít k expresi. Genetické varianty a mutanty zahrnují dále delece, inserce a substituce bází nebo kodonů, které nechají genový produkt takto změněné sekvence v jeho funkci v zásadě intaktní. Zahrnuty jsou zejména sekvence, které za obvyklých hybridizačních podmínek, tj. při teplotách mezi 55 a 66 °C a při 0,03 až 0,3 M obsahu soli, hybridizují se sekvencemi divokých typů, tedy se sekvencemi, které vykazují vysokou homologii k sekvencím divokých typů, například vyšší než 70 %.
Obr. 1 ukazuje enzymy látkové přeměny při biosynthese biotinu.
Obr. 2 znázorňuje konstrukční schéma pro plazmid pBO30.
Obr. 3 ukazuje DNA-sekvenci plazmidů pBO30, pBO30A-9 a pBO30A-15 pro rozsah 3'-konec bioD-genu a 5'-konec bioA-genu (přerušovaná šipka: bioA-startkodon je podtržený, bioDstopkodon je tečkované vyznačený) spolu s restrikčními místy štěpení relevantními pro vytvořené plazmidu a Shine-Dalgamo (SD)-sekvencí bioA-genu. Potenciální „stem-loop“struktury jsou vyznačeny spojitými šipkami.
Obr. 4 znázorňuje kroky pro variaci sekvence proti směru bioB-genu. když se vychází z plazmidu pbioB::lacZ-2. pro vytvoření zlepšených ribosomových vazebných míst při označení použitých restrikčních míst štěpení, právě těch Shine-Dalgamo-sekvencí (SD) a bioBstartkodonu (Met). Znázorněny jsou sekvence proti směru bioB-genu a 5'-konec bioB-genu. Přerušované čáry představují inserovaný oligonukleotid 985E. Přeškrtnuté nukleotidy by se podle teorie měly vyskytovat, scházejí však v plazmidu pbioB::lacZ/985E a z toho odvozených plazmidů pbioB::lacZ/9 a pbioB::lacZ/16. což má za následek ztrátu BamHI-místa (BamHI). „fíll-in“: doplnění s Klenow-polymerasou.
Obr. 5 znázorňuje konstrukční schéma pro plazmidy pBO30A-15/9 a ρΒΟ30Α-15/9Δ orfl.
Obr. 6 ukazuje DNA-sekvenci a sekvenci aminokyselin genů kódujících biotin-biosynthesu v plazmidu pBO30A-15/9 spolu s genetickými kontrolními elementy (SD: Shine-Dalgamosekvence). Kursivou vyznačené aminokyseliny na COOH-konci bioD15-genu znázorňují substituce vzhledem k sekvenci divokého typu bioD-genu z E.coli.
-2CZ 285533 B6
Obr. 7 znázorňuje konstrukční schéma pro plazmid ρΒΟ74ΔΒ, když se vychází zplazmidů pBO74-13 a pBO3; šipky udávají polohu a orientaci tac-promotoru a bio-genů. Vektorový podíl plazmidů je vyznačen tučně. Přerušované čáry vyznačují rozsah delece bioB-genu.
Na Obr. 2 a 5 znamenají A: AatlI: B: BamHI; Bg: BglII: C: Clal: E: EcoRI; H: HindlII; K: Kpnl; N: Ncol; Nr: Nru:I; P: Pstl; S: Snol; Sa: Saji; Se: Ssel; Sp: Sphl: Ss: SspI: a X: Xbal. „fíll-in“: doplnění recesivních 3-konců s Klenow-polymerasou; mbn: odstranění převislých 5- nebo 3konců „Mung Beán nukleasou“; Bal31: progresivní delece DNA s exonukleasou Bal31. Vektorový podíl plazmidů je znázorněn tučně. Rozdílně šrafované díly v plazmidech se pokaždé použily pro následující klonovací krok. Šipky vyznačují polohu a orientaci bio-genů.
Pro vytvoření DNA-fragmentů a vektorů podle vynálezu se geny biotin-operonu nejprve účelně izolují zchromosomu vhodného mikroorganizmu a pak se za kontroly genověregulačních elementů jako promotory a ribosomová vazebná místa tak spolu spojí, že jsou organizované v jedné jediné transkripční jednotce. Jako výchozí materiál pro isolaci bio-genů mohou sloužit kmeny bakterií z čeledi enterobakterií, například rodu Escherichia. Salmonella nebo Citrobacter. Výhodně je výchozí materiál mikroorganizmus druhu Escherichia coli, kteiý je nejlépe charakterizován.
Vytvoření DNA-fragmentů a vektorů podle vynálezu se může například uskutečnit tak, že se vyjde z genové banky vhodného mikroorganizmu jako je E. coli, ze které se bio-genv nebo jejich fragmenty mohou izolovat a klonovat známým způsobem pomocí hybridizace se značenými oligonukleotidy, které obsahují částečné sekvence bio-genů. Pak se izolované a klonované biogeny pomocí známých metod DNA-rekombinace za kontroly společného promotoru spolu spojí tak, že jsou jako jediná transkripční jednotka. Účelně se bio-genv uspořádají tak, že bioA-gen leží po směru genů bioB, bioF, bioC a bioD, které jsou už v divokém typu operonu z E. coli v jedné transkripční jednotce. BioB-gen kódu je s biotinsynthasou klíčový enzym celého postupu synthesy biotinu, neboť přeměna dethiobiotinu na biotin biotinsythasou tvoří až dosud krok, který určuje rychlost pětistupňové cesty synthesy biotinu. BioB-gen je proto účelně první gen uvnitř transkripční jednotky, takže se pak z důvodu blízkosti k promotoru může uskutečnit optimální exprese tohoto genu (Obr. 2,4, 5 a 6).
Druhá transkripční jednotka v divokém typu biotin-operonu z E. coli, která obsahuje bioA-gen. zahrnuje ještě další gen, ORFI, který kóduje polypeptid se 158 aminokyselinami. Pokusy, které se prováděly s expresními plazmidy, ve kterých není žádný ORFI-gen, ukazují, že tento gen není při obvyklých fermentačních podmínkách esenciální pro biotin-biosynthesu. Přesto však není možné vyloučit, že tomuto polypeptidu s dosud neznámou funkcí přísluší za určitých podmínek také nějaká role při biotin-biosynthese. Přestože tedy není přítomnost ORFI-genu v DNAfragmentech podle vynálezu nezbytně nutná, zahrnuje transkripční jednotka v účelné formě provedení spolu s bio-genv dodatečně také ORFI-gen (Obr. 2, 5 a 6).
V DNA-fragmentech a vektorech podle vynálezu nejsou bio-genv výhodně pod kontrolou přírodního biotin-promotoru z E. coli. Častěji jsou bio-genv pro zlepšení transkripce účelně pod kontrolou silného cizího promotoru. Volba promotoru závisí na požadovaných podmínkách exprese, například na tom, zdaje požadována konstitutivní nebo indukovaná exprese, nebo závisí na mikroorganizmu, ve kterém se má exprese uskutečnit. Vhodnými promotory jsou například promotory PL a PR fázu lamda (srovnej Schauder a spol., Gene 52:279-283; 1987), promotor pxvlS TOL-plazmidu z Pseudomonas putida se sousedním regulátorovým genem xylR (Franklin a spol., J. Bacteriol. 154:676-685; 1983), trc-promotor (Amann a spol., Gene 69:301-315; 1988), trp-promotor (Amann a spol., Gene 25:167-178; 1983), promotor pdegO z Bacillus subtilis, který je aktivní ve stacionární fázi (Dahl a spol., J. Bacteriol. 173:1539-1547; 1991) a lacUV5-promotor (Amann a spol., Gene 25:167-178; 1983). Výhodně se jako promotor volí
-3CZ 285533 B6 tac-promotor. hybrid ztrp-a lacUV5-promotoru z E. coli, který se může použít jako konstitutivní nebo inducibilní promotor (Russell a Bennett, Gene 20:231-243; 1982).
Navíc se zjistilo, že se exprese bioA-genu ve shora popsaném výhodném uspořádání může dále zlepšit, jestliže je odstup mezi za sebou následujícími geny bioD a bioA v transkripční jednotce co nejkratší, tj. výhodně méně než 50pb (párů bází). Překvapivě se zjistilo, že je exprese zvláště vysoká, jestliže sekvence 3'-konce bioD-genu, která kóduje COOH-konec dethiobiotin (DTB)synthetasy, současně obsahuje ribosomální vazebné místo následujícího bioA-genu. Výhodně se současně vyskytuje překryv čtecích rastrů genů bioD a bioA. Takovou konstelaci lze dosáhnout tehdy, když se 5-konec bioA-genu spolu sjeho ribosomálním vazebným místem tak fúzuje s bioD-genem. že jeho 3'-konec je substituován sekvencí s ribosomálním vazebným místem proti směru bioA-genu a popřípadě 5-konce bioA-genu (Obr. 3 a 6; Seq ID No: 1, 6 a 8-16). Tento efekt je tím překvapivější, že při takové fúzi může být vyměněn COOH-konec DTBsynthetasy, aniž by enzym ztratil svoji aktivitu. Podobné překryvy jsou také u divokého typu biotin-operon z E. coli mezi čtecími rastry genů bioB, bioF, bioC a bioD.
Exprese bioB-genu se nechá optimalizaci ribosomálního vazebného místa před bioB—genem dále optimalizovat. Účelně se vychází z takové konstrukce, ve které je bioB-gen právě pod kontrolou silného promotoru, např. tac-promotoru. Optimalizace ribosomálního vazebného místa bioBgenu, tzn. variace Shine-Dalgamo-sekvence a její odstup k 5'-konci strukturního genu, lze dosáhnout pomocí běžných metod DNA-rekombinace. Vliv určitého ribosomálního vazebného místa na translaci lze určit osobě známým způsobem, například genovou fúzí testovaného genu s lacZ-genem a následujícím testem s chromogenním substrátem 5-brom—4-chlor-3-indolyl-|3D-galaktopyranosidem (X-Gal).
DNA-fragmenty, které obsahují bio-geny v jedné transkripční jednotce, mohou být zabudovány pomocí známých technik DNA-rekombinace do řady vektorů. Takto se získají například plazmidy pBO30A-15/9 (Obr. 5 a 6, Seq ID No: 1 a 6; příklad 1.5.2) a pBO47 (příklad 1.7). Plazmid pBO30A-15/9 byl uložen 28. 9. 92 u Německé sbírky pro mikroorganizmy a buněčné kultury GmbH, D-3300 Braunschweig, Mascheroderweg lb, v E. coli XLl-Blue a E. coli BM4062 pod depozitním číslem DSM 7246 popř. 7247, a 17. 9. 1993 v E. coli ED8767 pod depozitním číslem DSM 85534. Plazmid pBO47 byl uložen 17. 9. 93 u Německé sbírky pro mikroorganizmy a buněčné kultury GmbH v Agrobacterium/Rhizobium sp HK4 pod depozitním číslem DSM 8555.
V závislosti na druhu zvolených vektorů mohou být geny pro enzymy pro synthesu biotinu exprimovány v různých organizmech. Jako vektory jsou vhodné jak vektory se specifickým hostitelským spektrem, tak také se širokým hostitelským spektrem („broad host range“). Příklady vektorů se specifickým hostitelským spektrem, např. pro E. coli, jsou pBR322 (Bolivar a spol., Gene 2:95-113; 1977), pUC18/19 (Yanisch-Perron a spol., Gene 33:103-119; 1985), pK18/19 (Pridmore, Gene 56:309-312; 1987) a pRA95 (získaný od Nycomed Pharma AS, Hvidovre, Dánsko).
Jako vektory se širokým hostitelským spektrem („broad host range“) lze použít všechny vektory, které se hodí pro Gram-negativní bakterie. Příklady takovýchto vektorů se širokým hostitelským spektrem jsou pRK290 (Ditta a spol., Proč. Nati. Acad. Sci. USA 77:7347-7351; 1980), pKT240 (Bagdasarian a spol., Gene 26:273-282; 1983) deriváty pRK290 jako pLAFRl (long a spol., Nátuře 298:485-488: 1982) a pRK290X (Alvarez-Morales a spol., Nucl. Acid. Res. 14:42074227; 1986), deriváty pTK240 jako pMMB66EH (Furste a spol., Gene 48:119-131; 1986) nebo pGSS33 (Sharpe, Gene 29:93-102; 1984).
Pro výrobu produkčních kmenů pro fermentaci, tzn. kmenů pro produkci biotinu, musí se DNAfragment podle vynálezu vložit do žádaných a pro expresi vhodných hostitelských kmenů.
-4CZ 285533 B6
Mikroorganizmy, které jsou vhodné pro expresi bio-genů. výhodné kmeny se širokým substrátovým spektrem, jsou například enterobakterie, výhodně rodu Escherichia, nebo mikroorganizmy rodu Rhizobium, Agrobacterium, Rhizobium/Agrobacterium, Acinetobacter, Azotobacter, Pseudomonas a Comamonas. Obzvláště výhodné jsou mikroorganizmy druhu E. coli. Rhizobium-ZAgrobacterium sp. HK4 (jak je popsáno v EP-B 158 194), Pseudomonas mendocina. Pseudomonas aeruginosa nebo Acinetobacter calcoaceticus. Mikroorganizmy mohou obsahovat DNA-fragment podle vynálezu buď na molekule vektoru nebo integrovaný ve svém chromosomu. Vložení DNA-fragmentu do mikroorganizmů lze provést například transformací nebo konjugací. Účelně se zvolené mikroorganizmy transformují osobě známým způsobem s vektory, které obsahují DNA-fragmenty podle vynálezu. Vhodnými produkčními kmeny jsou například E. coli XL1—Blue, E. coli BM4062 a E. coli ED8767, vždy obsahující plazmid pBO30A-15/9 (DSM 7246, DSM 7247 a DSM 8554) a Agrobacterium/Rhizobium sp HK4 s plazmidem pBO47 (DSM 8555).
Izolace transformovaných hostitelských kmenů se účelně provádí ze selektivního živného média, ke kterému se přidá antibiotikum, vůči kterému jsou hostitelské kmeny resistentní na základě markerového genu nalézajícího se na vektoru nebo DNA-fragmentu.
Biotechnologická výroba biotinu se uskuteční za použití mikroorganizmů, které obsahují DNAfragmenty nebo vektory podle vynálezu. Způsob výroby biotinu se uskuteční obvykle v kulturách, kdy se vychází z vhodného zdroje uhlíku jako růstového substrátu pro určitý mikroorganizmus, který je nakonec přeměněn na biotin. Jako zdroj uhlíku jsou vhodné zejména jednoduché molekuly cukrů, například glukóza nebo glycerin. Podle toho lze jako růstová média použít komerčně běžně dostupná média jako například kvasinkové živné prostředí (Nutrient Yeast Broth NYB: Nutrient Broth No. 2, Oxoid, 25g/l; extrakt droždí, Oxoid, 5g/l) nebo glycerin-a glukóza-minimální média.
Výhodně probíhá fermentace, tzn. výroba biotinu jako tzv. „fed-batch-způsob“, tzn. v batchfermentaci, které se kontinuálně nebo v intervalech přivádí objemový proud s čerstvými živnými látkami, přičemž se neodčerpává žádný kultivační roztok. Při takovém způsobu se jako „feed“ výhodně přivádí roztok glycerinu s variabilní přítokovou rychlostí přizpůsobenou vývoji určité biomasy.
Fermentace se uskutečňuje v rozsahu pH a teploty, které jsou pro daný mikroorganizmus fyziologicky vhodné. Účelně leží hodnota pH v rozmezí od 6 do 8 a teplota v rozmezí od 20 do 45 °C.
Obměnou živin v médiu a přizpůsobením podmínek fermentace pro určitý mikroorganizmus obvyklým způsobem lze výtěžek biotinu dále zlepšit.
Předmětem předloženého vynálezu je dále způsob výroby biotinu, který zahrnuje přeměnu dethiobiotinu na biotin v bezbuněčném systému pomocí enzymu biotinsynthasy, přičemž se reakce provádí v přítomnosti thiaminpyrofosfátu, NADPH, S-adenosylmethioninu, Fe2+-iontů, cysteinu a nejméně jedné další aminokyseliny ze skupiny asparagin, kyselina asparagová, glutamin a serin.
Biotinsynthasa se může použít buď ve vyčištěné formě nebo ve formě buněčného extraktu. Účelně se buněčný extrakt nebo vyčištěná biotinsynthasa získá z kmenu se zvýšenou expresí biotinsynthasy, například zE. coli XLl-Blue s plazmidem pO3OA-15/9 (DSM 7246). Příprava buněčného extraktu a popřípadě čištění biotinsynthasy se mohou uskutečnit v biochemii běžnými metodami, například homogenizací buněk, gelovou filtrací, frakcionací síranem amonným a iontoměničovou chromatografií.
-5CZ 285533 B6
Zjistilo se, že lze přeměnu dethiobiotinu na biotin vbezbuněčném systému pomocí biotinsynthasy uskutečnit s dobrými výtěžky jen tehdy, když se reakce provádí za přidání kofaktorů a aminokyselin.
Kofaktory potřebné pro reakci zahrnují S-adenosylmethionin (SAM), thiaminpyrofosfát (TPP), redukovaný nikotinamidadenindinukleotidfosfát (NADPH) a Fe2+-ionty. Kofaktory se účelně přidávají v koncentracích od 1 do 500 μΜ. Účelně se ke směsi také přidává dithiothreitol (DTT) v koncentraci od 0,1 do 10 mM.
Aminokyseliny, které jsou pro reakci potřebné, jsou cystein jako donor síry a alespoň jedna další aminokyselina ze skupiny asparagin, kyselina asparagová, glutamin a serin. Kyselina asparagová se účelně přidává jako aspartát. Cystein se účelně přidává v koncentraci od 10 do 500 pm, další aminokyseliny v koncentracích od 1 do 50 mM.
Dále se zjistilo, že se přeměna dethiobiotinu na biotin při použití čištěné biotinsynthasy uskuteční jen v přítomnosti flavodoxinu a ferredoxinu(flavodoxinu)-NADPI-r-reduktasy. Účelně se proto pro přeměnu přidávají flavodoxin a ferredoxin(flavodoxin)-NADPH+reduktasa, zejména když nepoužívá biotinsynthasa ve formě buněčného extraktu. Flavodoxin a ferredoxin(fiavodoxin)-NADPFr-reduktasy (EC-Nr, 1.18.1.2) jsou známé proteiny, které lze získat známým způsobem, například frakcionací síranem amonným s následující iontoměničovou chromatografíí a gelověfíltrační chromatografíí, nezávisle na expresi biotinsynthasy z buněčných extraktů E. coli. Tak se mohly izolovat flavodoxin a ferredoxin(flavodoxin)-NADPH*-reduktasa například jak z E. coli XLl-Blue splazmidem pBO30A-15/9 (DSM 7246), který má zvýšenou expresi biotinsynthasy, tak také zE, coli XLl-Blue splazmidem ρΒΟ74ΔΒ (DSM 7245), ve kterém je biotinsynthasa-gen bioB deletován (Obr. 7). Plazmid ρΒΟ74ΔΒ byl uložen v E. coli XLl-Blue 28. 9. 1992 u Německé sbírky pro mikroorganizmy a buněčné kultury GmbH, D-3300 Braunschweig, Maxscheroderweg lb pod depozitním číslem DSM 7245.
Navíc se zjistilo, že pro přeměnu dethiobiotinu na biotin jsou vedle biotinsynthasy potřebné další proteiny, které jsou obvykle obsažené v buněčném extraktu E. coli. Tyto proteiny jsou obsaženy v proteinové frakci, která se získá precipitací síranem amonným při 45%-ním nasycení síranem amonným z buněčného extraktu E. coli. Jak ukazuje izolace jedné takové proteinové frakce z E. coli XLl-Blue s plazmidem ρΒΟ74ΔΒ (DSM 7245), není exprese biotinsynthasy potřebná pro přítomnost a získání těchto proteinů. Sraženina získaná po precipitaci síranem amonným lze například dále čistit chromatografickými metodami, jako je iontoměničová chromatografie a gelověfíltrační chromatografie. Účelně se proto ke směsi pro přeměnu dethiobiotinu na biotin přidá proteinová frakce získaná shora popsaným způsobem, zejména když není biotinsynthasa použita ve formě buněčného extraktu.
Přeměna se provádí ve vhodné pufračním systému, účelně v rozmezích hodnot pH a teploty, ve kterých jsou enzymy fyziologicky aktivní, výhodně v rozmezí pH od 6 do 9 a při teplotě mezi 4 a 50 °C.
Předložený vynález je dále vysvětlen v následujících příkladech.
Příklady provedení vynálezu
Obecné postupy:
Restrikční endonukleasy byly použity s 3 až 5 jednotkami/pg DNA podle údajů výrobků. Značení a fosforylace DNA-linkerů (zakoupených od Boehringer Mannheim, SRN) pro zabudování restrikčních míst štěpení a syntetických oligonukleotidů (zakoupených od
-6CZ 285533 B6
Microsynth, Windisch, CH), například pro použití jako sond pro DNA/DNA-hybridizace a jako „primer“ pro reakce spojené se sekvenováním, se uskutečnily s T4-polynukleotid-kinasou (Boehringer Mannheim, SRN) podle Sambrooka a spol. (Molecular Cloning: A laboratory manual. 2nd edition, Cold Spring Harbour Laboratory, Cold Spring Harbour, NY; 11.31 a 5.68;
1989). Ligační reakce se uskutečnily s T4-DNA-ligasou podle údajů výrobce.
DNA-sekvenování se uskutečnila metodou zmenšování řetězce podle Sangera a spol. (Proč. Nati. Acad. Sci. USA 94:5463-5467; 1977). Všechny sekvenční reakce se prováděly se sekvenasou-K.it od United States Biochemicals (Cleveland, OH, USA) podle protokolu výrobce. Sekvenasa (verze 2.0, geneticky změněná T7-DNA-polymerasa) poskytovala rovnoměrnou, dobře čitelné DNA-sekvence přes více než 600bp; komprese v DNA-oblastech bohatých na GC se daly lehce uvolnit, když se místo dGTP použil nukleotid dITP. Jako matrice pro sekvenční reakci byly zpravidla použity jednovláknové formy vektorů M13mpl8/19 (Yanisch-Perron a spol., 1985, ibid.) nebo pBluescript KS+/SK+ (apR lacZ'; získaný ze Stratagene, La Jolla, CA), které byly izolovány podle Messinga (Methods Enzymol. 101:20-79; 1983). Pro sekvencování dvouvláknité plazmid-DNA byla plazmid-DNA čištěna pomocí CsCl-gradientu nebo „Gene Clean“ (BIO 101, La Jolla, CA). Jako radioaktivně značený nukleotid byl použit a[35S]-dATP (NEN-Du Pont, NEG-034H). Elektroforetické rozdělení se uskutečnilo buď v běžných 4% popř. 6% bis/akrylamidových gelech se 7M močoviny a 1 x TBE pufrem (90 mM Tris, 90 mM kyseliny borité, 2.5 mM EDTA), nebo v gelech z 5% HydroLink Long Ranger (AT Biochem, Malvem, PA, USA, via Chemie Brunschwig, Basel) se 7M močovinou a 1,2 x TBE-pufrem. Gely byly 550 mm dlouhé a 0,2 mm tlusté; elektroforéza se prováděla v zařízení LKB Macrophor s termostatem při napětí 2100 V a teplotě 60 °C. Pak byly geny sušeny na papíru Whatman 3 MM a podrobeny autoradiografii s rentgenovými filmy Fuji RX nebo Amersham Hyperfilm Pmax.
Izolace extrachromosomální DNA se provedla buď v menších množstvích podle „rapid alkaline SDS“ („miniprep“)-metody podle Bimboim a Doly (Nucl. Acid. Res. 7:1513-1523; 1979), nebo pro izolaci větších množství odstředěním v hustotním gradientu chloridu cesia modifikovanou metodou podle Clewell a Helsinki (Proč. Nati. Acad. Sci. USA 42:1159-1166; 1969). Alternativně se použily QUIAGEN-packs firmy DIAGEN, Důsseldorf (SRN).
Pro transformaci E. coli s plazmid-DNA se buňky připravily podle Cohena a spol. (Proč. Nati. Acad. Sci. USA 69:2110-2114; 1972) v 50 mM CaCl2. Transformace s plazmid-DNA a selekce klonů nesoucích plazmid se provedla pole Sambrooka a spol. (1989; ibid. 1.82-1.84).
Příklad 1
Klonování E. coli biotin-operonu v jediné transkripční jednotce
1.1. Vytvoření pBOl aM13bioD
Pro klonování bio-genů byla izolována chromosomální DNA zE. coli DSM 498 (K12 „divoký typ“; Německá sbírka pro mikroorganizmy a buněčné kultury GmbH). Izolace se provedla v podstatě podle Hahna a Hennecka (Mol. Gen. Genet. 193:46-52; 1984). Pak byly 2 pg celkové DNA z E. coli DSM 498 štěpeny restrikčním enzymem Pstl. DNA-fragmenty byly elektroforeticky rozděleny v horizontálním 0,7% agarosovém gelu obvyklým způsobem (Sambrook a spol., 1989, ibid.; 6.19 až 6.9) a transferovány na „Gene Screen“ membránách (nylonová membrána od NEN-Du Pont) podle (Southem, J. Mol. Biol., 98:503—517; 1975). DNA byla dvouhodinovou inkubací při 80 °C ve vakuové peci fixována na vysušených filtrech. Pro identifikaci DNA-fragmentů s bio-operonem byl hybridizován syntetický oligonukleotid dlouhý 25 nukleotidů se sekvencí 5'-GGCTCACCGCCCACGCTGGACATTG—3', odpovídající
-7CZ 285533 B6 sekvenci z 5-konce bioB-genu (Otsuka, A. J., Dizertace, Univerzita v Kalifornii, San Diego, CA.; 1978) jako sonda s DNA vázanou na filtru. Ktomu bylo nejprve 40 pMol tohoto oligonukleotidů koncově značeno s T4-polynukleotid-kinasou a τ-[32Ρ]-ΑΤΡ (75 pCi). Hybridizace DNA vázané na filtru s radioaktivně značenou sondou se provedla podle Sambrooka a spol., (1989, ibid., 9.52-9.55). Ktomu byla DNA nejdříve předhybridizována 2 h v 5x Denhardt-roztoku (lx Denhardt-roztok: 0,02% hovězí serum-albumin, 0,02% Ficoll, 0,01% polyvinylpyrrolidon), 6x SSC-pufru (lx SSC: 150 mM NaCl, 15 mM Natriumcitrát, pH 7,2) a 150 pg/ml DNA spermatu lososa. Pak byla DNA hybridizována 18 hod. v 2x Denhardt-roztoku, 6x SSc, 0,5% SDS, 150 pg/ml DNA spermatu lososa a 2 hod. promývána a nakonec čtyřikrát promyta pokaždé 30 min. v 2x SSc, 0,1% SDS. Při všech krocích byla teplota 65 °C. Značený oligonukleotid hybridizoval na tomto „Southem blot“ s 5,4 kb dlouhým Pstl-fragmentem.
Pro klonování tohoto 5,4 kb-Pstl-fragmentu s biotin-operonem bylo nejprve 50 pg celkové DNA zE. coli DSM 498 štěpeno s Pstl a rozděleno 0,7% agarosovém gelu jak shora uvedeno. Fragmenty o velikosti od 4,5 kb do 6,5 kb byly z gelu vyřezány a izolovány elektrodialýzou v dialyzaČních střevech. Přibližně 0,6 pg těchto fragmentů bylo ligováno s 0,6 pg vektoru pHE3 (Hennecke a spol., Gene 19:231-234; 1982) rozštěpeného s Pstl. Tento vektor obsahuje gen pro chloramphenicol-rezistenci (CmR), ColEl replikon zpACYC184 (Chang und Cohen, J. Bacteriol., 134:1141-1156; 1978) jakož i E. coligen pheS pro fenylalanin-tRNA-synthetasu, který má Pstl-místo.
0,2 ml způsobilých buněk z E. coli RP 28 (Hennecke a spol., 1982, ibid.) v 50 mM CaCl2 bylo transformováno touto ligační směsí. E. coli RR28 má v chromosomu mutovány pheS-gen (pheS12) a je proto rezistentní vůči p-fluorfenylalaninu (pFphe) v růstovém médiu. Když RR28 nese plazmid pHE3 s pheS divokým typem genu, je kmen na rozdíl od toho sensitivní vůči pFphe. Inserce DNA-fragmentů do Pstl-místa štěpení pHE3 přeruší pheS divoký typ genu; RR28 s rekombinovaným plazmidem je proto pFphe-rezistentní (pFpheR). Transformované buňky se rozprostřely na destičky s pFphe-minimální médium (7,1 g/1 Na2HPO4, 13,6 g/1 KH2PO4, 0,014 g/1 CaCl2x2H2O, 0,25 g/1 MgSO4, 1,58 g/1 (NFLi)2SO4, 15 g/1 agar, 4 g/1 glukóza, 0,005 g/1 thiamin, 0,05 g/1 leucin, 0,05 g/1 prolin, 0,2 g/1 D,L-p-fluorfenylalanin, 0,02 g/1 chloramphenicol; Hennecke a spol., 1982, ibid.) a izolovalo se ca. 2500 CmR pFpheR klonů, které obsahovaly plazmid pHE3 (CmR) s insertem v pheS-genu (pFpheR). 600 těchto klonů bylo přetištěno na nitrocelulózové filtry, které ležely na Nutrient agar (NA)-destičkách (NA: Blood Agar Base (Oxoid), 40 g/1; extrakt droždí (Oxoid), 5 g/1) s 20 pg/ml Cm. Filtry s narostlými koloniemi (průměr 3 až 5 mm) se zpracovaly podle Grunstein a Hogness (Proč. Nati. Acad. Sci. USA 72:3961-3965; 1975), aby se buňky lyžovaly a aby se uvolněná DNA vázala. Filtry s lyžovanými a fixovanými buňkami E. coli byly hybridizovány se shora popsaným 32P značeným bioB-oligonukleotidem o 25 nukleotidech. Hybridizace se provedla podle modifikací pro hybridizaci kolonií podle Sambrook a spol. (1989, ibid., 11.00), tzn. předhybridizace, hybridizace a první růstový proces se uskutečnily v 4x Denhardt-roztoku, 6x SSC, 100 pg/ml DNA spermatu lososa, s následujícím 6x promytím v 2x SSC. Teplota byla 65 °C. 3 klony vázaly bioB-oligonukleotid; z jednoho z těchto klonů byl izolován plazmid pBOl s Pstl-fragmentem dlouhým 5,4 kb (Obr. 2). Restrikční analýzy a srovnání s publikovanými daty (Szybalski a Szybalski, Gene 19:93-103; 1982) ukázaly, že pBOl obsahoval všechny geny biotin-operonu s výjimkou bioD.
Ke klonování bioD-genu se použila sonda s částmi genů bioC a bioD, složená z 520 bp dlouhého SphI/Pstl-fragmentu zpBOl. Tento fragment byl izolován zagarosového gelu. 0,2 pg izolovaného fragmentu bylo radioaktivně značeno pomocí „Nick-Translation“ s DNApolymerasou I (Boehringer Mannheim, SRN; holoenzym zE. coli; tato tzv. „Kombergpolymerasa“ byla použita spolu s DNasou I) a 25 pCi a-[32P]-dATP (NEN-Du Pont, NEG012H) podle (Sambrook a spol., 1989, ibid. 10.8). Hybridizace této sondy s restrikčními fragmenty E. coli DSM 498-chromosomu vyrobených s SspI na „Southem blot“ jak shora
-8CZ 285533 B6 uvedeno ukázala na jedné straně 1,6 kb-SspI-fragment s bioF a bioC známý z pBOl a na druhé straně 1,1 kb-SspI-fragment s bioD a sekvencemi sousedního genu uvrB (Sancar a spol., Cell,
28; 523-520; 1982).
Ke klonování 1,1 kb-SspI-fragmentu byla opět založena částečná genová banka. K tomu bylo 30 pg DNA E. coli DSM 498 štěpeno s SspI a rozděleno na 0,7% agarosovém gelu. Fragmenty o velikosti od 0,9 kb do 1,3 kb byly vystřiženy a izolovány elektrodialýzou. 0,5 pg těchto fragmentů byly ligovány s 0,5 pg fágové vektoru M13mpl9 štěpeného s Smál (Yanisch-Perron a spol., 1985, ibid.). S touto ligační směsí se provedla transfekce E. coli JM109 (Yanisch-Perron a spol., 1985, ibid.) podle Messinga (Methods Enzymol., 101:20-79; 1983). Bylo izolováno 150 fágových klonů s insertem (fenotyp LacZ~) a rozmnoženo v ΝΎΒ-mediu. Po odstředění E. colibuněk byly fágy pokaždé v 50 pl supematantů naneseny pomocí zařízení Schleicher & Schiill „minifold I“ jako „dot blot“ na nitrocelulózový filtr (Schleicher & Schůll BA 85). Pro denaturaci fágů byly filtry zpracovány 5 min. spufrem 0,1 M NaOH/1,5 M NaCl a pak neutralizovány 0,5 M Tris-HCl, pH 7,5/2,5 M NaCl (5 min.). DNA byla na filtru fixována 2 hod. inkubací při 80 °C. Filtr byl hybridizován jak popsáno (Sambrook a spol., 1989, ibid., 9.52-9.55) s radioaktivně značeným 520 bp dlouhým SphI/Pstl-fragmentem při 60 °C. Takto byl identifikován fágový klon M13bioD svýše popsaným 1,1 kb-SspI-fragmentem. který obsahuje bioD-gen (Obr. 2).
1.2 Vytvoření pBO2
Vždy 0,5 pg plazmidu pBOl a 0,5 pg fágu M13bioD byly štěpeny restrikčními enzymy Snol a HindlII a v jedné směsi religovány. Po transformaci E. coli RR28 touto směsí byly zjišťovány rekombinované plazmidy pomocí restrikční analýzy. Byl zvolen plazmid pBO2 (Obr. 2), ve kterém je ca. 1,5 kb dlouhý SnoI/HindlII-fragment z pBOl, který obsahuje část bioD-genu a neesenciální sekvenci vektoru pHE3, nahrazen 0,95 kb dlouhým SnoI/HindlII-fragment z M13bioD. Analýza ukázala, že plazmid pBO2 obsahoval kompletní bio-operon. který je v E. coli, spolu se sekvencemi uvrB-promotoru (Sancar a spol., Cell 28:523-530; 1982) ve směru bioD.
1.3 Vytvoření pBO3 a pBO6
Bylo pozorováno, že E. coli RR28 roste hůře s pBO2 na NA-destičkách než s pBOl a tvoří zřetelně menší kolonie. Příčinou toho mohou být uvrB sekvence v pBO2. Pro deleci těchto uvrB sekvencí bylo 20 pg pBO2-DNA štěpeno s HindlII a rozpuštěno ve 150 pl Bal31-pufru (600 mM NaCl, 12,5 mM MgCl2, 12,5 mM CaCl2, 1 mM EDTA, 20 mM Tris-HCl, pH 7,2). Pak byl pro postupné zkracování lineárních plazmidů přidán Bal31 (z Alteromonas espeiiani, Boehringer Mannheim, SRN). Po 3, 6, 9, 12 a 15 min inkubaci při 30 °C byly odebrány alikvoty vždy po 30 pl a Bal31-reakce zastavena přidáním vždy 2 pl 0,5 M EGTA (kyselina ethylenglykol-bis-(2-aminoethyl)-tetraoctová), pH 7,5, a následující extrakcí fenolem. Alikvoty pak byly rozpuštěny ve 40 pl Mung Beán Nuclease-pufřu (30 mM natriumacetát, 50 mM NaCl, 1 mM ZnCl2, 5% glycerin, pH 4,6) a pro odstranění nespárovaných jednovláknových konců a vytvoření nespecifických tupých konců byly zpracovány 10 min při 37 °C sMung Beán Nucleasou (Boehringer Mannheim, SRN).
Při zpracování s Bal31 se odstraní nejen uvrB-sekvence. ale také esenciální sekvence vektoru pHE3. Proto byly zkrácené pBO2-plazmidy po zpracování s Mung Beán Nucleasou štěpeny s Eco-RI, aby se odstranila část vektor-DNA zpHE3, která byla zkrácena Bal31. Původní vektorová sekvence byla pak regenerována tím, že byly zpracované pBO2-plazmidy ligovány s
1,5 kb-DNA-fragmentem, který byl po restrikci s BamHI. zpracování s Mung Beán Nucleasou a další restrikci s EcoRI izolován z pBO2 a který má předtím deletovanou esenciální vektorovou
-9CZ 285533 B6 sekvenci zpHE3. Protože touto ligací se zcela regeneruje Cm-rezistence vektoru, mohou být rozeznány intaktní plazmidy na základě jejich vlastnosti, zprostředkovat rezistenci proti Cm.
E. coli RR28 byl transformován ligačními směsmi a rozprostřen na NA-destičkách s 20 pg/ml Cm. Byly pozorovány malé pomalu rostoucí kolonie, jak jsou typické pro pBO2, a velké normálně rostoucí kolonie. Počet velkých kolonií na pBO2-alikvot vzrůstal s dobou Bal31inkubace.
Z 22 normálně rostoucích kolonií byla izolována plazmid-DNA a zkoumána restrikční a sekvenční analýzou. Takto byly získány plazmidy pBO3 a pBO6, ve kterých bylo deletováno ca 330 bp popř. 410 bp uvrB oblasti, které ale ještě zcela měly bioD-gen.
1.4. Klonování bio-genů v transkripční jednotce
1.4.1 Vytvoření pBO22: tac promotor před bioB
Pro zabudování vhodného promotoru před gen bioB se musí odstranit nežádoucí divoký typpromotor před geny bioBFCD. To se může provést štěpením s Ncol. čímž se současně uvolní start-kodon bioB-genu. V předloženém případě byl jako promotor zvolen tac-promotor (Russel a Bennett, 1982, ibid.), protože může být použit jako konstitutivní nebo indukovatelný promotor a je dobře aktivní nejen v E. coli, ale i v mnoha jiných Gram-negativních bakteriích.
DNA-fragment s tac-promotorem s konci HindlII a BamHI byl zakoupen u Pharmacia-LKB (Uppsala, Švédsko) a zabudován do plazmidů pUC18 štěpeného HindlII a BamHI (YanischPerron a spol., 1985, ibid.). Vznikl plazmid pUC 18/tac (Obr. 2). 8 pg tohoto plazmidů bylo pak štěpeno s BamHI a pro doplnění recesivních 3'-konců bylo inkubováno s Klenow-polymerasou (DNA-polymerasa I z E. coli: Boehringer Mannheim, SRN) v Klenow-polymerasa-pufru (20 mM Tris-HCl, pH 7,5, 10 mM MgCl2, 6 mM β-merkaptoethanol) za přidání po 100 pg dATP, dGTP, dCTP a dTTP. Pak se provedla druhá restrikce s AatlI. Takto se izoloval 0,55 kb dlouhý DNA-fragment s tac-promotorem.
3,2 kb-fragment s geny bioB. bioF, bioC a 5'-koncem bioD-genu byl izolován z pBOl. K tomu bylo 8 pg pBOl štěpeno sNeol a pak pro doplnění recesivních 3'-konců zpracováno s Klenowpolymerasou jako shora uvedeno. Pak byla provedena druhá restrikce s Pstl. následována izolací požadovaného 3,2 kb-fragmentu. Nakonec byly 4 pg vektoru pH3 štěpeny s Pstl a AatlI a P15Areplikon byl izolován z pHE3 (Hennecke a spol., 1982, ibid.).
Tyto tři fragmenty byly pro ligaci přečnívajících a hladkých konců zpracovány ve směsi v ekvimolámích množstvích s T4-DNA-ligasou (Boehringer Mannheim, SRN), přičemž byly vždy přečnívající konce od Pstl s Pstl a od AatlI s AatlI spolu ligovány a hladké konce po zpracování s Klenow-polymerasou od BamHI a Ncol byly spolu ligovány. Při ligaci BamHIkonce doplněného pomocí Klenow-polymerasy se stejně opracovaným Ncol-koncem byly regenerovány BamHI- a Ncol-místa štěpení. E. coli RR28 byla touto ligační směsí transformována a podrobena selekci na CmR. Plazmid-DNA z transformantů s CmR byla zkoumána restrikční analýzou. Takto byl získán plazmid pBO21 (Obr. 2), ve kterém je tacpromotor před bioB-genem. Delecí 1,5 kb dlouhého HindlII-fragmentu z pBO21, který vykazuje neesenciální sekvence z plazmidových vektorů pHE3 a pUC18, se nakonec získal pBO22 (Obr. 2).
1.4.2. Vytvoření pBO27 a pBO28 pg pBO22 byly štěpeny s Pstl a převislý Pstl-konec byl zkrácen na hladký konec zpracováním s Mung Beán nukleasou. Pak byl štěpen s Snol a vzniklý 6,8 kb dlouhý DNA-fragment byl
-10CZ 285533 B6 izolován. 0,76 kb-DNA-fragment s 3'-koncem bioD-genu byl izolován z 5 pg pBO3 po restrikci s Clal. doplnění převislých Clal-konců pomocí Klenow-polymerasy a restrikci s Snol. Oba DNA-fragmenty byly ligovány pomocí T4-DNA-ligasy a pak byla E. coli ligační směsí transformována. Po selekci na chloramfenicolu se z transformantů s CmR po restrikční analýze získal plazmid pBO27. Tento plazmid obsahuje tac-promotor spolu s geny bioB, bioF, bioC a úplným bioD-genem v jedné transkripční jednotce (Obr. 2).
Pro deleci BamHI místa štěpení v pBO27 bylo štěpeno 5 pg pBO27 s BamHI. inkubováno s Klenow-polymerasou a nukleotidem dGTP jak shora popsáno a pak zpracováno s Mung Beán nukleasou. Po religaci této DNA s T4-DNA-ligasou a transformaci E. coli DH5 (Hanahan, J. Mol. Biol. 166:557-580; 1983) byl získán plazmid pBO28, ve kterém je deletováno BamHI místo štěpení, zatímco Ncol místo štěpení zůstalo zachováno (Obr. 2).
1.4.3. Vytvoření M13biol8 aM13biol8/13
Pro odstranění nežádoucího promotoru divokého typu před bioA-genem byl nejdříve pomocí restrikce 5 pg pBO3 s BglII a KpnI izolován 4,4 kb-fragment s geny bioB. bioF, bioA a ORFI. 0,5 pg tohoto fragmentu bylo ligováno s 0,5 pg fágového vektoru M13mpl8 štěpeného BamHI a KpnI (Yanisch-Perron a spol., 1985., 1985, ibid.) touto ligační směsí byly identifikovány rekombinované fágové klony, které měly insert, podle Messinga (1983, ibid.); dvouvláknové fágové DNA byly izolovány z těchto klonů a zkoumány pomocí restrikční analýzy. Takto se získal fág M13biol8 s požadovaným 4,4 kb-fragmentem (Obr. 2).
pg dvouvláknové DNA fágu M13biol8 bylo linearizováno pomocí restrikce sNcol. zředěno 160 pl Bal31-pufrem, a hned po tom byl přidán Bal31 pro odstranění bioA-promotoru. Po 20, 40, 60, 80, 100 a 120 sek. inkubace při teplotě místnosti byly odebrány alikvoty po 25 pl a přidáním 2 pl 0,5 M EGTA, pH 7,5 a extrakcí fenolem byla Bal31-reakce zastavena. Vždy 3 alikvoty byly spojeny a štěpeny s Xbal. aby byly odstraněny geny bioB a bioF. Hned potom byla DNA zpracována s Klenow-polymerasou jak shora uvedeno, aby přečnívající 5'-konce byly doplněny na hladké konce. Takto opracovaná DNA byla religována a E. coli JM109 byl transformován s ligovanou DNA. Z 24 fágových klonů byl izolována jednovláknová DNA (Messing, 1983, ibid.) a DNA-sekvence na 5'-konci genu bioA byla analyzována podle Sangera a spol. (1977, ibid.). Takto byl získán fágový klon M13biol8/13, ve kterém je promotor divokého typu před bioA-genem deletován a který má současně Sall-místo štěpení 26 bp proti směru bioA-genu (Obr. 2).
1.4.4. Vytvoření MI3bioDA
Pro uspořádání genů bioD a bioA v jedné transkripční jednotce bylo 5 pg plazmidu pBO6 (Obr. 2) štěpeno s Sphl a Sáli. Vzniklý 0,97 kb dlouhý DNA-fragment, který má gen bioD a 72 bp DNA ve směru bioD-genu až k Sall-konci. byl izolován. 2 pg M13biol8/13 byly také štěpeny s Sphl a Sáli. DNA-fragmenty byly ligovány T4-DNA-ligasou a E. coli JMI09 byl transformován. Ze 24 rekombinovaných klonů byla izolována dvouvláknová fágová DNA a byla charakterizována restrikční analýzou. Takto byl získán klon M13bioDA, ve kterém jsou geny bioD a bioA od sebe vzdáleny 98 bp (Obr. 2).
1.4.2. Vytvoření pBO30 pg DNA z M13bioDA bylo štěpeno s Ecol pro vytvoření transkripční jednotky s tacpromotorem před bio-geny. pro vyplnění převislých EcoRI-konců bylo zpracováno jako shora s Klenow-polymerasou a pak štěpeno s Snol. Vzniklý 2,6 kb dlouhý DNA-fragment s geny bioD, bioA a ORFI byl izolován. 5 pg plazmidu pBO28 (Obr. 2) bylo štěpeno se Sáli, zpracováno s Mung Beán nukleasou pro odštěpení převislých Sall-konců a pak také štěpeno se
-11CZ 285533 B6
Snol. Byl izolován 6,7 kb dlouhý DNA-fragment s vektor-DNA, tac-promotorem a geny bioBFC.
Izolované DNA-fragmenty byly ligovány s T4-DNA-ligasou a biotin-auxotrofní kmen E, coli SA291 (Cleary a Campbell, J. Bacteriol. 112:830-839; 1972) byl touto ligační směsí transformován. Rozprostřením na NA-destičky s 20 pg/ml Cm a 8 pg/ml avidinu byly získány selekcí klony s kompletním biotin-operonem v plazmidu. Plazmidy z těchto klonů byly přezkoumány pomocí restrikční analýzy. Takto byl získán plazmid pBO30, který obsahuje geny bioB, bioF, bioC, bioD a bioA a gen ORFI spolu s tac-promotorem v jedné transkripční jednotce (Obr. 2).
1.5 Vytvoření plazmidů se zlepšenou expresí bio-genů
1.5.1. Vytvoření pBO30A-9 a pBO30A-15
V minibuňkách zE. coli DS410 (Dougan a Sheratt, Mol. Gen. Genet. 151:151—160; 1977) s plazmidem pBO30 byla podstatně slaběji exprimována DAPA-aminotransferasa kódovaná bioA-genem než jiné enzymy pro synthesu biotinu. V jednom pokusu pro zlepšení exprese bioA-genu byl zkrácen odstup mezi bioD-genem a bioA-genem pomocí exonukleasy Bal31, aby se odstranily případné rušivé sekvence jako struktury „stem-loop“. K tomu bylo štěpeno 25 pg pBO30 se Sáli a pak zpracováno jako shora s exonukleasou Bal31 a s Klenow-polymerasou. Sall-místo štěpení bylo regenerováno ligací se syntetickým oligonukleotidem o sekvenci 5'CGTCGACG-3', sall-linkerem. DNA pak byla štěpena Sáli a Snol a na 3-konci zkrácené bioDfragmenty o délce asi 640 bp byly izolovány. Tyto fragmenty byly ligovány s 8,25 kb velkým fragmentem z pBO30, který mohl být izolován po štěpení tohoto plazmidu se Sáli a Snol a který obsahuje nezměněný bioA-gen.
Biotin-auxotrofní kmen E. coli SA291 byl shora uvedenou ligační směsí transformován, aby se získaly selekcí na Na-destičkách se 60 pg/ml Cm a 5 pg avidinu klony s intaktním bioD-genem. Získalo se 26 takových klonů, které byly zkoumány restrikční analýzou. 8 těchto klonů se zřejmým zkrácením oblasti proti směru Sall-místa bylo přesněji charakterizováno DNAsekvenční analýzou. V pěti těchto klonech bylo jak požadováno asi 20 až 45 bp DNA deletováno mezi bioD-genem a bioA-genem. V E. coli-minibuňkách ovlivňovaly opravdu tyto klony zvýšenou expresi bioA-genu o faktor 2 vůči pBO30. Příklad pro plazmid s takto zlepšenou expresí je plazmid pBO30A-9 získaný tímto způsobem (Obr. 3).
Překvapivě byly izolovány tři další plazmidy, ve kterých bylo 70 až 90 bp DNA deletováno mezi bioD-genem a bioA-genem. Delece dosahovaly tedy až do bioD-struktumího genu. Z toho vyplynulo (i) pokaždé rozdílný COOH-konec DTB-synthetasy bez velké změny enzymové aktivity a (ii) překrytí změněných bioD-genů s bioA-čtecím rastrem. Takto se například získal plazmid pBO30A-15 s bioD-gen-mutantem bioD15 (Obr. 3, 5 a 6). V E. coli-minibuňkách s pBO30A-15 je bioA-exprese zvýšena o faktor 4 ve srovnání s pBO30.
DNA-sekvence bioDA-oblasti a z toho odvozená sekvence aminokyselin plazmidů pBO30, pBO30A-9 a pBO30A-15 jsou uvedeny na Obr. 3 (Seq ID No 9-16).
1.5.2. Vytvoření plazmidů se zlepšeným vazebným místem ribosomů před bioB-genem
Pro zlepšení translace bioB-genu. jehož exprese v pBO30 je zřetelně slabší než například bioDgenu, byla proti směru bioB-genu v pBO30 modifikována sekvence, která obsahuje tacpromotor a vazebné místo ribosomů, která je obsažena v klonovaných tac-promotorfragmentech. Proto byly před gen bioB vloženy syntetické, tak zvané smíšené neboli „mixed“ oligonukleotidy s proměnlivými sekvencemi. Pro jednoduchý výběr vhodných vazebných míst
-12CZ 285533 B6 ribosomů byl použit testovací plazmid stranslační bioB::lacZ genovou fúzí, pbioB::lacZ-2. pbioB::lacZ-2 je ve vektorové části, v tac-promotoru s vazebným místem ribosomů a v 5-konci genu bioB identický s plazmidem pBO22 (Obr. 2). Na Nrul-místě štěpení za nukleotidem 326 bioB-struktumího genu byly však deletovány 3'-konec bioB-genu a zbylé bio-genv a lacZ-gen zE. coli (Casadaban a spol., Methods Enzymol. 100:293-3082; 1983) byl tak zabudován, že bioB a lacZ byly fúzovány ve správném čtecím rastru pro expresi bioB::lacZ fúzovány ve správném čtecím rastru pro expresi bioB::lacZ fuzového proteinu, a že Nrul-místo štěpení bylo regenerováno.
Do plazmidu pbioB::lacZ-2 byl ve více krocích vložen oligonukleotid 985E se sekvencí 5CATGGAATCCTCCACTGATCAGTAC-3' před bioB-gen (Obr. 4). K tomu byl pbioB::lacZ-2 nejprve štěpen s BamHI a pak převislé BamHI-konce doplněny jak popsáno sKlenowpolymerasou. Při těchto krocích byl zřetelně nespecificky deletován guaninový zbytek (G), což způsobilo ztrátu jednoho BamHI-místa štěpení v pozdějších plazmidech. Po vložení Kpnllinkeru byla E. coli XLl-Blue (Bullock a spol., Biotechniques 5:376-379; 1987) transformována ligační směsí a byl izolován plazmid pbioB::lacZ/KpnI. Tento plazmid byl částečně štěpen sNeol a pak s KpnI doštěpen. Po ligaci s oligonukleotidem 985E bylo druhé DNA-vlákno doplněno s Klenow-polymerasou. Po transformaci E. coliXLl-Blue a selekci na NA-destičkách s 20 pg/ml Cm, 30 pg/ml X-Gal a 0,5 mM IPTG (isopropylthiogalaktosid) mohl být izolován plazmid pbioB::lacZ/985E (Obr. 4). Plazmid pbioB::lacZ/985E byl dále měněn tím, že vazebné místo ribosomů bylo vykrojeno restrikcí s KpnI a Spěl a nahrazeno třemi různými směsnými oligonukleotidy, SD17, SD19 a SD21 (Obr. 4). Po ligaci s těmito oligonukleotidy byla mezera ve druhém DNA-vláknu zavřena inkubací s Klenow-polymerasou. Bakteriální buňky E. coli XLlBlue byly touto DNA transformovány a jak uvedeno výše rozmístěny na NA-destičkách s 20 pg/ml Cm, 30 pg/ml X-Gal a 0,5 mM IPTG. Bylo vybráno 20 klonů s dobrou expresí bioB::lacZ-fůzového proteinu, které na tomto médiu tvořily tmavě modré kolonie, a byla měřena aktivita β-galaktosidasy těchto klonů pomocí Enzym-Assay podle Millera (Experiments in Molecular Genetics, Clod Spring Harbor Laboratory, Cold Spring Harbor, N. Y., str. 352-355; 1972). Proto byly nejdříve kmeny E. coli kultivovány s bio::lacZ-plazmidy v kapalné kultuře až k optické hustotě při 600 nm (ODĎoo) ca 0,5.
Nejvyšší aktivitu β-galaktosidasy měly plazmidy pbioB::lacZ/985E, pbioB::lacZ/16 a pbioB::lacZ/9 (Obr. 4), u nichž byla aktivita β-galaktosidasy zvýšena o faktor 2,1, 3,4 popř. 5,9 ve srovnání s pbioB::lacZ-2. DNA-sekvence optimalizovaných vazebných míst ribosomů pro bioB-gen v těchto plazmidech byla určena podle Sanger a spol. (1977, ibid.).
Po 5 pg plazmidů pbioB::lacZ/985E. pbioB::lacZ/16 nebo pbioB::lacZ/9 bylo štěpeno s Clal a Nrul a byl izolován ca. 550 bp dlouhý DNA-fragment s tac-promotorem. právě s tímto vazebným místem ribosomů a 5'-koncem bioB-genu. aby se zabudovala optimalizovaná vazebná místa ribosomů do jedné transkripční jednotky s bio-genv. Současně bylo štěpeno 5 pg plazmidu ρΒΘ30Δ A (Obr. 5) s Clal a Nrul a 7,7 kb dlouhý DNA-fragment byl izolován. V ρΒΟ30Δ A, který se odvozuje od pBO30, je deletován SalI/BamHI-fragment s větší částí bioA-genu a rušivým Nrul-místem štěpení (Obr. 5). Oba fragmenty byly ligovány a byly izolovány klony s rekombinovanými plazmidy. Takto byly získány plazmidy ρΒΟ30ΔΑ/9, ρΒΟ30ΔΑ/16 a ρΒΟ30ΔΑ/985. Obr. 5 ukazuje jedno takové vytvořené na příkladu ρΒΟ30ΔΑ/9 s vazebným místem ribosomů z pbioB::lacZ/9.
Po 2 pg plazmidů ρΒΟ30ΔΑ/9, ρΒΟ30ΔΑ/16 a pBO30AA/985E byly štěpeny s Snol a Knpl, přičemž Knpl bylo použito v menším množství, aby jen částečně štěpil. Pak byly izolovány pokaždé 6,6 kb dlouhé DNA-fragmenty, které obsahovaly vektor-DNA, tac-promotor. bioB-gen se zlepšeným vazebným místem ribosomů a geny bioFC. Plazmid pBO30A-15 (4 pg) byl rovněž štěpen s Snol a Ncol a byl izolován 2,8-kb fragment s geny bioDA-ORFT. Izolované fragmenty byly ligovány a E. coli RR28 byla transformována ligační směsí. Rekombinované plazmidy
-13ČŽ 285533 B6 s kompletním biotin-operonem byly identifikovány restrikční analýzou. Takto byly získány plazmidy pBO30A-15/9, pBO30A—15/16 a pBO30A-15/985E. Tyto všechny obsahují optimalizovanou bioDA-oblast zpBO30A-15 s odpovídajícími optimalizovanými vazebnými místy ribosomů zplazmidů pbioB::lacZ/9. pbioB::lacZ/16 popř. pbioB::lacZ/985E. Genetické kontrolní elementy těchto plazmidů, jmenovitě kombinace tac-promotoru a optimalizovaného vazebného místa ribozomů, které jsou v přímém spojení s bioB-genem a jehož efícienční expresi ovlivňují, vykazují následující sekvence:
pBO30A-15/985E (seq ID No: 17)
5'-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC-3' pBO30A-15/16 (Seq ID No: 18)
5'-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC-3' pBO30A-15/9 (Seq ID No: 19)
5-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC-3'.
Obr. 5 znázorňuje vytvoření plazmidů, které obsahují geny bioB, bioF, bioC. bioD a bioA spolu s optimalizovaným vazebným místem ribosomů, na příkladě vytvoření pBO30A-15/9.
Celková transkripční jednotka bio-genů vpBO30A-15/9 byla sekvenována. Sekvence a z toho odvozené genové produkty jsou znázorněny na Obr. 6 (Seq ID No. 1 - 8).
1.6 Vytvořené pBO30A-15/9AorfI pg plazmidů ρΒΟ30ΔΑ/9 byly jako shora štěpeny s Snol a Knpl a 6,6 kb dlouhý DNAfragment byl izolován. 4 pg plazmidů pBO30A-15 byly štěpeny s Sspl. Ligací vzniklých lineárních DNA s KpnI-linkerem sekvence 5'-CGGTACCG-3' bylo vloženo nové Kpnl-místo ve směru bioA-genu. Po štěpení s Snol byl izolován 2,1 kb-fragment s geny bioDA. Izolované DNA-fragmenty byly ligovány a E. coli RR28 byla transformována ligační směsí. Rekombinované plazmidy s geny bioBFCDA byly identifikovány restrikční analýzou. Takto byly získány pBO30A-15/9 Δ orfl s delecí ORFI-genu (Obr. 5).
1.7 Vytvoření plazmidů pBO47 pg plazmidů pBO30A-15/9 bylo štěpeno restrikčními enzymy Xbal a EcoRI. Vzniklý 5,8 kb velký restrikční fragment s tac-promotorem a biotin-operonem byl izolován a hned potom ligován s „broad-host-range“ plazmidem pRK290X (Alvarez-Morales a spol., Nucl. Acid. Res. 14, 4207—4227, 1986; modifikovaný delecí Xhol restrikčního místa a vložením Xbal-místa na stejnou pozici), který byl rovněž štěpen s Xbal a EcoRI. E. coli S17-1 (Simon a spol., Biotechnology 1:784-791; 1983) byla transformována ligační směsí. Rekombinované plazmidy byly identifikovány restrikční analýzou; takto byl získán plazmid pBO47, který obsahuje biotinoperon integrovaný v pRK290X.
Konjugací se kmenem E, coli S17-l/pBO47 byl plazmid pBO47 transferován do bakteriálních kmenů Rhizobium/Agrobacterium sp. HK4, Pseudomonas mondocina, Pseudomonas aeruginosa PA01 (Holloway, J. Gen. Microbiol. 13:572-581; 1955) a Acinetobacter calcoaceticus DSM 588.
-14CZ 285533 B6
1.8 Vytvoření ρΒΟ74ΔΒ
Vytvoření plazmidu ρΒΟ74ΔΒ s delecí bioB-genu se uskutečnilo tím, že se vyšlo z plazmidu pBO74-13 (Obr. 7). Plazmid pBO74-13 se skládá ze stejných DNA-stavebních kamenů jako pBO30 (Obr. 2). Pořadí bio-genů uvnitř plazmidu pBO74-13 je však rozdílné.
pg plazmidu pBO74-13 bylo štěpeno s Smál. Po extrakci s fenolem/chloroformem byla plazmid-DNA štěpena s Sphl a byl izolován 6 kb-fragment, který obsahoval vektor-DNA, tacpromotor, geny bioA-ORFI a bioCD. 18 pg plazmidu pBO3 (Obr. 2) bylo štěpeno s SspI a Sphl a byl izolován 1,66 kb-fragment s bioF-genem a částí bioC-genu. Izolované fragmenty byly spolu ligovány a E. coli RR28 byla transformována ligační směsí. Rekombinované plazmidy byly analyzovány restrikční analýzou. Takto byl získán plazmid ρΒΟ74ΔΒ, který se liší od plazmidu pBO74-13 delecí bioB-genu (Obr. 7).
Příklad 2
Fermentace biotinu in vivo
2.1 Fermentace biotinu in vivo s produkčními kmeny Escherichia coli
Buňky kmenu E. coli XLl-Blue spBO30A-15/9 (DSM 7246) byly kultivovány 201 MBRfermentorem v glycerin-minimálním médiu (3% glycerin při zahájení kultury) ve fed batch postupu více než 30 hod. při 37 °C až k optické hustotě 20 při 650 nm (OD650). Přítomnost plazmidu pBO30A-15/9 byla zajištěna přidáním chloramfenikolu (50 pg/ml) vpředkultuře (3 1 glycerin-minimální médium) a batch-fázi fermentace. Použití jiných zdrojů uhlíku jako glukóza nebo sukcinát (0,4% při začátku batch-fermentační fáze) bylo rovněž proveditelné. Metabolická aktivita buněk byla sledována na základě jejich specifické rychlosti příjmu kyslíku. Produkce biotinu během fermentace byla sledována titrací hodnot biotinu média fermentoru pomocí bioassay s Lactobacillus plantarum (E. DeMoll a W. Shive, Anal. Chem. 158:55-58. 1986).
Zdroj uhlíku, v tomto případě 50%-ní roztok glycerinu v deionizované vodě, byl přiváděn s variabilní přítokovou rychlostí přizpůsobenou vývoji biomasy. Pro glycerin byla jako základ zvolena empirická hodnota 2 g glycerinu na 1 litr kultury pro přírůstek OD z OD 1 na OD 2 pro „feed„-rychlost.
Hodnota pH fermentoru byla automaticky udržována na 7 připumpováním 40%-ní H3PO4 popř. 25%-ního NH3. Provzdušnění bylo regulováno vháněním vzduchu 10 až 25 NL/min a rotací míchadla 300 až 700 rpm (otáček za min.) podle vývoje biomasy. Usilovalo se o sycení kyslíkem mezi 15 a 40 %. Obsah kyslíku a CO2 odpadního vzduchu byl měřen paramagneticky popř. pomocí infračerveného světla. Teplota fermentoru byla udržována na 37 °C. Při teplotě 37 °C rostla kultura s dobou zdvojnásobení 2,5 hod. až k ODeso 20 a byla pak stacionární.
Během fermentace se nahromadilo 35 mg/1 D(+)-biotinu během 25 hod. V kmenech E.coli je možné dosáhnout syntézy biotinu, která by stála za zmínku, jen v rostoucích kulturách.
Jako další vhodné produkční kmeny se ukázaly E. coli ED8767 (N. E. Murray a spol., Mol. Gen. Genet. 150:53-61; 1975) s pBO30A-15/9 (DSM 8554) nebo E. coli BM4062 (D. F. Barker a A. M. Campbell, J. Bacteriol. 143:789-800; 1980) s pBO30A-15/9 (DSM 7247).
Obdobným způsobem byly testovány plazmidy pBO3, pBO30 a pBO30A-15/9AORFI a stanovena produktivita biotinu. Následující tabulka I ukazuje silné zlepšení produktivity biotinu kmenů s plazmidy pBO30, pBO30A-15/9 a pBO30A-15/9AORFI, které obsahují bio-geny
-15CZ 285533 B6 v jedné transkripční jednotce, ve srovnání s E. coli S17-1 (divoký typ, biotin-geny na chromosomu a E. coli S17-l/pBO3 (biotin-geny na plazmidu, přesto divergentní transkripce jako v operonu divokého typu). Pokusy dále ukázaly, že nepřítomnost ORFI-genu nemá žádný vliv na produktivitu biotinu.
Tabulka I
Kmen
E. coli S17-1
E. coli S17-l/pBO3
E. coli BM 4062/pB030
E. coli XL1 Blue/pBO30A-15/9
E. coli BM 4062/pBO30A-15/9AORFI
Produktivita biotinu pMol/min x 109 buněk 0,01 - 0,02 0,02 - 0,04 3,0-5,0 10,0-20,0 10,0-20,0
Glycerin-minimální-batch-médiu (v deionizované H2O)
glycerin | 30 | g/i |
MgCl2 x 6H2O | 0,8 | g/1 |
CaCl2 | 0,16 g/1 | |
(NH^SCU | 2,0 | g/1 |
stopové prvky SLFa) | 1,0 | ml/1 |
Fe-EDTAb | 1,5 | ml/1 |
PPG-2000 | 0,1 | g/i |
KH2PO4 | 1 | g/1 |
k2hpo4 | 1 | g/i |
Na2HPO4 | 1 | g/1 |
thiamin | 1 | g/1 |
chloramfenikol | 50 | mg/1 |
IPTG | 0,5 | mM |
a) Základní roztok stopových prvků SLF (v deionizované H2)
KOH | 15 | g/i |
EDTA-Na2 x 2H2O | 100 | g/1 |
ZnSO4 x 7H2O | 9 | g/1 |
MnCl2 x 4H2O | 4 | g/1 |
H3BO3 | 2,7 | g/1 |
CoCl2 x 6H2O | 1,8 | g/1 |
CuC12 x 2H2O | 1,5 | g/1 |
NíC12 x 6H2O | 0,18 g/1 | |
Na2MoO4 x 2H2 | 0,2 | g/1 |
b) Základní roztok Fe-EDTA (v deionizované H2O)
EDTANa2x2H2O 50 g/1
FeSO4 x 7H2O 20 g/1
KOH 10 g/1
Antibiotika-suplementy: (konečné koncentrace)
100 pg/ml ampicilinu (sodná sůl, Fluka) a 50 pg/ml chloramfenikolu (Fluka).
-16CZ 285533 B6
2.2 Fermentace biotinu in vivo s produkčním kmenem
Agrobacterium/Rhizobium HK4/pBO47
Buňky biotin-auxotrofního kmenu Agrobacterium/Rhizobium sp HK4 s biton-produkčním plazmidem pBO47 (DSM 8555) byly kultivovány v 2 1 MBR-fermentoru v minimálním médiu obsahujícím kyselinu L-glutaminovou a betain za fed-batch postupu při 30 °C až k hodnotě 70 při optické hustotě ODéso. HK4/pBO47 se vyznačuje zřetelně stabilní rychlostí syntézy biotinu i při extremně pomalém růstu („maintenance growth“). Proto se v tomto pokusu po napěstování biomasy připojila dlouhá maintenance fáze (500 hod.) při silně redukovaném uhlíkovém „feed“.
Po exponenciální růstové fázi, po dosažení hodnoty 12 při OD65o bylo přiživováno pomalými dávkami (1,5 ml/hod.) glukózou-betainem- „feed“ (360 g/1 glukózy plus 103 g/1 betainu rozpuštěné v deionizované vodě), aby byl umožněn dlouho zadržený pomalý růst, popřípadě „maintenance growth“. V časovém bodě 150 hod. bylo přiživováno Fe2+-glukonátem až ke konečné koncentraci 100 mg/1 ve fermentoru. V čase 200, 360 a 550 hod. bylo přiživováno 10 ml roztoku soli a 1,36 ml standardního vitaminového roztoku.
pH fermentoru bylo automaticky regulováno na hodnotu 7 připumpováním 85%-ní kyseliny fosforečné, popř. 3M louhu draselného. Provzdušnění bylo regulováno vháněním 1-3 NL/min. vzduchu a rotací míchadla o 300 až 1000 rpm (otáčkách za min.) podle aktuálního vývoje biomasy, takže bylo zajištěno rozpětí kyslíku 1 až 4 mg/1. Teplota fermentoru byla udržována na hodnotě 30 °C. Kultura rostla v exponenciální růstové fázi s dobou zdvojnásobení 5,6 hod., ve fázi se silně limitovaným „feed“ s dobou zdvojnásobení 300 hod. a pak růst přešel na „maintenance growth“.
Pro zahájení fermentace byla po 200 hod. a po 415 hod. přidána ke kultuře kyselina diaminoperalgonová (DAPA; dvakrát na konečnou koncentraci 200 pg/ml nakonec na konečnou koncentraci 100 pg/ml). HK4 sám je biotin auxotrofní. Kmen byl schopný vyrobit z předchůdce biotinu DAPA dethiobiotin a ten nakonec přeměnit na D(+)-biotin s vysokým výtěžkem. Bylo nahromaděno 110 mg/1 D(+)-biotinu. Stojí za zmínku ta skutečnost, že byla tato syntéza uskutečněna s převažujícím podílem nerostoucích buněk.
Glutamin/betain-minimální médium
V 1,25 litrech deionizované vody bylo rozpuštěno, popř. k tomu přidáno:
31,25g monosodné soli kyseliny L-glutaminové x H2O
12,5 g betainu
0,2 g CaCl2
1,0 g MgCl2x6H2O l,25g K2SO4
1,25 ml stopových prvků SLF (příklad 2.1)
1,87 ml Fe-EDTA (příklad 2.1)
0,25 ml tetracyklinu (10 mg/ml v 70% ethanolu)
Roztok solí
0,03 gCaCl2
0,16 gMgCl2 x 6 H2O
0,2 g K2SO4
200 pg SLF (příklad 2.1)
300 pg HC1 konc.
(rozpuštěno v 10 ml deionizované H2O)
-17CZ 285533 B6
Standardní vitaminový roztok (v deionizované H2O) mg/1 pyridoxalhydrochloridu mg/1 riboflavinu mg/1 amidu kyseliny nikotinové mg/1 thiaminhydrochloridu mg/1 biotinu mg/1 kyseliny pantothenové mg/1 kyseliny 4-aminobenzoové mg/1 kyseliny listové mg/1 vitamin B12
Příklad 3
Výroba biotinu z dethiobiotinu (měření reakce biotinsynthasy in vitro)
3.1 Výhody buněčných extraktů E. coli
Byly připraveny buněčný extrakt zE. coli XLl-Blue (DSM 7246) s plazmidem pBO30A-15/9 (extrakt Z) a buněčný extrakt z E. coli XLl-Blue s plazmidem ρΒΟ74ΔΒ (DSM 7245; extrakt W). K tomu byly buňky mikroorganizmů pěstovány při 37 °C v objemu 800 ml s OD600 hodnoty 2 v médiu s 20 g/1 Nutrient Broth, 5 g/1 extraktu droždí a 20 mg/1 Cm. Buňky byly sklízeny filtrací a pak odstředěny při 5000 x g 15 min.
Pro přípravu bezbuněčného extraktu byly buňky promyty 100 mM HEPES-pufrem (pH 7,5) a pak resuspendovány ve stejném pufru, aby se nastavila OD60o přibližně Γ000 a pak zpracovány s DNA-sou. Pak byly buňky rozbity kontinuálním buněčným homogenizátorem při 100'000 Pa. Homogenát byl 30 min. odstředěn při 20'000 x g a vzniklý supematant byl uchován při -80 °C. Extrakt Z mohl být pak buď přímo použit k měření (testování) reakce biotinsynthasy nebo až po čištění gelovou filtrací na sloupci Sephadexu G25M PD-10 (Pharmacia, objem sloupce: 9,1 ml). Extrakt W byl buď přímo použit k testování reakce biotinsynthasy nebo frakcionován podle příkladu 3.3.
3.2. Test reakce biotinsynthasy in vitro (standardní test)
Při testu in vitro byla testována reakce enzymu biotinsynthasy buď s 14C-značeným dethiobiotinem (0,1 pCi; 1,95 nmol) za vzniku 14C-značeného biotinu nebo reakce enzymu s neznačeným dethiobiotinem s 34S-značeným cysteinem (20 pCi; 1,32 nmol) za vzniku 35Sznačeného biotinu. Při tomto postupu vzniklý 14C-biotin nebo 35S-biotin byl snadno stanovitelný po extrakci pomocí kvantitativní HPLC (vysokotlaká kapalinová chromatografie) na „on-line“ radiochemickém detektoru nebo semikvantitativně pomocí tenkovrstevné chromatografie a s následným přiložením rentgenového filmu pomocí autoradiografie.
Typický standardní test se skládal z bezbuněčného extraktu Z nebo W, ze značeného nebo neznačeného dethiobiotinu podle reakce, nebo z toho vyčištěných proteinových frakcí (příklady 3.7 až 3.9) jednotlivě nebo v kombinaci mezi sebou a/nebo z obvyklých kofaktorů jako SAM 92 μΜ), Fe2+-glukonát (200 μΜ), NADPH (100 μΜ), TPP (100 μΜ), DTT (1 mM) a/nebo z kombinace aminokyselin. Proteinové frakce k testování, kofaktory nebo aminokyseliny byly k tomu přidány v konečném objemu 250 μΐ. Inkubace se uskutečnila mezi 4 a 50 °C. Po jednohodinové inkubaci při 37 °C byla reakce zastavena přidáním 12% hmotn. kyseliny trichloroctové (TCA) ve vodě. Vysrážený protein byl odstředěn a supematant byl nanesen na
-18CZ 285533 B6 extrakční sloupec Ci8“solid-phase“ (MACHEREY-NAGEL, 100 mg), který byl ekvilibrován methanolem (1 ml), vodou (1 ml) a kyselinou octovou (1 % obj.) ve vodě. Hned potom byl tento sloupec promyt 1 ml 1%-ní kyseliny octové a 1 ml vody, aby pak byl biotin a dethibiotin eluován 0,5 ml methanolem. Získané vzorky byly sušeny ve vakuu a pak resuspendovány v 30 μΐ HPLC-pufru A (25 mM KH2PO4, 5 mM tetrabutylamoniumchlorid, pH 3,4), aby pak bylo injikováno 25 μΐ do HPLC pro kvantitativní analýzu. Podmínky HPLC byly následující: sloupec Shandon-Hypersil-BDS-Cig (velikost částic: 5 pm, velikost sloupce 10 mm x 2,0 mm), průtoková rychlost 0,35 ml/min., teplota 40 °C, eluční prostředek: HPLC-pufr As 10% obj. acetonitrilu.
Po smíchání eluátového toku se scintilačním měřicím roztokem (Zinsser Quickszint Flow 303; průtoková rychlost: 1,25 ml/min.) byl detekován a kvantifikován buď nezreagovaný 14Cdethiobiotin a vytvořený 14C-biotin nebo vytvořený 35S-biotin („on-line“ detektor radioaktivity: Berthold).
Alternativně byly vzorky semikvantitativně analyzovány pomocí tenkovrstevné chromatografie a autoradiografie. Vzorky byly k tomuto účelu resuspendovány v 20 μΐ směsi složené z 10% kyseliny octové, 65 % methanolu a 25 % vody a 2,5 μΐ bylo naneseno na silikagel—„high performance“-TLC-destičku (E. Měrek, Darmstadt). Destička byla vyvíjena pohybujícím se prostředkem složeným z chloroformu (17 ml), methanolu (3 ml) a kyseliny mravenčí (0,2 ml). Po chromatografii byla destička sušena a přes noc byl přiložen rentgenový film.
3.3 Reakce biotinsynthasy v přítomnosti aminokyselin
Když byl odsolený bezbuněčný extrakt Z inkubován s dethiobiotinem podle příkladu 3.2 a s kofaktory SAM, TPP, NADPH a Fe2+-glukonát, nebyla pozorována žádná přeměna dethiobiotinu na biotin. Když se k tomuto bezbuněčnému extraktu přidal cystein (332 pm) a asparagin (15 mM) nebo cystein a aspartát (15 mM) nebo cystein a glutamin (15 mM) nebo cystein a serin (15 mM) s kofaktory podle příkladu 3.4, bylo možné prokázat produkci biotinu.
Tabulka II
Složení testu extrakt Z1 extrakt Z1 + kofaktory2 extrakt Z1 + aminokyseliny3 extrakt Z1 + kofaktory2 + aminokyseliny3 | produkovaný biotin pmol 0 0 0 780 |
1) odsolený
2) kofaktory: SAM, Fe2+, TPP, NADPH
3) Cys + Asn nebo Cys + Asp nebo Cys + Gin nebo Cys + Ser
3.4 Reakce biotinsynthasy v přítomnosti jednoho nebo více obvyklých kofaktorů
Když byl shodný odsolený buněčný extrakt jako v příkladě 3.3 inkubován s L-cysteinem, asparaginem, dethiobiotinem, SAM, TPP, NADPH a Fe2+-glukonátem, byl dethiobiotin přeměněn na biotin. Aby byl zjištěn vliv těchto kofaktorů na reakci biotinsynthasy, byly tyto kofaktory použity jednotlivě a v kombinaci. Jen kombinace všech těchto kofaktorů prokázala aktivitu biotinsynthasy. Když chyběl jeden kofaktor, nebylo možné měřit aktivitu biotinsynthasy, tzn. všechny kofaktory jsou nutné pro aktivitu biotinsynthasy (příklad 3.3, tabulka Π)
-19CŽ 285533 B6
3.5 Čištění biotinsynthasy
Na důkaz toho, že dodatečně k biotinsynthase je za přeměnu dethiobiotinu na biotin zodpovědno více proteinů, byl nejprve bezbuněčný extrakt Z podroben frakcionaci síranem amonným. Ta se uskutečnila při nasycení 25 % síranu amonného za míchání, 30 min. při 4 °C. Pak se 30 min. odstřeďovalo při 10'000 xg a vzniklá sraženina byla odstraněna. Vzniklý supematant byl nasycen 70 % síranu amonného, přičemž se biotinsynthasa vysrážela. Precipitát byl resuspendován v malém množství 100 mM HEPES-pufru (pH 7,5), odsolen (Sephadex G25M PD-10) a pak čištěn pomocí aniontoměničové chromatografie (Q-Sepharosa Fast-Flow, Pharmacia) s kontinuálním gradientem 100 mM - 1 mM HEPES-pufru (pH 7,5). Frakce s aktivitou biotinsynthasy byly zahuštěny (Amicon ultrafiltrační buňka, YM-10 Membrán), odsoleny jak již bylo popsáno a pak rechromatografovány na „Hi-Load“ sloupci pro aniontoměničovou chromatografii na Q-Sepharose (Pharmacia; 20 mM Tris-pufr (pH 7,5) obsahující 1 mM DTT a 0 až 1 M NaCl-gradient). Frakce s vysokou aktivitou biotinsynthasy byly spojeny, zahuštěny a odsoleny. V těchto frakcích už nebyla biotinsynthasa kontaminována jinými proteiny, které jsou nutné pro aktivitu biotinsynthasy.
Bylo nutné přidat k testované směsi (příklad 3.2) extrakt W, aby se změřila aktivita biotinsynthasy během kroků čištění. Z toho vyplývá, že jsou za přeměnu dethiobiotinu na biotin zodpovědné vedle biotinsynthasy ještě další proteiny.
3.6 Frakcionace proteinů z extraktu W
Extrakt byl vysrážen za sebou následujícím sycením síranem amonným při 45 % a 55 %. Po přidání síranu amonného byla směs míchána při 4 °C po dobu 30 min. a pak odstředěna 30 min. při 10'000xg. Sraženina získaná při 45% nasycení síranem amonným byla resuspendována ve 100 mM HEPES-pufru (pH 7,5). Pak byly odebrány alikvoty z 45%precipitátu, 55%-precipitátu a 55%-supematantu a odsoleny (sloupec Sephadexu G25M PD10). Jednotlivé frakce byly jak jednotlivě, tak také v kombinaci spolu testovány podle příkladu
3.2.
Byly získány dvě frakce, které jsou důležité pro biotinsynthasu. Tyto frakce byly:
- sraženina po 45% nasycení síranem amonným
- supematant po 55% nasycení síranem amonným
3.7 Čištění a identifikace flavodoxinu
Supematant, který vznikl po 55% nasycení síranem amonným z extraktu W (příklad 2.2) byl odsolen (sloupec Sephadexu G25M PD-10) a pak nanesen na sloupec pro anintoměničovou chromatografii (Q-Sepharosa Fast-Flow (Pharmacia)). Tento sloupec byl napřed ekvilibrován 20 mM Tris-pufrem (pH 7,5) obsahujícím 1 mM DTT. Nevázaný materiál byl odstraněn promytím tímto pufrem. Proteiny vázané na sloupec byly eluovány kontinuálním gradientem NaCl (0 až 1 M). Eluované proteinové frakce byly spojeny, zahuštěny (Amicon ultrafiltrační buňka, YM-10 Membrán), odsoleny (Sephadexu G25M PD-10) a pak čištěny na mono Qsloupci pro aniontoměničovou chromatografii ekvilibrovaném 20 mM Tris-pufrem (pH 7,0, obsahujícím 1 mM DTT). Pak byly vyčištěné frakce testovány pomocí SDS-PAGE.
Pro identifikaci frakcí s hledaným proteinem během kroků čištění byl proveden systém testování biotinsynthasy (příklad 3.2) s čištěnou biotinsynthasou, proteinem popř. proteiny ze sraženiny při srážení se 45% síranem amonným, s aminokyselinami (příklad 3.3) a s nízkomolekulámími kofaktory (příklad 3.4). Biotinsynthasová aktivita mohla být změřena jen v těch frakcích, které obsahovaly hledaný protein.
-20CZ 285533 B6
Pak byla určena sekvence aminokyselin tohoto proteinu jak dále uvedeno. Protein byl redukován 4 hod. s DTT v 6 M guanidin-HCl-pufru. Získané vzorky byly karboxymethylovány kyselinou jodoctovou a pak 48 hod. dialyzovány proti hydrouhličitanu amonnému. Po sušení vzorků byly tyto štěpeny prasečím trypsinem v 7 M pufru močoviny a peptidy děleny pomocí „ReversePhase“ HPCL. Byly identifikovány 2 peptidy s odpovídajícími DNA-sekvencemi k flavodoxin z E. coli. Těmito kroky čištění mohl být získán homogenní flavodoxin.
3.8 Čištění a identifikace ferredoxin (Flavodoxin)-NADP+-reduktasy
Extrakt W byl nanesen na sloupec pro anintoměničovou chromatografii (Q-Sepharosa Fast-Flow (Pharmacia)). Tento sloupec byl ekvilibrován 20 mM Tris-pufrem (pH 7,5) obsahujícím 1 mM DTT. Proteiny vázané na sloupec byly eluovány kontinuálním gradientem NaCl (0 až 1 M). Eluované proteinové frakce byly spojeny, zahuštěny podle příkladu 3.7, odsoleny a naneseny na sloupec pro mono Q-aniontoměničovou chromatografii. Proteiny vázané na tomto sloupci byly eluovány kontinuálním gradientem NaCl (0 až 0,4 M ve 20 mM Tris-pufru). Pak byly spojené eluované proteinové frakce (zahuštěné a odsolené jak již bylo popsáno) naneseny na chromatografický sloupec Superosy 12 pro preparační gelovou filtraci (Pharmacia; ekvilibrovaný 20 mM Tris-pufrem) a pak na sloupec Sephacrylu HR100 pro gelovou filtraci (Pharmacia; ekvilibrovaný 20 mM Tris-pufrem). Po eluci 20 mM Tris-pufrem mohl být získán další homogenní protein (testovaný pomocí SDS-PAGE). Frakce obsahující tento protein byly identifikovány analogicky k testovacímu systému podle příkladu 3.7. Aktivita biotinsynthasy byla změřena jen po přidání těchto frakcí.
Vyčištěný protein byl přímo sekvenován, aby se stanovila N-koncová sekvence aminokyselin tohoto proteinu. Protein měl N-koncovou sekvenci aminokyselin odpovídající ferredoxin(flavodoxin)-NADP+-reduktase. Těmito kroky čištění mohla být získána homogenní ferredoxin(flavodoxin)-NADP+-reduktasa.
3.9 Obohacení jednoho nebo více proteinů odpovědných za reakci biotinsynthasy
Čištěná biotinsynthasa (příklad 3.2) neměla s čištěným flavodoxinem plus ferredoxin(flavodoxin)-NADP+-reduktasou a s nutnými kofaktory jakož i s aminokyselinami žádnou biotinsynthasovou aktivitu. Aby se dosáhla tato aktivita, hledal se další protein nebo proteiny ve frakci 45% síranu amonného.
Tento protein nebo tyto proteiny se získaly z bezbuněčného extraktu W precipitací síranem amonným při 45% nasycení. Získaná proteinová sraženina byla resuspendována v 20 mM Trispufru, pH 7,5, obsahujícím 1 mM DTT a TPP (1 g/1) a pak odsolena na sloupci PD-10 (Pharmacia). Odsolený materiál byl pak nanesen na sloupec pro chromatografii na měniči aniontů (Q-Sepharosa HP HI-Load), který byl předtím ekvilibrován 20 mM Tris-pufrem, pH 7,5, obsahujícím 1 mM DTT a TPP (1 g/1). Proteinové frakce s požadovanou aktivitou byly eluovány kontinuálním gradientem NaCl (0 až 600 mM NaCl). Pak byly tyto proteinové frakce dále čištěny pomocí gelověfiltrační chromatografíe (sloupec Sephacrylu HR-100, Pharmacia). Takto získaná proteinová sraženina byla resuspendována ve 100 mM HEPES-pufru (pH 7,5) a pak odsolena popsaným způsobem. Z toho se získal proteinový roztok, který byl použit pro test in vitro podle příkladu 3.2.
3.10 Reakce biotinsynthasy v přítomnosti flavodoxinu, ferrodoxin (flavodoxin)-NADP+reduktasy, jednoho nebo více proteinů odpovědných za reakci biotinsynthasy, jedné nebo více aminokyselin a obvyklých kofaktorů
K bezbuněčnému extraktu Z byly přidány flavodoxin, ferredoxin (flavodoxin)-NADP+reduktasa a jeden nebo více proteinů odpovědných za reakci biotinsynthasy. Přidání proteinů, kofaktorů a aminokyselin ovlivnilo zvýšenou aktivitu biotinsynthasy (tabulka III).
Tabulka III
Složení testů Extrakt Z s kofaktory a aminokyselinami | produkovaný biotin pmol 390 |
Extrakt Z + kofaktory + aminokyseliny + flavodoxin + ferredoxin(flavodoxin)NADP+-reduktasa + jeden nebo více proteinů odpovědných za reakci biotinsynthasy | 1560 |
3.11 Reakce biotinsynthasy s čištěnou biotinsynthasou v přítomnosti kombinací flavodoxinu, ferredoxin(flavodoxin)-NADP+-reduktasy, jednoho nebo více proteinů odpovědných za reakci biotinsynthasy, jedné nebo více aminokyselin a obvyklých kofaktorů
Pro testování vlivu těchto složek na reakci biotinsynthasy s čištěnou biotinsynthasou, byly tyto použity jednotlivě nebo spolu v kombinaci. Kofaktory byly použity ve stejném množství jako v příkladě 3.4 a aminokyseliny v množství jako v příkladě 3.3. Když byly přítomné všechny tyto komponenty, byl dethiobiotin úplně přeměněn na biotin čištěnou biotinsynthasou. Když chyběla jedna z těchto komponent, nemohla být naměřena žádná aktivita. Proto jsou nutné všechny tyto komponenty pro přeměnu dethiobiotinu na biotin (tabulka IV).
Tabulka IV
Složení testů čištěna biotinsynthasa | produkovaný biotin pmol 0 |
čištěna biotinsynthasa + flavodoxin + ferredoxin(flavodoxin)NADP+-reduktasa +jeden nebo více proteinů odpovědných za reakci biotinsynthasy + kofaktory + aminokyseliny | 800 |
SEKVENČNÍ PROTOKOL (1) OBECNÉ INFORMACE:
(i) PŘIHLAŠOVATEL:
(A) JMÉNO: LONZAAG (B) ULICE: Muenchensteinerstrasse 38 (C) MÍSTO: Basel (E) ZEMĚ: Švýcarsko (F) PSČ: 4002 (ii) NÁZEV PŘIHLÁŠKY: Biotechnologický způsob výroby biotinu (iii) POČET SEKVENCÍ: 19 (iv) POČÍTAČOVĚ-ČITELNÁ FORMA:
(A) NOSIČ DAT: floppy disk
-22CZ 285533 B6 (B) POČÍTAČ: IBM PC kompatibilní (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, verze #1.25 (EPA) (vi) DŘÍVĚJŠÍ DATA PŘIHLÁŠKY:
(A) ČÍSLO PŘIHLÁŠKY: CH 2134/92 (B) DATUM PŘIHLÁŠKY: 02-OCT-1992 (vi) DŘÍVĚJŠÍ DATA PŘIHLÁŠKY:
(A) ČÍSLO PŘIHLÁŠKY: CH 2134/93 (B) DATUM PŘIHLÁŠKY: 15-JUL-1993 (2) INFORMACE K SEKVENCI ID Č.: 1:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 5872 párů bází (B) DRUH: nukleová kyselina (C) FORMA VLÁKNA: dvojitá (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: DNA (genomicky) (iii) HYPOTETICKY: NE (iii) NESMYSL (antisense): NE (vi) PRVOTNÍ PŮVOD:
(A) ORGANIZMUS: Escherichia coli (B) KMEN: DSM498 (vii) BEZPROSTŘEDNÍ PŮVOD:
(B) KLON: pBO30A-15/9 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 117..1157 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /kodon_start= 117 /produkt= „biotinsynthasa“ /evidence= EXPERIMENTÁLNĚ /gen= „bioB“ /číslo= 1 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 2295..3050 (D) JINÉ ÚDAJE: /kodon_start= 2295 /funkce= „zahrnutá v synthese pimeloyl-CoA“ /produkt= „protein“ /gen= „bioC“ /číslo= 3
-23CZ 285533 B6 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 3750..5039 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /kodon_start= 3750 /EC_číslo= 2.6.1.62 /produkt= „DAPA synthasa /evidence= EXPERIMENTÁLNĚ /gen= „bioA“ /číslo= 5 /standardníjméno= „S-Adenosyl-L-methionin:8-amino-7-oxononanoat aminotransf.“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 5098..5574 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /kodon_start= 5098 /funkce= „neznámá, zahrnutá v synthese biotinu“ /produkt= „protein“ /evidence= EXPERIMENTÁLNĚ /gen= „ORFI“ /číslo= 6 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: -10_signal (B) POLOHA: 45..49 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /evidence= EXPERIMENTÁLNĚ /standardní_jméno= „promotor ptač“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: -35_signal (B) POLOHA: 23..28 (D) JINÉ ÚDAJE: /standardní_jméno= „promotor ptač“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 105..119 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /evidence= EXPERIMENTÁLNĚ /standardní_jméno= „bioB RBS č. 9“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 2284..2297 (D) JINÉ ÚDAJE: /standardní_jméno= „bioC RBS“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 3742..3752 (D) JINÉ ÚDAJE: /standardní_jméno= „bioA RBS“ (ix) ZNAKY:
-24CZ 285533 B6 (A) JMÉNO/KLÍČ: RBS (B) POLOHA: 5088..5100 (D) JINÉ ÚDAJE: /standardní_jméno= „ORFI RBS“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: terminátor (B) POLOHA: 5583..5644 (D) JINÉ ÚDAJE: /standardní_jméno= „rho-nezávislý transkripční terminátor“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: smyčka (stem_loop) (B) POLOHA: 5583..5605 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: promotor (B) POLOHA: L.96 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /funkce= „promotor ptač“ /evidence= EXPERIMENTÁLNĚ (x) INFORMACE O ZVEŘEJNĚNÍ:
(H) ČÍSLO DOKUMENTU: WO 87/01391 B1 (I) DATUM PŘIHLÁŠENÍ: 26-AUG-1986 (J) DATUM ZVEŘEJNĚNÍ: 07-APR-1993 (xi) POPIS SEKVENCE: SEK ID Č.: 1:
AAGCITACIC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT 60
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGA1CGGTA CCTAAGGAGA CTAGTC 116
ATG | Ger | CAC | CGC | CCA | CGC | TGG | ACA | TTG | TCG | GAA | GTC | ACA | GAA | TTA | TTT | 164 |
Met | Ala | His | Arg | Pro | Arg | Trp | Thr | Leu | Ser | Gin | Val | Thr | Glu | Leu | Phe | |
1 | 5 | io | 15 | |||||||||||||
GAA | AAA | CCG | T1G | CTG | GAT | CTG | CTG | TTT | GAA | GCG | CAG | CAG | gtg | CAT | CGC | 212 |
Glu | lys | Pro | Leu | Leu | Asp | Leu | Leu | Phe | Glu | Ala | Gin | Gin | Val | His | Arg | |
20 | 25 | 30 | ||||||||||||||
CAG | CAr | TTC | GAT | CCT | CGT | CAG | GTG | CAG | GTC | AGC | AOG | TTG | CTG | TCG | ΛΤΤ | 260 |
Gin | His | Phe | Asp | Pro | Arg | Gin | Val | Gin | Val | Ser | Thr | Leu | Leu | Ser | Ile | |
35 | 40 | 45 | ||||||||||||||
AAG | ACC | GGA | GCT | TGT | CCG | GAA | GAT | TGC | AAA | TAC | TGC | CCG | CAA | AGC | TCG | 308 |
Lys | Thr | Gly | Ala | Cys | Pro | Glu | Asp | Cys | Lys | Tyr | Cys | Pro | Gin | Ser | Ser | |
50 | 55 | 60 | ||||||||||||||
GGC | TAC | AAA | ACC | GGG | CTG | GAA | GCC | GAG | CGG | TTG | ATG | GAA | GTT | GAA | CAG | 356 |
Arg | Tyr | lys | Thr | Gly | Leu | Glu | Ala | Glu | Arg | Leu | Met. | Glu | Val | Glu | Gin | |
65 | 70 | 75 | 80 | |||||||||||||
GTG | CTG | GAG | TCG | GCG | CGC | AAA | GCG | AAA | GCG | GCA | GGA | TCG | ACG | CGC | TTC | 404 |
Val | Lev | Glu | Ser | Ala | Arg | Lys | Ala | Lys | Ala | Ala | Gly | Ser | Thr | Arg | Phe |
90 95
-25CZ 285533 B6
TGT ATG GGC GCG GCG TGG AAG AAT CCC CAC GAA CGC GAT ATG CCG TAC452
Cys Met Gly Ala Ala Trp LyS Asn Pro His Glu Arg Asp Met Pro Tyr
100 105110
CTG GAA CAA ATG GTG CAG GGG GTA AAA GCG ATG GGG CTG GAG GCG TGT500
Leu G1u Gin Met Val G1n Gly Val Lys Ala Met Gly Leu Glu Ala Cys
115 120125
ATG ACG CTG GGC ACG Πβ AGT GAA TCT CAG GCG CAG CGC CTC GCG AAC548
Met Ihr Leu Gly Thr Leu Ser Glu Ser Gin Ale Gin Arg Leu Ala Asn
130 13S140
GCC GGG CTG GAT TAC TAC AAC CAC AAC CTG GAC ACC TCG CCG GAG TTT596
Ala Gly Leu Asp Tyr Tyr Asn His Asn Leu Asp Thr Ser Pro GluPhe
145 150 155160
TAC GGC AAT ATC ATC ACC ACA CGC ACT TAT CAG GAA CGC CTC GAT ACG544
Tyr Gly Asn Ile Ile Thr Thr Arg Thr Tyr Gin Glu Arg Leu AspThr
165 170175
CTG GAA AAA GTG CGC GAT GOC GGG ATC AAA GTC TGT TCT GGC GGC ATT692
Leu Glu Lys Val Arg Asp Ala Gly Ile Lys Val Cys Ser Gly GlyIle
180 185190
GTG GGC TTA GGC GAA ACG GTA AAA GAT CGC GCC GGA TTA TTG CTG CAA740
Val Gly Leu Gly Glu Thr Val Lys Asp Arg Ala Gly Leu Leu LeuGin
195 200205
CTG GCA AAC CTG CCG ACG CCG CCG GAA AGC GTG CCA ATC AAC ATG CTG78B
Leu Ala Asn Leu Pro Thr Pro Pro Glu Ser Val Pro Ile Asn MetLeu
210 215220
GTG AAG GTG AAA GGC ACG CCG CTT GCC GAT AAC GAT GAT GTC GAT GCC836
Val Lys Val Lys Gly Thr Pro Leu Ala Asp Asn Asp Asp Val AspAla
225 230 235240
TTT GAT TTT ATT CGC ACC ATT GCG GTC GCG CGG ATC ATG ATG CCA ACC884
Phe Asp Phe Ile Arg Thr Ile Ala Val Ala Arg Ile Met Met ProThr
245 250255
TČT TAC GTG CGC OT TCT GCC GGA CGC GAG CAG ATG AAC GAA CAG ACT932
Ser Tyr Val Arg Leu Ser Ala Gly Arg Glu Gin Met Asn Glu GinThr
260 265270
CAG GCG ATG TGC TTT ATG GCA GGC GCA AAC TCG ΑΠ TTC TAC GGT TGC980
Gin Ala Met Cys Phe Met Ala Gly Ala Asn Ser Ile Phe Tyr GlyCys
275 260285
AAA CTG CTG ACC ACG CCG AAT CCG GAA GAA GAT AAA GAC CTG CAA CTG1028
Lys Leu Leu Thr Thr Pro Asn Pro Glu Glu Asp Lys Asp Leu GinLeu
290 295300
TTC CGC AAA CTG GGG CTA AAT CCG CAG CAA ACT GCC GTG CTG GCA GGG1076
Phe Arg Lys Leu Gly Leu Asn Pro Gin Gin Thr Ala Val Leu AlaGly
305 311 315320
-26CZ 285533 B6
GAT AAC GM CM CAG CAA CGT CTT GAA CAG GCG CTG ATG ACC COG GACT124
Asp Asn Glu Gin G1n Gin Arg Leu Glu Gin Ala Leu Met Thr ProAsp
325 330335
ACC GAC GM TAT TAC AAC GCG GCA GCA TTA TGAGCTGGCA GGAGAAAATC1174
Thr Asp Glu Tyr Tyr Asn Ala Ala Ala Leu
340345
AACGCGfiCGC TCGATGCGCG GCGTGCTGCC GATGCCCTGC GTCGCCGTTA TCCGGTGGCG 1234 CAAGGAGCCG GACGCTGGCT GGTGGCGGAT GATCGCCAGT ATCTGAACTT TTCCAGTAAC1294
GATTATTTAG GTTTAAGCCA TCATCCGCAA ATTATCCCTG CCTGGCAGCA GGGGGCGGAG1354
CMTTTGGCA TCGGTAGCGG CGGCTCCGGT CACGTCAGCG GTTATAGCGT QGTGCATCAG1414
GCACTGGMG AAGAGCTGGC CGAGTGGCTT GGCTATTCGC GGGCACTGCT GTTTATCTCT1474
GGTTTCGCCG CTAATCAQGG AGTTATTGCC GCGATGATGG CGAAAGAGGA CCGTATTGCT1534
GCCGACCGGC TTAGCCA7GC CTCATTGCTG GAAGCTGCCA GTTTAAGCCC GTCGCAGCTT1594
CGCCGTTTTG CTCATAACGA TGTCACTCAT TTGGCGCGAT TGCTTGCTTC CCCCTGTCCG1654
GGGCAQCAAA TGGTGGTGAC AGMGGOGTG TTCAGCATGG ACGGCGATAG TGCGCCACTG1714
GCGGMATCC AGCAGGTAAC GCAACAGCAC MTGGCTGGT TGATGGTCGA TGATGCCCAC1774
GGCACGGGCG TTA1CGGGGA GCAGGGGCGC GGCAGCTGCT GGCTGCAAM GGTAAMCCA1834
GAATTGCTGG TAGTGACTTT TGGCMAGGA TTTGGCGTCA GCGGGGCAGC GGTGCTTTGC1894
TCCAGTACGG TGGOGGATTA TCTGCTGCM TTCGCOCGCC ACCTTATCTA CAGCACCAGT1954
ATGCCGCCCG CTCAGGCGCA GGCATTACGT GCGTCGC7GG CGGTCATTCG CAGTGATGAG2014
GGTGATQCAC GGCGCGAAM ACTGGCGGCA CTCATTACGC GTTTTCGTGC CGGAGTACAG2074
GATTTGCCGT TTACGCTTGC TGATTCATQC AGCGCCATCC AGCCA11GAT TGTCGGTGAT2134
MCAGCCGTG CGTTACAACT GGCAGMAM CTGCGTCAGC AAGGCTGCTG GGTCACGGCG2194
ATTCGCCCGC CAACCGTACC CGCTGGTACT GCGCGACTGC GCTTMCGCT AACCGCTGCG22S4
CATGAAATGC AGGATATCGA CCGTCTGCTG GAGGTGCTGC ATG GCA ACG GTT AAT 2309
Met Ala Thr Val Asn
AAA CAA GCC ATT GCA GCG GCA TTT GGT CGG GCA GCC GCA CAC TAT GAG2357
Lys Gin Ala ile Ala Ala Ala Phe Gly Arg Ala Ala Ala His TyrGlu
1520
CM CAT GCA GAT CTA CAG CGC CAG AGT GCT GAC GCC ΠΑ CTG GCA ATG2405
Gin His Ala Asp Leu Gin Arg Gin Ser Ala Asp Ala Leu Leu AlaMet
3035
-27ČZ 285533 B6
CH | CCA | CAG | CGT | AAA TAC | ACC | CAC | GTA | CTG | GAC | GCG | GGT | TGT | GGA | CCT | 2453 |
Leu | Pro | Gin | Arg | Lys Tyr | Thr | His | Val | Leu | Asp | Ala | Gly | Cys | Gly | Pro | |
40 | 45 | 50 | |||||||||||||
GGC | TGG | ATG | AGC | CGC CAC | TGG | CGG | GAA | CGT | CAC | GCG | CAG | GTG | ACG | GCC | 2501 |
Gly | Trp | Het | Ser | Arg His | Trp | Arg | Glu | Arg | His | Ala | Gin | Val | Thr | Ala | |
55 | 60 | 65 | |||||||||||||
TTA | GAT | CTC | TCG | CCG CCA | ATG | CTT | GTT | CAG | GCA | CGC | CAG | AAG | GAT | GCC | 2549 |
Leu | Asp | Leu | Ser | Pro Pro | Met | Leu | Val | Gin | Ala | Arg | Gin | Uya | Asp | Ala | |
70 | 75 | 60 | 85 | ||||||||||||
GCA | GAC | CAT | TAT | CTG GCG | GGA | GAT | ATC | GAA | TCC | CTG | CCG | TTA | GCG | ACT | 2597 |
Ala | Asp | His | Tyr | Leu Ala | Gly | Asp | 11» | Glu | Ser | Leu | Pro | Leu | Ala | Thr | |
90 | 95 | 100 | |||||||||||||
GCG | ACG | T1C | GAT | CTT GCA | TGG | AGC | AAT | CTC | GCA | GTG | CAG | TGG | TGC | GGT | 2645 |
Ala | Thr | Phe | Asp | Leu Ala | Trp | Ser | Asn | Leu | Ala | Val | Gin | Trp | Cys | Gly | |
105 | 110 | 115 | |||||||||||||
AAT | TTA | TCC | ACG | GCA CTC | CGC | GAG | CTG | TAT | CGG | GTG | GTG | CGC | CCG | AAA | 2693 |
Asn Leu Ser Thr Ala Leu Arg Glu Leu Tyr Arg Val Val Arg Pro Lys
120 125 130
GGC GTG GTC GCG TTT ACC ACG CTG GTG CAG GGA TCG TTA COC GAA CTG 2741
Gly | Val | Val | Ala | Phe | Thr | Thr | Leu | Val | Gin | Gly | Ser | Leu | Pro | Glu | Leu | |
135 | 140 | 145 | ||||||||||||||
CAT | CAG | GCG | TGG | CAG | GCG | GTG | GAC | GAG | CGT | CCG | CAT | GCT | AAT | CGC | TTT | 2789 |
His | Gin | Ala | Trp | Gin | Ala | Val | Asp | Glu | Arg | Pro | His | Ala | Asn | Arg | Phe | |
150 | 155 | 160 | 165 | |||||||||||||
TTA | CCG | CCA | GAT | GAA | ATC | GAA | CAG | TCG | CTG | AAC | GGC | GTG | CAT | TAT | CAA | 2837 |
Leu | Pro | Pro | Asp | Glu | 11· | Glu | Gin | Ser | Leu | Asn | Gly | Val | His | Tyr | Gin | |
170 | 175 | 180 | ||||||||||||||
CAT | CAT | ATT | CAG | ccc | ATC | ACG | CTG | TGG | TTT | GAT | GAT | GCG | CTC | AGT | GCC | 2885 |
His | His | Ile | Gin | Pro | Ile | Thr | Leu | Trp | Phe | Asp | Asp | Ala | Leu | Ser | Ala | |
185 | 190 | 195 | ||||||||||||||
ATG | CGT | TCG | CTG | AAA | GGC | ATC | GGT | GCC | ACG | CAT | CTT | CAT | GAA | GGG | CGC | 2933 |
Met | Arg | Ser | Leu | lys | Gly | n· | Gly | Ala | Thr | His | Leu | His | Glu | Gly | Arg | |
200 | 205 | 210 | ||||||||||||||
GAC | CCG | CGA | ATA | TTA | ACG | CGT | TCG | CAG | TTG | CAG | CGA | TTG | CAA | CTG | GCC | 2981 |
Asp | Pro | Arg | Ile | Leu | Thr | Arg | Ser | Gin | Leu | Gin | Arg | Leu | Gin | Leu | Ala | |
215 | 220 | 225 | ||||||||||||||
TGG | CCG | CAA | CAG | CAG | GGG | CGA | TAT | CCT | CTG | ACG | TAT | CAT | CTT | TTT | TTG | 3029 |
Trp | Pro | Gin | Gin | Gin | Gly | Arg | Tyr | Pro | Leu | Thr | Tyr | His | Leu | Phe | Leu | |
230 | 235 | 240 | 245 | |||||||||||||
GGA | GTG | ATT | GCT | CGT | GAG | TAAACGT1 | AT TTTGTCACCG GAACGGATAC | 3077 | ||||||||
Gly | Val | Ile | Ala | Arg | Glu |
-28250
CGAAGTGGGG AAAACTGTCG CCAGTTGTQC ACTTTTACAA GCCGCAAAGG CAQCAGGCTA3137
CCGGACGGCA GGTTATAAAC CGGTCQCCTC TGGCAGCGAA MGACCCCGG AAGGTTTACG3197
CAATAGCGAC GCGCTGGCGT TACAQCGCAA CAGCAGCCTG CAGCTGGATT ACGCAACAGT3257
AAATCCTTAC ACCTTCGCAG AACCCACTTC GOCGCACATC ATCAGCGCGC AAGAGGGCAG3317
ACCGATAGAA TCATTGGTAA TGAGCGOCGG ATTACGCGCG CTTGAACAAC AGGCTGACTG3377
GGTGTTAGTG GAAGG1GCTG GCGGCTGGTT TACGCCGCTT TCTGACACTT TCACTTTTGC3437
AGATTGGGTA ACACAGGAAC AACTGCCGGT GATACTGGTA GTTGGTGTGA AACTCGGCTG3497
TATTAATCAC GCGATGHGA CTGCACAGGT AATACAACAC GCCGGACTGA CTCTGGCGGG3557
TTGGGTGGCG AACGATGTTA CGCCTCCGGG AAAAOGTCAC GCTGAATATA TGACCACGCT3617
CACCCGCATG ATTCCCGCGC OGCTGCTGGG AGAGATCCCC TGGCTTQCAG AAAATCCAGA3677
AAATGCGGCA ACCGGAAAGT ACATAAACCT TGCCTTCGTC GACGCGTCGA CTCTAGGGTT3737
TACAAGTCGA TT ATG ACA ACG GAC GAT CTT GCC TTT GAC CAA CGC CAT3785
Met Thr Thr Asp Asp Leu Ala Ph· Asp Gin Arg His
510
ATC TGG CAC CCA TAC ACA TCC ATG ACC TCC CCT CTG CCG GTT TAT CCG3833
Ile Trp His Pro Tyr Thr Ser Met Thr Ser Pro Leu Pro Val TyrPro
2025
GTG GTG A£C GCC GAA GGT TGC GAG CTG ΑΓΓ TTG TCT GAC GGC AGA CGC3881
Val Val Ser Ala Glu Gly Cys Glu Leu Ile Leu Ser Asp Gly ArgArg
3540
CTG GTT GAC GGT ATG TCG TCC TGG TGG GOG GOG ATC CAC GGC TAC ΑΛΤ3929
Leu Val Asp Gly Met Ser Ser Trp Trp Ala Ala Ile H1s Gly TyrAsn
5 50 5560
CAC CCG CAG CTT AAT GCC GCG ATG AAG TCG CAA ATT GAT GCC ATG TCG3977
His Pro Gin Leu Asn Ala A1a Met Lys Ser Gin tle Asp Ala MetSer
7075
CAT GTG ATG TTT GGC GGT ATC ACC CAT GCG CCA GCC ΑΠ GAG CTG TGC4025
H1s Val Met Phe Gly G1y Ile Thr His Ala Pro Ala Ile Glu LeuCys
8590
CGC AAA CTG GTG GCG ATG ACG CCG CAA CCG CTG GAG TGC GTT TTT CTC4073
Arg Lys Leu Val Ala Met Thr Pro Gin Pro Leu Glu Cys Val PheLeu
100W5
GCG GAC TCC GGT TCC GT A GCG GTG GAA GTG GCG ATG AAA ATG GCG TTG4121
Ala Asp Ser Gly Ser Val Ala Val Glu Val Ala Met Lys Het AlaLeu
110 115120
-29CZ 285533 B6
CAG | TAC | TGG | CAA | GCC | AAA | GGC | GAA | GCG | CGC | CAG | CGT | TTT | CTG | ACC | TTC | 4169 |
Gin | Tyr | Trp | Gin | Ala | Lys | Gly | Glu | Ala | Arg | Gin | Arg | Phe | Leu | Thr | Phe | |
125 | 130 | 135 | 140 | |||||||||||||
CGC | AAT | GGT | TAT | CAT | GGC | GAT | ACC | m | GGC | GCG | ATG | TCG | GTG | TGC | GAT | 4217 |
Arg | Asn | Gly | Tyr | His | Gly | Asp | Thr | Phe | Gly | Ala | Met | Ser | Val | Cys | Asp | |
145 | ISO | 155 | ||||||||||||||
CCG | GAT | AAC | TCA | ATG | CAC | AGT | CTG | TGG | AAA | GGC | TAC | CTG | CCA | GAA | AAC | 4265 |
Pro | Asp | Asn | Ser | Met | His | Ser | Leu | Trp | Lys | Gly | Tyr | Leu | Pro | Glu | Asn | |
160 | 165 | 170 | ||||||||||||||
CTG | TTT | GCT | CCC | GCC | CCG | CAA | AGC | CGC | ATG | GAT | GGC | GAA | TGG | GAT | GAG | 4313 |
Leu | Phe | Ala | Pro | Ala | Pro | Gin | Ser | Arg | Met | Asp | Gly | Glu | Trp | Asp | Glu | |
175 | 180 | 185 | ||||||||||||||
CGC | GAT | ATG | GIG | GGC | TTT | GCC | CGC | CTG | ATG | GCG | GCG | CAT | CGT | CAT | GAA | 4361 |
Arg | Asp | Met | Val | Gly | Phe | Ala | Arg | Leu | Met | Ala | Ala | His | Arg | His | Glu | |
190 | 19S | 200 | ||||||||||||||
ATC | GCG | GCG | GTG | ATC | ATT | GAG | CCG | ATT | GTC | CAG | GGC | GCA | GGC | GGG | ATG | 4409 |
Ile | Ala | Ala | Val | Ile | Ile | Glu | Pro | Ile | Val | Gin | Gly | Ala | Gly | Gly | Met | |
205 | 210 | 215 | 220 | |||||||||||||
CGC | ATG | TAC | CAT | CCG | GAA | TGG | TTA | AAA | CGA | ATC | CGC | AAA | ATA | TGC | GAT | 4457 |
Arg | Met | Tyr | His | Pro | Glu | Trp | Leu | tys | Arg | Ile | Arg | Lys | Ile | Cys | Asp | |
225 | 230 | 235 | ||||||||||||||
CGC | GAA | GGT | ATC | TTG | CTG | ATT | GCC | GAC | GAG | ATC | GCC | ACT | GGA | TTT | GGT | 4505 |
Arg | Glu | Gly | Ile | Leu | Leu | Ile | Ala | Asp | Glu | 11« | Ala | Thr | Gly | Phe | Gly | |
240 | 24S | 230 | ||||||||||||||
CGT | ACC | GGG | AAA | CTG | TTT | GCC | TGT | GAA | CAT | GCA | GAA | ATC | GCG | CCG | GAC | 4553 |
Arg | Thr | Gly | Lys | Leu Phe Ala | Cys | Glu | His | Ala | Glu | Ile | Ala | Pro | Asp | |
255 | 260 | 265 | ||||||||||||
ATT | TTG | TGC | CTC | GGT AAA GCC | TTA | ACC | GGC | GGC | ACA | ATG | ACC | CTT | TCC | 4601 |
Ile | Leu | Cys | Leu | Gly Lys Ala | Leu | Thr | Gly | Gly | Thr | Met | Thr | Leu | Ser | |
270 | 275 | 280 | ||||||||||||
GCC | ACA | CTC | ACC | ACG CGC GAG | GTT | GCA | GAA | ACC | ATC | AGT | AAC | GGT | GAA | 4649 |
Ala | Thr | Leu | Thr | Thr Arg Glu | Val | Ala | Glu | Thr | Ile | Ser | Asn | Gly | Glu |
205 290 295 300
GCC GGT TGC TTT ATG CAT GGG CCA ACT TTT ATG GGC AAT CCG CTG GCC4697
Ala Gly Cys Phe Met His Gly Pro Thr Phe Met Gly Asn Pro LeuAla
305 310315
TGC GCG GCA GCA AAC GCC AGC CTG GCG ATT CTC GAA TCT GGC GAC TGG4745
Cys Ala Ala A1a Asn Ala Ser Leu Ala Ile Leu G1u Ser Gly AspTrp
320 325330
CAG CAA CAG GTG GCG GAT ATT GAA GTA CAG CTG CGC GAG CAA CTT GCC4793
Gin Gin Gin Val Ala Asp Ile Glu Val Gin Leu Arg Glu Gin LeuAla
335 340345
-30CZ 285533 B6
CCC GCC CGT GAT GCC GAA ATG GTf GOC GAT CTG CGC GTA CTG GGG GCC484?
Pro Ala Arg Asp Ala Glu Het Val Ala Asp Val Arg Val Leu Gly Ala
350 355360
ATT GGC GTG GTC GAA ACC ACT CAT CCG GTG AAT ATG GCG GCG CTG CAA4889
11* Gly Val Val Glu Thr Thr His Pro Val Asn Het Ala Ala Leu Gin
365 370 375380
AAA TTC TTT GTC GAA CAG GGT GTC TGG ATC CGG CCT TTT GGC AAA CTG4937
Lys Phe Phe Val Glu Gin Gly Val Trp Ile Arg Pro Phe Gly LysLeu
385 390395
ATT TAC CTG ATG CCG COC TAT ATT ATT CTC CCG CAA CAG TTG CAG CGT4985
Ile Tyr Leu Het Pro Pra Tyr tle Ile Leu Pro Gin Gin Leu GinArg
400 405410
CTG ACC GCA GCG GTT AAC CGC GCG GTA CAG GAT GAA ACA TTT TTT TGC5033
Leu Thr Ala Ala Val Asn Arg Ala Val Gin Asp Glu Thr Phe PheCys
415 420425
CAA TAACGAGAAG TCCGCGTGAG GGTTTCTGGC TACACTTTCT GCAAACAAGA5086
Gin
430
AAGGAGGGTT C ATG AAA CTC ATC AGT AAC GAT CTG CGC GAT GGC SAT AAA5136
Het Lys Leu Ile Ser Asn Asp Leu Arg Asp Gly Asp Lys
5W
TTG CCG CAT CGT CAT GTC TTT AAC GGC ATG GGT TAC GAT GGC GAT AAT5184
Leu Pro His Arg H1s Val Phe Asn Gly Met G1y Tyr Asp Gly AspAsn
2025
ATT TCA CCG CAT CTG GCG TGG GAT GAT GTT CCT GCG GGA ACG AAA AGT5232
Ile Ser Pro H1s Leu Ala Trp Asp Asp Val Pro A1a G1y Thr LysSer
35 4045
TTT GTT GTC ACC TGC TAC GAC CCG GAT GCG CCA ACC GGC TCC GGC TGG5280
Phe Val Val Thr Cys Tyr Asp Pro Asp Ala Pro Thr Gly Ser Gly Trp
5560
TGG CAC TGG GTA GTT GTT AAC TTA CCC GCT GAT ACC CGC GTA TTA CCG5328
Trp His Trp Val Val Val Asn Leu Pro Ala Asp Thr Arg Val Leu Pro
7075
CAA GGG TTT GGC TCT GGT CTG GTA GCA ATG CCA GAC GGC GTT TTG CAG5375
Gin G1y Phe Gly Ser Gly Leu Val Ala Het Pro Asp Gly Val Leu Gin
8590
ACGCGTACCGACTTTGGTAAAACCGGGTACGATGGCGCAGCACCGCCG 5424 Thr Arg Thr Asp Phe Gly Lys Thr Gly Tyr Asp Gly Ala Ala Pro Pro
100105
AAA GGC GAA ACT CAT CGC TAC ATT TTT ACC GTT CAC GCG CTG GAT ΑΤΛ5472
Lys Gly Glu Thr His Arg Tyr ITe Phe Thr Val His Ala Leu AspIle
110 115 120125
-31ČŽ 285533 B6
GAA CGT ATT GAT GTC GAT GAA GGT GCC AGC GGC GCG ATG GTC GGG TTT
GTu Arg Ile Asp Val Asp Glu Gly Ala Ser Gly Ala Met Val Gly Phe
130 135140
AAC GTT CAT TTC CAC TCT CTG GCA AGC GCC TCG ATT ACT GCG ATG TTT 5568
Asn Vat His Phe His Ser Leu Ala Ser Ala Ser Ile Thr Ala HetPhe
145 1501 55
AGT TAATCACTCT GCCAGATGGC GCAATGCCAT CTGGTATCAC TTAAAGGTAT5621
Ser
5520
TAAAAACAAC TTTTTGTCTT TTTACCTTCC CGTTTCGCTC AAGTTAGTAT AAAAAAGCAG 5681
GCTTCAACGG ΑΤΤΟΑΤΠΤΤ CTATTTCATA GCCCGGAGCA ACCTGTGAAC ACATTTTCAG 5741
TTTCCCGTCT GGCGCTGGCA TTGGCTTTTG GCGTGACGCT GACCGCCTGT AGCTCAACCC 5801
CGCCCGATCA ACGTCCTTCT GATCAAACCG CGCCTGGTAC CGAGCTCGAA TTCCTGCAGG 5861
CATGCAAGCT T 5872 (2) INFORMACE K SEKVENCI SEK ID Č.: 2:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 346 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID Č.: 2:
Het | Ala | His | Arg Pro | Arg | Trp | Thr | Leu | Ser | Gin Val | Thr | Glu | Leu | Phe |
1 | 5 | 10 | 15 | ||||||||||
Glu | Lys | Pro | Leu Leu | Asp | Leu | Leu | Phe | Glu | Ala Gin | Gin | Val | His | Arg |
20 | 25 | 30 | |||||||||||
Gin | His | Phe | Asp Pro | Arg | Gin | Vat | Gin | Val | Ser Thr | Leu | Leu | Ser | Ile |
35 | 40 | 45 | |||||||||||
Lys | Thr | Gly | Ala Cys | Pro | Glu | Asp | Cys | lys | Tyr Cys | Pro | Gin | Ser | Ser |
50 | 55 | 60 | |||||||||||
Arg | Tyr | Lys | Thr Gly | Leu | Glu | Ala | Glu | Arg | Leu Met | Glu | Val | Glu | Gin |
65 | 70 | 7S | 60 | ||||||||||
Val | Leu | Glu | Ser Ala | Arg | Lys | Ala | Lys | Ala | Ala Gly | Ser | Thr | Arg | Phe |
Θ5 | 90 | 95 | |||||||||||
Cys | Het | Gly | Ala Ala | Trp | Ly» | Asn | Pro | llls | Glu Arg | Asp | Met | Pro | Tyr |
100 | 105 | 110 | |||||||||||
Leu | Glu | Gin | Het Val | Gin 1 | Gly | Val | Lys | Ala | Het Gly | Leu | Glu | AU | Cys |
115 120 125
-32CZ 285533 B6
Met Thr Leu Gly Thr Leu Ser Glu Sar Gin AI* Gin Arg Leu Ala Asn
130 | 135 | 140 | |||||||||||||
Ala | Gly | Leu | Asp | Tyr | tyr | Asn | His | Asn | Leu | Asp | Thr | Ser | Pro | Glu | Phe |
145 | 150 | 155 | 160 | ||||||||||||
Tyr | Gly | Asn | Ile | tle | Thr | Thr | Arg | Thr | Tyr | Gin | Glu | Arg | Leu | Asp | Thr |
165 | 170 | 175 | |||||||||||||
Leu | Glu | Lys | Val | Arg | Asp | Ala | Gly | Ile | Lys | Val | Cys | Ser | Gly | Gly | Ile |
1Θ0 | 185 | 190 | |||||||||||||
Val | Gly | Leu | Gly | Glu | Thr | Val | Lys | Asp | Arg | Ala | Gly | Leu | Leu | Leu | Gin |
195 | 200 | 205 | |||||||||||||
Leu | Al* | Asn | Leu | Pro | Thr | Pro | Pro | Glu | Ser | Val | Pro | Ile | Asn | Met | Leu |
210 | 215 | 220 | |||||||||||||
Val | Lys | Val | Lys | Gly | Thr | Pro | Leu | Ala | Asp | Asn | Asp | Asp | Val | Asp | Ala |
225 | 230 | 235 | 240 | ||||||||||||
Ptra | Asp | Phe | Ile | Arg | Thr | Ile | Al* | Val | Ala | Arg | Ile | Met | Met | Pro | Thr |
245 | 250 | 255 | |||||||||||||
Ser | Tyr | Val | Arg | Leu | Ser | Ala | Gly | Arg | Glu | Gin | Met | Asn | Glu | Gin | Thr |
260 | 265 | 270 | |||||||||||||
Gin | A]* | Met | Cys | Phe | Met | Ala | Gly | Ala | Asn | Ser | Ile | Phe | Tyr | Gly | Cys |
275 | 280 | 285 | |||||||||||||
Lys | Leu | Leu | Thr | Thr | Pro | Asn | Pro | Glu | Glu | Asp | Lys | Asp | Leu | G1n | Leu |
290 | 295 | 300 | |||||||||||||
Phe | Arg | Lys | Leu | Gly | Leu | Asn | Pro | Gin | Gin | Thr | Al* | Val | Leu | Ala | Gly |
305 | 310 | 315 | 320 | ||||||||||||
Asp | Asn | Glu | Gin | Gin | Gin | Arg | Leu | Glu | Gin | Ala | Leu | Met | Thr | Pro | Asp |
325 330 335
Ihr Asp Glu Tyr Tyr Asn Ala Ala Ala Leo
340 345 (2) INFORMACE K SEK ID Č.: 3:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 251 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID Č.: 3:
-33CZ 285533 B6
Met | Ala | Thr | Val Asn | Lys | Gin | Ala | Ile Ala | Ala | , Ala | Phe | Gly | Arg | Ala |
1 | 5 | 10 | 15 | ||||||||||
Ala | Ala | H1s | Tyr Glu | Gin | His | Ala | Asp Leu | Gin | Arg | Gin | Ser | Ala | Asp |
20 | 25 | 30 | |||||||||||
Ala | Leu | Leu | Ala Met | Leu | Pro | Gin | Arg Lys | Tyr | Thr | His | Val | Leu | Asp |
35 | 40 | 45 | |||||||||||
Ala | Gly | Cys | Gly Pro | Gly | Trp | Met | Ser Arg | His | Trp | Arg | G1u | Arg | His |
50 | 55 | 60 | |||||||||||
Ala | Gin | Val | Thr Ala | Leu | Asp | Leu | Ser Pro | Pro | Met | Leu | Val | Gin | Ala |
65 | 70 | 75 | 80 | ||||||||||
Arg | Gin | Lys | Asp Ala | Ala | Asp | His | Tyr Leu | A1a | Gly | Asp | Ile | Glu | Ser |
65 | 90 | 95 | |||||||||||
Leu | Pro | Leu | Ala Thr | Ala | Thr | Phe | Asp Leu | Ala | Trp | Ser | Asn | Leu | Ala |
100 | 105 | 110 | |||||||||||
Val | Gin | Trp | Cys Gly | Asn | Leu | Ser | Thr Ala | Leu | Arg | Glu | Leu | Tyr | Arg |
115 | 120 | 125 | |||||||||||
Val | Val | Arg | Pro lys | Gly | Val | Val | Ala Phe | Thr | Thr | Leu | Val | Gin | Gly |
130 | 135 | 140 | |||||||||||
Ser | Leu | Pro | Glu Leu | His | Gin | Ala | Trp Gin | Ala | Va1 | Asp | Glu | Arg | Pro |
145 | 150 | 155 | 160 | ||||||||||
His | Ala | Asn | Arg Phe | Leu | Pro | Pro | Asp Glu | Ile | Glu | Gin | Ser | Leu | Asn |
165 | 170 | 175 | |||||||||||
Gly | Val | His | Tyr Gin | His | Bis | Ile | Gin Pro | Ile | Thr | Leu | Trp | Phe | Asp |
180 | 185 | 190 |
Asp | Ala | Lev | Ser | Ala | Met | Arg | Ser | Leu | Lys | Gly | Ile | Gly | Ala | Thr | His |
195 | 200 | 205 | |||||||||||||
Leu | His | Glu | GV | Arg | Asp | Pro | Arg | Ile | Leu | Thr | Arg | Ser | Gin | Leu | Gin |
210 | 215 | 220 | |||||||||||||
Arg | Leu | Gin | Leu | Ala | Trp | Pro | Gin | Gin | Gin | Gly | Arg | Tyr | Pro | Leu | Thr |
225 | 230 | 235 | 240 | ||||||||||||
Tyr | His | Leu | Phe | Leu | Gly | Val | Ile | Ala | Arg | Glu |
245 250 (2) INFORMACE K SEK ID Č.: 4:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 429 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein
-34CZ 285533 B6 (xi) POPIS SEKVENCE: SEK ID Č.: 4:
Met | Thr Thr | Asp | Asp | Leu | Ala | Phe | Asp Gin Arg His Ile | Trp | His | Pro |
1 | 5 | 10 | 15 | |||||||
Tyr | Thr Ser | Met | Thr | Ser | Pro | Leu | Pro Val Tyr Pro Val | Val | Ser | A1a |
20 | 25 | 30 | ||||||||
Glu | Gly Cys | Glu | Leu | Ile | Leu | Ser | Asp Gly Arg Arg Leu | Val | Asp | Gly |
35 | 40 | 45 | ||||||||
Met | Ser Ser | Trp | Trp | Ala | Ala | Ile | H1s Gly Tyr Asn His | Pro | Gin | Leu |
50 | 55 | 60 | ||||||||
Asn | Ala Ala | Het | Lys | Ser | Gin | 11a | Asp Ala Mot Ser His | Val | Met | Phe |
55 | 70 | 75 | 80 | |||||||
Gly | Gly Ile | Thr | His | Ala | Pro | Ala | Ile Glu Leu Cys Arg | Lys | Leu | Val |
90 95
Ala Het Thr Pro Gin Pro Leu G1u Cys Val Phe Leu Ala Asp Ser Gly 100 105 110
Ser | Val | Ala | Val | Glu | Va1 | Ala | Het | Lys | Het | Ala | Leu Gin | Tyr | Trp | Gin |
115 | 120 | 125 | ||||||||||||
Ala | Lys | Gly | Glu | Ala | Arg | Gin | Arg | Phe | Leu | Thr | Phe Arg | Asn | Gly | Tyr |
130 | 135 | 140 | ||||||||||||
His | Gly | Asp | Thr | Phe | Gly | A1a | Het | Ser | Val | CyS | Asp Pro | Asp | Asn | Ser |
145 | 150 | 155 | 160 | |||||||||||
Met | His | Ser | Leu | Trp | Lys | Gly | Tyr | Leu | Pro | Glu | Asn Leu | Phe | Ala | Pro |
165 | 170 | 175 | ||||||||||||
Ala | Pro | Gin | Ser | Arg | Het | Asp | Gly | Glu | Trp | Asp | Glu Arg | Asp | Het | Val |
180 | 185 | 190 | ||||||||||||
Gly | Phe | Ala | Arg | Leu | Het | Ala | Ala | IHs | Arg | His | Glu Ile | Ala | Ala | Val |
195 | 200 | 205 |
Ile | Ile | Glu | Pro | Ile | Val | Gin | Gly | Ala | Gly | Gly | Met | Arg Het | Tyr | His |
2)0 | 215 | 220 | ||||||||||||
Pro | Glu | Trp | Leu | Lys | Arg | Ile | Arg | Lys | De | Cys | Asp | Arg Glu | Gly | Ile |
225 | 230 | 235 | 240 | |||||||||||
Leu | Leu | Ile | Ala | Asp | Glu | Ile | Ala | Hu- | Gly | Phe | Gly | Arg Thr | Gly | Lys |
245 | 250 | 255 | ||||||||||||
Leu | Phe | Ala | Cys | Glu | His | Ala | Glu | líš | A1a | Pro | Asp | Ile Leu | Cys | Leu |
260 | 265 | 270 | ||||||||||||
Gly | Lys | Ala | Leu | Thr | Gly | Gly | Thr | Het | Thr | Leu | Ser | Ala Thr | Leu | Thr |
275 | 280 | 285 |
-35CZ 285533 B6
Thr Arg Glu Val Ala Glu Thr Ba Ser Asn Gly Glu Ala Gly Cys Phe 290 295300
Met His Gly Pro Thr Phe Met Gly Asn Pro Leu Ala CyS Ala AlaAla
305 310 315320
Asn Ala Ser Leu Ala Be Leu G1u Ser Gly Asp Trp Gin Gin GinVal
325 330335
A1a Asp Π· Glu Val Gin Leu Arg Glu Gin Leu Ala Pro Ala Arg Asp
340 345350
Ala | Glu | Met | VaT | Ala | Asp | Val | Arg | Val | Leu | Gly | Ala | Be | Gly | Val | Val |
355 | 3S0 | 365 | |||||||||||||
Glu | Thr | Thr | His | Pro | VaT | Asn | Met | Ala | Ala | Leu | Gin | Lys | Phe | Phe | Val |
370 | 375 | 380 | |||||||||||||
Glu | Gin | Gly | Val | Trp | Be | Arg | Pro | Phe | Gly | Lys | Leu | Be | Tyr | Leu | Met |
305 | 390 | 395 | 400 | ||||||||||||
Pro | Pro | Tyr | Be | Be | Leu | Pro | Gin | Gin | Leu | Gin | Arg | Leu | Thr | ATa | Ala |
405 410 415
Val Asn Arg Ala Val Gin Asp Glu Thr Phe Phe Cys Gin 420425 (2) INFORMACE K SEK ID Č.: 5:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 158 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID Č.: 5:
Met | Lys | Leu | Ile Ser Asn Asp | Leu | Arg | Asp | Gly | Asp | Lys | Leu | Pro | His |
1 | 5 | 10 | 15 | |||||||||
Arg | His | Val | Phe Asn Cly Met | Gly | Tyr | Asp | Gly | Asp | Asn | Ile | Ser | Pro |
20 | 25 | 30 | ||||||||||
His | Leu | Ala | Trp Asp Asp Val | Pro | Ala | Gly | Thr | Lys | Ser | Phe | Val | Val |
35 | 40 | 45 | ||||||||||
Thr | Cys | Tyr | Asp Pro Asp Ala | Pro | Thr | Gly | Ser | Gly | Trp | Trp | His | Trp |
50 | 55 | 60 | ||||||||||
Val | Val | Val | Asn Leu Pro Ala | Asp | Thr | Arg | Val | Leu | Pro | Gin | Gly | Phe |
65 | 70 | 75 | 80 | |||||||||
Gly | Ser | Gly | Leu Val Ala Met | Pro | Asp | Gly | Val | Leu | Gin | Thr | Arg | Thr |
85 | 90 | 95 | ||||||||||
Asp | Phe | Gly | Lys Thr Gly Tyr | Asp | Gly | Ala | Ala | Pro | Pro | Lys | Gly | Glu |
100 105 110
-36CZ 285533 B6
Thr His Arg Tyr Ile Phe Thr Val His Ala Leu Asp Ile Glu Arg Ile
11S 120125
Asp Val Asp Glu Gly Ala Ser Gly Ala Met Val Gly Phe Asn Val His 130 135140
Phe His Ser Leu Ala Ser Ala Ser 11« Thr Ala Met Phe Ser
145 150155 (2) INFORMACE K SEK ID Č.: 6:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 5872 párů bází (B) DRUH: nukleová kyselina (C) FORMA VLÁKNA: dvojitá (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: DNA (genomicky) (iii) HYPOTETICKY: NE (vi) PRVOTNÍ PŮVOD:
(A) ORGANIZMUS: Escherichia coli (B) KMEN: DSM498 (vii) BEZPROSTŘEDNÍ PŮVOD:
(B) KLON: pBO30A15-9 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 1154..2308 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /kodon_start= 1154 /EC_číslo= 2.3.1.47 /produkt= „KAPA synthasa“ /evidence= EXPERIMENTÁLNĚ /gen= „bioF“ /číslo= 2 /standardníjméno= „8-amino-oxononanoát synthasa“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 3043-3753 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /kodon_start= 3043 /EC_číslo= 6.3.3.3 /produkt= „DTB synthasa“ /evidence= EXPERIMENTÁLNĚ /gen= „bioD“ /číslo= 4 /standardní_jméno= „dethiobiotin synthasa“
-37CZ 285533 B6 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 1141..1156 (D) JINÉ ÚDAJE: /standardní_jméno= „bioF RBS“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 3030..3045 (D) JINÉ ÚDAJE: /standardní_jméno= „bioD RBS“ (x) INFORMACE O ZVEŘEJNĚNÍ:
(H) ČÍSLO DOKUMENTU: WO 87/01391 B1 (I) DATUM PŘIHLÁŠENÍ: 26-AUG-1986 (J) DATUM ZVEŘEJNĚNÍ: 07-APR-1993 (xi) POPIS SEKVENCE: SEK ID Č.: 6:
AAGCT7ACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT60
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTCATGG120
CTCACCGCCC ACGCTGGACA TTGTCGCAAG TCACAGAATT ATTTGAAAAA CCGTTGCTGG180
ATCTGCTGTT TGAAGCGCAG CAGGTGCATC 6CCAGCATTT OGATOCTCGT CAGGTGCAGG240
TCAGCACGTT GCTGTCGATT AAGACCGGAG CTTGTCCGGA AGA7TGCAAA TACTGCCCGC300
AAAGCTCGCG CTACAAAACC GGGCTGGAAG CCGAGCGGTT GATGGAAGTT GAACAGGTGC360
TGGAGTCGGC GCGCAAAGCG AAAGCGGCAfi GATCGACGCG CTTCTGTATG GGCGCGGCGT420
GGAAGAATCC CCACGAAOGC GATATGCCGf ACCTGGAACA AATGGTGCAG GGGGTAAAAG430
CGATGGGGCT GGAGGCGTGT ATGACGCTGG GCACGTTGAG TGAATCTCAG GCGCAGCGCC540
TCGCGAACGC CGGGCTGGAT TACFACAACC ACAACCTGGA CACCrCGCCG GAGTTTTACG600
GCAATATCAT CACCACACGC ACTTATCAGG AACGCCTCGA TACGCTGGAA AAAGTGCGCG660
ATGCCGGGAT CAAAGTCTGT TCTGGCGGCA TTGTGGGCn AGGCGAAAOG GTAAAAGATC720
GCGCCGGATT ATTGCTGCAA CTGGCAAACC TGCCGACGCC GCCGGAAAGC GTGCCAATCA780
ACATGCTGGT GAAGGTGAAA GGCACGCCGC TIGCCGATAA CGATGATGTC GATGCCmG840
ATTTTATTCG CAOCATTGCG GTCGCGOGGA TCATGATGCC AACCTCTTAC GTGCGCCTTT900
CTGCCGGACG CGAGCAGATG AACGAACAGA CTCAGGCGAT GTGCTTTATG GCAGGCGCAA960
ACTCGATTTT CTACGGTTGC AAACTGCTGA CCACGCCGAA TCCGGAAGAA GATAAAGACC1020
TGCAACTGTT CCGCAAACTG QGGCTAAATC CGCAGCAAAC TGOCGTGCTG GCAGGGGATA1080
ACGAACAACA GCAACGTCTT GAACAGGCGC TGATGACCCC GGACACCGAC GAATATTACA1140
-38CZ 285533 B6
ACGCGGCAGC ΑΠ ATG AGC TGG CAG GAG AAA ATC AAC GCG GCG CTC GAT
Met Ser Trp Gin G1u lys Ile Asn Ala Ala Leu Asp
5 10
11S9
GCG | CGG | CGT | GCT | GCC | GAT | GCC | CTG | CGT | CGC | CGT | TAT | CCG | GTG | GCG | CAA | 1237 |
Ala | Arg | Arg | Ala | Ala | Asp | Ala | Leu | Arg | Arg | Arg | Tyr | Pro | Val | Ala | Gin | |
15 | 20 | 25 | ||||||||||||||
GGA | GCC | GGA | CGC | TGG | CTG | GTG | GCG | GAT | GAT | CQC | CAG | TAT | CTG | AAC | TTT | 1285 |
Gly | Ala | Gly | Arg | Trp | Leu | Val | Ala | Asp | Asp | Arg | Gin | Tyr | Leu | Asn | Phe | |
30 | 35 | 40 | ||||||||||||||
TCC | AGT | AAC | GAT | TAT | TTA | GGT | TTA | AGC | CAT | CAT | CCG | CAA | ATT | ATC | CGT | 1333 |
Ser | Ser | Asn | Asp | Tyr | Leu | Gly | Leu | Ser | His | His | Pro | Gin | Ile | Ile | Arg | |
45 | 50 | 55 | 60 | |||||||||||||
GCC | TGG | CAG | CAG | GGG | GCG | GAG | CAA | TTT | GGC | ATC | GGT | AGC | GGC | GGC | TCC | 1381 |
Ala | Trp | Gin | Gin | Gly | Ala | Glu | Gin | Phe | Gly | Ile | Gly | Ser | Gly | Gly | Ser | |
65 | 70 | 75 | ||||||||||||||
GGT | CAC | GTC | AGC | GGT | TAT | AGC | GTG | GTG | CAT | CAG | GCA | CTG | GAA | GAA | GAG | 1429 |
Gly | His | Val | Ser | Gly | Tyr | Ser | Val | Val | His | Gin | Ala | Leu | Glu | Glu | Glu | |
eo | 85 | 90 | ||||||||||||||
CTG | GCC | GAG | TGG | CTT | GGC | TAT | TCG | CGG | GCA | CTG | CTG | TTT | ATC | TCT | GGT | 1477 |
Lev | Ala | Glu | Trp | Leu | Gly | Tyr | Ser | Arg | Ala | Leu | Leu | Phe | I1e | Ser | Gly | |
95 | 100 | 105 | ||||||||||||||
TTC | GOC | GCT | ΛΑΤ | CAG | GCA | GTT | ATT | GCC | GCG | ATG | ATG | GCG | AAA | GAG | GAC | 1525 |
Phe | Ala | Ala | Asn | Gin | Ala | Val | Ile | Ala | Ala | Met | Met | Ala | Lys | Glu | Asp | |
110 | 115 | 120 | ||||||||||||||
CGT | ATT | GCT | GCC | GAC | CGG | CTT | AGC | CAT | GCC | TCA | TTG | CTG | GAA | GCT | GCC | 1573 |
Arg | Ile | Ala | Ala | Asp | Arg | Leu | Ser | His | Ala | Ser | Leu | Leu | Glu | Ala | Ala | |
125 | 130 | 135 | 140 | |||||||||||||
AGT | TTA | AGC | CCG | TCG | CAG | CTT | CQC | CGT | TTT | GCT | CAT | AAC | GAT | GTC | ACT | 1621 |
Ser | Leu | Ser | Pro | Ser | Gin | Leu | Arg | Arg | Phe | Ala | His | Asn | Asp | Val | Thr | |
145 | 150 | 155 | ||||||||||||||
CAT | TTG | GCG | CGA | TTG | CTT | GCT | TCC | CCC | TGT | CCG | GGG | CAG | CAA | ATG | CTG | 1669 |
His | Leu | Ala | Arg | Leu | Leu | Ala | Ser | Pro | Cys | Pro | Gly | Gin | Gin | Met | Val |
160 165 170
GTG ACA GAA GGC CTG TTC AGC ATG GAC GGC GAT AGT GCG CCA CTG GCG 1717
Val Thr Glu Gly Va1 Phe Ser Met Asp Gly Asp Ser Ala Pro Leu Ala
175 | 180 | 185 | |||||||||||
GAA | ATC | CAG | CAG GTA ACG | CAA | CAG | CAC | AAT | GGC | TGG | TTG ATG | GTC | GAT | 1765 |
G1u | Ile | Gin | Gin Val Thr | Gin | Gin | His | Asn | Gly | Trp | Leu Met | Val | Asp | |
190 | 195 | 200 | |||||||||||
GAT | GCC | CAC | GGC ACG GGC | GTT | ATC | GGG | GAG | CAG | GGG | CGC GGC | AGC | TGC | 1813 |
Asp | Ala | His | Gly Thr Gly | Val | Ile | Gly | Glu | Gin | Gly | Arg Gly | Ser | Cys | |
205 | 210 | 215 | 220 |
-39CZ 285533 B6
TGG | C1G | CAA | AAG | GTA | AAA | CCA | GAA | TTG | CTG | GTA | GTG | ACT | TTT | GGC | AAA | 1861 |
Trp | Leu | Gin | Lys | Val | Lys | Pro | Glu | Leu | Leu | Val | Val | Tlv | Phe | Gly | Lys | |
225 | 230 | 235 | ||||||||||||||
GGA | ΤΠ | GGC | GTC | AGC | GGG | GCA | GCG | GTG | CTT | TGC | TCC | AGT | ACG | GTG | GCG | 1909 |
Gly | Phe | Gly | Val | Ser | Gly | Ala | Ala | Val | Leu | Cys | Ser | Ser | Thr | Val | Ala | |
240 | 245 | 250 | ||||||||||||||
GAT | 1AT | CTG | CTG | CAA | TTC | GCC | CGC | CAC | CTT | ATC | TAC | AGC | ACC | AGT | ATG | 1957 |
Asp | Tyr | Leu | Leu | Gin | Phe | Ala | Arg | His | Leu | 11« | Tyr | Ser | Thr | Ser | Met | |
255 | 260 | 265 | ||||||||||||||
CCG | CCC | GCT | CAG | GCG | CAG | GCA | TTA | CGT | GCG | TCG | CTG | GCG | GTC | ATT | CGC | 2005 |
Pra | Pro | Ala | Gin | A1a | Gin | Ala | Leu | Arg | Ala | Ser | Leu | Ala | Val | ile | Arg | |
270 | 275 | 280 | ||||||||||||||
AGT | GAT | GAG | GGT | GAT | GCA | GGG | CGC | GAA | AAA | CTG | GCG | GCA | CTC | ATT | ACG | 2053 |
Ser | Asp | Glu | Gly | Asp | Ala | Arg | Arg | Glu | Lys | Leu | Ala | Ala | Leu | Tle | Thr | |
285 | 290 | 295 | 300 | |||||||||||||
CGT | TTT | CGT | GCC | GGA | GTA | CAG | GAT | TTG | CCG | TTT | ACG | CTT | GCT | GAT | TCA | 2101 |
Arg | Phe | Arg | Ala | G1y | Val | Gin | Asp | Leu | Pro | Phe | Thr | Leu | Ala | Asp | Ser | |
305 | 310 | 315 | ||||||||||||||
TGC | AGC | GCC | ATC | CAG | CCA | TTG | ATT | GTC | GGT | GAT | AAC | AGC | CGT | GCG | TTA | 2149 |
Cys | Ser | Ala | Ile | Gin | Pro | Leu | Ile | Val | Gly | Asp | Asn | Ser | Arg | Ala | Leu | |
320 | 325 | 330 | ||||||||||||||
CAA | CTG | GCA | GAA | AAA | CTG | CGT | CAG | CAA | GGC | TGC | TGG | GTC | ACG | GCG | ATT | 2197 |
Gin | Leu | Ala | Glu | Lys | Leu | Arg | Gin | Gin | Gly | Cys | Trp | Val | Thr | Ala | Ile | |
335 | 340 | 345 | ||||||||||||||
CGC | CCG | CCA | ACC | GTA | CCC | GCT | GGT | ACT | GCG | CGA | CTG | CGC | TTA | ACG | CTA | 2245 |
Arg | Pro | Pro | Thr | Val | Pro | Ala | Gly | Thr | Ala | Arg | Leu | Arg | Leu | Thr | Leu | |
350 | 35S | 360 | ||||||||||||||
ACC | GCT | GCG | CAT | GAA | ATG | CAG | GAT | ATC | GAC | CGT | CTG | CTG | GAG | GTG | CTG | 2293 |
Thr | Ala | Ala | H1s | Glu | Met | Gin | Asp | Ile | Asp | Arg | Leu | Leu | Glu | Val | Leu |
365 370 375 380
CAT GGC AAC GGT TAATAAACAA GCCATTGCAG CGGCATTTGG TCGGGCAGCC2345
His Gly Asn Gly
385
GCACACTATG AGCAACATGC AGATCTACAG CGOCAGAGTG CTGACGCCTT ACTGGCAATG2405
CTTCCACAGC GTAAATACAC CCACGTACTG GACGCGGGTT GTGGACCTGG CTGGATGAGC2465
CGCCACTGGC GGGAACGTCA CGCGCAGGTG ACGGCCTTAG ATCTC7CGCC GCCAATGCTT2525
GTTCAGGCAC GOCAGAAGGA TGCCGCAGAC CATTATCTGG CGGGAGATAT CGAATCCCTG2585
CCGTTAGCGA CTGCGACGTT CGATCTTGCA TGGAGCAATC TCGCAGTGCA GTGGTGCGGT2645
-40CZ 285533 B6
AATΓTAT CCA CGGCACTCCG CGAGCTGTAT CGGGTGGTGC GCCCCAAAGG CG1GGTCGCG2705
TTTACCACGC TGGTGCAGGG ATCGTTAQCC GAACTGCATC AGGCGTGGCA GGCGGTGGAC2765
GAGCGTCCGC ATGCTAATCG ClHTTACCG CCAGATGAAA TCGAACAGTC GCTGAACGGC2825
GTGCATTATC AACATCATAT TCAGCCCATC ACGCTGTGGT TTGATGATGC GCTCAGTGCC2885
ATGCOTTCGC TGAAAGGCAT CGGTGCCACG CATCTTCATG AAGGGCGCGA CCCGCGAATA2945 ttaacgcgtt cgcagttqca gcgattgcaa ctggcctggc cgcaacacca ggggcgatat3005
CCTCTGACGT ATCATCTTTT TTTO3GAGTG ATTGCTC GTG AGT ΑΑΑ CGT TAT TTT 3060
Val Ser Lys Arg Tyr Pbe
GTC | ACC | GGA | ACG | GAT | ACC | GAA | GTG | GGG | AAA | ACT | GTC | GCC | AGT | TGT | GCA | 3108 |
Val | Thr | Gly | Thr | Asp | Thr | Glu | Val | Gly | Ly» | Thr | Val | Ala | Ser | Cys | Ala | |
W | 15 | 20 | ||||||||||||||
CTT | TTA | CAA | GCC | GCA | AAG | GCA | GCA | GGC | TAC | CGG | ACG | GCA | GGT | TAT | AAA | 3156 |
Leu | Leu | Gin | Ala | Ala | Lys | Ala | Ala | Gly | Tyr | Arg | Thr | Ala | Gly | Tyr | Lys | |
25 | 30 | 35 | ||||||||||||||
CCG | GTC | GCC | TCT | GGC | AGC | GAA | AAG | ACC | CCG | GAA | GGT | TTA | CGC | AAT | AGC | 3204 |
Pro | Val | Ala | Ser | Gly | Ser | Glu | Lys | Thr | Pro | Glu | Gly | Leu | Arg | Asn | Ser | |
40 | 45 | 50 | ||||||||||||||
GAC | GCG | CTG | GCG | TTA | CAG | CGC | AAC | AGC | AGC | CTG | CAG | CTG | GAT | TAC | GCA | 3252 |
Asp | Ala | Leu | Ala | Leu | Gin | Arg | Asn | Ser | Ser | Leu | Gin | Leu | Asp | Tyr | Ala | |
55 | 60 | 65 | 70 | |||||||||||||
ACA | OTA | AAT | CCT | TAC | ACC | TTC | GCA | GAA | CCC | ACT | TCG | CCG | CAC | ATC | ATC | 3300 |
Thr | Val | Asn | Pro | Tyr | Thr | Phe | Ala | Glu | Pro | Thr | Ser | Pro | His | Ile | Ile | |
75 | 80 | 85 | ||||||||||||||
AGC | GCG | CAA | GAG | GGC | AGA | CCG | ATA | GAA | TCA | TTG | GTA | ATG | AGC | GCC | GGA | 3348 |
Ser | Ala | Gin | Glu | Gly | Arg | Pro | Ile | Glu | Ser | Leu | Val | Met | Ser | Ala | Gly | |
90 | 95 | 100 | ||||||||||||||
TTA | CGC | GCG | CTT | GAA | CAA | CAG | GCT | GAC | TGG | GTG | TTA | GTG | GAA | GGT | GCT | 3396 |
Leu | Arg | Ala | Leu | Glu | Gin | Gin | Ala | Asp | Trp | Val | Leu | Val | Glu | Gly | A1a | |
105 | 110 | 115 | ||||||||||||||
GGC | GGC | TGG | TTT | ACG | CCG | CTT | TCT | GAC | ACT | TTC | ACT | TTT | GCA | GAT | TGG | 3444 |
Gly | Cly-Trp | Phe | Thr | Pro | Leu | Ser | Asp | Thr | Phe | Thr | Phe | Ala | Asp | Trp | ||
120 | 125 | 130 |
OTA ACA CAG GAA CAA CTG CCG GTG ATA CTG GTA GTT GGT GTG AAA CTC3492
Val Thr Gin Glu Gin Leu Pro Val Ile Leu Va1 Val Gly Val Lys Leu
135 140 145150
GGC 1GT ATT AAT CAC GCG ATG TTG ACT GCA CAG GTA ATA CAA CAC GCC3540
Gly Cys Ile Asn His Ala Met Leu Thr Ala Gin Val Ile Gin His Ala
155 160165
GGA CTG ACT CTG GCG GGT TGG GTG GCG AAC GAT GTT ACG CCT CCG GGA3588
Gly Leu Thr Leu Ala Gly Trp Val Ala Asn Asp Val Thr Pro Pro Gly
170 175100
AAA CGT CAC GCT GAA TAT ATG ADC ACG CTC ACC CGC ATG ATT CCC GCG3636
Lys Arg His Ala Glu Tyr Mat Thr Thr Leu Thr Arg Met Ile Pro Ala
1B5 190195
-41CZ 285533 B6
CCG CTG CÍG GGA GAG ATC CCC TGG CTT GCA GAA AAT CCA GAA AAT GCG3684
Pro Leu Leu Gly Glu 11« Pro Trp Leu Ala Glu Asn Pro Glu AsnAla
200 205210
GCA ACC GGA AAG TAC ATA AAC CTT GCC TTC GTC GAC GCG TCG ACT CTA3732
Ala Thr Gly Lys Tyr 11« Asn Leu Ala Phe Val Asp Ala Ser ThrLeu
215 220 225230
GGG TTT ACA AGT CGA TTA TGACAACGGA CGATCTTGCC TTTGACCAAC3780
Gly Phe Thr Ser Arg Leu
235
GCCATATCTG GCACCCATAC ACATCCATGA CCTCCCCTCT GCCGGTTTAT CCGGTGGTGA3840
GCGCCGAAGG TTGCGAGCTG ATTTTGTCTG ACGGCAGACG CCTGGTTGAC GGTATGTCGT3900
CCTQGTGGGC GGCGATCCAC GGCTACAATC ACCCGCAGCT TAATGCGGCG ATGAAGTCGC3960
AAATTGATGC CATGTCGCAT GIGAIGITTG GCGGTATCAC CCATGCGCCA GCCATTGAGC4020
TGTGCCGCAA ACTGGTGGCG ATGACGCCGC AACCGCTGGA GTGCGTTTTT CTCGCGGACT4080
CCGGTTCCGT AGCGGTGGAA GTGGCGATGA AAATGGCGTT GCAGTACTGG CAAGCCAAAG4140
GCGAAGCGOG CCAGCGTTTT CTG*CCn<X GCAATGGTTA TCATGGCGAT ACCTTTGGCG4200
CGATGTCGGT GTGCGATCCG GATAACTCAA TGCACAGTCT GTGGAAAGGC TACCTGCCAG4260
AAAACCTGTT TGCTCCCGCC CCGCAAAGCC GCATGGATGG CGAATGGGAT GAGCGCGAIA4320
TGGTGGGCTT TGCCCGCCTG ATGGCGGCGC ATCGTCATGA AATCGCGGCG GTGATCAT1G4380
AGCCGATTGT CCAGGGCSCA GGCGGGATGC GCATGTACCA TCCGGAATGG TTAAAACGAA4440
TCCGCAAAAT ATGCGATCGC GAAGGTATCT TGCTGATTGC CGACGAGATC GCCACTGGAT4500
TTGGTCGTAC CGGGAAACTG TTTGCCIGTG AACATGCAGA AATCGCGCCG GACATTTTGT4S60
GCCTCGGTAA AGCCTTAACC CGCGGCACAA TGACCCTTTC CGCCACACTC ACCACGCGCG4620
AGGTTGCAGA AACCATCAGT AACGGTGAAG CCGGTTGCTT TATGCATGGG CCAACTTTTA4680
TGGGCAATCC GCTGGCCTGC GCGGCAGCAA ACGCCAGCCT GGCGATTCTC GAATC1GGCG4740
ACTGGCAGCA ACAGGTGGCG GATATTGAAG TACAGCTCCG CGAGCAACTT GCCCCCGCCC4800
GTGATGCCGA AATGGTTGOC GATGTQCGCG TACTGGQGGC CATTGGCGTG GTCGAAACCA4860
CTCATCOGGT GAATATGGCG GCGCTGCAM AATTCTTTGT CGAACAGGGF GTCTGGATCC4920
GGCCTTTTGG CAAACTGATT TACCTGATGC CGCCCTATAT TATTCTCCOG CAACAGTTGC4980
AGCGTCTGAC CGCAGCGGTT AACCGCGCGG TACAGGATGA AACATTTTTT TGCCAATAAC5040
GAGAAGTCCG CGTGAGGGTT TCTGGCTACA CTTTCTGCAA ACAAGAMGG AGGGTTCATG5100
AAACTCATCA GTAACGATCT GCGCGATGGC GATAAATTGC CGCATCGTCA TGTCTTTAAC5160
GGCATGGGTT ACGATGGCGA TMTATTTCA CCGCATCTGG CGTGGGATGA TGTTCCTGCG5220
GGAACGAAAA GTTTTGTTGT CACCTGCTAC GACCCGGATG CGCCAACCQG CTCCGGCTGG5Ž80
TGGCACTGGG TAGTTGTTAA CTTACCCGCT GATACCCGCG TATTACCGCA AGGGTTTGGC5340
-42CZ 285533 B6
TCTGGTCTGG TAGCAATGCC AGACGGCGTT TTGCAGACGC GTACCGACTT TGGTAAAACC
GGGTACGATG GCGCAGCACC GCCGAAAGGC GAAACTCA1C GCTACATTTT TACCGTTCAC
GCGCTGGATA TAGAACGTAT TGATGTCGAT GAAGGTGCCA GCGGCGCGAT GGTCGGGTFT
AACGTTCATT TCCACTCTCT GGCAAGCGCC TCGATTACTG CGATGTTTAG TTAATCACTC
IGCCAGATGG CGCAATGCCA TCTGGTATCA CTTAAAGGTA TTAAAAACAA CTTTTTG1CT
TTTTACCTTC CCGÍTTCGCT CAAGFFAGTA TAAAAAAGCA GGCTTCAACG GATTCAHTT
TCTATTTCAT AGCCCGGAGC AACCTGIGAA CACATTTTCA GTTTCCCGTC TGGCGCTGGC
ATTGGCTTTT GGCGTGAOGC TGAOCGCCTG TAGCTCAACC CCGCCCGATC AACGTCCT1C
TGATCAAACC GCGCCTGGTA CCGAGCTCGA ATTCCTGCAG GCATGCAAGC TT (2) INFORMACE K SEK ID Č.: 7:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 384 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární ío (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID Č.: 7:
5400
5460
5520
5500
5640
5700
5760
5820
5872
Met | Ser | Trp | Gin | Glu | Lys | 11· | Asn | Ala | Ala | Leu | Asp | AU | Arg | Arg | AU |
1 | 5 | 10 | 15 | ||||||||||||
Ala | Asp | Ala | Leu | Arg | Arg | Arg | Tyr | Pro | Val | Ala | Gin | Gly | Ala | G1y | Arg |
20 | 25 | 30 | |||||||||||||
Trp | Leu | Val | Ala | Asp | Asp | Arg | Gln | Tyr | Leu | Asn | Phe | Ser | Ser | Asn | Asp |
35 | 40 | 45 | |||||||||||||
Tyr | Leu | Gly | Leu | Ser | His | HIS | Pro | Gin | Ile | Ile | Arg | Ala | Trp | Gin | Gin |
50 | 55 | 60 | |||||||||||||
Gly | Ala | Glu | Gin | Phe | Gly | Ile | Gly | Ser | Gly | Gly | Ser | Gly | His | Val | Ser |
65 | 70 | 75 | 80 | ||||||||||||
Gly | Tyr | Ser | Val | Val | His | Gin | Ala | Leu | Glu | Glu | Glu | Leu | Ala | Glu | Trp |
85 | 90 | 95 | |||||||||||||
Leu | Gly | Tyr | Ser | Arg | Ala | Leu | Leu | Phe | Ile | Ser | Gly | Kw | AU | AU | Asn |
100 | 105 | 110 | |||||||||||||
Gin | Ala | Val | Ile | Ala | Ala | Met | Met | Ala | Lys | Glu | Asp | Arg | IU | Ala | Ala |
115 | 120 | 125 |
-43CZ 285533 B6
Asp | Arg | Leu | Ser | His | Ala | Ser | Leu | Leu | Glu | Ala | Ala | Ser | Leu | Ser | Pro |
130 | 135 | 140 | |||||||||||||
Ser | Gin | Leu | Arg | Arg | Phe | Ala | His | Asn | Asp | Val | Thr | His | Leu. | .Ala | Arg |
145 | 150 | 155 | 160 | ||||||||||||
Leu | Leu | Ala | Ser | Pro | Cys | Pro | Gly | Gin | Gin | Met | Val | Val | Thr | Glu | Gly |
165 | 170 | 175 | |||||||||||||
Val | Phe | Ser | Met | Asp | Gly | Asp | Ser | Ala | Pro | Leu | Ala | Glu | Ile | Gin | Gin |
180 | 185 | 190 | ||||||||||||
Val | Thr | Gin Gin | His | Asn | Gly | Trp | Leu | Met | Val | Asp | Asp | Ala | His | Gly |
195 | 200 | 205 | ||||||||||||
Thr | Gly | Val Ile | Gly | Glu | Gin | Gly | Arg | Gly | Ser | Cys | Trp | Leu | Gin | Lys |
210 | 215 | 220 | ||||||||||||
Val | lys | Pro Glu | Leu | Leu | Val | Val | Thr | Phe | Gly | Lys | Gly | Phe | Gly | Val |
225 | 230 | 235 | 240 | |||||||||||
Ser | Gly | A1a Ala | Val | Leu | Cys | Ser | Ser | Thr | Val | Ala | Asp | Tyr | Leu | Leu |
245 | 250 | 255 | ||||||||||||
Gin | Phe | Ala Arg | His | Leu | Ile | Tyr | Ser | Thr | Ser | Met | Pro | Pro | Ala | Gin |
260 | 265 | 270 | ||||||||||||
Ala | Gin | Ala Leu | Arg | Ala | Ser | Leu | Ala | Val | Ile | Arg | Ser | Asp | Glu | Gly |
275 | 280 | 285 | ||||||||||||
Asp | Ala | Arg Arg | Glu | Lys | Leu | Ala | Ala | Leu | Ile | Thr | Arg | Phe | Arg | Ala |
290 | 295 | 300 | ||||||||||||
Gly | Va) | Gin Asp | Leu | Pro | Phe | Thr | Leu | Ala | Asp | Ser | Cys | Ser | Ala | Ile |
305 | 310 | 315 | 320 | |||||||||||
Gin | Pro | Leu 1le | Val | Gly | Asp | Asn | Ser | Arg | Ala | Leu | Gin | Leu | Ala | Glu |
325 | 330 | 335 | ||||||||||||
Lys | Leu | Arg Gin | Gin | Gly | CyS | Trp | VaT | Thr | Ala | Ile | Arg | Pro | Pro | Thr |
340 | 345 | 350 | ||||||||||||
Val | Pro | Ala Gly | Thr | Ala | Arg | Leu | Arg | Leu | Thr | Leu | Thr | Ala | Ala | His |
3S5 | 360 | 365 | ||||||||||||
Glu | Met | Gin Asp | Í1e | Asp | Arg | Leu | Leu | Glu | Val | Leu | His | Gly | Asn | Gly |
380
370
375 (2) INFORMACE K SEK ID C.: 8:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 236 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID C.: 8:
-44CZ 285533 B6
Val Ser Lys Arg Tyr Phe Val Thr Gly Thr Asp Thr Glu Val Gly Lys 15 10 15
Thr | Val | Ala | Ser | Cys | Ala | Leu | Leu | Gin | Ala | A1a | Lys | Ala | Ala | Gly | Tyr |
20 | 25 | 30 | |||||||||||||
Arg | Thr | Ala | Gly | Tyr | Ly» | Pro | Val | Ala | Ser | Gly | Ser | Glu | Lys | Thr | Pro |
35 | 40 | 45 | |||||||||||||
Glu | Gly | Leu | Arg | Asn | Ser | Asp | Ala | Leu | Ala | Leu | Gin | Arg | Asn | Ser | Ser |
SQ | 55 | 60 | |||||||||||||
Leu | Gin | Leu | Asp | Tyr | Ala | Thr | Val | Asn | Pro | Tyr | Thr | ΡΙ» | Ala | Glu | Pro |
65 | 70 | 75 | 80 | ||||||||||||
Ihr | Ser | Pro | H1S | Ile | Ile | Ser | Ala | Gin | Glu | Gly | Arg | Pro | Ile | Glu | Ser |
85 | 90 | 95 | |||||||||||||
Leu | Val | Met | Ser | Ala | Gly | Leu | Arg | Ala | Leu | Glu | Gin | Gin | Ala | Asp | Trp |
100 | 105 | no | |||||||||||||
Val | Leu | Val | Glu | Gly | Ala | Gly | Gly | Trp | Phe | Thr | Pro | Leu | Ser | Asp | Thr |
115 | 120 | 125 | |||||||||||||
Phe | Thr | Phe | Ala | Asp | Trp | Val | Thr | Gin | Glu | Gin | Leu | Pro | Val | Ile | Leu |
130 | 135 | 140 | |||||||||||||
Val | Val | Gly | val | Lys | Leu | Gly | Cys | Ile | Asn | His | Ala | Met | Lev | Thr | Ala |
145 | 150 | 155 | 150 | ||||||||||||
Gin | Val | [le | Gin | His | Ala | Gly | Leu | Thr | Leu | Ala | Gly | Trp | Val | Ala | Asn |
165 | 170 | 175 | |||||||||||||
Asp | Val | Thr | Pro | Pro | Gly | Ly» | Arg | His | Ala | Glu | Tyr | Met | Thr | Thr | Leu |
180 | 185 | 190 | |||||||||||||
Thr | Arg | Met | Ile | Pro | Ala | Pro | Leu | Leu | Gly | Glu | Ile | Pro | Trp | Leu | Ala |
195 | 200 | 205 | |||||||||||||
Glu | Asn | Pro | Glu | Asn | Ala | Ala | Thr | Gly | Lys | Tyr | Ile | Asn | Leu | Ala | Phe |
210 | 215 | 220 | |||||||||||||
Val | Asp | Ala | Ser | Thr | Leu | Gly | Phe | Thr | Ser | Arg | Leu | ||||
225 | 230 | 235 |
(2) INFORMACE K SEK ID Č.: 9:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 143 párů baží (B) DRUH: molekulová kyselina (C) FORMA VLÁKNA: dvojitá (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: DNA (genomicky) (iii) HYPOTETICKY: NE
-45CZ 285533 B6 (iii) NESMYSL (antisense): NE (vi) PRVOTNÍ PŮVOD:
(A) ORGANIZMUS: Escherichia coli (vii) BEZPROSTŘEDNÍ PŮVOD:
(B) KLON: pBO30 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 1..24 (D) JINÉ ÚDAJE: /parciální /EC_číslo= 6.3.3.3. /produkt= „dethiobiotin synthasa“ /gen= „bioD“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 120..143 (D) JINÉ ÚDAJE: /parciální /kodon_start= 120 /EC číslo= 2.6.1.62 /produkt= „DAPA synthasa“ /gen= „bioA“ /pseudo (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 111..122 (D) JINÉ ÚDAJE: /standardní_jméno= „bioA RBS“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: smyčka (stem_loop) (B) POLOHA: 38..85 (x) INFORMACE O ZVEŘEJNĚNÍ:
(H) ČÍSLO DOKUMENTU: WO 87/01391 Bl (I) DATUM PŘIHLÁŠENÍ: 26-AUG-1986 (J) DATUM ZVEŘEJNĚNÍ: 07-APR-1993 (xi) POPIS SEKVENCE: SEK ID Č.: 9:
TAC ATA AAC CTT GCC TTG TTG TAGCCATTCT GTATTTGGTT AAATTGCGAG51
Tyr 11® Asn Leu Ala Leu Leu
CGAGATCGCG TCTTCGATTG ACTGCAATTT AACCCTCTAG AGTCGACTCT AGGGTTTACA 111
AGTCGATT ATG ACA ACG GAC GAT CTT GCC TTT143
Met Thr Thr Asp Asp Leu Ala Phe
-46CZ 285533 B6 (2) INFORMACE K SEK ID Č.: 10:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 8 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID Č.: 10:
Tyr Ile Asn Leu Ala Leu Leu
5 (2) INFORMACE K SEK ID Č.: 11 :
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID Č.: 11:
Met Thr Thr Asp Asp Leu Ala Phe 1 5 (2) INFORMACE K SEK ID Č.: 12:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 93 párů baží (B) DRUH: nukleová kyselina (C) FORMA VLÁKNA: dvojitá (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: DNA (genomicky) (iii) HYPOTETICKY: NE (iii) NESMYSL (antisense): NE (vi) PRVOTNÍ PŮVOD:
(A) ORGANIZMUS: Escherichia coli (vii) BEZPROSTŘEDNÍ PŮVOD:
(B) KLON: pBO30A-9 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 1..24 (D) JINÉ ÚDAJE: /parciální /kodon_start= 1 /EC_číslo= 6.3.3.3.
-47CZ 285533 B6 /produkt= „DTB synthasa“ /gen= „bioD“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 70..93 (D) JINÉ ÚDAJE: /parciální /kodon_start= 70
ZEC_číslo= 2.6.1.62 /produkt= „DAPA synthasa“ /gen= „bioA“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 61..72 (D) JINÉ ÚDAJE: /standardníjméno= „bioA RBS“ (x) INFORMACE O ZVEŘEJNĚNÍ:
(H) ČÍSLO DOKUMENTU: WO 87/01391 Bl (I) DATUM PŘIHLÁŠENÍ: 26-AUG-1986 (J) DATUM ZVEŘEJNĚNÍ: 07-APR-1993 (xi) POPIS SEKVENCE: SEK ID Č.: 12:
TAC ATA AAC CTT GCC TTG TTG TAGCCATTCT GTATTTGGTT CGTCGACTCT51
Tyr Ile Asn Leu Ala Leu Leu
AGGGTTTACA AGTCGATT ATG ACA ACG GAC GAT CTT GCC TTT93
Het Thr Thr Asp Asp Leu Ala Phe (2) INFORMACE K SEK ID Č.: 13:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 8 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID Č.: 13:
Tyr Ile Asn Leu Ala Leu Leu
5 (2) INFORMACE K SEK ID Č.: 14:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 7 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární
-48CZ 285533 B6 (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID Č.: 14:
Met Thr Thr Asp Asp Leu Ala Phe 1 5 (2) INFORMACE K SEK ID Č.: 15:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 77 párů baží (B) DRUH: nukleová kyselina (C) FORMA VLÁKNA: dvojitá (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: DNA (genomicky) (iii) HYPOTETICKY: NE (iii) NESMYSL (antisense): NE (vi) PRVOTNÍ PŮVOD:
(A) ORGANIZMUS: Escherichia coli (vii) BEZPROSTŘEDNÍ PŮVOD:
(B) KLON: pBO30A-15 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 1..57 (D) JINÉ ÚDAJE: /parciální /kodon_start= 1 /funkce= „změněný 3-konec“ /EC_číslo= 6.3.3.3.
/produkt= „DTB synthasa“ /gen= „bioD“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: CDS (B) POLOHA: 54..77 (D) JINÉ ÚDAJE: /parciální /kodon_start= 54 /EC_číslo= 2.6.1.62 /produkt= „DAPA synthasa“ /gen= „bioA“ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 45..56 (D) JINÉ ÚDAJE: /standardní_jméno= „bioA RBS“ (x) INFORMACE O ZVEŘEJNĚNÍ:
(H) ČÍSLO DOKUMENTU: WO 87/01391 Bl
-49CZ 285533 B6 (I) DATUM PŘIHLÁŠENÍ: 26-AUG-1986 (J) DATUM ZVEŘEJNĚNÍ: 07-APR-1993 (xi) POPIS SEKVENCE: SEK ID Č.: 15:
TAC ATA AAC CFT GCC TTC GTC GAC GCG TCG ACT CTA GGG TTT ACA AGT Tyr Ile Asn Leu Ala Phe Val Asp Ala Ser Thr Leu Gly Phe Thr Ser 1 5 10 1$
CGA TTA TGACAACGGA CGATCTTGCC TTT
Arg Leu (2) INFORMACE K SEK ID Č.: 16:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 18 aminokyselin (B) DRUH: aminokyselina (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: protein (xi) POPIS SEKVENCE: SEK ID Č.: 16:
Tyr Ile Asn Leu Ala Phe Val Asp Ala Ser Thr Leu Gly Phe Thr Ser 1 5 10 |5
Arg Leu (2) INFORMACE K SEK ID Č.: 17:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 125 párů baží (B) DRUH: nukleová kyselina (C) FORMA VLÁKNA: dvojitá (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: DNA (genomicky) (iii) HYPOTETICKY: NE (iii) NESMYSL (antisense): NE (vi) PRVOTNÍ PŮVOD:
(A) ORGANIZMUS: Esycherichia coli (vii) BEZPROSTŘEDNÍ PŮVOD:
(B) KLON: pBO30A-15/985E (ix) ZNAKY:
(A) JMÉNO/KLÍČ: -10_signal (B) POLOHA: 45..49 (D) JINÉ ÚDAJE: /standardní_jméno= „promotor ptač“
4S
-50CZ 285533 B6 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: promotor (B) POLOHA: 1..96 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /funkce= „promotor ptač“ /evidence= EXPERIMENTÁLNĚ (x) INFORMACE O ZVEŘEJNĚNÍ:
(H) ČÍSLO DOKUMENTU: WO 87/01391 B1 (I) DATUM PŘIHLÁŠENÍ: 26-AUG-1986 (J) DATUM ZVEŘEJNĚNÍ: 07-APR-1993 (xi) POPIS SEKVENCE: SEK ID Č.: 17:
AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTCA
7GGCT
120
125 (2) INFORMACE K SEK ID Č.: 18:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 126 párů baží (B) DRUH: nukleová kyselina (C) FORMA VLÁKNA: dvojitá (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: DNA (genomicky) (iii) HYPOTETICKY: NE (iii) NESMYSL (antisense): NE (vi) PRVOTNÍ PŮVOD:
(A) ORGANIZMUS: Escherichia coli (vii) BEZPROSTŘEDNÍ PŮVOD:
(B) KLON: pBO30A-15/16 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: promotor (B) POLOHA: 1„96 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /funkce= „promotor ptač“ /evidence= EXPERIMENTÁLNĚ (ix) ZNAKY:
(A) JMÉNO/KLÍČ: RBS (B) POLOHA: 105..123 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně
-51CZ 285533 B6 (D) JINÉ ÚDAJE: /evidence= EXPERIMENTÁLNĚ /standardní_jméno= „bioB RBS č. 16“ (x) INFORMACE O ZVEŘEJNĚNÍ:
(H) ČÍSLO DOKUMENTU: WO 87/01391 B1 (I) JMÉNO PŘIHLÁŠENÍ: 26-AUG-1986 (J) DATUM ZVEŘEJNĚNÍ: 07-APR-1993 (xi) POPIS SEKVENCE: SEK ID Č.: 18:
AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTICA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTrACTAGTO ATGGCT (2) INFORMACE K SEK ID Č.: 19:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 122 párů baží (B) DRUH: nukleová kyselina (C) FORMA VLÁKNA: dvojitá (D) TOPOLOGIE: lineární (ii) DRUH MOLEKULY: DNA (genomicky) (iii) HYPOTETICKY: NE (iii) NESMYSL (antisense): NE (vi) PRVOTNÍ PŮVOD:
(A) ORGANIZMUS: Escherichia coli (vii) BEZPROSTŘEDNÍ PŮVOD:
(B) KLON: pBO30A-15/9 (ix) ZNAKY:
(A) JMÉNO/KLÍČ: promotor (B) POLOHA: 1..96 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /funkce= „promotor ptač“ /evidence= EXPERIMENTÁLNĚ (ix) ZNAKY:
(A) DÉLKA/KLÍČ: RBS (B) POLOHA: J05.. 119 (C) DRUH ZJIŠŤOVÁNÍ: experimentálně (D) JINÉ ÚDAJE: /evidence= EXPERIMENTÁLNĚ /standardní_jméno= „bioB RBS č. 9“ (x) INFORMACE O ZVEŘEJNĚNÍ:
(H) ČÍSLO DOKUMENTU: WO 87/01391 B1 (I) DATUM PŘIHLÁŠENÍ: 26-AUG-1986
120
126
-52CZ 285533 B6 (J) DATUM ZVEŘEJNĚNÍ: 07-APR-1993 (xi) POPIS SEKVENCE ID Č.: 19:
AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT 60
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTCATGG 120
Claims (20)
- PATENTOVÉ NÁROKY1. DNA-fragment obsahující geny pro biosynthesu biotinu bioB, bioF, bioC. bioD a bioA z enterobakterií, přičemž jde o geny bioB, bioF, bioC, bioD a bioA ze skupiny rodů Escherichia, Salmonella a Citrobacter uspořádané v jedné transkripční jednotce pod jedním společným promotorem.
- 2. DNA-fragment podle nároku 1 vybraný z druhu Escherichia coli.
- 3. DNA-fragment podle nároku 1 nebo 2, ve kterém je společný promotor tac-promotor.
- 4. DNA-fragment podle jednoho z nároků 1 až 3, ve kterém genověregulační prvek transkripční jednotky v přímém spojení s bioB-genem zahrnuje sekvenci:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTTGTAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC
- 5. DNA-fragment podle jednoho z nároků 1 až 3, ve kterém genověregulační prvek transkripční jednotky v přímém spojení s bioB-genem zahrnuje sekvenci:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
- 6. DNA-fragment podle jednoho z nároků 1 až 3, ve kterém genověregulační prvek transkripční jednotky v přímé spojení s bioB-genem zahrnuje sekvenci:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTTGTAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
- 7. DNA-fragment podle jednoho z nároků 1 až 6, ve kterém odstup mezi po sobě následujícími geny bioD a bioA v transkripční jednotce není větší než 50 bp.
- 8. DNA-fragment podle jednoho z nároků 1 až 7, ve kterém jsou geny bioD a bioA uspořádány tak, že 3'-konec bioD-genu zahrnuje vazebné místo ribosomů pro bioA-gen.-53CZ 285533 B6
- 9. Plazmid pBO30A-15/9, obsahující DNA-fragment podle nároku 1, jak je uložen v E. coli XLl-Blue nebo E. coli BM4062 pod depozitními čísly DSM 7246 nebo DSM 7247.
- 10. Plazmid pBO30A-15/9, obsahující DNA-fragment podle nároku 1, jak je uložen v E. coli ED8767 pod depozitním číslem DSM 8554.
- 11. Plazmid pBO47, obsahující DNA-fragment podle nároku 1, jak je uložen v Agrobacterium/Rhizobium sp. HK4 pod depozitním číslem DSM 8555.
- 12. E. coli XLl-Blue produkující biotin a obsahující plazmid pBO30A-15/9 uložený pod depozitním číslem DSM 7246.
- 13. E. coli BM4062 produkující biotin a obsahující plazmid pBO30A-15/9 uložený pod depozitním číslem DSM 7247.
- 14. E. coli ED8767 produkující biotin a obsahující plazmid pBO30A-15/9 uložený pod depozitním číslem DSM 8554.
- 15. Agrobacterium/Rhizobium sp. HK4 produkující biotin a obsahující plazmid pBO47, uložený pod depozitním číslem DSM 8555.
- 16. Způsob biotechnologické synthesy biotinu, vyznačující se tím, že se látkové přeměnitelný zdroj uhlíku fermentuje pomocí mikroorganizmu podle jednoho z nároků 12 až 15 na biotin.
- 17. Způsob výroby biotinu, vyznačující se tím, že zahrnuje přeměnu dethiobiotinu na biotin v bezbuněčném systému pomocí biotinsynthasy, přičemž se přeměna provádí v přítomnosti thiaminpyrofosfátu, NADPH, S-adenosylmethioninu, Fe2+-iontů, cysteinu a alespoň jedné další aminokyseliny ze skupiny asparagin, kyselina asparagová, glutamin a serin za použití DNA-fragmentu obsahujícího gen pro biosynthesu biotinu bioB.
- 18. Způsob podle nároku 17, vyznačující se tím, že se přeměna provádí v přítomnosti flavodoxinu a ferredoxin(flavodoxin)-NADP+-reduktasy.
- 19. Způsob podle jednoho z nároků 17 nebo 18, vyznačující se tím, že se přeměna provádí v přítomnosti proteinové frakce, která se získá precipitací síranem amonným při 45%ním nasycení buněčného extraktu z Escherichia coli.
- 20. Proteinová frakce s biotinsynthasovým stimulačním účinkem, připravitelná precipitací síranem amonným při 45%ním nasycení buněčného extraktu z Escherichia coli.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CH312492 | 1992-10-02 | ||
CH213493 | 1993-07-15 | ||
PCT/EP1993/002688 WO1994008023A2 (de) | 1992-10-02 | 1993-10-01 | Biotechnologisches verfahren zur herstellung von biotin |
Publications (2)
Publication Number | Publication Date |
---|---|
CZ80995A3 CZ80995A3 (en) | 1995-09-13 |
CZ285533B6 true CZ285533B6 (cs) | 1999-08-11 |
Family
ID=25689605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CZ95809A CZ285533B6 (cs) | 1992-10-02 | 1993-10-01 | DNA-fragmenty, plasmidy a mikroorganismy obsahující tyto DNA-fragmenty a plasmidy a způsob biotechnologické výroby biotinu |
Country Status (16)
Country | Link |
---|---|
US (1) | US6083712A (cs) |
EP (2) | EP0667909B1 (cs) |
JP (2) | JP3566287B2 (cs) |
KR (1) | KR100200542B1 (cs) |
AT (1) | ATE163198T1 (cs) |
AU (1) | AU4820293A (cs) |
CA (1) | CA2145400C (cs) |
CZ (1) | CZ285533B6 (cs) |
DE (1) | DE59308149D1 (cs) |
DK (1) | DK0667909T3 (cs) |
ES (1) | ES2112995T3 (cs) |
FI (1) | FI117515B (cs) |
HU (1) | HU219827B (cs) |
PL (2) | PL177635B1 (cs) |
SK (1) | SK279669B6 (cs) |
WO (1) | WO1994008023A2 (cs) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5859335A (en) * | 1994-12-08 | 1999-01-12 | Novartis Finance Corporation | Enhanced biotin biosynthesis in plant tissue |
US5869719A (en) * | 1995-03-08 | 1999-02-09 | Novartis Finance Corporation | Transgenic plants having increased biotin content |
WO1997016560A1 (en) * | 1995-11-02 | 1997-05-09 | Takeda Chemical Industries, Ltd. | Microorganism resistant to threonine analogue and production of biotin |
ES2201219T3 (es) | 1996-05-06 | 2004-03-16 | F. Hoffmann-La Roche Ag | Produccion fermentativa de biotina. |
DE69731451T2 (de) | 1996-09-27 | 2005-11-24 | Dsm Ip Assets B.V. | Biotin-Biosynthese-Gene II |
US6737256B2 (en) | 1997-07-14 | 2004-05-18 | Roche Vitamins Inc. | Overcoming DAPA aminotransferase bottlenecks in biotin vitamers biosynthesis |
DE19731274A1 (de) | 1997-07-22 | 1999-01-28 | Basf Ag | Verfahren zur Herstellung von Biotin |
IL135776A0 (en) * | 1997-10-24 | 2001-05-20 | Life Technologies Inc | Recombinational cloning using nucleic acids having recombination sites |
CA2384496A1 (en) * | 1999-09-08 | 2001-03-15 | Xenogen Corporation | Luciferase expression cassettes and methods of use |
US6660907B2 (en) | 2000-07-10 | 2003-12-09 | Pioneer Hi-Bred International, Inc. | Genes encoding SCIP-1 orthologs and methods of use |
US7198924B2 (en) | 2000-12-11 | 2007-04-03 | Invitrogen Corporation | Methods and compositions for synthesis of nucleic acid molecules using multiple recognition sites |
WO2002090596A1 (en) * | 2001-05-07 | 2002-11-14 | Paradigm Genetics, Inc. | Methods for the identification of inhibitors of biotim synthase expression or activity in plants |
WO2005054438A2 (en) | 2003-12-01 | 2005-06-16 | Invitrogen Corporation | Nucleic acid molecules containing recombination sites and methods of using the same |
AU2009224600A1 (en) * | 2008-03-14 | 2009-09-17 | Merck Serono S.A. | Variation of recombinant expression titres by optimising bacterial ribosome binding sites |
GB0920775D0 (en) * | 2009-11-26 | 2010-01-13 | King S College | Cells |
EP3488006B1 (en) | 2016-07-25 | 2023-06-07 | INVISTA Textiles (U.K.) Limited | Materials and methods utilizing biotin producing mutant hosts for the production of 7-carbon chemicals |
KR20230070943A (ko) * | 2021-11-15 | 2023-05-23 | 씨제이제일제당 (주) | 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0740922B2 (ja) * | 1985-03-05 | 1995-05-10 | 株式会社資生堂 | ビオチン生産性微生物 |
US5110731A (en) * | 1985-08-26 | 1992-05-05 | Amgen, Inc. | System for biotin synthesis |
NZ217336A (en) * | 1985-08-26 | 1988-06-30 | Amgen | Production of biotin from microorganisms |
JPS62155081A (ja) * | 1985-12-27 | 1987-07-10 | Shiseido Co Ltd | 新規微生物およびそれを用いる醗酵法によるビオチンの製造法 |
AU616380B2 (en) * | 1986-09-30 | 1991-10-31 | Transgene S.A. | Cloning of the bioA, bioD, bioF, bioC, and bioH genes of Bacillus sphaericus, vectors and transformed cells and method for preparing biotin |
CA1322735C (en) * | 1987-11-07 | 1993-10-05 | Shinichiro Haze | Microorganism having low acetate forming capability, and process for production of useful substrate using same |
GB2216530B (en) * | 1988-03-22 | 1992-07-08 | Mini Agriculture & Fisheries | Genetic material for expression of biotin synthetase enzymes |
JP3006847B2 (ja) * | 1990-03-27 | 2000-02-07 | 株式会社資生堂 | 新規微生物およびそれを用いるビオチン類の製造方法 |
JPH04169180A (ja) * | 1990-11-02 | 1992-06-17 | Shiseido Co Ltd | 新規微生物及びそれを用いるビオチン活性物質の製造方法 |
JP3290473B2 (ja) * | 1991-09-13 | 2002-06-10 | 株式会社資生堂 | ビオチンオペロン |
JP3192704B2 (ja) * | 1991-10-17 | 2001-07-30 | 株式会社資生堂 | デスチオビオチンからビオチンへの変換方法 |
US5374543A (en) * | 1992-10-02 | 1994-12-20 | Amgen Inc. | Enhanced indole biosynthesis |
US5445952A (en) * | 1993-01-22 | 1995-08-29 | Basf Aktiengesellschaft | Method to produce biotin |
-
1993
- 1993-10-01 DE DE59308149T patent/DE59308149D1/de not_active Expired - Lifetime
- 1993-10-01 KR KR1019950701255A patent/KR100200542B1/ko not_active IP Right Cessation
- 1993-10-01 JP JP50871694A patent/JP3566287B2/ja not_active Expired - Fee Related
- 1993-10-01 HU HU9500951A patent/HU219827B/hu unknown
- 1993-10-01 SK SK420-95A patent/SK279669B6/sk not_active IP Right Cessation
- 1993-10-01 WO PCT/EP1993/002688 patent/WO1994008023A2/de active IP Right Grant
- 1993-10-01 PL PL93308301A patent/PL177635B1/pl unknown
- 1993-10-01 AU AU48202/93A patent/AU4820293A/en not_active Abandoned
- 1993-10-01 CZ CZ95809A patent/CZ285533B6/cs not_active IP Right Cessation
- 1993-10-01 AT AT93920855T patent/ATE163198T1/de active
- 1993-10-01 DK DK93920855T patent/DK0667909T3/da active
- 1993-10-01 EP EP93920855A patent/EP0667909B1/de not_active Expired - Lifetime
- 1993-10-01 US US08/411,768 patent/US6083712A/en not_active Expired - Lifetime
- 1993-10-01 EP EP97107803A patent/EP0798384A1/de not_active Withdrawn
- 1993-10-01 PL PL93333484A patent/PL179166B1/pl unknown
- 1993-10-01 ES ES93920855T patent/ES2112995T3/es not_active Expired - Lifetime
- 1993-10-01 CA CA002145400A patent/CA2145400C/en not_active Expired - Lifetime
-
1995
- 1995-03-31 FI FI951547A patent/FI117515B/fi not_active IP Right Cessation
-
2003
- 2003-09-04 JP JP2003312645A patent/JP3577075B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
FI117515B (fi) | 2006-11-15 |
JPH08501694A (ja) | 1996-02-27 |
HUT71781A (en) | 1996-02-28 |
CA2145400A1 (en) | 1994-04-14 |
EP0667909A1 (de) | 1995-08-23 |
PL308301A1 (en) | 1995-07-24 |
AU4820293A (en) | 1994-04-26 |
HU9500951D0 (en) | 1995-05-29 |
SK279669B6 (sk) | 1999-02-11 |
ES2112995T3 (es) | 1998-04-16 |
EP0667909B1 (de) | 1998-02-11 |
HU219827B (hu) | 2001-08-28 |
KR100200542B1 (ko) | 1999-06-15 |
JP3577075B2 (ja) | 2004-10-13 |
JP3566287B2 (ja) | 2004-09-15 |
KR950703648A (ko) | 1995-09-20 |
DE59308149D1 (de) | 1998-03-19 |
EP0798384A1 (de) | 1997-10-01 |
FI951547A0 (fi) | 1995-03-31 |
CA2145400C (en) | 2005-08-09 |
JP2004000283A (ja) | 2004-01-08 |
WO1994008023A3 (de) | 1994-06-23 |
DK0667909T3 (da) | 1998-09-23 |
PL177635B1 (pl) | 1999-12-31 |
WO1994008023A2 (de) | 1994-04-14 |
CZ80995A3 (en) | 1995-09-13 |
FI951547A (fi) | 1995-03-31 |
PL179166B1 (pl) | 2000-07-31 |
US6083712A (en) | 2000-07-04 |
SK42095A3 (en) | 1995-11-08 |
ATE163198T1 (de) | 1998-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CZ285533B6 (cs) | DNA-fragmenty, plasmidy a mikroorganismy obsahující tyto DNA-fragmenty a plasmidy a způsob biotechnologické výroby biotinu | |
KR100760222B1 (ko) | 유전자 증폭에 의해 증가된 리신 생산 | |
Neidle et al. | 5-Aminolevulinic acid availability and control of spectral complex formation in HemA and HemT mutants of Rhodobacter sphaeroides | |
EP1186664B1 (en) | Process for producing a fermentation product | |
NZ256053A (en) | Nucleotide sequences and polypeptides involved in the biosynthesis of streptogramin | |
US5759824A (en) | Genes for butyrobetaine/crotonobetaine-l-carnitine metabolism and their use for the microbiological production of l-carnitine | |
Thöny-Meyer et al. | The Bradyrhizobium japonicum aconitase gene (acnA) is important for free-living growth but not for an effective root nodule symbiosis | |
JP3734466B2 (ja) | コバラミンおよび/またはコバミドの生合成に関与するポリペプチド、それらのポリペプチドをコードするdna配列、それらの調製および使用 | |
JP2722504B2 (ja) | 新規微生物及びそれを用いるd−ビオチンの製法 | |
JP4293637B2 (ja) | コバラミンを製造し得る生合成方法 | |
KR20020064788A (ko) | 관능기에 의해 수식된 이차 대사산물을 생산하는형질전환체 및 신규 생합성 유전자 | |
CA2171668A1 (en) | Expression system which can be regulated | |
JPH03180174A (ja) | バチルス・スフエリカスにおけるビオチンの発現の改良方法 | |
JPH0856673A (ja) | ウロポルフィリノーゲンiii メチルトランスフェラーゼをコードするdna 及びこれを用いるビタミンb12の生産方法 | |
HU213418B (en) | Process for producing polypeptides using bacterial host cells containing expression plasmids with deo promoter | |
NEIDLE et al. | Rhodobacter sphaeroides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
IF00 | In force as of 2000-06-30 in czech republic | ||
MK4A | Patent expired |
Effective date: 20131001 |