PL177635B1 - Rekombinacyjny materiał genetyczny, plazmidy i mikroorganizmy zawierające ten rekombinacyjny materiał genetyczny oraz biotechnologiczny sposób syntezy biotyny - Google Patents
Rekombinacyjny materiał genetyczny, plazmidy i mikroorganizmy zawierające ten rekombinacyjny materiał genetyczny oraz biotechnologiczny sposób syntezy biotynyInfo
- Publication number
- PL177635B1 PL177635B1 PL93308301A PL30830193A PL177635B1 PL 177635 B1 PL177635 B1 PL 177635B1 PL 93308301 A PL93308301 A PL 93308301A PL 30830193 A PL30830193 A PL 30830193A PL 177635 B1 PL177635 B1 PL 177635B1
- Authority
- PL
- Poland
- Prior art keywords
- dna fragment
- gene
- plasmid
- microorganism
- coli
- Prior art date
Links
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 title claims abstract description 191
- 235000020958 biotin Nutrition 0.000 title claims abstract description 92
- 239000011616 biotin Substances 0.000 title claims abstract description 92
- 229960002685 biotin Drugs 0.000 title claims abstract description 92
- 238000010352 biotechnological method Methods 0.000 title claims abstract description 11
- 239000013612 plasmid Substances 0.000 claims abstract description 139
- 239000012634 fragment Substances 0.000 claims abstract description 137
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 131
- 241000588724 Escherichia coli Species 0.000 claims abstract description 110
- 101150029327 bioB gene Proteins 0.000 claims abstract description 80
- 101150076754 bioA gene Proteins 0.000 claims abstract description 73
- 244000005700 microbiome Species 0.000 claims abstract description 68
- 101150023452 bioD gene Proteins 0.000 claims abstract description 67
- 238000013518 transcription Methods 0.000 claims abstract description 65
- 230000035897 transcription Effects 0.000 claims abstract description 65
- 101100381793 Bacillus subtilis (strain 168) bioK gene Proteins 0.000 claims abstract description 43
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 39
- 101100218845 Escherichia coli (strain K12) bioH gene Proteins 0.000 claims abstract description 38
- 241000305071 Enterobacterales Species 0.000 claims abstract description 27
- 230000002068 genetic effect Effects 0.000 claims abstract description 27
- 101150032820 bioF gene Proteins 0.000 claims abstract description 25
- 101150085692 bioC gene Proteins 0.000 claims abstract description 24
- 241000589158 Agrobacterium Species 0.000 claims abstract description 16
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 16
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 16
- 241000589187 Rhizobium sp. Species 0.000 claims abstract description 14
- 229910052799 carbon Inorganic materials 0.000 claims abstract description 10
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 63
- 230000001105 regulatory effect Effects 0.000 claims description 9
- 230000008021 deposition Effects 0.000 claims description 8
- 241000588923 Citrobacter Species 0.000 claims description 7
- 241000588722 Escherichia Species 0.000 claims description 7
- 241000607142 Salmonella Species 0.000 claims description 7
- 230000002103 transcriptional effect Effects 0.000 claims description 3
- 108020004414 DNA Proteins 0.000 description 95
- 235000013351 cheese Nutrition 0.000 description 61
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 41
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 36
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 33
- 239000013598 vector Substances 0.000 description 33
- 101150066555 lacZ gene Proteins 0.000 description 26
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 23
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 21
- 150000001413 amino acids Chemical class 0.000 description 21
- 238000003776 cleavage reaction Methods 0.000 description 20
- 230000007017 scission Effects 0.000 description 20
- 229940024606 amino acid Drugs 0.000 description 19
- 235000001014 amino acid Nutrition 0.000 description 19
- 230000014509 gene expression Effects 0.000 description 19
- 238000010276 construction Methods 0.000 description 17
- 101000623262 Trypanosoma brucei brucei Uncharacterized 22 kDa protein in aldolase locus Proteins 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 14
- 230000004151 fermentation Effects 0.000 description 14
- 239000002245 particle Substances 0.000 description 14
- 210000004027 cell Anatomy 0.000 description 13
- 238000004519 manufacturing process Methods 0.000 description 13
- 108091034117 Oligonucleotide Proteins 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 239000000243 solution Substances 0.000 description 12
- 238000011144 upstream manufacturing Methods 0.000 description 12
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 11
- 101150000658 RR28 gene Proteins 0.000 description 11
- 235000011187 glycerol Nutrition 0.000 description 11
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 10
- 239000008103 glucose Substances 0.000 description 10
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 235000018102 proteins Nutrition 0.000 description 10
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 8
- 101710163270 Nuclease Proteins 0.000 description 8
- 240000004922 Vigna radiata Species 0.000 description 8
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 108020004707 nucleic acids Proteins 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 8
- 150000007523 nucleic acids Chemical class 0.000 description 8
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 108010037850 glycylvaline Proteins 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- 102000012410 DNA Ligases Human genes 0.000 description 6
- 108010061982 DNA Ligases Proteins 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 6
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 108010042833 7,8-diaminopelargonic acid aminotransferase Proteins 0.000 description 5
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 5
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 5
- 239000002028 Biomass Substances 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 229960003237 betaine Drugs 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 101150080777 pheS gene Proteins 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 101150060445 uvrB gene Proteins 0.000 description 5
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 4
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 4
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 4
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 4
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- 241000589180 Rhizobium Species 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 239000011543 agarose gel Substances 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 4
- 108010040030 histidinoalanine Proteins 0.000 description 4
- 125000001841 imino group Chemical group [H]N=* 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- DSJWOERHCVJUFY-UHFFFAOYSA-N 1-[2-(1,4,7-triazonan-1-yl)ethyl]-1,4,7-triazonane Chemical compound C1CNCCNCCN1CCN1CCNCCNCC1 DSJWOERHCVJUFY-UHFFFAOYSA-N 0.000 description 3
- LMSDCGXQALIMLM-UHFFFAOYSA-N 2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid;iron Chemical compound [Fe].OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O LMSDCGXQALIMLM-UHFFFAOYSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 3
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 3
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 3
- NFDVJAKFMXHJEQ-HERUPUMHSA-N Ala-Asp-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NFDVJAKFMXHJEQ-HERUPUMHSA-N 0.000 description 3
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 3
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 3
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 3
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 3
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 3
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 3
- 241000972773 Aulopiformes Species 0.000 description 3
- 101100296545 Caenorhabditis elegans pbo-6 gene Proteins 0.000 description 3
- HAYVTMHUNMMXCV-IMJSIDKUSA-N Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CS HAYVTMHUNMMXCV-IMJSIDKUSA-N 0.000 description 3
- 235000000638 D-biotin Nutrition 0.000 description 3
- 239000011665 D-biotin Substances 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 3
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 3
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 3
- 101100008681 Glycine max DHPS1 gene Proteins 0.000 description 3
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 3
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 3
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 3
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 3
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 3
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 3
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 3
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010084389 glycyltryptophan Proteins 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 229910001629 magnesium chloride Inorganic materials 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 239000007858 starting material Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000011573 trace mineral Substances 0.000 description 3
- 235000013619 trace mineral Nutrition 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 150000003722 vitamin derivatives Chemical class 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 2
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical group C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 2
- WIIZWVCIJKGZOK-IUCAKERBSA-N 2,2-dichloro-n-[(1s,2s)-1,3-dihydroxy-1-(4-nitrophenyl)propan-2-yl]acetamide Chemical compound ClC(Cl)C(=O)N[C@@H](CO)[C@@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-IUCAKERBSA-N 0.000 description 2
- VUFNLQXQSDUXKB-DOFZRALJSA-N 2-[4-[4-[bis(2-chloroethyl)amino]phenyl]butanoyloxy]ethyl (5z,8z,11z,14z)-icosa-5,8,11,14-tetraenoate Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)OCCOC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 VUFNLQXQSDUXKB-DOFZRALJSA-N 0.000 description 2
- OSBLTNPMIGYQGY-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid;boric acid Chemical compound OB(O)O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O OSBLTNPMIGYQGY-UHFFFAOYSA-N 0.000 description 2
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 2
- XAEWTDMGFGHWFK-IMJSIDKUSA-N Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O XAEWTDMGFGHWFK-IMJSIDKUSA-N 0.000 description 2
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- BNODVYXZAAXSHW-IUCAKERBSA-N Arg-His Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BNODVYXZAAXSHW-IUCAKERBSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 2
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 2
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 2
- DVUFTQLHHHJEMK-IMJSIDKUSA-N Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O DVUFTQLHHHJEMK-IMJSIDKUSA-N 0.000 description 2
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 2
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 2
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101100283604 Caenorhabditis elegans pigk-1 gene Proteins 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 229910052684 Cerium Inorganic materials 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 101100004473 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) bioDA gene Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 102100040004 Gamma-glutamylcyclotransferase Human genes 0.000 description 2
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 2
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 2
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 2
- XXGQRGQPGFYECI-WDSKDSINSA-N Gly-Cys-Glu Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(O)=O XXGQRGQPGFYECI-WDSKDSINSA-N 0.000 description 2
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 2
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 2
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 2
- 101000886680 Homo sapiens Gamma-glutamylcyclotransferase Proteins 0.000 description 2
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 2
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 2
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 2
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 2
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 2
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 2
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 2
- 101150104372 SD17 gene Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 239000008051 TBE buffer Substances 0.000 description 2
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 2
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- KBUBZAMBIVEFEI-ZFWWWQNUSA-N Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CNC=N1 KBUBZAMBIVEFEI-ZFWWWQNUSA-N 0.000 description 2
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 2
- GZWPQZDVTBZVEP-BZSNNMDCSA-N Tyr-Tyr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O GZWPQZDVTBZVEP-BZSNNMDCSA-N 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 235000011148 calcium chloride Nutrition 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- GWXLDORMOJMVQZ-UHFFFAOYSA-N cerium Chemical compound [Ce] GWXLDORMOJMVQZ-UHFFFAOYSA-N 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000000909 electrodialysis Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 229960002989 glutamic acid Drugs 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 125000000896 monocarboxylic acid group Chemical group 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- WLJVNTCWHIRURA-UHFFFAOYSA-N pimelic acid Chemical compound OC(=O)CCCCCC(O)=O WLJVNTCWHIRURA-UHFFFAOYSA-N 0.000 description 2
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 235000019157 thiamine Nutrition 0.000 description 2
- 229960003495 thiamine Drugs 0.000 description 2
- 239000011721 thiamine Substances 0.000 description 2
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 238000009423 ventilation Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- ZDSRFXVZVHSYMA-CMOCDZPBSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 ZDSRFXVZVHSYMA-CMOCDZPBSA-N 0.000 description 1
- LZLVZIFMYXDKCN-QJWFYWCHSA-N 1,2-di-O-arachidonoyl-sn-glycero-3-phosphocholine Chemical group CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC LZLVZIFMYXDKCN-QJWFYWCHSA-N 0.000 description 1
- 101150029062 15 gene Proteins 0.000 description 1
- NKDFYOWSKOHCCO-YPVLXUMRSA-N 20-hydroxyecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@](C)(O)[C@H](O)CCC(C)(O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 NKDFYOWSKOHCCO-YPVLXUMRSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- XWHHYOYVRVGJJY-UHFFFAOYSA-N 4-fluorophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241000588624 Acinetobacter calcoaceticus Species 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000589159 Agrobacterium sp. Species 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 1
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 1
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- DGLQWAFPIXDKRL-UBHSHLNASA-N Ala-Met-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N DGLQWAFPIXDKRL-UBHSHLNASA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 241000590031 Alteromonas Species 0.000 description 1
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 1
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-IUCAKERBSA-N Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N WYBVBIHNJWOLCJ-IUCAKERBSA-N 0.000 description 1
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- XTWSWDJMIKUJDQ-RYUDHWBXSA-N Arg-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XTWSWDJMIKUJDQ-RYUDHWBXSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 1
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 1
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 1
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 1
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 1
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101000755953 Bacillus subtilis (strain 168) Ribosome maturation factor RimP Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 101710117026 Biotin synthase Proteins 0.000 description 1
- 101100058405 Bordetella avium (strain 197N) bioCD gene Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 102100034330 Chromaffin granule amine transporter Human genes 0.000 description 1
- 241000272470 Circus Species 0.000 description 1
- 241000589519 Comamonas Species 0.000 description 1
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 1
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 1
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 1
- XZFYRXDAULDNFX-UWVGGRQHSA-N Cys-Phe Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UWVGGRQHSA-N 0.000 description 1
- MSWBLPLBSLQVME-XIRDDKMYSA-N Cys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CS)=CNC2=C1 MSWBLPLBSLQVME-XIRDDKMYSA-N 0.000 description 1
- LHRCZIRWNFRIRG-SRVKXCTJSA-N Cys-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O LHRCZIRWNFRIRG-SRVKXCTJSA-N 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 206010013647 Drowning Diseases 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical class CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- LKVCNGLNTAPMSZ-JYJNAYRXSA-N Gln-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N LKVCNGLNTAPMSZ-JYJNAYRXSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- MRVYVEQPNDSWLH-XPUUQOCRSA-N Gln-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O MRVYVEQPNDSWLH-XPUUQOCRSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- JPWIMMUNWUKOAD-STQMWFEESA-N Gly-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN JPWIMMUNWUKOAD-STQMWFEESA-N 0.000 description 1
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 1
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 1
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 1
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 1
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 1
- XMAUFHMAAVTODF-STQMWFEESA-N His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 1
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 1
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 1
- 108010025076 Holoenzymes Proteins 0.000 description 1
- 101000641221 Homo sapiens Chromaffin granule amine transporter Proteins 0.000 description 1
- 101000666730 Homo sapiens T-complex protein 1 subunit alpha Proteins 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 239000007836 KH2PO4 Substances 0.000 description 1
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 240000006024 Lactobacillus plantarum Species 0.000 description 1
- 235000013965 Lactobacillus plantarum Nutrition 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000721701 Lynx Species 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- 241000193386 Lysinibacillus sphaericus Species 0.000 description 1
- JHKXZYLNVJRAAJ-WDSKDSINSA-N Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(O)=O JHKXZYLNVJRAAJ-WDSKDSINSA-N 0.000 description 1
- MUYQDMBLDFEVRJ-LSJOCFKGSA-N Met-Ala-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 MUYQDMBLDFEVRJ-LSJOCFKGSA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- FMYLZGQFKPHXHI-GUBZILKMSA-N Met-Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O FMYLZGQFKPHXHI-GUBZILKMSA-N 0.000 description 1
- SBFPAAPFKZPDCZ-JYJNAYRXSA-N Met-Pro-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SBFPAAPFKZPDCZ-JYJNAYRXSA-N 0.000 description 1
- MNGBICITWAPGAS-BPUTZDHNSA-N Met-Ser-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MNGBICITWAPGAS-BPUTZDHNSA-N 0.000 description 1
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 1
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 101100270435 Mus musculus Arhgef12 gene Proteins 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 229910004619 Na2MoO4 Inorganic materials 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- RFCVXVPWSPOMFJ-STQMWFEESA-N Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-STQMWFEESA-N 0.000 description 1
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 1
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 1
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 1
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 1
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 1
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 1
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241000589755 Pseudomonas mendocina Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 206010039792 Seborrhoea Diseases 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 102100038410 T-complex protein 1 subunit alpha Human genes 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 1
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 description 1
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- IMYTYAWRKBYTSX-YTQUADARSA-N Trp-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O IMYTYAWRKBYTSX-YTQUADARSA-N 0.000 description 1
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- DXYQIGZZWYBXSD-JSGCOSHPSA-N Trp-Pro Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(O)=O DXYQIGZZWYBXSD-JSGCOSHPSA-N 0.000 description 1
- CUHBVKUVJIXRFK-DVXDUOKCSA-N Trp-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC=3C4=CC=CC=C4NC=3)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CUHBVKUVJIXRFK-DVXDUOKCSA-N 0.000 description 1
- RWTFCAMQLFNPTK-UMPQAUOISA-N Trp-Val-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 RWTFCAMQLFNPTK-UMPQAUOISA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- ONWMQORSVZYVNH-UWVGGRQHSA-N Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UWVGGRQHSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 1
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 1
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 1
- VSYROIRKNBCULO-BWAGICSOSA-N Tyr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O VSYROIRKNBCULO-BWAGICSOSA-N 0.000 description 1
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- WPSXZFTVLIAPCN-WDSKDSINSA-N Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O WPSXZFTVLIAPCN-WDSKDSINSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 1
- JPPXDMBGXJBTIB-ULQDDVLXSA-N Val-His-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N JPPXDMBGXJBTIB-ULQDDVLXSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 229930003779 Vitamin B12 Natural products 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 229960004050 aminobenzoic acid Drugs 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 239000003674 animal food additive Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000004596 appetite loss Effects 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 101150062667 bioCD gene Proteins 0.000 description 1
- 101150045308 bioDA gene Proteins 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- 239000007478 blood agar base Substances 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 229940050410 gluconate Drugs 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 229940072205 lactobacillus plantarum Drugs 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 235000021266 loss of appetite Nutrition 0.000 description 1
- 208000019017 loss of appetite Diseases 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- LPUQAYUQRXPFSQ-DFWYDOINSA-M monosodium L-glutamate Chemical compound [Na+].[O-]C(=O)[C@@H](N)CCC(O)=O LPUQAYUQRXPFSQ-DFWYDOINSA-M 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- FTQWRYSLUYAIRQ-UHFFFAOYSA-N n-[(octadecanoylamino)methyl]octadecanamide Chemical compound CCCCCCCCCCCCCCCCCC(=O)NCNC(=O)CCCCCCCCCCCCCCCCC FTQWRYSLUYAIRQ-UHFFFAOYSA-N 0.000 description 1
- 229960003966 nicotinamide Drugs 0.000 description 1
- 235000005152 nicotinamide Nutrition 0.000 description 1
- 239000011570 nicotinamide Substances 0.000 description 1
- 239000006916 nutrient agar Substances 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229940089807 pantothenic acid 5 mg Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- LYCRXMTYUZDUGA-UYRKPTJQSA-N pimeloyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCCC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LYCRXMTYUZDUGA-UYRKPTJQSA-N 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- FCHXJFJNDJXENQ-UHFFFAOYSA-N pyridoxal hydrochloride Chemical compound Cl.CC1=NC=C(CO)C(C=O)=C1O FCHXJFJNDJXENQ-UHFFFAOYSA-N 0.000 description 1
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 102220277134 rs776745497 Human genes 0.000 description 1
- 239000012266 salt solution Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 208000008742 seborrheic dermatitis Diseases 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 235000021309 simple sugar Nutrition 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000011684 sodium molybdate Substances 0.000 description 1
- 235000015393 sodium molybdate Nutrition 0.000 description 1
- TVXXNOYZHKPKGW-UHFFFAOYSA-N sodium molybdate (anhydrous) Chemical compound [Na+].[Na+].[O-][Mo]([O-])(=O)=O TVXXNOYZHKPKGW-UHFFFAOYSA-N 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000012086 standard solution Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940040944 tetracyclines Drugs 0.000 description 1
- 229910052716 thallium Inorganic materials 0.000 description 1
- BKVIYDNLLOSFOA-UHFFFAOYSA-N thallium Chemical compound [Tl] BKVIYDNLLOSFOA-UHFFFAOYSA-N 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 229960000344 thiamine hydrochloride Drugs 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010068794 tyrosyl-tyrosyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010036320 valylleucine Proteins 0.000 description 1
- 235000019163 vitamin B12 Nutrition 0.000 description 1
- 239000011715 vitamin B12 Substances 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 101150038987 xylR gene Proteins 0.000 description 1
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 1
- 229910000368 zinc sulfate Inorganic materials 0.000 description 1
- 239000011686 zinc sulphate Substances 0.000 description 1
- 235000009529 zinc sulphate Nutrition 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/185—Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system
- C12P17/186—Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system containing a 2-oxo-thieno[3,4-d]imidazol nucleus, e.g. Biotin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Heterocyclic Carbon Compounds Containing A Hetero Ring Having Oxygen Or Sulfur (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Saccharide Compounds (AREA)
Abstract
1. Rekombinacyjny material genetyczny, stanowiacy fragment DNA zawierajacy geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równowazne genetyczne warianty i mutanty, zna- mienny tym, ze geny te ustawione sa w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz sa transkry bowane od wspólnego promotora. 10. Plazmid, znamienny tym, ze zawiera fragment DNA zawierajacy geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równowazne genetyczne warianty i mutanty cechujacy sie tym, ze we fragmencie DNA geny te ustawione sa w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz s a transkr y bowane od wspólnego promotora. 19. Plazmid pBO30A -15/9, taki jak zlozony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod nu- merami depozytu DSM 7246, DSM 7247 wzglednie DSM 8554 20. Plazmid pBO47, taki jak zlozony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozytu DSM 8555. 21. Mikroorganizm zawierajacy fragment DNA lub plazmid obejmujacy ten fragment DNA zawierajacy geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równowazne genetyczne warianty i mutanty, cechujacy sie tym, ze we fragmencie DNA geny te ustawione sa w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz s a transkrybowane od wspólnego promotora. 32. Mikroorganizmy E. coli XL1-Blue, E. coli BM4062 i E coli ED8767, kazdy z nich zawierajacy plazmid pBO30A-13/9, zlozone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak równiez ich genetyczne warianty i mutanty. 33. Mikroorganizm Agrobacterium/Rhizobium sp. HK4, zawierajacy plazmid pB047, zlozony pod numerem zglo- szenia DSM 8555, jak równiez jego genetyczne warianty i mutanty. 34. Biotechnologiczny sposób syntezy biotyny, w którym ulegajace przemianie materii zródlo wegla poddaje sie fermentacji do biotyny z zastosowaniem mikroorganizmu, znamienny tym, ze stosuje sie mikroorganizm zawiera- jacy fragment DNA lub plazmid obejmujacy ten fragment DNA zawierajacy geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równowazne genetyczne warianty i mutanty, cechujacy sie tym, ze we fragmencie DNA geny te ustawione sa w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz s a transkrybowane od wspólnego promotora. PL PL PL
Description
Niniejszy wynalazek dotyczy rekombinacyjnego materiału genetycznego dla ekspresji genów drogi metabolizmu biotyny enterobakterii, stanowiącego fragment DNA, wektorów i mikroorganizmów zawierających ten rekombinacyjny materiał genetyczny oraz biotechnologicznego sposobu wytwarzania biotyny przy użyciu tych mikroorganizmów'.
Biotyna (witamina H) jest ważną witaminą dla ludzi i zwierząt, której niedobór może przykładowo wywoływać łojotok, zapalenie skóry, brak apetytu i zmęczenie. Dlatego też biotyna jest przydatnym dodatkiem do żywności i paszy.
Wytwarzanie biotyny metodami syntetycznej chemii organicznej wymaga dużych nakładów i jest kosztowne. Z tego powodu coraz większe znaczenie mają sposoby biotechnologiczne, w których biotynę można zsyntetyzować z pomocą mikroorganizmów z tanich materiałów wyjściowych, takich jak glukoza.
Escherichia coli (E. coli) jest mikroorganizmem zdolnym do tego, by wychodząc z prostych źródeł węgla, takich jak gliceryna lub glukoza, zsyntetyzować biotynę (fig. 1). Geny odpowiedzialne za biosyntezę biotyny u E. coli, występują w operonie, który już sklonowano i który obejmuje pięć genów : bóoA, bioB, bioC, bioD oraz bioF (dalej określanych także jako geny bio) (Gupta i in., Gene 1:331-345; 1977). Geny te są przez obszar promotora-operatora, znajdujący się pomiędzy genami bioA i bioO, transkrybowane w dwóch różnych kierunkach. W odniesieniu do konwencjonalnej mapy genów, geny bioO, bioF, bioC oraz bioD znajdują się na prawo, a gen bioA - na lewo od obszaru promotor-operator. DNA na lewo od obszaru promotor-operator obejmuje w dół sekwencji od genu bioA, dalszy gen oznaczony jako ORFI (ORF - open reading frame, otwarta ramka odczytu), kodujący polipeptyd o 158 aminokwasach i transkrybowany wraz z genem bioA (Otsuka i in., J. Biol. Chem., 263:19577-19585; 1988). Funkcja tego genu dotąd jest nieznana. Inne szczepy rodziny enterobakterii, przykładowo z gatunku Salmonella lub Citrobacter, mają strukturę operonu biotyny analogiczną do E. coli (Shiuan i Campbell, Gene 67:203-211; 1988).
Znane są już biotechnologiczne sposoby wytwarzania biotyny, wykonywane za pomocą mikroorganizmów, transformowanych klonowanym operonem biotyny E. coli. Te sposoby realizuje się wychodząc z glukozy. EP-B-236 429 opisuje np. mikroorganizmy, transformowane operonem biotyny E. coli, przy czym organizmy gospodarza ulegają mutacji w swoim genie birAJbioR..
W EP-A-316 229 opisano mutanty E. coli, które wytwarzają mniej octanu i które również przetransformowano klonowanym operonem biotyny.
EP-A-449 724 ujawnia mikroorganizmy transformowane operonem biotyny, wykazujące dodatkowo mutacje, powodujące w następstwie mniejsze zużycie glukozy.
Z EP-A-266 240 znane jest ponadto klonowanie genu odpowiedzialnego za syntezę biotyny w Bacillus sphaericus oraz oparty na tym sposób wytwarzania biotyny. Metabolizm Oacillus sphaericus warunkuje, że ten sposób musi być realizowany wychodząc z kosztownego kwasu pimelinowego.
Wydajności, uzyskiwane według dotychczas znanych sposobów biotechnologicznych są jednak z gospodarczego punktu widzenia niezadowalające.
177 635
Celem wynalazku było zatem, dostarczenie biotechnologicznego sposobu wytwarzania biotyny, umożliwiającego wyższe wydajności biotyny i tym samym mającego większe znaczenie gospodarcze.
Zadanie to rozwiązano dzięki rekombinacyjnemu materiałowi genetycznemu dla ekspresji genów drogi metabolizmu biotyny enterobakterii, stanowiącemu fragment DNA, wektorom i mikroorganizmom zawierającym ten rekombinacyjny materiał genetyczny oraz biotechnologicznemu sposobowi wytwarzania biotyny przy użyciu tych mikroorganizmów, objętym obecnym wynalazkiem. W szczególności cel wynalazku osiągnięto przy zastosowaniu fragmentów DNA oraz wektorów, zawierających geny bioB, bioF, bioC, bioD oraz bioA lub ich funkcjonalnie równoważne genetyczne warianty i mutanty z eneterobakterii, przy czym te geny są zorganizowane w jednostkę transkrypcyjną.
Fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty według wynalazku cechuje się tym, że geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz sątranskrybowane od wspólnego promotora,
Fragment DNA według wynalazku zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter Korzystnie, fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli.
We fragmencie DNA według wynalazku, korzystnie jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
Korzystnie również, we fragmencie DNA według wynalazku regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:
AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC
Alternatywnie, we fragmencie DNA według wynalazku, regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:
AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
Alternatywnie, we fragmencie DNA według wynalazku, regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:
AAGCTTCTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
Korzystnie, we fragmencie DNA według wynalazku odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
Zgodnie z wynalazkiem we fragmencie DNA geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.
Wynalazek obejmuje również plazmid cechujący się tym, że zawiera omówiony wyżej fragment DNA według wynalazku.
Obecny wynalazek obejmuje w szczególności plazmid pBO30A-15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 i DSM 8554 oraz plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozyty DSM 8555.
Wynalazek obejmuje również mikroorganizm zawierający wyżej wskazany fragment DNA lub wyżej zdefiniowany plazmid według wynalazku.
Wynalazkiem objęte są: mikroorganizm zawierający plazmid pBO30A-15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 i DSM 8554, jak również mikroorganizm zawierający plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp.HK4 pod numerem depozytu DSM 8555.
Wynalazek obejmuje mikroorganizmy, E. coli XL1-Blue, E. coli BM4062 i, E. coli ED8767, każdy z nich zawierający plazmid pBO30A-13/9, złożone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak również ich genetyczne warianty i mutanty oraz mi177 635 kroorganizm Agrobacterium/Rhizobium sp. HK4, zawierający plazmid pBO47, złożony pod numerem zgłoszenia DSM 8555, jak również jego genetyczne warianty i mutanty.
Biotechnologiczny sposób syntezy biotyny, w którym ulegające przemianie materii źródło węgla poddaje się fermentacji do biotyny z zastosowaniem mikroorganizmu, według wynalazku polega na tym, że stosuje· się mikroorganizm zawierający fragment DNA lub plazmid obejmujący ten fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty, cechujący się tym, że we fragmencie DNA geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz sątranskrybowane od wspólnego promotora.
Korzystnie w sposobie według wynalazku jako mikroorganizm stosuje się mikroorganizm wybrany z grupy obejmującej E. coli XL1-Blue, E. coli BM4062 i E. coli ED8767, z których każdy zawiera plazmid pBO30A-I3/9, złożone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak również ich genetyczne warianty i mutanty, bądź mikroorganizm wybrany z grupy obejmującej Agrobacterium/Rhizobium sp. HK4, zawierający plazmid pBO47, złożony pod numerem zgłoszenia DSM 8555, jak również jego genetyczne warianty i mutanty.
Przez jednostkę transkrypcyjną rozumie się tu sekwencję DNA, w której geny są ustawione w kierunku transkrypcji i pod wspólną kontrolą transkrypcji są przepisywane w nieprzerwany transkrypt, przy czym sekwencja. DNA obok każdorazowych genów obejmuje także genetyczne elementy kontrolne wymagane dla ekspresji genu, takie jak promotory i miejsca wiązania rybosomów.
Przez „funkcjonalnie równoważne genetyczne warianty i mutanty” rozumie się geny, które pochodzą od genów dzikiego typu organizmów pierwotnych tzn. enterobakterii i cechują się zamianą zasad w ramach znanej degeneracji kodu genetycznego. Tego rodzaju zamiany zasad mogą być pochodzenia naturalnego lub mogą być wytworzone sztucznie, np. aby dopasować sekwencję genu do uprzywilejowanego zastosowania kodonu określonego mikroorganizmu, w którym powinna nastąpić ekspresja. Genetyczne warianty i mutanty obejmują ponadto delecje, inserty i substytucje zasad lub kodonu, które pozostawiają produkt genu o tego rodzaju zmienionej sekwencji przy zasadniczo nienaruszonej funkcji. Objęte są w szczególności sekwencje, które w zwykłych warunkach hybrydyzacji, tzn. w temperaturach między 55 i 66°C i przy 0,03 do 0,3 M zawartości soli, hybrydyzują z sekwencjami dzikiego typu, a także sekwencje, które wykazują w wysokim stopniu homologię, np. wyższą niż 70%.
Figura 1 przedstawia enzymy drogi metabolizmu biosyntezy biotyny.
Figura 2 przedstawia schemat budowy plazmidu pBO30.
Figura 3 przedstawia sekwencję plazmidu pBO30, pBO30A-9 oraz pBO30A-15 dla obszaru końca 3’ genu bioD oraz końca 5’ genu bioA (przerywane strzałki; kodon startowy bioA podkreślono, stop-kodon bioD zaznaczono kropkami) wraz z miejscami cięcia przez enzymy restrykcyjne związanymi z konstrukcją plazmidu oraz sekwencją Shine-Dalgarno (SD) genu bioA. Potencjalne struktuty „stem-loop” zaznaczono przerywanymi strzałkami.
Figura 4 przedstawia kroki zmiany sekwencji w górę sekwencji od genu bioB dla przypadku wyjścia z plazmidu pbioB::lacZ-2 dla konstrukcji ulepszonych miejsc wiązania rybosomów przy danych stosowanych miejscach cięcia enzymami restrykcyjnymi, każdorazowych sekwencjach Shine-Dalgarno (SD) oraz kodonie startowym bioB (Met). Przedstawiono sekwencje w górę sekwencji od genu bioB oraz końca 5’ genu bioB. Linie kreskowane oznaczają wstawiony oligonukleotyd 985E. Nukleotydy przekreślone powinny wedle teorii występować, nie ma ich jednak w plazmidzie pbioB:.lacZI985E oraz w wyprowadzonych z niego plazmidach pbioB::lacZl9 oraz bioB::lacZ/16, co powoduje w rezultacie utratę miejsca BamHI (BamHI). „fill-in”: uzupełnienie za pomocą polimerazy Klenowa.
Figura 5 przedstawia schemat budowy plazmidów pBO30A-15/9 oraz BO30A15/9AorfI.
Figura 6 przedstawia sekwencję DNA i aminokwasową genu kodującego w plazmidzie pBO30A-15/9 biosyntezę biotyny wraz z genetycznymi elementami kontrolnymi (SD: se8
177 635 kwencja Shine-Dalgarno). Aminokwasy przedstawione kursywą na końcu COOH genu bioD 15 przedstawiają substytucje w stosunku do sekwencji dzikiego typu genu bioD E. coli.
Figura 7 przedstawia schemat budowy plazmidu pBO74 B wychodząc z plazmidów pBO74-13 oraz pBO3; Strzałki podają położenie oraz orientację promotora tac oraz genu bio. Udział wektora plazmidów wytłuszczono. Linie przerywane przedstawiają zakres delecji genu bioB.
Na figurze 2 oraz 5 zastosowano następujące oznaczenia: A: Aatll; B: BamHI; Bg: BglII; C: Clal; E: EcoRA; H: HindIII; K: KpnI; N: Ncol; Nr: Nru:I; P: Pstl; S: Snol; Sa: Sali; Se: Ssel; Sp: SphI; Ss: SspI; oraz X: XbaI. „fill-in” uzupełnienie recesywnych końców 3’ za pomocą polimerazy Klenowa; mbn: usunięcie wystających końców 5’ - lub 3’ za pomocą nukleazy Phaseolus aureus (nukleaza mung bean); Bal31: progresywna delecja DNA egzonukleazą Bal31. Udział wektora plazmidów wytłuszczono. Za pomocą różnie zakreskowanych elementów oznaczono części plazmidów zastosowane każdorazowo w następującym po tym etapie klonowania. Strzałki podają położenie i orientację genów bio.
Aby skonstruować fragmenty DNA i wektory według niniejszego wynalazku, geny operonu biotyny najpierw celowo wyodrębnia się z chromosomu odpowiedniego mikroorganizmu, a następnie wzajemnie się łączy pod kontrolą elementów regulujących geny, takich jak promotory i miejsca wiązania rybosomów, tak by znalazły się one w jednej jednostce transkrypcyjnej. Materiałem wyjściowym do izolowania genów bio mogą być szczepy bakteryjne z rodziny enterobakterii, np. gatunku Escherichia, Salmonella lub Citrobacter. Celowo materiałem wyjściowym jest mikroorganizm gatunku Escherichia coli, który jest najlepiej scharakteryzowany.
Konstrukcja fragmentów DNA i wektorów według niniejszego wynalazku może nastąpić biorąc za punkt wyjścia np. bank genów odpowiedniego mikroorganizmu, takiego jak E. coli, z którego w znany sposób można wyodrębnić i klonować geny bio lub ich fragmenty przez hybrydyzację znaczonymi oligonukleotydami zawierającymi częściowe sekwencje genów bio. Następnie wyodrębnione i klonowane geny bio są przy pomocy znanych metod rekombinacji DNa pod kontrolą wspólnego promotora wzajemnie łączone, tak by utworzyły pojedyncząjednostkę transkrypcyjną. Celowo ustawia się geny bio w ten sposób, że gen bioA znajduje się w kierunku przeciwnym do genów bioB, bioF, bioC oraz bioD, które już są obecne w jednostce transkrypcyjnej w operonie dzikiego typu E. coli. Gen bioB koduje syntezę biotynową - kluczowy enzym całej drogi syntezy biotyny, ponieważ przemiana detiobiotyny w biotynę przy udziale syntezy biotynowej stanowi dotąd stadium określające szybkość pięcioetapowej drogi syntezy biotyny. Gen bioB jest zatem celowo pierwszym genem w obrębie jednostki transkrypcyjnej, ponieważ z powodu bliskości promotora może nastąpić optymalna ekspresja tego genu. (fig. 2, 4, 5 oraz 6).
Druga jednostka transkrypcyjna w operonie dzikiego typu biotyny E. coli, która zawiera gen bioA, obejmuje ponadto dalszy gen, ORFI, kodujący polipeptyd o 158 aminokwasach. Próby przeprowadzone z plazmidami ekspresyjnymi, w których nie było żadnego genu ORFI wykazują że gen ten w zwykłych warunkach fermentacji nie ma zasadniczego znaczenia dla biosyntezy biotyny. Nie można jednak wykluczyć, że wspomniany polipeptyd o dotychczas nieznanej funkcji w określonych warunkach także odgrywa pewną rolę w syntezie biotyny. Choć obecność genu ORFI we fragmentach DNA według niniejszego wynalazku również nie jest absolutnie niezbędna, jednostka transkrypcyjna z genami bio w celowej postaci wykonania zawiera dodatkowo także gen ORFI (fig. 2, 5 oraz 6).
We fragmentach DNA oraz wektorach według niniejszego wynalazku geny bio korzystnie nie znajdują się pod kontrolą naturalnego promotora biotyny E. coli. W znacznie większym stopniu geny bio dla polepszenia transkrypcji celowo są ustawione pod kontrolą silnego obcego promotora. Wybór promotora zależy od żądanych warunków ekspresji, np. od tego, czy pożądana jest ekspresja konstytutywna czy też indukowana, lub też od mikroorganizmu, w którym ma nastąpić ekspresja. Odpowiednimi promotorami są np. promotory PL oraz P. fagu Lambda (por. Schauder i in., Gene 52:279-283; 1987), promotor pxylS plazmidu TOL Pseudomonas putida z sąsiednim genem regulatorem xylR (Franklin i in., J. Bacteriol. 15-4:676-685; 1983), promotor trc (Amann i in., Gene 69:301-315; 1988), promotor trp \ΊΊ 635 (Amann i in., Gene 25:167-178; 1983), promotor pdegQ z Bacillus subtilis, czynny w fazie stacjonarnej (Dahl i in., J. Bacteriol. 173: 1539-1547; 1991) oraz promotor lacUV5 (Amann i in., Gene 25:167-178; 1983). Jako promotor jest korzystnie wybrany promotor tac, hybryda z promotora trp i lacUV5 z E. coli, który można zastosować jako promotor konstytutywny lub indukowalny (Russell i Bennett, Gene 20:231-243; 1982).
Ponadto ustalono, że ekspresję genu bioA w wyżej opisanym korzystnym ustawieniu można jeszcze udoskonalić, gdy odległość między genami bioD i bioA jest możliwie najkrótsza, tzn. korzystnie jest mniejsza niż 50 bp (par zasad). Nieoczekiwanie stwierdzono, że ekspresja jest szczególnie wysoka, gdy sekwencja końca 3’ genu bioD, który koduje zakończenie COOh syntetazy detiobiotynowej (DTB), zawiera równocześnie miejsce wiązania rybosomów następującego po nim genu bioA. Korzystnie występuje równocześnie nakładanie się genów bioD i bioA. Tego rodzaju konstelację można osiągnąć, gdy podda się fuzji koniec 5’ genu bioA razem z ich miejscem wiązania rybosomów z genem bioD, tak że koniec 3’ jest podstawiony przez sekwencję z miejscem wiązania rybosomów w górę sekwencji od genu bioA i, w danym przypadku, końcem 5’ genu bioA (fig. 3 i 6; Seq ID nr: 1, 6 i 8-16). Efekt ten jest tym bardziej zaskakujący, że przy tego rodzaju fuzji zakończenie COOH syntetazy DTB można wymienić, bez utraty aktywności enzymu. Podobne nakładanie się występuje także w operonie biotyny dziekiego typu E. coli między rastrami odczytu genów bioB, bioF, bioC i bioD.
Ekspresję genu bioB można przez optymalizację miejsca wiązania rybosomów genu bioB jeszcze zwiększyć. Celowo wychodzi się tu z konstruktu, w którym gen bioB już znajduje się pod kontrolą silnego promotora, np. promotora tac. Optymalizacja miejsca wiązania rybosomów genu bioB, tzn. zmiana sekwencji Shine-Dalgarno i ich odległości od końca 5’ genu struktury, może nastąpić za pomocą zwykłych metod rekombinacji DNA. Wpływ określonego miejsca wiązania rybosomów na translację można określić w znany sposób, np. przez fuzję genu badanego z genem lacZ i następującą po tym próbę z chromogennym substratem 5-bromo-4-chloro-3-indolilo-P-D-galaktopiranozydem (X-Gal).
Fragmenty DNA obejmujące geny bio w jednostce transkrypcyjnej, można wbudować przy pomocy znanych technik rekombinacji DNA w wiele wektorów. W ten sposób otrzymano np. plazmidy pBO30A-15/9 (fig. 5 i 6, Seq ID nr: 1 i 6; przykład I.5.2) oraz pBO47 (przykład I.7). Plazmid pBO30A-15/9 złożono 28. 9. 1992 w Deutsche Sammlung fur Mikroorganismen und Zellkulturen GmbH, D-3300 Braunschweig, Mascheroderweg 1b, w E. coli XL1-Blue oraz E. coli BM4062 pod numerami zgłoszenia DSM 7246 względnie 7247, oraz
17. 9. 1993 w E. coli ED8767 pod numerem zgłoszenia DSM 8554. Plazmid pBO47 złożono 17.9. 1993 w Deutsche Sammlung fur Mikroorganismen und Zellkulturen GmbH, w Agrobacterium/Rhizobium sp HK4 pod numerem zgłoszenia DSM 8555.
Zależnie od rodzaju wybranych wektorów można poddać ekspresji geny dla enzymów drogi syntezy biotyny w różnych organizmach. Jako wektory nadają się zarówno wektory o specyficznym, jak też wektory o szerokim spektrum gospodarzy (ang. :”broad host range”). Przykładami wektorów o specyficznym spektrum gospodarzy np. dla E. coli są pBR322 (Bolivar i in., Gene 2:95-113; 1977), pUC18/19 (Yanisch-Perron i in., Gene 33:103-119; 1985), K18/19 (Pridmore, Gene 56:309-312; 1987) oraz pRA95 (można otrzymać z Nycomed Pharma AS, Hvidovre, Dania).
Jako wektory o „szerokim spektrum gospodarzy” można zastosować wszystkie wektory, które są odpowiednie dla bakterii Gram-ujemnych. Przykładami takich wektorów o „szerokim spektrum gospodarzy” są pRK290 (Ditta i in., Proc. Natl. Acad. Sci. USA 77:7347-7351: 1980), pKT240 (Bagdasarian i in., Gene 26:273-282; 1983), pochodne pRK290 jak pLAFRI (Long i in., Nature 298:485-488; 1982) oraz pRK290X (Alvarez-Morales i in., Nucl. Acid. Res. 14:4207-4227; 1986), pochodne pKT240, jak pMMB66EH (Furste i in., Gene 48: 119-131; 1986) lub pGSS33 (Sharpe, Gene 29:93-102; 1984).
Do wytwarzania szczepów produkcyjnych dla fermentacji, tzn. szczepów dla produkcji biotyny, należy fragment DNa według niniejszego wynalazku wstawić w żądane i odpowiednie dla ekspresji szczepy gospodarza. Mikroorganizmami odpowiednimi dla ekspresji genów bio, korzystnie szczepów o szerokim spektrum substratów, są np. enterobakterie, korzystnie
177 635 gatunku Escherichia lub mikroorganizmy gatunku Rhizobium, Agrobacterium, Rhizobium/Agrohacterium. Acinetobacter, Pseudomonas oraz Comamonas. Szczególnie korzystne są mikroorganizmy gatunku E. coli, Rbizobium/Agrobacterium s. HK4 (jak opisano w EP-B 158 194), Pseudomonas mendocina, Pseudomonas aeruginosa lub Acinelobacter calcoaceticus, Mikroorganizmy mogą zawierać fragment DNA według niniejszego wynalazku na cząsteczce wektora lub zintegrowany w swoim chromosomie. Wstawienie fragmentu DNA w mikroorganizmy może np. nastąpić przez transformację lub koniugację. Celowo transformuje się wybrane mikroorganizmy znanym sposobem wektorami, które zawierają fragmenty DNA według niniejszego wynalazku. Odpowiednimi szczepami produkcyjnymi są np.E.coli XL1-Blue, E. coli DM4062 i E. coli ED8767, każdorazowo zawierając plazmid pBO30A-15/9 (DSM 7246, DSM 7247 i DSM 8554) i Agrohacterium/Rhizobium sp. HK4 z plazmidem pBO47 (DSM 8555).
Wyodrębnienie transformowanych szczepów gospodarza następuje celowo z selektywnej pożywki, do której dodaje się antybiotyk, wobec którego szczepy gospodarza są odporne przez dzięki genowi markera znajdującemu się na wektorze lub fragmencie DNA.
Biotechnologiczne wytwarzanie biotyny następuje przy zastosowaniu mikroorganizmów, zawierających fragmenty DNA lub wektory według niniejszego wynalazku. Sposób wytwarzania biotyny realizuje się w zwykły sposób w kulturach wychodząc ze źródła węgla odpowiedniego jako podłoże wzrostu dla konkretnego mikroorganizmu, który ostatecznie ulega przemianie do biotyny. Jako źródło węgla odpowiednie są w szczególności proste cząsteczki cukru, np. glukoza lub gliceryna. Stosownie do tego można zastosować jako podłoże wzrostu środki występujące w handlu, jak np. Nutrient Yeast Broth (NYB: Nutrient Broth No. 2, Oxoid, 25 g/l; ekstrakt drożdżowy, Oxoid, 5 g/l) lub minimalne pożywki z gliceryną i glukozą.
Fermentacja tzn. wytwarzanie biotyny, przebiega korzystnie jako tzw. metoda „zasilanego wsadu” (ang.:”fed-batch”), tzn. w fermentacji wsadowej, do której dodaje się w sposób ciągły lub okresowo strumień objętościowy ze świeżymi składnikami, przy czym jednak nie odprowadza się żadnego roztworu z kulturami. W takiej metodzie jako „zasilanie” korzystnie stosuje się roztwór gliceryny z szybkością dopływu dopasowaną do danej ewolucji biomasy.
Fermentacja następuje w obrębie obszarów temperatury i pH odpowiednich fizjologicznie dla danych mikroorganizmów. Celowo wartość pH mieści się w zakresie od 6 do 8, a temperatura w zakresie od 20 do 45°C.
Poprzez zmianę składników w pożywce i dopasowanie warunków fermentacji do danego mikroorganizmu można w zwykły sposób wydajność biotyny jeszcze zwiększyć.
Niniejszy wynalazek zostanie objaśniony bliżej przez poniższe przykłady.
Ogólne metody:
Endonukleazy restrykcyjne zastosowano według danych producenta w ilości od 3 do 5 jednostek/pg DNA. Znaczenie i fosforylowanie linkerów DNA (uzyskanych z Boehringer Mannheim, RFN) dla wbudowywania miejsc cięcia enzymami restrykcyjnymi, i syntetycznych oligonukleotydów (uzyskanych z Microsynth, Windisch, CH), np. do zastosowania jako sondy dla hybrydyzacji DNA/DNA i jako „primer” dla reakcji sekwencjonowania, nastąpiły przy użyciu kinazy T4-polinukleotydowej (Boehringer Mannheim, RFN) według Sambrooka i in. (Molecular Cloning: A laboratory manual. 2nd edition, Cold Spring Harbour Laboratory, Cold Spring Harbour, NY; 11.31 i 5.68; 1989). Reakcje ligacji przeprowadzono przy użyciu ligazy T4-DNA według danych wytwórcy.
Sekwencjonowanie DNA przeprowadzono według metody przerwania łańcucha według Sangera i in. (Proc. Natl. Acad. Sci. USA 94:5463-5467; 1977). Wszystkie reakcje sekwencyjne przeprowadzono przy użyciu zestawu do sekwenazy z United States Biochemicals (Cleveland, OH, USA) według protokołu wytwórcy. Sekwenaza (wersja 2,0, polimeraza T7-DNA zmieniona za pomocą technik genetycznych) dała równomierne, dobrze czytelne sekwencje DNA o ponad 600 bp; Kompresje w obszarach DNA bogatych w GC można było łatwo rozwiązać, jeśli zamiast dGTP zastosowano nukleotyd dlTP. Jako matryce dla reakcji sekwencyjnej stosowano z reguły jednoniciowe postacie wektorów M13mp18/19 (YanischPerron i in., 1985, ibid.) lub pBluescript KS+/SK+ (apR lacZ'; można uzyskać z Stratagene,
177 635
La Jolla, CA), które wyodrębniono według (Methods Enzymol. 101:20-79: 1983). Dla sekwencjonowania dwuniciowego plazmidowego DNA, plazmidowe DNA oczyszczono za pomocą gradientów CsCl lub „Gene Clean” (BIO 101, La Jolla, CA). Jako nukleotyd znaczony radioaktywnie użyto a-[3;,S]-dATP (NEN-Du Pont, NEG-034H). Rozdzielenie elektroforetyczne nastąpiło bądź przez typowe 4% względnie 6% żele bis/akrylamidowe z 7M mocznika oraz 1x buforem TBE (90 mM Tris, 90 mM kwasu bornego, 2,5 mM EDTA), lub przez żele z 5% HydroLink Long Ranger (AT Biochem, Malvern, PA, USA, via Chemie Brunschwig, Basel) z 7M mocznika i 1,2 x buforem TBE. Żele miały 550 mm długości i 0,2 mm grubości; elektroforeza nastąpiła w aparaturze makroforowej LKB z termostatem przy napięciu 2100 V i temperaturze 60°C. Następnie żele suszono na papierze 3 MM Whatmana i poddano autoradiografii przy użyciu filmu rentgenowskiego Fuji Rx lub Amersham Hyperfilm ()max.
Wyodrębnienie pozachromosomowego DNA wykonano bądź w małych ilościach według metody „szybkiego alkalicznego SDS” („Miniprep”) według Birnboima i Doly (Nucl. Acid. Res. 7:1513-1523; 1979), lub, dla wyodrębnienia większych ilości, przez odwirowywanie gradientów gęstości chlorku cezu według zmodyfikowanej metody Clewell i Helsinki (Proc. Natl. Acad. Sci. USA 42:1159-1166; 1969). Alternatywnie zastosowano pakiety QIAGEN Fa. DIAGEN, Dusseldorf (RFN).
Aby przekształcić E. coli plazmidem DNA, komórki uczyniono „kompetentnymi” według Cohen i in. (Proc. Natl. Acad. Sci. USA 69:2110-2114; 1972) w 50 mM CaC^. Przekształcenie DNA plazmidowego i selekcja klonów noszących plazmidy nastąpiła według Sambrooka i in., (1989; ibid. 1.82-1.84).
Przykład I. Klonowanie operona biotyny E . coli w pojedynczej jednostce transkrypcyjnej
I.1 Konstrukcja pBO1 oraz M13bioD
Dla klonowania genów bio wyodrębniono chromosomowe DNA z E. coli DSM 498 (K12 Typ dziki; Deutsche Sammlung far Mikroorganismen und Zellkulturen GmbH). Wyodrębnienie wykonano zasadniczo według Hahna i Hennecke (Mol. Gen. Genet. 193:46-52; 1984). Następnie 2 pg całkowitego DNA z E. coli DSM 498 przecięto enzymem restrykcyjnym PstI. Fragmenty DNA rozdzielono elektroforetycznie w horyzontalnym żelu agarozowym 0,7% w zwykły sposób (Sambrook i in., 1989, ibid.; 6.19 do 6.9) i przeniesiono na membrany „Gene Screen” (membrany nylonowe NEN-Du Pont) (Southern, J. Mol. Biol., 98:503-517; 1975). DNA utrwalono przez dwugodzinną inkubację w 80°C w piecu próżniowym na wususzonych filtrach. W celu identyfikacji fragmentów DNA operonem bio poddano jako sondę syntetyczny oligonukleotyd o długości 25 nukleotydów o sekwencji 5’-GGCTCACCGCCCACGCTGGACATTG-3’, odpowiadającej sekwencji z końca 5’ genu bioB (Otsuka, A. J., Dysertacja, University of California, San Diego, CA; 1978) hybrydyzacji z DNA związanym z filtrem. Następnie 40 pMoli tego oligonukleotydu z kinazą polinukleotydową T4 i ,y-[j2P]-ATP (75pCi) znaczono na końcu. Hybrydyzację DNA związanego z radioaktywnie znaczoną sondą przeprowadzono według Sambrook i in., (1989, ibid., 9.52 -9.55). Następnie prehybrydyzowano DNA 2 godz. w 5x roztworze Denhardta (1x roztwór Denhardta: 0,02% albumina osocza krwi wołu, 0,02% Ficoll, 0,01% poliwinylopirolidon), 6x bufor SSC (1x SSC: 150 mM NaCl, 15 mM cytrynian sodowy, pH 7,2) oraz 150 pg/ml DnA ze spermy łososia, a następnie hybrydyzowano 18 godz. w 2x roztworze Denhardta, 6 x SSC , 0,5% SDS, 150 pg/ml dNa ze spermy łososia, 2 godz. przemywano i ostatecznie czterokrotnie przemyto każdorazowo 30 min. w 2x SSC, C.%() S^ITS. Temperatura podcaas wzzystkich etapów wyniosła 65°C. Znaczony oligonukleotyd hybrydyzował na tym „Southern blot” ' z fragmentem PstI o 5,4 kb.
Dla sklonowania tego fragmentu 5,4 kb PstI z operonem biotyny przecięto najpierw 50 pg całkowitego E. coli DSM 498 przy użyciu PstI i rozdzielono na żelu agarozowym 0,7% jak wyżej. Fragmenty o wielkości 4,5 kb do 6,5 kb wycięto z żelu i wyodrębniono przez elektrodializę w wężach do dializy. Około 0,6 pg tych fragmentów poddano ligacji z 0,6 pg wektora pHE3 przeciętego PstI (Hennecke i in., Gene 19:231-234; 1982). Wektor ten zawiera gen oporności na chloramfenikol (CmR, replikon ColE1 z pACYC184 (Chang i Cohen,
177 635
J. Bacteriol., 134:1141-1156; 1978) jak również gen pheS z E. coli syntetazy-tRNAfenyloalaninowej, charakteryzujący się miejscem Pstl.
0,2 ml „kompetentnych” komórek E. coli RR28 (Hennecke i in., 1982, ibid.,) w 50 mM CaCl2 transformowano przy użyciu powyższego tworu ligacyjnego. E. coli RR28 ma w chromosomie mutowany gen pheS (pheS12) i dlatego jest oporny na p-fluorofenyloalaninę (pFphe) na podłożu wzrostu. Jeśli RR28 jest nośnikiem plazmidu pHE3 z genem dzikiego typu pheS, szczep jest wrażliwy na pFphe. Wstawienie fragmentów DNA w miejsce cięcia PstI pHE3 przerywa gen dzikiego typu pheS; stąd RR28 z rekombinowanym plazmidem jest oporny na pFphe (pFpheR. Transformowane komórki przełożono na pożywce minimalnej (7,1 g/l Na2HPO4, 13,6 g/l KH2PO4, 13,6 g/l KH2PO4, 0,014 g/l CaCl2x2H2O, 0,25 g/l MgSO4, 1,58 g/l (NH4)2sO4, 15 g/l agaru, 4 g/l glukozy, 0,005 g/l tiaminy, 0,05 g/l leucyny, 0,05 g/l proliny, 0,2 g/l D,L-p-fluorofenyloalaniny, 0,02 g/l chloramfenikolu; Hennecke i in., 1982, ibid.) i wyodrębniono około 2500 klonów pFpheR CmR zawierających plazmid pHE3 (CmR z insertem w genie pheS (pFpheR). 600 tych klonów replikowano na filtrze z nitrocelulozy, leżącym na płytkach z pożywką agarową (NA) (NA: zasada agarowa krwi (Oksoid). 40 g/l; ekstrakt drożdży (Oksoid), 5 g/l z 20 pg/ml Cm. Na filtry z wyrosłymi koloniami (3-5 mm średnicy) podziałano według procedury Grunsteina i Hognessa (Proc. Natl. Acad. Sci. USA 72:3961-3965; 1975), aby poddać komórki lizie i wiązać uwalniany DNA. Filtr z uległymi lizie i utrwalonymi komórkami E. coli poddano hybrydyzacji z wyżej opisanym oligonukleotydem bioB o 25 nukleotydach znaczonym 32P. Hybrydyzacja nastąpiła według modyfikacji dla hybrydyzacji kolonii według Sambrooka i in., (1989, ibid., 11.00), tzn. prehybrydyzacja, hybrydyzacja i pierwsza operacja przemywania nastąpiły w 4x roztworze Denhardta, 6x SSC, 100 pg/ml DNA ze spermy łososia, po czym nastąpiło 6x przemywanie w 2x SSC. Temperatura wyniosła 65°C. 3 klony związały oligonukleotyd bioB; z jednego z tych klonów wyodrębniono plazmid pBO1 o fragmencie PstI (fig. 2) o 5,4 kb. Analizy restrykcyjne i porównanie z danymi publikowanymi (Szybalski, Szybalski, Gene 19:93-103; 1982) wykazały, że pBO1 zawierało wszystkie geny operonu biotyny z wyjątkiem bioD.
W celu klonowania genu bioD zastosowano sondę z częściami genów bioC oraz bioD, składającą się z fragmentu Sphl/Pstl z pBO1 o długości 520 bp. Fragment ten wyodrębniono z żelu agarozowego i 0,2 pg wyodrębnionego fragmentu znaczono radioaktywnie (Sambrook i in., 1989, ibid. 10.8) za pomocą translacji „Nick” polimerazz I DNA (Boehringer Mannheim, RFN; Holoenzym z E. coli; tą tzw. Polimerazę Kornberga zastosowano wraz z Dnazą I) oraz 25 pCi a-[32P]-dATP (NEN-Du Pont, NEG-012H). Hybrydyzacja tej sondy na „Southern blot”, jak opisano powyżej, przy użyciu chromosomu fragmentu restrykcyjnego E. coli DSM 498 wytworzonego przez Sspl wykazała z jednej strony fragment Sspl o 1,6 kb znany z pBO1 z bioF i bioC, a z drugiej strony fragment Sspl o 1,1 kb z bioD i sekwencjach sąsiadującego genu uvrB (Sancar i in., Cell, 28; 523-520; 1982).
W celu klonowania fragmentu Sspl o 1,1 kb znów nałożono częściowy bank genów. 30 pg DNA E. coli DSM 498 poddano cięciu za pomocą Sspl i rozdzielono na żelu agarozowym 0,7%. Fragmenty o wielkości od 0,9 kb do 1,3 kb wycięto i wyodrębniono przez elektrodializę. 0,5 pg tych fragmentów poddano ligacji z 0,5 pg fagowektora M13mp19 ciętego Smal (Yanisch-Perron i in., 1985, ibid.). Przy użyciu tego tworu ligacyjnego nastąpiła transfekcja E. coli JM109 (Yanisch-PerrOn i in., 1985, ibid) według Messing (Methods Enzymol., 101:20-79; 1983). 150 klonów fagowych z insertem (fenotyp LacZ) wyodrębniono i namnożono w pożywce NYB. Po odwirowaniu komórek E. coli naniesiono fagi każdorazowo w 50 pl pozostałości przy użyciu aparatury Schleicher & Schuell „minifold I” jako „dot blot” na filtrze nitrocelulozowym (Schleicher & Schuell BA 85). W celu denaturacji fagów na filtry przez 5 min. podziałano buforem 0,1 M NaOH/1,5 M NaCl, a następnie zneutralizowano 0,5 M Tris-HCl, pH 7,5/2,5 M NaCl (5 min.). DNA utrwalono na filtrze przez inkubacje (2 godz.) w 80°C. Filtr, tak jak opisano (Sambrook et al., 1989, ibid., 9.52-9.55), zhybrydyzowano ze znaczonym radioaktywnie fragmentem SphI/PstI o 520 bp w 60°C. W ten sposób zidentyfikowano klon fagu M13bioD o wyżej opisanym fragmencie Sspl o 1,1 kb, zawierającym gen bioD (fig. 2).
177 635
1.2 Konstrukcja pBO2
Każdorazowo poddawano cięciu 0,5 pg plazmidu pBO1 i 0,5 pg fagu M13bioD enzymem restrykcyjnym SnoI und HindIII i poddano powtórnej ligacji. Po transformacji E. coli RR28 otrzymanym tworem ligacyjnym badano rekombinowane plazmidy za pomocą analizy restrykcyjnej. Wybrano plazmid pBO2 (fig. 2), w którym fragment SnoI/HindIII z pBO1 o około 1,5 kb, zawierający część genu bioD i niezasadnicze sekwencje wektora pHE3, jest zamieniony przez fragment SnoI/HindIII (0,95 kb) z M13bioD. Analiza wykazała, że plazmid pBO2 zawierał kompletny operon bio, tak jak E. coli, wraz z sekwencjami promotora uvrB (Sancar et al., Cell 28;523-530; 1982) w dół sekwencji od bioD.
1.3 Konstrukcja pBO3 i pBO6
Zaobserwowano, że E. coli RR28 z pBO2 na płytkach NA słabiej rośnie niż przy użyciu pBO1 i tworzy wyraźnie mniejsze kolonie. Powodem tego mogą być sekwencje uvrB w pBO2. W celu delecji tych sekwencji, 20 pg pBO2-DNA przecięto przy użyciu HindIII i umieszczono w 150 pl buforu Bal31 (600 mM NaCl, 12,5 mM MgC12, 12,5 mM CaC12, 1 mM EDTA, 20 mM Tris-HCl, pH 7,2). Następnie w celu stopniowego skracania liniowych plazmidów dodano Bal31 (z Alteromonas espejiani, Boehringer Mannheim, RFN). Po 3, 6, 9, 12 i 15 min. inkubacji w 30°C pobierano próbki każdorazowo 30 pl i reakcję Bal3\ zatrzymano przez dodanie każdorazowo 2 pl 0,5 M EGTA (kwasu etylenoglikolo-bis-(2-aminoetylo)czterooctowego, pH 7,5, a następnie ekstrakcję fenolem. Potem przeniesiono próbki do 40 pl bufora nukleazy (mung bean) z Phaseolus aureus (30 mM octanu sodowego, 50 mM NaCl, 1 mM ZnC12, 5°% gliceryny, pH 4,6) oraz podziałano nukleazą Ph^a^<^^olus aurreus (B<^oehring(er Mannheim, RFN) przez 10 min. w 37°C w celu usunięcia niesparowanych pojedynczych końców nici oraz wytworzenia końców „stępionych”.
Przy działaniu Bal31 usuwane są nie tylko sekwencje uvrB, lecz także zasadnicze sekwencje wektora pHE3. Zatem skrócone plazmidy pBO2 po działaniu nukleazą z Phaseolus aureus rozcięto EcoRI, aby usunąć część DNA wektora pHE3, skróconą przez Bal31. Następnie zregenerowano pierwotną sekwencję wektora przez ligację plazmidu pBO2, na który działano z fragmentem DNA (1,5 kb), który po cięciu BamHI, działaniu nukleazą z Phaseolus aureus oraz dalszym cięciu EcoRI wyodrębniono z pBO2 i który posiada uprzednio deletowane zasadnicze sekwencje wektora pHE3. Ponieważ wskutek tej ligacji zregenerowano w pełni oporność Cm, można rozpoznać nienaruszone plazmidy na podstawie ich właściwości:oporności przeciw Cm.
E. coli RR28 transformowano przy użyciu tworów ligacyjnych i przełożono na płytkach NA 20 pg/ml Cm. Zaobserwowano małe, powoli rosnące kolonie typowe dla przypadku BO2 oraz wielkie, normalnie rosnące kolonie. Liczba wielkich kolonii na próbkę pBO2 wzrastała wraz z trwaniem inkubacji Bal31.
Z 22 normalnie rosnących kolonii wyodrębniono plazmid DNA i zbadano za pomocą analizy restrykcyjnej i sekwencyjnej. W ten sposób otrzymano plazmidy pBO3 i pBO6, w których poddano delecji 330 bp względnie 410 bp obszaru uvrB, lecz które jednak wciąż zawierały gen bioD.
1.4 Klonowanie genów bio w jednostce transkrypcyjnej.
I.4.1. Konstrukcja pBO22: promotor tac przed bioB.
Dla wbudowania odpowiedniego promotora przed genem bioB należy usunąć niepożądany promotor dzikiego typu przed genami bioBFCD. Może to nastąpić przez cięcie za pomocą NcoI, wskutek czego równocześnie odsłania się kodon startowy genu bioB. W danym przypadku wybrano w charakterze promotora tac (Russell i Bennett, 1982, ibid.), ponieważ może on być zastosowany jako promotor konstytutywny lub indukowalny i wykazuje bardzo dobrą aktywność nie tylko w E. coli, ale również w wielu innych bakteriach Gram-ujemnych.
Fragment DNA z promotorem tac z końcami HindIII oraz BamHI uzyskano z Pharmacia-LKB (Uppsala, Szwecja) i wbudowano w plazmid pUC18 pocięty HindIII i BamHI (Yanisch-Perron i in., 1985, ibid.). W wyniku uzyskano plazmid pUC18/tac (fig. 2). 8 pg tego plazmidu cięto następnie BamHI, a dla wypełnienia recesywnych końców 3’ za pomocą polimerazy Klenowa (Polimeraza I DNA z E. coli; Boehringer Mannheim RFN) w buforze polimerazy Klenowa (20 mM Tris-HCl, pH 7,5, 10 mM MgCh, 6 mM β-merkaptoetanol) inkubowa14
177 635 no przy dodatku po 100 pM dATP, dGTP, dCTP i dTTP. Następnie wykonano drugie cięcie przy użyciu Aatll. W ten sposób, przy użyciu promotora tac, można było wyodrębnić fragment DNA o długości 0,55 kb..
Fragment 3,2 kb z genami bioB, bioF, bioC oraz końcem 5' genu bioD wyodrębniono z pBO1. Ponadto poddano cięciu 8 pg pBO1 za pomocą Ncol, a następnie dla wypełnienia recesywnych końców 3' poddano jak wyżej działaniu polimerazy Klenowa. Następnie wykonano drugie cięcie przy pomocy PstI, po czym nastąpiło wyodrębnienie żądanego fragmentu o 3,2 kb. Na koniec, 4 pg wektora pHE3 poddano cięciu przy użyciu Pstl oraz Aatll i wyodrębniono z pHE3 replikon P15A (Hennecke i in., 1982, ibid.).
Te trzy fragmenty poddano w równomolowych ilościach ligacji wystających i gładkich końców przy użyciu ligazy T4-DNA (Boehringer Mannheim, RFN), przy czym każdorazowo ligowano wystające końce PstI, przy pomocy PstI, AatII - przy pomocy AatII z gładkimi końcami BamHl i NcoI. Przy ligacji końca BamHl uzupełnionego za pomocą polimerazy Klenowa z poddanym również obróbce NcoI regeneruje się miejsca cięcia BamHl i NcoI. E. coli RR28 poddano transformacji przy użyciu uzyskanego tworu ligacyjnego i selekcjonowano na CmR DNA plazmidu transformowane przez, CmR zbadano za pomocą analizy restrykcyjnej. W ten sposób otrzymano plazmid pBO21 (fig. 2), w którym promotor tac znajduje się przed genem bioB. Wskutek delecji fragmentu Hindlll o 1,5 kb z pBO21, charakteryzującego się niezasadniczymi sekwencjami z wektorów plazmidów pHE3 i pUC18, otrzymano- ostatecznie pBO22 (fig. 2).
1.4.2. Konstrukcja pBO27 i pBO28.
pg pBO22 poddano cięciu za pomocą PstI, a wystający koniec PstI skrócono przez działanie nukleazą z Phaseolus aureus do gładkiego końca. Następnie poddano cięciu za pomocą Snol, i wyodrębniono otrzymany fragment DNA o 6,8 kb. Wyodrębniono fragment DNA o 0,76 kb z końcem 3' genu bioD z 5 pg pBO3 po restrykcji za pomocą Clal, dopełniono wystające końce Clal za pomocą polimerazy Klenowa i cięto przy użyciu Snol. Obydwa fragmenty DNA ligowano za pomocą ligazy T4-DNA, a następnie E. coli transformowano za pomocą tego tworu ligacyjnego. Po selekcji na chloramfenikolu otrzymano z transformantu CmR po analizie restrykcyjnej plazmid pBO27. Plazmid ten zawiera promotor tac wraz z genami bioB, bioF, bioC i kompletnym genem bioD w jednostce transkrypcyjnej (fig. 2).
W celu delecji miejsca cięcia BamHl w pBO27 poddano cięciu 5 pg pBO27 za pomocą BamHl, inkubowano za pomocą polimerazy Klenowa i nukleotydu dGTP jak opisano wyżej, a następnie poddano działaniu nukleazy z Phaseolus aureus. Po powtórnej ligacji tego Dna ligazą T4-DNA i transformacji E. coli DH5 (Hanahan, J. Mol. Biol. 166:557-580; 1983) otrzymano plazmid pBO28, w którym miejsce cięcia BamHl uległo delecji, podczas gdy miejsce cięcia Ncol zostało zachowane (fig. 2).
1.4.3. Konstrukcja M13bio18 oraz M13b/o 18/13
W celu usunięcia niepożądanego promotora dzikiego typu przed genem bioA najpierw wyodrębniono przez cięcie 5 pg pBO3 za pomocą Bglll oraz Kpnl fragment o 4,4 kb z genami bioB, bioF, bioA i ORFI. 0,5 pg tego fragmentu poddano ligacji z 0,5 pg wektora fagu M13mp18 ciętego za pomocą BamHl oraz Kpnl (Yanisch-Perron i in., 1985, ibid.). Po transformacji E. coli JM109 (Yanisch-Perron i in., 1985, ibid.) tym tworem ligacyjnym zidentyfikowano (według Messinga, 1983, ibid.) rekombinowane klony fagowe, które posiadały insert. Wyodrębniono dwuniciowe fagi DNA z takich klonów i zbadano za pomocą analizy restrykcyjnej. W ten sposób otrzymano fag M13bio18 z żądanym fragmentem o 4,4 kb (fig. 2).
pg dwuniciowego DNA fagu M13óio18 zlinearyzowano przez cięcie za pomocą Ncol, wprowadzono do 160 pl buforu Bal31 i następnie dodano Bal31 w celu usunięcia promotora bioA. Po 20, 40, 60, 80, 100 i 120 sekundach inkubacji w temperaturze pokojowej pobierano próbki po 25 pl i zatrzymano reakcję Bal31 przez dodanie 2 pl 0,5 M EGTA, pH
7,5 oraz ekstrakcję fenolem. Każde 3 próbki łączono i poddano cięciu za pomocą XbaI, aby usunąć geny bioB i bioF. Następnie poddano DNA działaniu polimerazy Klenowa jak wyżej, aby wystające końce 5' dopełnić do gładkich końców. Po takiej obróbce DNA poddano powtórnej ligacji, a E. coli JM109 poddano- transformacji ligowanym DNA. Z 24 klonów fagowych wyodrębniono jednoniciowy DNA (Messing, 1983, ibid.) a sekwencję DNA na końcu
177 635
5’ genu bioA zanalizowano według Sangera i in., (1977; ibid.). W ten sposób otrzymano klon fagu M13bio18/13, w którym promotor dzikiego typu przed genem bioA uległ delecji i w którym równocześnie wystęouje miejsce cięcia Sali 26 bp w górę sekwencji od genu bioA (fig. 2).
1.4.4. Konstrukcja M1 zbioDA
Aby umieścić geny bioD oraz bioA w jednostce transkrypcyjnej poddano cięciu 5 Lig plazmidu pBO6 za pomocą Sphi i Sali. Wyodrębniono otrzymany fragment DNA o długości 0,97 kb, zawierający gen bioD i 72 bp DNA w dół sekwencji od genu bioD aż do końca Sali. 2 pg M133^ziil8/1^ również p()ddano cięęiu zz pcjmocą Sphl i Sall. fragmenty DNA poddano ligacji ligaz^ą T4-DNA i za pomocą otrzymanego produktu transformowano JM109 E. coli. Z 24 rekombinowanych klonów wyodrębniono awuniciowe DNA fagu i scharakteryzowano za pomocą analizy restrykcyjnej. W ten sposób otrzymano klon M13bioDA, w którym geny bioD i bioA są oddalone o 98 bp (fig. 2).
1.4.5. Konstrukcja pBO30
Dla skonstruowania jednostki transkrypcyjnej z promotorem tac przed genami bio poddano cięciu 5 pg DNA M13óioDA za pomocą EcoRi, dla dopełnienia wystających końców EcoRi poddano działaniu polimerazy Klenowa, a następnie cięciu za pomocą Snoi. Wyodrębniono otrzymany fragment DNA o długości 2,6 kb ·z genami bioD, bioA i ORFI. 5 pg plazmidu pBO28 (fig. 2) poddano cięciu za pomocą Sali, podziałano nukleazą z Phaseolus aureus dla odłączenia wystających końców Sali, a następnie poddano cięciu za pomocą Snoi. Wyodrębniono fragment DNA o długości 6,7 kb z wektorem DNA, promotorem tac i genami bioBFC. Wyodrębniono fragmenty DNA poddano ligacji za pomocą ligazy T4-DNA i transformowano za pomocą tego tworu ligacyjnego biotyno-auksotropowy szczep E. coli SA291 (Campbell, J. Bacteriol. 112:830-839; 1972). Przez przełożenie na płytkach NA za pomocą 20 pg/ml Cm i 8 pg/ml awidyny wyselekcjonowano klony o kompletnym operonie biotyny w plazmidzie. Plazmidy z takich klonów zbadano za pomocą analizy restrykcyjnej. W ten sposób otrzymano plazmid pBO30, zawierający geny bioB, bioF, bioC, bioD i bioA oraz gen ORFI wraz z promotorem tac w jednostce transkrypcyjnej (fig. 2).
1.5. Koostitrucja plazmiddw o ulepszone cespresji geeów bio
I.5.1. Konstrukcja pBO30A-9 i pBO30A-15
W minikomórkach E. coli Ds410 (Dougan i Sheratt, Mol. Gen. Genek 353:353-360; 1977) z plazmidem pBO30 aminotransferaza DAPA kodowana przez gen bioA jest znacznie słabiej eCsprymowaóa niż inne enzymy dla syntezy biotyny. Przy próbie polepszenia ekspresji genu bioA skrócono odległość między genem bioD i genem bioA za pomocą egzonukleazy Bal3l, aby usunąć możliwe zakłócające sekwencje, takie jak „stem-loop”. Następnie 25 pg BO30 poddano cięciu za pomocą Sali i podziałano egzonukleazą Bal31 i polimerazą Klenowa, jak opisano wyżej. Przez ligację z syntetycznym olieonukleotydżm o sekwencji 5’-CGTCGACG-3’, linkerem Sali, zregenerowano miejsce cięcia Sali. Następnie DNA poddano cięciu za pomocą Sali i Snoi, i wyodrębniono fragmenty bioD o długości około 640 bp skróconych na końcu 3’. Fragmenty te poddano ligacji z fragmentem z pBO30 o 8,25 kb, wyodrębnionym po cięciu tego plazmidu za pomocą Sali i Snoi i zawierającym niezmieniony gen bioA.
Bidtynd-auksotrooowy szczep E. coli SA291 transformowano powyższym tworem ligacyjnym, aby następnie za pomocą 60 pg/ml Cm i 5 μ g/ml awidyny wyselekcjonować na płytkach NA klony z nienaruszonym genem bioD. Otrzymano 26 takich klonów, które zbadano za pomocą analizy restrykcyjnej. 8 spośród tych klonów o widocznym skróceniu obszaru w górę sekwencji od miejsca Sali scharakteryzowano dokładniej za pomocą analizy sekwencyjnej DNA. W pięciu z tych klonów były, jak tego oczekiwano, deletowane odcinki od 20 do 45 bp DNA między genem bioD i bioA. W minikomórkach E. coli klony te wywołały faktycznie zwiększoną ekspresję genu bioA o czynnik 2 w stosunku do pBO30. Przykładem plazmidu o ulepszonej ekspresji tego rodzaju jest otrzymany w ten sposób plazmid pBO30A-9 (fig. 3).
Nieoczekiwanie wyodrębniono trzy dalsze plazmidy, w których były deletowane odcinki od 70 do 90 bp DNA między genem bioD i genem bioA. Delecje sięgały także do genu struktury bioD.. Z tego wynikły: (i) każdorazowo zróżnicowany koniec cOoH syntetazy DTB bez dużej zmiany aktywności enzymu i (ii) nakładanie zmienionych genów bioD i rastru od16
177 635 czytu bioA. W ten sposób otrzymano np. plazmid pBO30A-15 z mutantem genu bioD - bioD15 (fig. 3, 5 i 6). W minikomórkach E. coli z BO30A-15 ekspresja bioA jest w porównaniu do BO30 zwiększona o czynnik 4. Sekwencja DNA obszaru bioA i wyprowadzone stąd sekwencje aminokwasów plazmidów pBO30, pBO30A-9 i pBO30A-15 przedstawiono na fig. 3 (Seq iD nr 9-16).
I.5.2. Konstnikcsa plazmidaw o ulepszonpm miej scu wiążarna rybosomów przed genem bioB
W celu polepszenia translacji genu bioB, którego ekspresja w pB030 jest wyraźnie słabsza niż np. genu bioD, zmodyfikowano sekwencję w górę sekwencji od genu bioB w pBO30, który obejmuje promotor tac i miejsce wiązania rybosomów, zawarte w klonowanym fragmencie promotora tac. Wstawiono tu syntetyczne, tzw. mieszane („mixed”) ^gonukleotydy ze zmennymi sekwencjami przed genem bioB. W celu prostego wyboru korzystnych miejsc wiązania rybosomów zastosowano próbny plazmid o translacyjnej fuzji genów bioB :: lacZ, pbioB z.lctcZ-2. poioB c -acZ-2 jeHw jzęeei wektoeai w ργοπκ^orce tam e smejs cem wiązania rybosomów i w końcu 5’ genu bioB identyczny z plazmidem pBO22 (fig. 2). W miejscu cięcia NruI o nukleotydzie 326 genu struktury bioB uległy delecji koniec 3’ genu bioB oraz pozostałe geny bio i wbudowano gen lacZ E. coli (Casadaban i in., Methods Enzymol. W0:293-308; 1983) w taki sposób, że bioB i lacZ poddano fuzji w poprawnym rastrze odczytu dla ekspresji proteiny fuzji bioB::lacZ oraz że zregenerowano miejsce cięcia NruI.
W plazmidzie pbioB:.lacZ-Z wstawiono w szeregu etapach oligonukleotyd 985E o sekwencji 5’CATGGAATCCTCCACTGATCAGTAC-3’ przed genem bioB (fig. 4). Następnie rozdzielono pbioB::lacZ za pomocą BamHI, a wystające końce BamHI dopełniono, jak opisano, za pomocą polimerazy Klenowa. W trakcie tych etapów widocznie niespecyficznie deίetkwrno resztę guaninową (G), czego następstwem była utrata miejsca cięcia BamHI w późniejszych plazmidach. Po wstawieniu linkera KpnI transformowano XL1-Blue E. coli (Bullock i in., Biotechniquet 5:376-379; 1987) za pomocą tworu ligacyjnego, i wyodrębniono plazmid bioB:.lacZ/KpnI Plazmid ten poddano częściowo cięciu za pomocą NcoI, a następnie cięciu za pomocą KpnI. Po ligacji z oligknuplekty0em 985E dopełniono drugą nić DnA za pomocą polimerazy Klenowa. Po transformacji XL1-Blue E. coli i selekcji na płytkach NA za pomocą 20 pg/ml Cm, 30 pg/ml X-Gal i 0,5 mM IPTG (izoropylotikgαlαPtozyd) wyodrębniono plazmid pbioB::lacZ/985E (fig. 4). Plazmid pbioB::lacZ/985E poddano dalszej modyfikacji, wycinając miejsce wiązania rybosomów przez restrykcję za pomocą KpnI oraz SpeI i zamieniając przez trzy różne oligonukleotydy, SD17, SD19 oraz SD>21 ffig , 4)) , Po iigajjl yyml kligonuPleotydrmi zamknięto lukę w drugiej nici przez inkubację polimerazy Klenowa. Komórki bakterii XL1-Blue E. coli transformowano za pomocą tego DNA i jak wyżej przełożono na płytkach NA za pomocą 20 pg/ml Cm, 30 pg/ml X-Gal i 0,5 mM IPTG. Wybrano 20 klonów o dobrej ekspresji proteiny fuzji bioB:.lacZ, które na tej pożywce utworzyły ciemnobiałe kolonie i zmierzono aktywność e-galaktozydazy tych klonów za pomocą próby enzymu według Millera (Experiments in Molecular Genetics, Cold Springs Harbor Laboratory, Cold Spring Harbor, N.Y., str. 352-355; 1972). Ponadto uprzednio wyhodowano szczepy E. coli z plazmidami bio::lacZ w pożywce płynnej aż do gęstości optycznej przy 600 nm (OD600) około 0,5.
Najwyższą aktywność β-galaPtozy0αzy wykazały plazmidy pbioB::lacZ/985, pbioB:.lacZ/16 i pbioB::lacZ/9 (fig. 4), dla których aktywność e-galaktozydazy w porównaniu z pbioB::lacZ-a wzrosła o czynnik 2,1 3,4 względnie 5,9. Sekwencję DNA zoptymalizowanych miejsc wiązania rybosomów dla genów bioB w tych plazmidach określono według Sangera i in., (1997, ibid.,).
W celu wbudowania zoptymalizowanych miejsc wiązania rybosomów w jednostkę transkrypcyjną z genami bio poddano cięciu każdorazowo 5 pg plazmidów pbioB::lacZ/985E, pbioB::lacZH6 lub pbioB::lacZ/9 za pomocą ClaI i NruI i wyodrębniono fragment DNA o długości 550 bp z promotorem tac, każdorazowym miejscem cięcia rybosomów i końcem 5’ genu bioB. Równocześnie poddano cięciu 5 pg plazmidu pBO30AA(fig. 5) za pomocą ClaI i NruI i wyodrębniono fragment DNA o długości 7,7 kb. W pBO3OAA, wyprowadzonym z pBO30, uległ delecji fragment SalI/BamHI ze znaczną częścią genu bioA i zakłócającym
177 635 miejscem cięcia Nrul (fig. 5). Obydwa fragmenty poddano ligacji i wyodrębniono klony z rekombinowanymi plazmidami. W ten sposób otrzymano plazmidy pBO30AA/9, pBO30AA/16 oraz pBO30AA/985. Fig. 5 przedstawia taką konstrukcję na przykładzie pBO30AA/9 z miejscem wiązania rybosomów z pbioB::lacZ/9.
Po 2 pg plazmidów pBO30AA/9, pBO30AA/16 oraz pBO3O A/985E poddano cięciu za. pomocą Snol i Kpnl, przy czym Kpnl użyto w małej ilości, aby ciąć jedynie częściowo. Następnie wyodrębniono każdorazowo fragmenty DNA o długości 6,6 kb, zawierające wektor DNA, promotor tac, gen bioB z ulepszonym miejscem wiązania rybosomów i geny bioFC. Plazmid pBO30A-15 (4 pg) również poddano cięciu za pomocą Snol i Ncol i wyodrębniono fragment 2,8 kb z genami bioDA-ORFI. Wyodrębnione fragmenty poddano ligacji i RR28 E. coli poddano transformacji tą mieszanką ligacyjną. Rekombinowane plazmidy z kompletnym operonem biotyny zidentyfikowano przez analizę restrykcyjną. W ten sposób otrzymano plazmidy pBO30-15/9, pBO30A-15/16 oraz pBO30A-15/985E. Zawierały one wszystkie zoptymalizowany obszar bioDA z pBO30A-15 z odpowiadającymi zoptymalizowanymi miejscami wiązania rybosomów z plazmidów pbioB::lacZ/9, pbioB::lacZ/l6 względnie pbioB::lacZ/9S5E. Genetyczne elementy kontrolne tych plazmidów, mianowicie kombinacja z promotora tac i zoptymalizowanego miejsca wiązania rybosomów, które są bezpośrednio powiązane z genem bioB i oddziałują na jego skuteczną ekspresję, wykazują następujące sekwencje:
pBO30A-15/985E (Seq ID nr: 17)
5’-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC-3’ pBO30A-15/16 (Seq ID nr: 18)
5’-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC-3’ pBO30A-15/9 (Seq ID nr: 19)
5’-AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC-3’
Figura 5 przedstawia konstrukcję plazmidów zawierających geny bioB, bioF, bioC, bioD i bioA wraz ze zoptymalizowanym miejscem wiązania rybosomu, na przykładzie konstrukcji pBO30A-15/9.
Zsekwencjonowano całą jednostkę transkrypcyjną genów bio w BO30A-15/9. Sekwencję i wyprowadzone z niej produkty genowe przedstawiono na fig. 6 (Seq ID nr: 1-8)
1.6. Konstrukcja pBO30A-15/9AorfI pg plazmipu pBO3 0ΔΑ/9 pAddano cięciu jakwyżej w pomocą Snol i Kpnl i wyodrębniono fragment DNA o długości 6,6 kb. 4 pg plazmidu pBO30A-15 poddano cięciu za pomocą Sspl. Przez ligację otrzymanego liniowego DNA z linkerem Kpnl o sekwencji 5’-CGGTACCG-3’ dodano w dół sekwencji od genu bioA nowe miejsce Kpnl. Po cięciu za pomocą Snol wyodrębniono fragment o 2,1 kb z genami bioDA. Wyodrębnione fragmenty DNA poddano ligacji i RR28 E. coli transformowano otrzymaną mieszanką ligacyjną. Rekombinowane plazmidy z genami bioBFCDA zidentyfikowano przez analizę restrykcyjną W ten sposób otrzymano BO30A-15/9 orfl z delecjągenu ORFI (fig. 5).
1.7. Konstrukcja plazmidu pBO47 pg plazmidu pBO30A-15/9 poddano cięciu enzymami restrykcyjnymi Xbal i EcoRl. Otrzymany fragment restrykcyjny o 5,8 kb z promotorem tac i operonem biotyny wyodrębniono, a następnie poddano ligacji z plazmidem pRK290X o „szerokim spektrum gospodarzy” (Alvarez-Murcles i in., Nucl. Acid. Res. 14, 4207-4227, 1986; zmodyfikowany przez delecję miejsca restrykcyjnego Xhol i dodanie miejsca Xbal w tej samej pozycji), który również poddano cięciu Xbal i EcoRl. S17-1 (Simon i in., Biotechnology 1:784-791; 1983) E. coli transformowano tworem ligacyjnym. Rekombinowane plazmidy scharakteryzowano przez analizę restrykcyjną; W ten sposób otrzymano plazmid pBO47, zawierający operon biotyny wcielolny w pRK290X.
Przez koniugację ze szczepem E. coli S17-1/pBO47 plazmid pBO47 przeniesniono do szczepów bakteryjnych Rhizobium/Agrobacterium sp. HK4, Pseudomonas mondocina, Pseu18
177 635 domonas aeruginosa PA01 (Holloway, J. Gen. Microbiol. 13:572-581; 1955) i Acinetobacter calcoaceticus DSM 588.
I. 8. Konstrukcja pBO74AB
Konstrukcji plazmidu pBO74AB z delecją genu bioB dokonano wychodząc z plazmidu pBO74-13 (fig. 7). Plazmid pBO74-13 składa się z równych elementów DNA, jak pBO30 (fig. 2). Następstwo w szeregu genów bio w obrębie plazmidu pBO74-13 jest jednak różne.
pg plazmidu pBO74-13 poddano cięciu za pomocą Smal. Po ekstrakcji fenolem/chloroformem DNA plazmidu poddano cięciu za pomocą SphI i wyodrębniono fragment o 6 kb zawierający DNA wektora, promotor tac, geny bioA-ORFI oraz bioCD. 18 pg plazmidu pBO3 (fig. 2) poddano cięciu za pomocą SspI i SphI i wyodrębniono fragment 1,66 kb z genem bioF i częścią genu bioC. Wyodrębnione fragmenty poddano wzajemnej ligacji i RR28 E. coli transformowano za pomocą otrzymanej . mieszanki ligacyjnej. Rekombinowane plazmidy zanalizowano za pomocą analizy restrykcyjnej. W ten sposób otrzymano plazmid pBO74AB, różniący się od plazmidu pBO74-13 delecją genu bioB (fig. 7).
Przykład II
Fermentacja biotynowa in vivo
II. I Fermentacja biotynowa in vivo ze szczepami produkcyjnymi Escherichia coli.
Komórki szczepu XL1-Blue E. coli z pBO30A-15/9 (DSM 7246) hodowano przy użyciu fermentatora MBR (20 1. w pożywce minimalne. z giiceiyną (3% giiu^cryup·· pazy zapoczątkowaniu kultury) metodą „fed batch”) przez 30 godz. w 37°C aż do gęstości optycznej przy 650 nm (OD650) 20. Obecność plazmidu pBO30A-15/9 potwierdzono przez dodanie chloramfenikolu (50 pg/ml) do wstępnej kultury (3 l pożywki minimalnej zaw. glicerynę) i w fazie fermentacji wsadowej. Zastosowanie innych źródeł węgla, takich jak glukoza lub bursztynian (0,4% na początku fazy fermentacji wsadowej) również wchodzi w rachubę. Aktywność metaboliczną komórek śledzono poprzez ich specyficzną szybkość pobierania tlenu. Produkcję biotyny podczas fermentacji obserwowano przez miareczkowanie biotyny w pożywce fermentatora próbą bio za pomocą Lactobacillus plantarum (E. DeMoll i W. Shive, Anal. Chem. 158:55-58, 1986). Źródło węgla, w tym przypadku 50% roztwór gliceryny w demineralizowanej wodzie, dostarczano ze zmienną szybkością dopływu, stosownie do ewolucji biomasy. Za podstawę dla szybkości zasilania przyjęto dla gliceryny empiryczną wartość 2 g gliceryny na 1 litr kultury dla wzrostu OD od 1 do 2.
Wartość pH fermentatora doprowadzono automatycznie do pH 7 za pomocą dopompowywania 40% H3PO4 względnie 25% NH3. Wentylację regulowano przez nadmuchiwanie 10 -25 NL/min. powietrza i obracanie mieszadła z prędkością 300-70 obr./min. stosownie do danej ewolucji biomasy. Dążono do nasycenia tlenem między 15 a 40%. Zawartość tlenu i CO3 w powietrzu wychodzącym mierzono paramagnetycznie względnie za pomocą podczerwieni. Temperaturę fermentatora ustalono na 37°C. W 37°C kultura rosła przy czasie podwajania 2,5 godz. do wartości OD650 20, a następnie osiągnęła stan stacjonarny.
Podczas fermentacji nagromadziło się wciągu 25 godz 35 mg/l D(+)-biotyny. U szczepów E. coli można osiągnąć znaczącą syntezę biotyny jedynie w kulturach rosnących.
Dalszymi odpowiednimi szczepami produkcyjnymi okazały się E. coli ED8767 (N. E. Murray i in., Mol. Gen. Genet. 150:53-61; 1975) z pBO30A-15/9 (DSM 8554) lub E. coli BM4062 (D. F. Barker i A. M. Campbell, J. Bacteriol. 143:789-800; 1980) z pBO30A-15/9 (DSM 7247).
W podobny sposób zbadano plazmidy pBO3, pBO30 i pBO30A-15/9AORFI i określono produktywność biotyny. Poniższa tabela 1 uwidacznia silne polepszenie produktywności biotyny szczepów z plazmidami pBO30, pBO30A-15/9 i pBO30A-15/9AORFI, posiadającymi geny bio w jednostce transkrypcyjnej, w porównaniu do E. coli S17-1 (Typ dziki, geny biotyny w chromosomie) i E. coli S17-1/pBO3 (geny biotyny na plazmidzie, jednak rozbieżna transkrypcja jak w operonie dzikiego typu). Badania wykazują ponadto, że brak genu ORFI nie ma żadnego wpływu na produktywność biotyny.
177 635
Tabela 1
Szczep | Produktywność biotyny pmoli/min x 109 komórek | |
E. coli S17-1 | 0,01 - | 0,02 |
E. coli S17—1/pBO3 | 0,02 - | 0,04 |
E. coli BM 4062/pBO30 | 3,0 - | 5,0 |
E. coli XL1 Blue/pBO30A-15/9 | 10,0 - | 20,0 |
E. coli BM 4062/pBO30A-15/9ńORFI | 10,0 - | 20,0 |
Wsadowa minimalna pożywka glicer1 | ynowa (w demineralizowanej H2O) | |
Gliceryna | 30 | g/l |
MgCl2 x 6H2O | 0,8 | g/l |
CaCl 2 | 0,16 | g/l |
(NH4)2SO4 | 2,0 | g/l |
Elementy śladowe SLFa) | 1,0 | ml/l |
Fe-EDTA b | 1,5 | ml/l |
PPG-2000 | 0,1 | g/l |
KH2PO4 | 1 | g/l |
K2HPO4 | 1 | g/l |
Na2HPO4 | 1 | g/l |
Tiamina | 1 | g/l |
Chloramfenikol | 50 | mg/l |
IPTG | 0,5 | mM |
a) Roztwór elementów śladowych S | LF (w demineralizowanej H2O) | |
KOH | 15 | g/l |
EDTA-Na2 x 2H2O | 100 | g/l |
ZnSO4 x 7H2O | 9 | g/l |
MnCl2 x 4H2O | 4 | g/l |
H3BO3 | 2,7 | g/l |
CoCl2 x 6H2O | 1,8 | g/l |
CuCl2 x 2H2O | 1,5 | g/l |
NiCl2 x 6H2O | 0,18 | g/l |
Na2MoO4 x 2H2O | 0,2 | g/l |
b) Roztwór Fe-EDTA (w demineralizowanej H2O) | ||
EDTA Na2 x 2H2O | 50 | g/l |
FeSO4 x 7H2O | 20 | g/l |
KOH | 10 | g/l |
177 635
Uzupełnienia w postaci antybiotyków: (stężenia końcowe)
100 pg/ml ampicyliny (sól sodowa, Fluka) oraz 50 pg/ml chloramfenikolu (Fluka)
II.2. Fermentacja ϋοΙνηοχνΗ no vivo zv pomocą szczepu piOdukcojnego IlKoipl3O47 Agrobacterium/Rhizobium.
Komórki biotyno-auksotropowago Agrobacterium/Rhizobium sp. HK4 z plazmidem produkcji biotyny pBO47 (DSM 8555) hodowano w farmantatcrza MBR (2 l) w pożywce minimalnej (kwas L-glutaminowy/betaina) metodą „fed batch” w 30°C do uzyskania OD650 70. HK4/pBO47 charakteryzuje się godną odnotowania stabilną szybkością syntezy biotyny, także przy skrajnie wolnym wzroście („maintenanοa growth”). Dlatego w tym doświadczeniu dołączono po fazie ewolucji biomasy długą fazę utrzymywania (500 godz.) przy silnie zmniejszonym zasilaniu źródłem węgla.
Po fazie wzrostu wykładniczego i osiągnięciu OD650 12, dodano zasilanie w postaci glukozy i betainy (360 g/l glukozy + 103 g/l betainy rozpuszczone w demineralizowanaj wodzie); Dozowano powoli (1,5 ml/godz.), aby umożliwić długotrwały powolny wzrost względnie „maintenance growth”. Do osiągnięcia 150 godz. zasilano dodatkowo glukonianem Fe2+ do stężenia końcowego 100 mg/l w fermentatorze. Do osiągnięcia odpowiednio 200, 360 i 550 godz. zasilano dodatkowo 10 ml roztworu soli i 1,36 ml standardowego roztworu witaminy.
Wartość pH fermenta-tora automatycznie doprowadzono do wartości 7 przez dopompowywanie 85% roztworu kwasu fosforowego względnie 3M ługu potasowego. Wentylację regulowano przez nadmuchiwanie 1-3 NL/min. powietrza i obracanie mieszadła z prędkością 300-1000 obr./min. stosownie do danej ewolucji biomasy, tak by zapewnić ilość tlenu 14 mg/l. Tercperattlrę fermenIatoca us^ttalono na 30°C. Kullura rco^la w fazie wznosu wykładniczego przy czasie podwajania 5,6 godz., w fazie z silnie ograniczonym zasilaniem przy czasie podwajania 300 godz., a następnie przeszła do „maintenance growth”.
Przy stracie fermantacji, po 200 godz. i po 415 godz. dodano do kultury kwas dwuamincpalargcnowy (DAPA; dwukrotnie do końcowego stężenia 200 pg/ml, w końcu do końcowego stężenia 100 pg/ml). HK4 jest sam biotyno-auksotropowy. Szczep był zdolny wytworzyć z poprzednika biotyny DAPA detiobiotynę, a tę ostatecznie przetworzyć z dużą wydajnością w D(+)-biotynę. Zgromadzono 110 mg/l D(+)-biotyny. Warte odnotowania jest przy tytm że syntezę tą w przeważającym stopniu wykonały komórki niarcsnąοe.
Minimalna pożywka kwas glutaminowy/betaina | |
W 1,25 l | demineralizowanej wody rozpuszczono względnie do niej dodano |
31,25 g | soli jednosodowej kwasu L-glutaminowego x H2O |
12,5 g | betainy |
0,2 g | CaCl2 |
1,0 g | MgCl2 x 6H,O |
1,25 g | K2SO4 |
1,25 ml | elementów śladowych SLF (przykład II.1) |
1,87 ml | Fe-EDTA (przykład II.1) |
0,25 ml | tetracykliny (10 mg/ml w 70% etanolu) |
Roztwór soli | |
0,03 g | CaCl2 |
0,16 g | MgCl2 x 6H2O |
0,2 g | K2SO4 |
200 pl | SLF (przykład II.1) |
300 pl | HCl stęż. |
(rozpuszczono w 10 ml daminaralizcwanej H2O)
Standardowy roztwór witaminy (w demineralizcwanaj HO) 10 mg/l chlorowodorek pirydoksalu mg/l ryboflawiny
177 635 mg/1 amidu kwasu nikotynowego 5 mg/1 chlorowodorku tiaminy 2 mg/1 biotyny mg/1 kwasu pantotenowego 5 mg/1 kwasu 4-aminobenzoesowego 2 mg/1 kwasu foliowego mg/1 witaminy B12
ZESTAWIENIE SEKWENCJI (1) INFORMACJA OGÓLNA:
(i) ZGŁASZAJĄCY:
(A) NAZWA: LONZA AG (B) ULICA: Muenchensteinerstrasse 38 (C) MIEJSCOWOŚĆ: Basel (E) KRAJ: Szwajcaria (F) KOD POCZTOWY: 4002 (ii) TYTUŁ ZGŁOSZENIA: Biotechnologiczny sposób wytwarzania biotyny (iii) LICZBA SEKWENCJI: 19 (iv) POSTAĆ CZYTANA PRZEZ KOMPUTER:
(A) NOŚNIK: Floppy disk (B) KOMPUTER: kompatybilny z IBM PC (C) SYSTEM OPERACYJNY: PC/DOS/MS-DOS (D) OPROGRAMOWANIE: Patentln Release 1.0, Version 1.25 (EPA) (vi) POPRZEDNIE DATY ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: CH 3124/92 (B) DATA ZGŁOSZENIA: 02-10-1992 (vi) POPRZEDNIE DATY ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: CH 2134/93 (B) DATA ZGŁOSZENIA: 15-07-1993 (2) INFORMACJA O SEQ ID Nr: 1:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DłUGOŚĆ: 5872 par zasad (B) RODZAJ: Kwas nukleinowy (C) POSTAĆ NICI: Podwójna (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: DNS (genomowa) (iii) HIPOTETYCZNOŚĆ: NIE (iii) ANTYSENSOWNOŚĆ: Nie (vi) PIERWOTNE POCHODZENIE:
(A) ORGANIZM: Escherichia coli (B) SZCZEP: D5T1498 (vii) BEZPOŚREDNIE POCHODZENIE:
(B) KLON: p8O3O A-15/9 (ix) CECHY:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 117..1157 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /codon_start= 117 /product=„biotin synthase” /evidence=EXPERIMENTAL /gene= „bioB” /number= 1
177 635 (ix) CECHY:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 2295..3050 (D) POZOSTAŁE DANE: /codon_start= 2295 /function= „involved in pimeloyl-CoA synthesis” /product= „protein” /gene= „bioC” /number= 3 (ix) CECHY:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 3750..5039 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /codon_start= 3750 /EC number= 2.6.1.62 /product= „DAPA synthase” /evidence= EXPERIMENTAL /gene= „bioA” /number= 5 /standard_name= „S-Adenosyl-L-methionine:8-amino-7-oxononaoate aminotransf.’ (ix) CECHY:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 5098..5574 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /codon_start= 5098 /function= „unknown, involved in biotin synthesis” /product= „protein” /evidence= EXPERIMENTAL /gene= „ORFI” /number= 6 (ix) CECHY (A) NAZWA/KLUCZ: -10_signal (B) POŁOŻENIE: 45..49 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE:
/evidence= EXPERIMENTAL /standard_name= „promoter ptac” (ix) CECHY (A) NAZWA/KLUCZ: -35_signal (B) POŁOŻENIE: 23..28 (D) POZOSTAŁE DANE:
/standard name= „promoter ptac” (ix) CECHY (A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 105..119 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE:
/evidence= EXPERIMENTAL /standard name= „bioB RBS no.9” (ix) CECHY (A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 2284..2297 (D) PCO^^(O^'L/\ DANE:
/standard name= „bioC RBS’’ i (ix) CECHY (A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 3742..3752 (D) POZOSTAŁE DANE: //sandard name= „bioA RBS”
177 635 (ix) CECHY (A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 5088..5100 (D) POZOSTAŁE DANE: /standard name= „ORFI RBS” (ix) CECHY (A) NAZWA/KLUCZ: terminator (B) POŁOŻENIE: 5583..5644 (D) POZOSTAŁE DANE: /stcndcrC name= „rho-independent transcriptional terminator” (ix) CECHY (A) NAZWA/KLUCZ: stemjoop (B) POŁOŻENIE: 5583..5605 (ix) CECHY:
(A) NAZWA/KLUCZ: promotor (B) POŁOŻENIE: 1..96 (c) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /function= „promoter ptac” /evidence= EXPERIMENTAL (x) INFORMACJA DOT. OPUBLIKOWANIA:
(H) NUMER DOKUMENTU: WO 87/01391 B1 (I) DATA ZGŁOSZENIA: 26-08-1986 (J) DZIEŃ OPUBLIKOWANIA: 07-04-1993 (xi) OPIS SEKWENCJI SEQ ID Nr: 1:
AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATT
116
164
212
GTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
ATG GCT Met Ala 1 | CAC Hi £5 | CCG AAg | CCA CCG Cro CAg 5 | TGG Trp | ACC. TTr | TTG TCG CC GTC ACA GAA. TTA | TTT Phe | ||||||||
Leu | Ser 10 | Gin Val | Thr | Glu | Leu 15 | ||||||||||
GAA | AAA | CCG | TTT | CCG | GGA | CTG | CCT | TTT | GAA | GCG | CAG | CAG | gtg | CAT | CGC |
Glu | Lys | Pro | LLe | Ceu | Aap | Leu | Llu | Phe | Glu | Ala | Gin | Gln | Val | His | Arg |
20 | 25 | 30 |
CAG CAT TTC GAT CCC CGT CAG GG^Gt CAG GTC AGC ACG TTG CTG TCG ATT
260
177 635
Gln His | Phe 35 | Asp | Pro Arg | Gln | VaU 44 | Gln Val | eer Thr | Leu 415 | Leu eer | lle | ||||||
AAG | ACC | Gd | TCT | CCG | GGA | CG.T | Cd | GAA | TTA | CCG | CCG | CAA | Ad | CCA | 308 | |
Lys | Thr | Gly | Ala | Cys | Pro | du | AAs | Cy-s | Cye | (Cr | CCS | Pro | Gln | Ser | Cer | |
50 | 55 | 60 | ||||||||||||||
CGC | TAC | A2AA | ACC | (GA | CTC | GGA | (GC | CGA» | Cd | TTG | (AT | dA | GTT | GGA | CCA | 356 |
Arg | Tyr | Lys | Thr | Gly | Leu | Glu | Ala | CAC_^ | (Arg | Lee | Lee | Glu | Val | du | dn | |
65 | 77 | 75 | 80 | |||||||||||||
GTG | CTG | GACA | TCG | GCG | Cd | (AA | (^GZCA | (AA | CGC | GCA | (AA | TCG | ACG | Cd | CTC | 404 |
Val | Leu | Glu | Ser | CAL a | (Arg | Lys | Ala | (Lys | (Aa | AA a | du | ser | Thr | GAg | CPh | |
85 | 90 | 95 | ||||||||||||||
TGT | ATG | GGC | GCG | CAG | Td | CAG | (AT | CCC | cca | CGA | CCG | dT | ATG | CCC | CT^A | 452 |
Cys | Met | Gly | Ala | Ala | Τη? | Lys | (An | (Po | (Hi | du | «o | Asp | Met | Ρρό | CTr | |
100 | 105 | 110 | ||||||||||||||
CTG | GAA | CGA | ATC | GTC | CAG | cm | GTA | (AA | CGC | (ATC | Gf G CTG GAG GCG TGT | 500 | ||||
Leu | Glu | Glu | Val | Gin | Gly | Val | Cyy | (Aa | Lee | Gly | Leu | Glu | Ala | Cys | ||
115 | 120 | 125 | ||||||||||||||
ATG | ACG | CTG | dC | ACG | TTG | AGT | (GA | TCT | CCA | GCG | GCA | CGC | CTC | GGG | (AA | 548 |
Met | Thr | Leu | Gly | Thr | Leu | See | de | Cee | dn | Ala | du | Arg | Leu | AA a | «π | |
130 | 115 | 140 | ||||||||||||||
GCC | GGG | CTC | GAT | TAA | TAA | (AC | CCA | (AA | CC^^ | LGA | CAC | TCG | CCG | GGA | ctt | 596 |
Ala | Gly | Leu | Asp | C^r | (tyr | Asn | (^j.E( | Asn | Ceu | AAs | CTr | Ser | Pro | du | CPh | |
145 | 115 | 155 | 160 | |||||||||||||
TAC | GGC | GAT | ATC | ATC | ACC | ACC. | CGC | (ACC? | CTA | CCG | CGA | CGC | CTC | GG.A | AAC | 644 |
Tyr | Gly | Asn | Ile | Ile | Thr | Thr | (Arg | TTh | (Cr | Gln | de | Arg | Leu | AAs> | CTh | |
165 | 170 | 175 | ||||||||||||||
CTG | GAA | GkGA | gtc | CGC | dT | GCC | (GA | CAC | (AA | (GC | TGT | TCT | GGC | GGC | ATT | 690 |
Leu | Glu | Lys | Val | (Arg | Asp | (A^a | Gly | Cle | Cys | Lvl | Cys | eer | Gly | Gly | Ile | |
180 | 185 | 190 |
177 635
GTG Val | GGC Gly | TTA GGC Leu Gly 195 | GAA ACG Glu Thr | 6 TA Val | AAA GAT CGC GCC GGA TTA TTG CTT TTA< | 740 | ||||||||||
Lys 200 | Asp | CArg | Ala Gly | Leu Leu 205 | Tet | iGu | ||||||||||
CTG | GCA | AAC | CTC | CCG | ACG | CCG | CCG | GGCT | agt | GTG | CCC | ATC | CAAC | ATG | CTC | 799 |
Leu | Ala | Asn | Leu | Pro | Thr | Pro | Pro | Glu | Sse | Val | Pro | Ile | Asn | Met | ILU | |
210 | 215 | 220 | ||||||||||||||
GTG | AAG | GTG | GACA | GGC | ACG | CCG | CTTP | GCC | AGAT | AAC | GAT | GGA | CTC | ATC | g:c | 836 |
Val | Lys | Val | Lys | Gly | Thr | Pro | Leu | Ala | Asp | Asn | Asp | AAp | Tal | ASJ) | ACu | |
225 | 230 | 235 | 240 | |||||||||||||
TTT | GAT | TTT | ATT | CGC | ACC | ATT | GCG | GTC | GCG | CTG | ATC | ATC | ATG | TCA | acc | 8884 |
Pht | Asp | Phe | Ile | Arg | Thr | Ile | Ala | Val | Ala | Arg | Ile | Met | Aet | Cpo | CTh | |
245 | 250 | 255 | ||||||||||||||
TCT | TAC | GTG | CGC | CTT | TCT | GCC | GGA | CGC | <GG | CAG | ATG | GAAC | AGA | TGC | acc | 932 |
Ser | Tyr | Val | GAg | Leu | Ser | Ala | Gly | CCrg | GCu | Gln | Met | Ass | CGu | tCu | iTh | |
260 | 265 | 270 | ||||||||||||||
CAG | GCG | ATG | TGC | TTT | ATG | GCA | GGC | GCA | CAAC | TCG | ATT | TTC | TTC | CGT | TTC | 990 |
Gln | Ala | Met | Cys | Phe | Met | Ala | Gly | Ala | Asn | Ser | Ile | PPh | CTy | CGu | ICS | |
275 | 280 | 228 5 | ||||||||||||||
AAA | CTG | CTG | ACC | ACG | CCG | AAT | CCG | GGCT | GGAA | GAT | AAA | GGAC | CTC | IGA | ATT | 1028 |
Lys | Leu | Leu | Thr | Thr | Pro | Asn | Pro | Glu | Gili | Asp | Lys | GAs | Aeu | CGn | Aeu | |
290 | 295 | 300 | ||||||||||||||
TTC | CGC | AAA | CTG | GGG | CTA | AAT | CCG | CAG | CGAA | CCT | GCC | GTC | CTC | CCC | TTG | 1076 |
Phe | Arg | Lys | Leu | Gly | Leu | Asn | Pin | Gin | GCu | Thr | Ala | Val | leu | AC u | TCu | |
305 | 310 | 315 | 320 | |||||||||||||
GAT | AAC | GAJA | CAA | CAG | CAA | CGT | CTTT | AGAT | CCG | GCG | CTG | AST | AAC | CCG | TTC | 1124 |
Asp | Asn | Glu | Gin | Gin | Gin | is-g | Leu | Glu | GCu | Ala | Leu | Met | CTi- | Cpo | Ass |
325 330 335
ACC GAC GAA TAT TAC AAC GCG GCC GCA TTA TGAGCTGGCA GGAGAAAATC
1174
177 635
Thr Asp Glu Tyr Tyr Asn Ala Ala Ala Leu 340 345
AACGCGGCGC | TCGATGCGCG | GCGTGCTGCC | GATGCCCTGC | GTCGCCGTTA | TCCCGJTCGSCG |
CAAGGAGCCG | GACGCTGGCT | GGTGGCGGAT | GATCGCCAGT | ATCTGTG.CTT | TTCCAGGTA.C |
GATTATTTAG | GTTTAAGCCA | TCATCCGCAA | ATTATCCGTG | CCTGGCGCAA | agcggccgag |
CAATTTGGCA | TCGGTAGCGG | CGGCTCCGGT | CACGTCAGCG | GTTATAGCGT | (GSTfGCTCAG |
GCACTGGAAG | AAGAGCTGGC | CGAGTGGCTT | GGCTATTCGC | GtGJCACTCTT | (GTTATCTCT |
GGTTTCGCCG | CTAATCAGGC | AGTTATTGCC | GCGATGATGG | CGCGAGACA | ccgtattgct |
GCCGACCGGC | TTAGCCATGC | CTCATTGCTG | GAAGCTGCCA | GTTTJTGCCC | GTCGCCGCTT |
CGCCGTTTTG | CTCATAACGA | TGTCACTCAT | TTGGCGCGAT | tgcttgcttc | CCCCTCTCCG |
GGGCAGCAAA | TGGTGGTGAC | AGAAGGCGTG | TTCAGCATGG | ACCCTCGATAG | ttgzgccactg |
GCGGAAATCC | AGCAGGTAAC | GCAACAGCAC | AATGGCTGGT | TGATCTTTCGA | TGATGCCCC |
GGCACGGGCG | TTATCGGGGA | GCAGGGGCGC | GGCAGCTGCT | GGCTGCGCAAA | TG5TCTATTCCA |
GAATTGCTGG | TAGTGACTTT | TGGCAAAGGA | TTTGGCGTCA | GCGCGG5CAGC | CG»TGCTTTGC |
TCCAGTACGG | TGGCGGATTA | TCTGCTGCAA | TTCGCCCGCC | ACCTTATCTA | CAGCACCAGT |
ATGCCGCCCG | CTCAGGCGCA | GGCATTACGT | GCGTCGCTGG | CCCGTCATTCG | CAGTGATGAG |
GGTGATGCAC | GGCGCGAAAA | ACTGGCGGCA | CTCATTACGC | GTTTTCGTGC | |
GATTTGCCGT | TTACGCTTGC | TGATTCATGC | AGCGCCATCC | AGCCTTGAT | TGTCCGTTGAT |
AACAGCCGTG | CGTTACAACT | GGCAGAAAAA | CTGCGTCAGC | AAGGCTGCTG | (GTTCACCG3CG |
ATTCGCCCGC | CAACCGTACC | CGCTGGTACT | GCGCGACTGC | GCTTAACGCT | AACCGCTGCG |
1233
12991
12591
1244
1247
1254
12591
1265
1274
1274
1234
1294
1254
2014
2074
2134
94
2254
177 635
CATGAAATGC AGGATATCGA CCGTCTGCTG GAGGTGCTGC ATG GCA ACG GTT AAT 2309
Met Ala Thr Val Asn
5
AAA CAA | GCC ATT GCA GCG GCA TTT | TCT Gly | CGG GCA GCC | GCA CAC | TAT Tcy 20 | GAG AAu | 2235 | |||||||||
Lys | Gln | AAa | I Il Ala Ala 10 | Ala | Phe | Arg 15 | Ala | Ala | Ala | His | ||||||
CAA | CAT | GCA | GAA | CTA | CAG | CGC | CAG | AGT | GCT | GAC | GCC | TTA | CTG | <AA | ATG | 22^5 |
Gln | His | AAa | Aap | Leu | Gln | Arg | Gln | See | Ala | Asp | Ala | Leu | Leu | Ala | Mee | |
25 | 33 | 35 | ||||||||||||||
CTT | CCA | CAG | CCG | AAA | TAC | ACC | CCC | GTA | CTG | GAC | GCG | GGT | TGT | CAA | ACT | 2245 |
Leu | Pro | Gln | AAr | Ays | (Tyr | Thr | Hi i | Val | Leu | Asp | Ala | Gly | Cys | GAy | Aro | |
40 | 44 | 50 | ||||||||||||||
GGC | TGG | ATG | A«G | CGC | CAC | ATGG | CTC | GHA | CGT | CAC | GCG | CAG | GTG | ACC | AGC | 2501. |
Gly | Trp | Met | s ee | Arg | His | Tir? | lArg | GAu | Arg | His | Ala | Gln | Val | TTh | AA u | |
55 | 60 | 65 | ||||||||||||||
TTA | GAT | CTC | TTC | CCG | CGA | ATC | CTT | ggt | CAG | GCA | C<^C | GAG | AAG | GAI | AGC | 2244 |
Leu | Asp | Leu | s ee | Pro | Pro | Met | Leu | vvi | Gln | Ala | Arg | Gln | Lys | AAfl | AAa | |
70 | 75 | 80 | 85 | |||||||||||||
GCA | GAC | CAT | TTA | CTC | GCG | (GGA | CGAT | ATC | GAA | TCC | CTA | CCG | TTA | GAC | ACT | 2259 |
Ala | Asp | His | Ttyy | Leu | Ala | Gly | Asp | Ul | Glu | Ser | Leu | Pro | Leu | AA u | TTh | |
90 | 95 | 100 | ||||||||||||||
GCG | ACG | TTC | GAA | ccc· | GCCA | ttc | AGC | AM | CTC | GCA | GTG | CAG | TTC | TTA | TCG | 2264 |
Ala | Thr | Phe | AAp | Leu | Ala | Tjr? | Ser | Am | Leu | Ala | Val | Gln | Trp | CCS | GAu | |
105 | 111 | 115 | ||||||||||||||
AAT | TTA | TCC | ATC | ACA | CTC | ccac | GAG | CCG | TAT | CGG | GTC | GTG | CGC | CCC | 2«. | 2263 |
Asn | Leu | Ser | TTh | Ala | Leu | (Arg | GAu | Leu | Tyr | Arg | Val | Val | Arg | Prr | ALS | |
120 | 112 | 130 | ||||||||||||||
GGC | GTG | GTC | GAC | TTT | ACC | ACG | CTC | GAC | AAG | AGA | TCG | CTA | ccc | GAA | CTC | 2271 |
177 635
Gly | Val Vaa 135 | Ala Phe Thr | Thr Leu Val Gln Gly Ser Leu Pro Glu Leu | |||||||||||||
140 | 145 | |||||||||||||||
CAT | CAG | GCG | TGG | CAG | GCG | GTG | GAC | GAG | CGT | CCG | CAT | GCT | CAT | CGC | TTT | 2278 |
His | Gln | Ala | Trp | Gln | Ala | Val | Asp | Glu | A^rg | Pro | His | Ala | Asn | Arg | Phe | |
150 | 155 | 110 | 165 | |||||||||||||
TTA | CCG | CCA | GAT | GAA | ATC | GAA | CAG | TCG | CTG | CAC | GGC | GTG | CAT | TAT | CAA | 2233 |
Leu | Pro | Pro | Asp | Glu | Ile | Glu | Gln | Ser | Leu | Asn | Gly | Val | His | Tyr | Gln | |
170 | 175 | 180 | ||||||||||||||
CAT | CAT | ATT | CAG | CCC | ATC | ACG | CTG | T<GG | TTT | GAT | GAT | GCG | CTC | AGT | GCC | 2285 |
His | His | Ile | Gln | Pro | Ile | Thr | Leu | Trp | Phe | AA3p | Asp | Ala | Leu | Ser | Ala | |
185 | 190 | 195 | ||||||||||||||
ATG | CGT | TCG | CTG | AAA | GGC | ATC | GOT | (GCC | ACG | CAT | CTT | CAT | GCA | GGG | CGC | 2293 |
Met | Arg | Ser | Leu | Lys | Gly | Ile | Gly | Ala | Thr | His | Leu | His | Glu | Gly | Arg | |
200 | 205 | 210 | ||||||||||||||
GAC | CCG | CGA | ATA | TTA | ACG | CGT | TCG | CG | TTG | CG | CGA | TTG | CCA | CTG | GCC | 2981 |
Asp | Pro | Arg | Ile | Leu | Thr | Arg | Ser | Gln | Leu | Gln | AArg | Leu | Gln | Leu | Ala | |
215 | 220 | 225 | ||||||||||||||
TGG | CCG | CAA | CAG | CAG | GGG | CGA | TAT | CCT | CTG | ACG | TAT | CAT | CTT | TTT | TTG | 3329 |
Trp | Pro | Gln | Gln | Gln | Gly | Arg | Tyr | Pro | Leu | Tlu: | Tyr | His | Leu | Phe | Leu | |
230 | 235 | 240 | 245 | |||||||||||||
GGA | GTG | ΑΊΓ | GCT | CGT | GAG | TAAACGTTAT TTTGCCACCG GAC^C^GA^A^A^AC | 30 77 | |||||||||
Gly | Val | 11l | Ala | Arg | Glu |
250
CGAAGTTTGT | CACCCTGTCG | CCGGTGTGC | CCTTTTACA | CCCGCCAAGG | CGCGGCTA | 3137 |
CCGGACTTCC | GTTTATCCAC | CGG^G^G^G^^G^T^t^ | TGGTACTGTA | CAGACCCCGG | CAGTTTTACG | 3317 |
CAATAGCGAC | GCGCTGGCGT | TΑGAGCGC]Α | CGTAATCTG | CAGCTG5ATT | ACGCAACAGT | 3357 |
AAATCCTTAC | ACCTTCTCAG | CACCCCCCG | GTCGCACACG | ATCAGCGCGC | ΑCGAGTGCAG | 3317 |
177 635
TCGGATTATT TGTTTGATTA TGAGCGCCCC ATTACGCGCG CCTCACAC TAGCTGTCTG | 3377 |
GGTGTTAGTG GTAGATGGTG GCGGCTGGTT TACGCCCGGTT TCTGACACTT TGTGTTTTGC | 3437 |
CGATTGGGTA TGTGTGAAAC ACTtTCCCCCT GATACTCAAA GTTGAAGTGA ATCTGAAGTG | 3497 |
TTTTTTTCTG GGGATGTTGA CT<TA<A<TCT ATACACAC GCCGGACTGA CTCTAACGGA | 3557 |
TTCGGTGGCG AATGATGTTA CGCCTCCCTGϊ CTTCAGGTCAC GCTGATATA | 3617 |
CACCCGGATG TTTCCCGGAG CGCGTCCCAA «AC'!^^ CCACTGTGAT (AATAGCCATA | 3367 |
TAATGGGGCT TGGGATTTGT ATGTTAACTC CTCTTTTTCT GATGCGGTGA | 3737 |
TACATGTCGA TT CTG CCC ACC GAT CC^T CCT (X^C CTT GAT CCA GCC CCT Met Thr TTr Acp Acp Glu Ala Chr Acp GCa CAg Cis 15 10 | 3785 |
TTC TGG CAC | CCC Phr | GAT ACA TCC ATG | ACC TCC | CCT CTG CCG GCT CAT GCG | 3833 | |||||||||||
Ile | Trp | His 15 | CTy | Thr | Ser | Met 20 | Thr | Ser | Pho Leu | Pro 25 | Val | CTy | Cpo | |||
GTG | GTG | AGC | GCC | ggt | TGC | GAG | CTG | ATT | TTG | TCT | GAC | (AA | AGA | CCC | 3881 | |
Val | Val | Ser | ACa | gGu | Gly | Cys | Glu | Leu | Ila | Llu | Ssr | Asp | GCa | (Arg | Ccrg | |
30 | 35 | 40 | ||||||||||||||
CTG | GTT | GAC | GGG | act; | TCG | TCC | *TA3 | TAC | <a:g | GCG | ATC | CAC | (AA | GAC | CCT | 3929 |
Leu | Val | Asp | GCa | GeU | Ser | Ser | Tir? | Tar? | Ala | Ala | Ila | His | GCa | CTy | Asn | |
45 | 50 | 55 | 60 | |||||||||||||
CAC | CCG | CAG | CCT | CAT | GCG | GCG | ATG | (TCG | TCG | CA | ATT | GAT | GCC | ATG | TCG | 3977 |
iis | hro | Gin | Llu | Am | Ala | Ala | Met | Lys | Ser | Gin | Ile | Asp | Ala | Met | Gsr | |
65 | 70 | 75 | ||||||||||||||
CAT | GTG | ATG | TTT | GGC | ggt | ATC | ACC | (AT | GCG | CCA | GCC | ATT | GAT | CTG | TTC | 4025 |
iis | Val | Mele | Phr | g'u | Gly | Ile | Thr | His | Ala | Pho | Ala | Ila | gCu | Glu | CCS |
177 635
CGC AAA CTG GTG GCG | ATC Met | ACG CCG Thh Pro 100 | CCA CCG CTG GAG (TG GTT | ITT Phe | CCT LLU | 4073 | ||||||||||
Arg | Lys | Leu 95 | Val | Ala | dn | TPO | Leu | Glu | Cys 110) | Val | ||||||
GCG | GAC | TCC | <GT | TCC | GTA | (GG | GTG | GGAA | GTG | <GG | ATG | (AAA | ATG | GCG | TTT | 4121 |
Ala | Asp | Ser | Gly | Ser | Val | Ala | Val | Glu | Val | Ala | Met | Lys | Met | Ala | Llu | |
110 | 111 | 110 | ||||||||||||||
CAG | TAC | TGG | CjAA | GCC | TAAA | «G | GAA | GCG | Cd | TAG | CGT | . TTT | CTG | ACC | TTT | 4419 |
Gln | Tyr | Trp | Gin | (ALa | Lys | dy | Glu | Ala | (Arg | Gin | (Arg | Phe | Leu | Thr | pph | |
125 | 113 | 135 | 110 | |||||||||||||
CGC | AAT | GGT | TAT | CAT | «G | GAT | ACC. | TTT | dG | GCG | . ATC | TCG | GTC | TGC | GGT | 4417 |
Arg | Asn | Gly | His | Gly | Asp | Thr | PPh | d^y | Ala | Met | Ser | Val | Cys | Aas | ||
145 | 150 | 1155 | ||||||||||||||
CCG | GAT | AAC | TCA | ATC | (CAC | AGT | CTG | T(G | (AA | <GG | TAC | CTG | CCA | GAA | AAC | 4265 |
Pro | Asp | As U | Ser | Met | His | See | Leu | Τη? | Lys | Gly | Tyr | Leu | Pro | Glu | Aas | |
160 | 165 | 170 | ||||||||||||||
CTG | TTT | GCT | CCC | GCC | CCG | CCAA | AGC | CGC | ATC | GT | GdC | GAA | TH | GAT | GGA | 4313 |
Leu | Phe | Ala | Pro | Ala | Pro | Gin | eer | JArg | Met | Asp | Gly | Glu | Τη? | Asp | GGu | |
175 | 180 | 115 | ||||||||||||||
CGC | GAT | ATG | gtg | (UC | TTT | <GC | CGC | CTG | ATG | GCG | GCG | CAT | CGT | CAT | GGA | 43 61 |
Arg | Asp | Met | Val | Gly | Phe | Ala | Arg | Leu | Met | Ala | Ala | His | Arg | His | gGu | |
190 | 119 | 200 | ||||||||||||||
ATC | GCG | GCG | GTG | ATC | ATT | GAG | CCG | ATT | GTC | CAG | Gd | GCA | <GG | GGG | ATC | 4409 |
Ile | Ala | Ala | Val | Ile | 1ll | Glu | Pro | Ile | Val | Gin | Gly | Ala | Gly | Gly | MeU | |
205 | 210 | 215 | 220 | |||||||||||||
CGC | ATG | TAC | CAT | GJAA | TTH | TTA | AAA | CGA | ATC | CGC | AAA | ATA | TGC | GAA | 4457 | |
Arg | Met | Tyr | Bis | Pro | Glu | Trp | Leu | Lys | Arg | Ile | Arg | Lys | Ile | Cys | AA£) | |
225 | 220 | 235 | ||||||||||||||
CGC | GAA | GGT | ATC | TTG | CTC | ATT | GCC | GAC | GAG | ATC | GCC | ACT | GGA | TTT | GGG | 4505 |
177 635
Arg | Glu | Gly | Hu 340 | Lee | uce | ICe aCt 1as 2395 | Glu | Ile | Ala | Thr | Gly 250 | Phe | Gly | |||
CGT | ACC | GGG | TTT | CTG | ttt | gcc | TGT | GTT | CAT | GCA | GAA | ATC | GTG | CCC | CAT | 4553 |
Arg | Thr | Gly | LLS | Leu | Phe | Ala | <^3 | Glu | His | Ala | Glu | Ile | ATa | Cpo | CTJ^ | |
355 | 230 | 265 | ||||||||||||||
ATT | TTG | TGC | CCT | (ATT | CTTC | GCC | TTA | ACC | GGC | <TTC | ACA | ATG | ACC | CCT | CGC | 41502 |
Ile | Leu | Cys | Leu | Gly | Lys | Ala | Leu | Thr | Gly | Gly | Tiar | Met | Thh | Leu | Ceu | |
370 | 235 | 280 | ||||||||||||||
GCC | ACA | CTC | ATC | ACG | CGC | GAG | GTT | G<CC | GTT. | ACC | ATC | AGT | TTC | cat | CAT. | 4649 |
Ala | Thr | Leu | TTh | Thr | Aog | Glu | Val | Ala | Glu | T]hr | Ile | Ser | Acs | Cll | Clu | |
335 | 290 | 295 | 300 | |||||||||||||
GCC | GGT | TGC | TTT | ATG | CAT | <ggt | CCCT | ACT | TTT | ATG | (TTC | AAT | CCG | CCG | CTC | 4697 |
Ala | Gly | Cys | PPe | Met | His | Gly | Pro | Thr | Phe | Met | Gly | Asn | Ppo | C>eu | CTa | |
305 | 320 | 3 25 | ||||||||||||||
TGC | GCG | GlA | GAC | CTC | GCC | AGC | CTG | <a:g | ATT | CTC | GAA | TCT | GAC | GAC | ThA | 4745 |
Cys | Ala | AAa | ATl | Asn | Ala | Ser | Leu | Ala | Ile | Leu | Glu | Ser | Gll | Ces | Crr | |
330 | 333 | 330 | ||||||||||||||
CAG | CAT | CAG | GTG | GCG | GAT | ATT | GTAT | GTA | CAG | CTG | CGC | GAG | CCA | CCG | CTC | 4793 |
Gln | Gln | Gln | vaa | Ala | Asp | Ile | Glu | Val | Gln | Leu | Arg | Glu | Gln | Ceu | CTu | |
335 | 330 | 345 | ||||||||||||||
CCC | GCC | CGT | GAT | CCC | GAA | ATG | GTT | GCC | GAT | GTG | CGC | GTA | CCG | cga | CTC | 4342 |
Pro | Ala | Arr | AAp | Ala | Glu | Met | Val | Ala | Asp | Val | Arg | Val | Lee | Gll | CTu | |
350 | 335 | 360 | ||||||||||||||
ATT | GGC | GTG | στο; | GAA | ACC | ACT | CCT | CCG | GTG | AAT | ATG | GCG | GCG | CTC | CCT | 4839 |
Ile | Gly | Val | val | Glu | Thr | Thr | His | Pro | Val | Asn | Met | Ala | Ala | Cese | Gln | |
365 | 370 | 3-75 | 380 | |||||||||||||
AAT | TTC | TTT | gtg | CTC | CAG | (ATT | GTC | T<G5 | ATC | C<GT | CCT | ttt | GGC | CTT | CCG | 4937 |
Lys | Phe | Phe | val | Glu | Gln | Gly | Val | Trp | Ile | Arg | Pro | Phe | GTu | Lys | Leu |
335
390
395
177 635
ATT TAC CTC ATG CCG CCC ΤΑΤ ATT ATT CTC CCG CCA CAG TTG CAG CGT 4985
Ile Tyr Leu Met Pro Pro Tyr Ile Ul Leu Pro Gln Gln Leu Gln CAg
400 40Ε» 410
CTG ACC GCA GCG GTT CAC CGC GCG GTA CAG GAT CGA ACA TTT TTT TGC 5(^^:3
Leu Thr Ala Ala Val Asn Arg Ala Val Gln Asp Glu Thr Phe Phe Cys
415 440 442
CAA TAACGAGAAG TCCGyGTGAG GGGTTCTTGC TCycyTTTCG GyACACAAGA 5086
Tln
430
AAGGCGCTTT C ATG AAA CTC ATC AGT AAC GAT CTT CGC GAT GGC GAT -CAA 5536
Met Lys Leu Ile Ser Asn Asp Leu Arg Asp Gly Asp Lys
1 | 5 | |||||||
TTG | CCG | CAT | CGT | CAT | GTC | TFT | A^C | cgtc |
Leu | Pro | His | JAg | HlS | val | Phe | Asn | Gly |
15 | 20 | |||||||
ATT | TCA | CCC» | OAT | CTG | GCG | TCC | GAT | CAT |
Ile | Ser | Pro | His | Leu | Ala | Τη? | Asp | Asp |
30 | 35 | |||||||
TTT | GTT | GTC | ACC | TGC | TAC | CAC | CCG | GAT |
Phe | Val | Val | T1a | Cys | Tyr | Asp | Pro | Asp |
50 | ||||||||
TGC | CAC | TGG | GTA | GTT | GTT | CAC | TTA | CCC |
Trp | His | Τ-η? | Val | Val | Val | Asn | Leu | Pro |
65 | 70 | |||||||
CAA | GCT | TTT | GTC | TCT | ggt | CTG | GTA | GGA |
Gln | Gly | Phe | Gly | Ser | Gly | Leu | Val | Ala |
80 | 85 | |||||||
ACG | CGT | ACC | GAC | TTT | GGT | AAA | ACC | CCTC |
ATG GCT TAC | CGA CGCC CAT CAT | 5184 | |||||
Met | Gly | 25 | Asp Gly Asp | Asn | |||
GTT | CCT | CCC» | CGA | ACG | CAA | AGT | 5232 |
Val | Pro | Ala | Gly | Thr | Lys | Ser | |
40 | 45 | ||||||
GCG | CCA | ACC | gt: | TCC | GTC | TGC | 5280 |
Ala | Pro | Thr | Gly | Ser | Gly | Trp | |
55 | 60 | ||||||
GCT | GAT | ACC | ccc: | GTA | TTA | CCG | 5328 |
Ala | Asp | Thr | CAg | Val | Leu | Pro | |
77 | |||||||
ATG | CCA | GAC | CGCC | GTT | TTG | CAG | 5376 |
Met | Pro | Asp | Gly | Val | Leu | Gln | |
99 | |||||||
TAC | GAT | CG^C | GCA | GCA | CCG | CCG | 5424 |
177 635
Thr Arg Thr Asp hhe Gly Lys Thr Gly Tyr Asp Gly Ala Ala hro hro 95 100 105
ACA TGG GCA ACC CAT CCA: TAG ATT TTT ACG GTT CTCC GCG CTT GAT ATT 5472
Lys Gly GCu CGhr iis (Arg Tyr Ila hhe Thr Val His Ala llu As]p lle
110 115 120 125
GAA GTT ACT? GAT GTT GAT GAA GGT GTT AGC ATG CAG CTG GTT GGG TTT 5520
Glu Arg Ile Asp Val A^s> Glu Gly Ala Ser Gly Ala Met wI Gly hhe
130 135 140
CAC TTT CAT CTT CCC TTC CTT CTCC CGC TCC TCG ATT CCT GGG GTG TTT 5568
Asn Val His Phh iis Sse Leu Ala Ser Ala Ser Ile Thr ACa Met hhe
145 150 155
CGT AACTCACTTT GGCCGATGGC TGTTTGCTΑT CTGGTATCCT TTAAAGTTCT 5621
Ser
TCATAATAAG TTTTTGTGTA TTTACATCCC CGTTTCTATC CCCGTAAGTAT GTAAAAGCAG 5681
GCTTGCACGG ATACATATTT CTAGACGATA GCCTGGATCG GATGATTCAA ACATTTTCAG 5741
CTTCTCTTCT GGCGTTGTCA TTCAATCTTA GCCTTAAGCC GAATGCCTGT AGCTCAACCC 5801
TGCTTGATGA ACGTTCTACT GATATGACCG CGGTTATTAA CGAAGCTGGA TTTCTGCAGG 5861
GATTGCAGTT C 5872 (2) INFORMACJA O SEQ ID Nr: 2:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 346 Aminokwasów (B) TYP: Aminokwlsowy (D) topologia: liniowa (ii) RODZAJ CZĄSTECZKI: Proteina
177 635 (xi) OPie eEKWENCJlc SEQ lD Nr: 2:
Met Ala His Arg Ρρό | Arg | Top | Tho Leu Ser Gln Val Thr Glu Ler Phe | ||||||||||||
1 | 5 | 11 | 11 | ||||||||||||
Glu | Lys | Pro | Leu | Leu | Asp | Lru | Leu | Phe | Glu | Ala | Gln | Gln | Val | His | Arg |
00 | 5 T | 33 | |||||||||||||
Gln | His | Phe | AAs | Lrr | Ocg | AOa | VaG | GTn | VaU | ser | Thr | Leu | Leu | Ser | Ile |
35 | 40 | 44 | |||||||||||||
Lys | Tho | GUy | Ala | yys | Poo | Glu | Asp | Cys | Lys | Tyo | Cys | Poo | Gln | eeo | eeo |
50 | 55 | 66 | |||||||||||||
Arg | Tyo | LyS | Thr | Gly | Ler | Glu | Ala | Glu | GArg | Leu | Met | Glu | Val | Glu | Gln |
65 | 77 | 17 | 80' | ||||||||||||
Val | Leu | Glu | eer | Ala | Arg | Lys | GUL a | Lys | Ala | Ala | Gly | Ser | Thr | GAg | Phe |
85 | 90 | 90 | |||||||||||||
Cys | Met | Gly | A AU | LlA | lep | Lgs | ASI | sro | His | Glu | Ar g | At p | Met | PrAg-Tyr | |
100 | 105 | 111 | |||||||||||||
Leu | Glu | Gln | MmU | AaV | uTn | Gln | VaG | rys | A1u | Met | GTy | Leu | Glu | Ala | Cys |
115 | 120 | H0 | |||||||||||||
Met | Tho | Leu | Gly | Tho | Leu | ero | Glu | ero | Gln | Ala | Gln | Agg | Ieu | Ala | Asn |
130 | 113 | HO | |||||||||||||
AUa | Gly | Leu | Asp | Trr | iyr | Asn | His | Asn | Leu | Asp | Thr | ser | Pro | Glu | Phr |
145 | 110 | 115 | 160 | ||||||||||||
Tyo | Gly | Asn | Ile | Ile | Thr | Thr | Arg | Thr | Tyr | Gln | Glu | Arg | Leu | Asp | Tho |
165 | 170 | 117 | |||||||||||||
Leu | GUu | Lys | Vaa | ArA | At p | Asp | GlA | a A e | Lys | Val | ey e | ser | Gly | Gly | Ile |
180 | 185 | 110 |
177 635
Val Gly Ilu | Gly | Glu Thr Val Lys Asp Arg Ala Gly Leu Leu Leu | Gln | ||||||||||||
195 | 200 | 205 | |||||||||||||
Leu | Ala | Am | Leu | Pro | Tło | Pro | Pro | Glu | eer | Val | Pro | iIu | Am | Met | Leu |
210 | 221 | 220 | |||||||||||||
Val | Lys | Val | Lys | Gly | Tłur | Poo | Leu | Al^a | Asp | Asn | Asp | Asp | Val | Asp | Ala |
225 | 230 | 223 | 240 | ||||||||||||
Phe | Asp | Phe | Ile | Arg | Tłur | Ile | Ala | Val | Ala | ,?og | Ile | Met | Met | Pro | Thr |
245 | 2^0 | 255 | |||||||||||||
eer | Tyr | wa | Arg | Leu | eer | Ala | Gly | AOg | Glu | Gln | Met | As n | Glu | Gln | Thr |
260 | 265 | 270 | |||||||||||||
Gln | Ala | Mee | Ays | Phe | Met | Ala | Gly | Ala | Asn | Ser | Ile | Phe | dyy | Gly | tyS |
275 | 280 | 225 | |||||||||||||
Lys | Leu | Ilu | Tło | Thr | Poo | Asn | Pro | Glu | Glu | Asp | Lys | Asp | Le^u | Gln | Leu |
290 | 229 | 300 | |||||||||||||
Phe | Arg | Lys | Leu | Gly | Leu | Asn | Pro | Gln | Gln | Thr | Ala | Val | Leu | Ala | Gly |
305 | 310 | 311 | 330 | ||||||||||||
Asp | Asn | GAu | Gln | Gln | Gln | Aog | Leu | Glu | Gln | Ala | Leu | Met | Tło | Pro | Asp |
325 | 330 | 335 | |||||||||||||
Thr | Asp | GAu | Tyr | Tyr | Asn | Ala | Ala | Ala | Leu | ||||||
340 | 345 |
(2) INFORMACJA O SEQ ID Nr: 3:
(i) CHARAKTERYSTYKA SEKWENCJI;
(A) DŁUGOŚĆ: 251 Aminokwasów (B) TYP: Aminokwasowy (D) TOPOLOGIA: liniowa
177 635 (ii) TYP CZĄSTECZKI: Proteina (xi) OPIS SEKWENCJI: SEQ ID Nr: 3:
Mtt | Ali | Tłh- | Val | Asn | Lys | Gln | Ala | Ile | GAla | iCLa | AC a | Phe | Gly | Arg | Ala |
1 | 5 | 10 | 15 | ||||||||||||
Ala | Ali | His | ^r | Glu | Gln | HHs | Ala | Asp | Leu | Gln | CArg | Gln | ser | Ala | Asp |
20 | 22 | 30 | |||||||||||||
Ala | Ltu | Leu | Ala | Met | Leu | Pro | Gln | Arg | eys | Tyr | Thr | His | Val | Leu | Asp |
35 | 40 | 44 | |||||||||||||
Ala | Gly | Cys | Gly | Pro | Gly | Tt—» | Met | Ser | Arg | His | TT— | Arg | Glu | Arg | His |
50 | 55 | 66 | |||||||||||||
Ala | Gln | Val | Thr | Ala | Leu | GAjp | Ltu | Ser | Pro | Pro | Met | Leu | Val | Gln | Ala |
65 | 70 | 75 | 80 | ||||||||||||
Arg | Gln | Lys | Asp | Ala | Ala | Asp | His | Ty— | Leu | Ala | Gly | Asp | Ile | Glu | Ser |
85 | 99 | 95 | |||||||||||||
Leu | Pro | Leu | Ala | Tho | Ala | Thr | Pht | Asp | Leu | Ala | Trp | Suo | Asn | Ltu | Ala |
100 | 115 | 110 | |||||||||||||
Val | Gln | Top | Cys | Gly | Asn | Leu | Suo | Thr | Ala | Leu | Arg | Glu | etu | Tyr | Arg |
115 | 110 | 112 | |||||||||||||
Val | Vil | Arg | Pro | Lys | Gly | Vil | Val | Ala | Phe | Thr | Thr | Ltu | Val | Gln | Gly |
130 | 135 | 140 | |||||||||||||
Sto | Ltu | Pro | Glu | Leu | His | Gln | jma | Tipi | Gln | GAla | Val | Asp | Glu | A—g | Pro |
145 | 150 | 155 | 1(50 | ||||||||||||
His | Ala | Asn | Arg | Phe | Leu | Pro | Pro | Asp | Glu | Ile | Glu | Gln | Ser | Leu | Asn |
165
110
117
177 635
iuy aal | His TTy Gin 180 | iis | Bis | Ile Gin Pro Ile Thr Leu Trp Phe Asp | |
185 | 110 | ||||
Asp Ala | Leu Seu (Ia | fet | Mug | SeA A(u | Su: Gly I(e lSs Ali Thu TUs |
195 | 200 | 205 | |||
Leu iis | Glu Gly ArA | A(p | Aso | Arp I(e | Leu Thr Mg Leu Gin Leu Gin |
210 | 215 | 220 | |||
Arg Leu | Gin Leu Ala | Trp | poo | Gin Gin- | Gin Gly Arg Tyr Pro Leu Thr |
225 | 230 | 235 220 | |||
Tyr iis | Leu PPh Leu | Gly | Val | Ile Ala | (Arg Glu |
245 | 250 | ||||
(2) INFORMACJA O | SEQ ID | No: 4: | |||
(i) | CHARAKTERYSTYKA | SEKWENCJI: | |||
(A) DŁUGOŚĆ: 429 | aminokwasów | ||||
(B) TYP: aminokwasowy | |||||
(D) TOPOLOGIA: | : liniowa | ||||
(ii) TYP CZĄSTECZKI: | Pooteina | ||||
(xi) OPIS SEKWENCJI: | SEQ ID No: 4: | ||||
Met Thr | Thr Asp Asp | Leu | Ala | Phe Asp | lUn Arę: Hćslle Trp His Pro |
1 | 5 | 10 15 | |||
Tyr Thr | ser (teU Thr | Ser | Poo | Leu Pro | Val Tyr Pro Val Val Se: da |
20 | 25 | 30 | |||
Alu Gly | Cys Glu Leu | Ile | Leu | Ser Asp | Gly Arg Arg Leu Val Asp Gly |
35 | 40 | 45 | |||
Met Suo | Se: Trp Trp | Ala | Ala | Ilu iis | Gly Tyr Asn His Pro Gln Leu |
177 635
Asn 65 | Ala | Ala Met | Lys | Ser 77 | Gin | lle Asp AAa GmU Ser His val Met Phh | |||||||||
75 | 80 | ||||||||||||||
Gly | Gly | Ile | TGho | His | Ala | Pro | Ali | lle | Glu | Glu | cys | Arg | Lys | Leu | wi |
85 | 90 | 99 | |||||||||||||
Ala | Met | TłAh | Phr | Gin | Pro | Leu | GCu | CCS | Vil | Phh | Glu | GCa | Ges | Csu | Gly |
100 | 115 | 110 | |||||||||||||
Ser | Val | Ala | Vv1 | Glu | Val | (Ala | Met | Lys | Met | ACa | Glu | Glu | Cer | Cep | Gln |
115 | 110 | 115 | |||||||||||||
Ala | Lys | Gly | Alu | Ala | Aog | Gin | Arg | Phe | Leu | Thp | Phh | (Arg | Asn | Gly | Ter |
130 | 113 | 110 | |||||||||||||
iis | Gly | Asp | Thr | Phe | Gly | Ala | Met | Ser | Wl | CCS | Asp | Pro | Asp | Asn | Ssu |
145 | 150 | 115 | 116 | ||||||||||||
Met | iis | Ser | Leu | τη? | Lys | Gly | Tyo | Leu | Ppo | Glu | Asn | Leu | Phe | Ala | PhO |
165 | 117 | 117 | |||||||||||||
Ala | hro | Gin | S su | Crg | Met | Asp | Giy | Glu | Top | «s | Glu | CA^CJ | A^s> | MmU | Gv1 |
180 | 185 | 190 | |||||||||||||
Gly | Phe | ACa | Aao | Ge u | Met | Ala | Ala | His | Aog | Hi i | Gln | Gla | Ala | (Aa | Wl |
195 | 200 | 205 | |||||||||||||
lle | Ila | Glu | Pro | Ile | Val | Gin | Gly | Ala | Gly | Gly | MmU | Arg | Met | Tyr | Hii |
210 | 215 | 222 | |||||||||||||
Pro | Glu | tao | Leu | Lys | Aog | ile | Aog | Lys | Ila | Cys | Asp | Arg | Glu | Gly | Iln |
225 | 230 | 22i^ | 224) | ||||||||||||
Leu | Leu | Ile | Ala | Asp | Glu | Ile | Ala | Thr | Gly | Phe | Gly | Arg | Thr | Gly | Lys |
245 | 250 | 225 | |||||||||||||
Leu | Phe | ACa | Ccs | Glu | His | Ala | Glu | Ile | Ala | Pro | Asp | Ila | Leu | Cys | Leu |
260 265 270
177 635
Gly Lys AAa Leu | Thr | Gly | Gly | Thr Met Thr Leu Ser Ala Thr Leu | Thr | ||||||||||
275 | 220 | 285 | |||||||||||||
Thr | Arg | Glu | Val | ATa | AAu | ATr | AIa | Aeu | Acs | AGu | Glu | Ala | Gly | cys | PPr |
290 | 295 | 330 | |||||||||||||
Met | His | gA| | Pro | Thr | Phe | Met | Gly | Asn | Pro | Leu | Ala | Cys | Ala | Ala | ATl |
305 | 310 | 315 | 332 | ||||||||||||
Asn | Ala | See | Leu | Ala | Ile | Leu | Glu | Ser | Gly | Asp | Trp | Gln | Gln | Gln | Wl |
325 | 333 | 335 | |||||||||||||
Ala | Asp | Ilu | Glu | VaA | GAn | Vll | Atg | nAu | Gln | Leu | Ala | Pro | Ala | Arg | Arp |
340 | 334 | 330 | |||||||||||||
Ala | Glu | MmU | Val | Ala | Asp | Vil | Arg | Val | Leu | Gly | Ala | Ile | Gly | Val | Val |
344 | 330 | 365 | |||||||||||||
Glu | Thr | Thr | His | Aro | Av1 | AAs | AMt | ACa | ATl | Alu | Gln | Lys | Phe | Phe | wa |
370 | 375 | 380 | |||||||||||||
Glu | Gln | Gly | val | Top | Ile | Tog | Poo | Phe | Gly | Lys | Leu | Ilu | Tyo | Leu | MmU |
385 | 390 | 395 | 440 | ||||||||||||
Pro | Pro | Tyy | Ale | Ile | Leu | Poo | Gln | Gln | Leu | Gln | Arg | eeu | Tho | Ala | AT a |
405 | 44.0 | 415 | |||||||||||||
Val | Asn | AA— | Ala | VaT | lA n | Vi| | GlG | nhr | Phe | Phe | cyr | Aln |
420 442 (2) INFORMACJA O eEQ ID Nr: 5 (i) ΗΤΚΤΚΤΕΈΚΥΤΤΥΚΆ EEiENEJCJI:
(A) DŁUGOŚĆ: 115 Mtmiokwasów (B) TYP: aminokwasowy (D) TOPOLOGIA: liniowa (ii) TYP CZĄeTECZKI: Proteina
177 635
(xi) OPIS | SEKWENCJI: | SEQ ID Nr: 5: | |
Met | Lys Leu Ile | SerAsn Ass | Leu Arę Asp Gly Asp Lys Leu Pro His |
1 | 5 | 10 11 | |
Arg | Hss aal Phe | Asn Gly MmU | (li Tyr .Osp Gly Asp Asn Ile Ser Pro |
20 | 22 33 | ||
iis | Leu Ala Top | Asp Asp aal | Poo Ala lly Th: Lys Se: Phe aal aal |
35 | 40 45 | ||
Th: | Cys Ty: Asp | Poo Asp Ala | Poo Th: lly Suo Aly Trp Top iis Top |
50 | 55 | 60 | |
aal | aal Val Asn | Leu Pro Ala | Asp TTu: TTog Val Leu Pro Gln Gly Phe |
65 | 77 | 75 80 | |
AUy | Se: Gly Leu | Val Ala JteU | (rp A( s ply (sI (eu Gln Tin: (Trg Tfar |
85 | 90 95 | ||
Asp | Phe Gly Lys | Thr Gly Tts | (sę oCyATu ATu (ro Pro Lys Gly UTa |
100 | 110 111 | ||
Thr | iis Arg Tyr | Ilu Phe Thr | aal iis Ala Leu Asp IUu Glu Tog Ile |
115 | 112 115 | ||
Asp | aal Asp ilu | Gly Ala Su: | Gly Ala Met aal lly Phu Asn aal iis |
130 | 113 | 114 | |
Phe | iis Ser Leu | Ala Ser Ala | Se: Ile Th: Ala Met Phe Ser |
145 | 150 | 115 |
(2) INFORMACJA O SEQ ID Nr: 6:
(i) CIUTRAKTERYSTYIKS SE1KWENCJI:
(A) DŁUGOŚĆ: 5872 par zasad (B) TYP? kwas nukleinowy
177 635 (C) POSTAĆ NICI: podwójni (D) GOPOeOGIA: liniowi (ii) GYP CZĄSTECZKI: DNS (genomowu) (iii) HIPOTETYCZNOŚĆ: NIE (vi) POCHODZENIE PIERWOTNE:
(A) ORGANIZM; Escherichii coli (B) SZCZEP: DSM493 (vii) BEZPOŚREDNIE POCHODZENIE:
(B) KLON: pBO30A25-9 (ix) CECHY:
(T) NAZWT/KLUCZ: CDS (B) POŁOŻENIE: 2254..3303 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DANE: /codon_start= 2154 /EC number= 2.321.47 /product= KTPT pynthlpe /evidence= EPEEIIMNCTLL· /gene= bioF /number= 2 /standard name= 8τ-£ϋΐη-—7-xxnnoinoatec sythisse (ix) CECHY:
(T) NTZWT/KLUCZ: CDS (B) POŁOŻENIE: 3043..3753 (C) RODZAJ OZNACZENIA: eksperymentalne (D) POZOSTAŁE DTNE: /codoy_stiot= 3434 /EC number= 2.2.2.3 /pooduct= TBC Sythhase SvviSoceeE PX^£^I^^I^Nh^T^eAL /gene= bioD /numbe^ 4 /standard nime= Dethiobiotin Synthise
177 635 (ix) cechy:
(A) NAZWA/KLUCZ: ΗΒε (B) POŁOŻENlE: 1141..1156 (D) POZOSTAŁE DANE: /standard name= bio F RBS (ix) CECHY:
(C) NCZWC/KLUCZ: RBS (B) POŁOŻENlE: 3030..3045 (D) POZOSTAŁE DANE: /standard name= bio D RBS (x) informacja dot. opublikowania:
(H) NUMER DOKUMENTU: WO 87/01301 B1 (l) DATA ZGŁOeZENlA: 06-08-1086 (J) DZlEŃ OPUBLlKOWANlA: 07-04-1003 (xi) OPlS SEKWENCJl: SEQ lD Nr: 6:
CAGTTCACTC | ΤΤΤΑΤΤΤΤΤΤ | tgtictgcac | ΤΤΑΑΤΤΑΤΤΊ | (ΤΤΤΊΤΑΤΑΑ | GTGTdAATT | 60 |
ΊΤΊΑΊΤΙΊΑΤ | ΑΑΤΑΑΤΤΤΤΑ | ΟΑΤΑΤΑΙΙΑΑ | ταίιαττίιτ | (ΤΤΤΑΑΊΊΑΊ | CTAGTCATGG | 120 |
ΤΤΤΑΤΤΙΤΤΤ | ΑΤ^Τ^ΑΤΑ | ttgtitccag | ιτταταίαατ | ATTTTlAAAA | CCGTTGCTGG | 180 |
ατττίττίττ | ΤΊΑΑΙΤΙΤΑΊ | CAdllCACC | τιτταίταττ | ΑΤΙΑΤΤΤΤΤΙ | CAGlTGCAGG | 2010 |
ΤΤΑΊΤΑΤΊΤΤ | ΊΤΤΊΤΤΊΑΤΤ | AAGACCCCAG | ICTTGCCCGl | AGATTCGCAA | ΤΑΑΤΟϋΟΟΟΤ | 300 |
ΑΑΑΙΤΤΤΊΤΊ | ΤΤΑΤΑΑΑΑΤΤ | GdllCTlAG | ιττιαιτίιτ | LlCCGGAGlT | LAACAGGTGC | 360 |
ΤΙΊΑΊΤΤΊΊΤ | ΊΤΊΤΑΑΑΊΤΊ | Α/ΑΑΑΧΤϊΐΙΤϊ | ίίαττιατιτ | τ:τττττίαατ | LGCGCGGCGT | 420 |
GGAAGAATCC | ΤΤΑΤΙΑΑΤΊΤ | GATATGCCGT | τατττίίαατ | ΑΑΑΤΊΊΤΙΤΑ | LGGGTAAAAG | 480 |
CGATGGGGCT | ΊΊΑΊΊΤΊΤΊΤ | ATGACGCTGT | ίιτατίττία | ατίααττττα | σοίΤ^σοσΤΤ | 540 |
ΤΤΊΤΊΑΑΤΊΤ | CGlGCTlGAT | TACTACCACC | ΑίΤΑΑΤΤΤΊΊ | (τταττττιττ | LAGTTTTACG | 600 |
ΊΤΑΑΤΑΤΤΑΤ | ΤΑΤΤΑΤΑΤΙΤ | ACTTATCAd | CACClTCTyA | (ΤΑΤΙΤΤΊΙΑ | GACGTGCGCG | 660 |
177 635
AGTCCGTGCT CACCGTCGGG yCTTTCGGCT TTCTCTiGCTC AGT;CGGGACy GTAAACGCTC 720 tctccgtatt AGTGyτGCAA ctgtcaaacc ¢(::((^(3] GTGyccATCA 7 80
AyATGyTGTT TATTTTTTAA GTCACGCCGC TTGG]CyCCGG. CyCCGCCGCG GATGCCTGTG 840
CGTGTATTCT CCCCATTTCG GTCGCGCCGA GTGCGCCTTT 900
CTGCCGTACT CGΑGCCGΑTT AACGTACAGA CTCACG]]yC GCGCCTTATC GCAGGCGCAA 960
ACGCGATGTT CTACTGTTTC ACACGGCGCA CCCCGCTCCA Tyc:TCAGCA CCATACATCCC 1020
TGCAACTGTT CCGCACACTG GGGyGACAGC Οσ^^ΤΑ^ TCCCGTGCCKC CCyAGGGGAGA 1080
GCCACGTCTT (««(Τ»]: TGATGACCCC GGACACCGAC G]ACACTACC 1140
ACGCCTCAGC ATT ATT AGC TGG CAG GAG AAA ATC AAC GCG CCG CCT CTT 1189
Met Ser Trp Gln Glu Lys Ile Asn Ala Ala Leu AAp
10
GCG CGT CGT GCT GGC CTT GCC CTG CGT CGC CCT TTA CCC GCT GCG CCA 1237
Ala Arg Arg AAl AAa Aas Ala Leu CAg CAg CAg C^r Cro Cć^a. Ala Gln
20 25
GTA GCC GGA CGC TTG CCT GTG GCG GAT GAT CCC CAA TTA CCTC CAA TTT 1285
Gly Ala GTy Ato Tto Ceu Val Ala Asp Asp CAg Gln CTt Ceu Asn Phe
35 40
TCC AGT Α« GAT TTA TTA <GTT TTA ACC CAT CCT CCG CCA ATT ATC CGT 1030
Ser Sur AAn AAp Tyy Ceu Gly Leu Ser ΗΪ3 ΗΪ3 Pro Gln Ul CIi CAg
50 55 60
GCC TGC CAG CAG GGGC CCLC AG CCA TTT <TCC ATC CG3T AGC CGC CGCC TCC 1381
Ala Trp GTn G Tn GT! Ala Glu Glin Phe Gly Ul Gly Ssu GGi Gly Ser
70 75
GTT CAC GTC AGC GGT TAT AGC GTC TTG CAT CAG GCA CTG Τ^ GAG 1429
177 635
Gly His | Val | Ser 80 | Gly | Tyr | Ser Val | Val His 85 | Gln Ala Leu | Glu 90 | Glu | Glu | ||||||
CTG | GCC | GAG | TGG | CTT | GGC | TAT | TCG | CGG | GCA | CTG | CTG | TTT | ATC | TCT | GGT | 1477 |
Leu | Ala | Glu | Trp | Leu | Gly | Tyr | Ser | Arg | Ala | Leu | Leu | Phe | Ile | Ser | Gly | |
95 | 100 | 105 | ||||||||||||||
TTC | GCC | GCT | AAT | CAG | GCA | GTT | ATT | GCC | GCG | ATG | ATG | GCG | AAA | GAG | GAC | 1525 |
Phe | Ala | Ala | Asn | Gln | Ala | Val | Ile | Ala | Ala | Met | Met | Ala | Lys | Glu | Asp | |
110 | 115 | 120 | ||||||||||||||
CGT | ATT | GCT | GCC | GAC | CGG | CTT | AGC | CAT | GCC | TCA | TTG | CTG | GAA | GCT | GCC | 1573 |
Arg | Ile | Ala | Ala | Asp | Arg | Leu | Ser | His | Ala | Ser | Leu | Leu | Glu | Ala | Ala | |
125 | 130 | 135 | 140 | |||||||||||||
AGT | TTA | AGC | CCG | TCG | CAG | CTT | CGC | CGT | TTT | GCT | CAT | AAC | GAT | GTC | ACT | 1621 |
Ser | Leu | Ser | Pro | Ser | Gln | Leu | Arg | Arg | Phe | Ala | His | Asn | Asp | Val | Thr | |
145 | 150 | 155 | ||||||||||||||
CAT | TTG | GCG | CGA | TTG | CTT | GCT | TCC | ccc | TGT | CCG | GGG | CAG | CAA | ATG | GTG | 1669 |
His | Leu | Ala | Arg | Leu | Leu | Ala | Ser | Pro | Cys | Pro | Gly | Gln | Gln | Met | Val | |
160 | 165 | 170 | ||||||||||||||
GTG | ACA | GAA | GGC | GTG | TTC | AGC | ATG | GAC | GGC | GAT | AGT | GCG | CCA | CTG | GCG | 1717 |
Val | Thr | Glu | Gly | Val | Phe | Ser | Met | Asp | Gly | Asp | Ser | Ala | Pro | Leu | Ala | |
175 | 180 | 185 | ||||||||||||||
GAA | ATC | CAG | CAG | GTA | ACG | CAA | CAG | CAC | AAT | GGC | TGG | TTG | ATG | GTC | GAT | 1765 |
Glu | Ile | Gln | Gln | Val | Thr | Gln | Gln | His | Asn | Gly | Trp | Leu | Met | Val | Asp | |
190 | 195 | 200 | ||||||||||||||
GAT | GCC | CAC | GGC | ACG | GGC | GTT | ATC | GGG | GAG | CAG | GGG | CGC | GGC | AGC | TGC | 1813 |
Asp | Ala | His | Gly | Thr | Gly | Val | Ile | Gly | GlU | Gln | Gly | Arg | Gly | Ser | Cys | |
205 | 210 | 215 | 220 | |||||||||||||
TGG | CTG | CAA | AAG | GTA | AAA | CCA | GAA | TTG | CTG | GTA | GTG | ACT | TTT | GGC | AAA | 1861 |
Trp | Leu | Gln | Lys | Val | Lys | Pro | Glu | Leu | Leu | Val | Val | Thr | Phe | Gly | Lys |
225 230 235
177 635
GAA Gly | GAA Phe | GGC GTC ATC TTT GCA GCG GCG CTT TTC TCC | CTT CSU | ACG Thr 350 | gtg Val | GCG Ala | 19909 | |||||||||
Gly Val 340 | Seo Gly | Ala Ali | ail 345 | Leu | Cys | SSU | ||||||||||
GAG | GAG | CTG | CTG | CAT | TTC | GCC | CTC | CAC | CK] | TTC | TAT | CTT | TCC | AGT | ATG | 1957 |
Tsp | Gyo | Leu | Leu | Gln | Phu | Ala | Tog | His | Leu | Ile | Thr | CSU | Tho | SSr | MeU | |
251 | 360 | 2(55 | ||||||||||||||
CCG | CCC | GTT | CAG | GCG | CAG | GCC | TGT | CGT | GCG | CCG | CCG | CTC | GCC | ATT | CCC | 2005 |
ΡΟ- | Pro | ATl | Gln | Tla | Gln | Ala | Leu | Tog | Ala | Ser | ILU | Ala | Cal | Hu | Crg | |
370 | 275 | 280 | ||||||||||||||
ΤΑ] | GAG | GAG | <GTT | GAT | GCA | CCCT | CTC | GTT | TAG | CCG | GAC | CTC | CTC | ATT | ACG | 2053 |
Ser | Asp | Glu | Gly | Asp | Ala | Arg | Tog | Glu | lls | Leu | AT u | ATu | Leu | iIn | CCh | |
335 | 390 | 395 | 330 | |||||||||||||
CGG | Thr | CGT | GCC | TTA | GTA | CAG | GAG | ThA | CCG | TTC | ATC | CCT | CCT | GAT | TCA | 2102 |
Aog | Phu | Ato | Ala | Gly | aal | Gln | Tsp | Leu | Pro | Phe | TAh- | Ceu | Ali | Asp | CSU | |
305 | 320 | 325 | ||||||||||||||
GAC | TGC | GCC | -ATC | CAG | CCT | TTG | TTT | GTC | <T3T | GAT | ATT | CTT | CGT | GCG | CTA | 2149 |
Cys | Seo | ATl | He | Gln | Pro | Leu | Ile | aal | Gly | Asp | Acs | CSU | Tog | Ala | CLU | |
330 | 335 | 330 | ||||||||||||||
CTT | CTT | GAC | GAA | TTT | CTG | CGT | CAG | CTT | <G5C | TGC | TAG | CTC | ACG | GGG | ATT | 2197 |
Aln | Leu | ATu | Glu | Lys | Leu | Arg | Gln | Gln | Gly | Cys | Tc- | Cal | Thr | Ala | CIu | |
335 | 340 | 345 | ||||||||||||||
CGC | CCG | CCA | ACC | GCA | CCC | (ACT | TTT | ACC | <TCG | CGA | CCA | CCC | CTA | ACG | CTA | 2245 |
Aog | Poo | Pro | Thr | aal | Poo | Ala | Gly | Thr | Ala | Tog | Leu | cto | Leu | TTh | Ceu | |
350 | 355 | 3(60 | ||||||||||||||
TCC | GCT | GCG | CAT | GTT | ATC | C1TT | GAT | ACC | GAC | CGT | CCG | CCA | CAG | GTG | CCG | 2293 |
Thr | Ala | ATu | His | Glu | Met | Gln | Asp | Ile | Asp | Tog | Leu | Ceu | Glu | Val | Ceu | |
365 | 370 | 375 | 333 |
CAG GAC TAC GAC TAATAAACAA GGGACGGCAG CAACATTTGA GCGGGCAGCG
3555
177 635 iis lly Asn Gly
385
GGTCTCCACG | ATCTACATCC ΑΤΜΌΤ^Κ lCCTGTAhl( CTGAGlCChT «ΑΚΤΑΓΑ | 240 5 |
ATAAACAGTC CTG1TTGh1( TGlClllhhC lTGAAGCTlA «ΑΤΑΠΑΚ | 2465 | |
CGCCTCTGGC | GGAATClTCA 15150101( ^Τ^^ΑΚ T^TCTCTC^C GCCAATGCCT | 2525 |
GTTGA1ACAC | GCCATAATAA Α^ΚΤΑΑΜ ThTThCT1GC CGAAA1ATAC CGAATCCCTG | 2585 |
CCTTTATCGA | CCGCGACGTT 1AhChT1CTC 11A1CTAhCC «ΚΑΚΚΑ TTGTTGCGAT | 2645 |
AACCCATCCA | C1ΑCΑCCCC1 ΟσΜΑΤ^^ «CGATf^GlGC GCCCCATAG CGTGGTCGiG | 2055 |
«TACCSClC | TAA'T1CA1AA ΜΑΜΤ^^ TAGh1CThCC AGGGGT1GCA 1GCGAT1GAC | 2765 |
ΤΑΚΚ^Κ | ΜΊ^ΑΑ^Α 11«««« IC^SATG^dS TCGjTTCAGTC Α^ΙΑΤ^Α: | 2825 |
ΚΚΑ^Α^ | AACATCATAT CA1GCCTCCC G1Ch1h11hC TTTATTATTC Κ^Α^Α^ | 22885 |
ATGC1CTCGC | TAAAAGACAC CdidCCACT iCThChhATG AAGGGCGCGA CCCTC1AACA | 2945 |
TTATG1C1TT | CGCATTTTCA GCGATAGCCC TTGGCCCGG1 CGCTACAACA GAAAC1ATAC | 3005 |
CCCCCGAGGC | «««Μ «ΠΑΤΑΤη ΑΜΚ^ GTT AGT AAA CTT TAT TTT | 3060 |
aal Suo Lys Arg Ty: Phu 1 5
GTC aal | ACC Th: | GGA ATC GAT ACC G7AA | GTG ATT JTAA ACT GTC GCC ATT TGT GiA | 3108 | ||||||||||||
Gly | TTh (3ρ 10 | Thr | Glu | Val | lly 15 | Ly^Et | Th: Val Ala ssu 20 | Cys Ala | ||||||||
CTT | TTA | CJCA | GAC | (CCA | (TAG | GCA | GCA | TGC | TT.T | C1G | ACG | TCA | (Gi | (AT | JATA | 3156 |
Luu | Luu | Gln | ATu | Ala | Lys | A1 a | Ala | lly | 5Tt | Arg | Thr | Ala | Gly | Ty: | Lyy | |
25 | 30 | 35 | ||||||||||||||
CCA | ATC | GCC | TTC | (A3C | AGC | (ATA | (TAG | ACC | CCG | TAT | GAT | TTA | CGC | ATT | AGC | 3204 |
177 635
Poo Van Ala Sep Gly 40 | Sep Glu Lys 45 | Tho | Poo Glu Gly 50 | Leu Arg | Asn | Sep | ||||||||||
GCC | GTT | CTC | GCG | TTA | CAG | CGC | cat: | a<a: | AGC | CTC | CCG | CTG | GAT | CAA | GCA | 3252 |
Asp | Ala | Leu | Ala | Leu | Gln | Arg | Asn | Ssr | SSr | Glu | Gln | Glu | Ars | Ala | ||
55 | 60 | 66 | TO | |||||||||||||
ATT | TTA | (TCT | CCT | TAC | ACC | TTC | GCA | GCAC | ccc | ACT | TCG | CCG | CGA | ATC | GTC | 3655 |
Cho | Van | Asn | Pro | 'Ayr | Thr | Phe | Ala | Gla | Pro | TTr | Ssu | Ppo | Chs | Gln | Gla | |
75 | 80 | 88 | ||||||||||||||
CGT | GGT | CCTA | GAG | GGC | AGA | CCG | ATA | GCAC | TACA | TTG | GTA | ATC | GAG | GCC | CTAA | 3348 |
Sep | Ala | Gln | Glu | Gly | Arg | Pro | Ile | Glu | Ser | Llu | Wl | MmU | Ssu | Ala | Gly | |
90 | 99 | 110 | ||||||||||||||
TTA | CGT | <CCG | CTT | GAA | CAA | CAG | GCT | GAC | T<TA | GTG | TTA | gtc | GCA | (AST | GCT | 3396 |
Leu | Arg | Ala | Leu | Glu | Gln | Gln | Ala | Asp | Trp | wi | Glu | Wl | Gln | Gly | Ala | |
105 | 110 | m | ||||||||||||||
GGC | GGT | T<AA | ttt | ACG | CCG | CTT | TCT | GAC | ACT | TTC | ACT | TTT | GCA | GAT | SAGA | 3444 |
Gly | Gir | Tapp | Phe | Thr | Pro | Leu | Ser | Asp | Thr | Phh | TGur | Chh | Ala | Asp | Cep | |
120 | 115 | 113 | ||||||||||||||
GTC | AGA | CAG | GAA | (CCA | CTG | CCG | GTG | ATA | CTG | GTA | GTT | GGT | gtg | CATC | CTC | 3492 |
Val | Tho | Gln | Glu | Gln | Leu | Pro | Wl | Ile | Leu | Wl | Val | Gly | Wl | Lls | Leu | |
135 | 140 | 114 | 110 | |||||||||||||
GGC | TGT | AAT | AAT | CAC | GCG | ATG | TTG | CCT | GCA | CCG | GTA | ATA | CCTK | CAC | GCC | 3340 |
Gly | Cys | Iln | Asn | His | Ala | Met | Leu | Thr | <y.a | Gln | Wl | Ila | Gln | His | Ala | |
155 | 110 | 116 | ||||||||||||||
GGC | CTG | ACT | CTC | GCG | GGT | T<TA | GTG | GCG | CTCC | GAA | GATT | ACG | CCT | CCG | CTAA | 3588 |
Gly | Leu | Thr | Leu | Ala | Gly | Trp | Wl | Ala | Asn | Asp | Wl | Thr | Pro | Pro | Gly | |
170 | 115 | 118 | ||||||||||||||
AAA | CGT | CCC | GCT | GAC | TAT | ATG | ACC | ACG | CTC | ACC | CGC | ATC | ATT | CCC | GCG | 3636 |
Lys | Aog | His | Ala | Glu | Tyr | Met | Thr | Thr | Leu | Thr | CArg | Met | Ila | Pro | Ala |
185 110 119
177 635
CCG CTT CTG GTG GAT ATC CCC TCTC CTT CCA GCA ACT CCA GCA TAT TCG 338^
Pro eeu Leu GT. Glu He Pro Trp Leu Ala Glu Asn Pro GTu Asn Ala
200 205 210
GCA ACC GGA AAA TAC ATA AAC CTT GCC TTC GTC TAC GCG TTA ACT CTA 3372
Ala Thr Gly Ley Tyr He Asn Leu Ala Phe Val Asp Ala Ssu Thr Leu
215 220 225 230 gtt yτy aca agt cga tta tgacaacgga cgatcttgcc ττyτAccAAC 2780
Tly Phu Thr Sur Arg Leu
235
GCCTTATCyG GCACCCATAC ACATCCATGA CCTCCCCTCT GCCGGTTTTy CCyTCAGGAT 33^0
GAGACGAAGG TTGC]AG:yG ATTT7GyCTG ACCTCATACT CCTTTTTGAC GGCAGTCTAC 3300
CCyGGTGGGC GGCGCTCCAC CGCTACAATC ACCCGCAGCT TCATGCCGCG ATAGACCTCC 339C>
AAATTGATGC CAAGTCGCAT GTGATGTATG GCCGTATCAC CCATCCGCCA GCCATTATAC 4(00
AGAGCCGCAT ACTTCTTGCG ATCACGACGA AACCGCTGGA GTGCCTTTTT CCTCTCTTTC H0O
CCGGTTCCGT ACAGGTCGAA GTCGCGATGA AAATCGAGTA CCAGTACTGT CAAATCAAAA 44.10
GAGAACCGCG CCAGCGTTTT CTGACCTTCC GyAATGGTTT TCATCGCCAT ACCCTTATCC 4420
CGATGTCGTT GTGCGATCCG GATAACTCAA TGCACAGTCT CTGGACAGGy TATCCTTCAA 4420
AAAACCTTTT TGCTCCCGCC CCGCAATGCC GyATGGATGG CGAATGGGAy GTTGCTCTTA 4430
TGGyGGGCyT TGCCCGCCTG ATGGCCGCGC ATCCTCATGA AATCGCCGCG GCTTTTATTA 433^0
AGyyGATTTT yCGCGGCGCA GGyGGGATGy GCAGGTACCA TCCGGAATGG TTAAAAACTA 4440
TCCGCAAAAT ATGCGATCCC GAACGTATCT TGCTGATTGC CGACCAGATC GTCATCATTT 4400 yyGTyCGTAC CGGGACACTG TTTGyCTGTG AACATGCAGA AATCGCGCCG GTCATTTyAG 4560
177 635
GGCTCGATAA | AAGCTTAACC | AACGACACAA | TAACCCTTTC | CGCCACACTC | ACCACGCGCG | 4460 |
AGATTGCAGA | AACCATCAAT | AACAATAAAG | CCAATTGCTT | TATGCATATAA | CCCAACTTTTA | 44^0 |
TAGGCAATCC | ACTAAGCTGC | ACAACAGCAA | ACAGCAGCCT | GGCGATTCTC | GAAATCCTAACG | 4440 |
ACTGACAACA | ACAAATAACA | AATATTAAAG | TACAACTACG | CGAtAACCTT | łGACCCCCATCC | 4400 |
ATAATACCAA | AATAATTAGC | AATATACGCG | TACTGGGAGC | CATTCTJCGTG | GTCGAAAACCA | 4480 |
CTCATCCGAT | GAATATGACG | ACAGTAGCAA | AATTCTTTAT | CGAAAACAAAT | GTCTCAAATCC | 4490 |
AACCTTTTAA | CAAACTGATT | TACCTGATAC | CACCCTATAT | TATTCTCCCG | AGAACAGTTGC | 4490 |
AACGTCTAAC | CGCAGCGATT | AACCGCGCAA | TACAAAATAA | AACATTTTTTT | TGCCAAATCAAC | 50^4» |
GAGAAGTCCG | CGTAAGGATT | TCTAACTACA | CTTTCTACAA | acataaaaaa; | ACAGATTCATG | 551^0 |
ACACTCATCA | ATAACAATCT | GGACGATAAC | AATAAATTAG | CGCATCGTCA | ATATCTTTłAAC | 55^0 |
GACATAAATT | ACAATAACAA | TAATATTTCA | CCACATCTAA | CGTATAATGA | TGTTCCTGCG | 5520 |
GAAACGAAAA | GTTTTATTGT | CACCTGCTAC | AACCCAAATA | CGCAGCCCCGA | CTCCCAACCTAA | 5520 |
TGACACTGAA | TAATTATTAA | CTTACCCAGT | AATACCCGCG | TATTACCGCA | AAAAJTTTCAA | 5530 |
TCTGATCTGA | TAGCAATACC | AGACGACGTT | TTACAAACAC | GTACTGACTT | TTA5TCAAAACC | 5500 |
GAGTACAATG | GGGCAACACC | GCCGAAAAAC | AAACCTCATC | GCTACATTTT | TACCGTTCCAC | 5540 |
ACGCTGAATA | TAGAACATAT | TAATGTCGAT | AAAAATACCA | GCAGCACGAT | CAATCCAAACTT | 555 2) |
AACGTTCATT | TCCACTCTCT | GACAAGCGCC | TCGATTACTG | CGAAATGTAT | TTTAATCACTC | 5558 |
TACCAGATGA | CACAATAGCA | TCTAATATGA | CTTAAAGATA | ΤΤΤΤΑΑΑΑΑΓ | CTTTTTGTCT | 55^0 |
TTTTACCTTC | CCGTTTCACT | CAAGTTAGTA | TAAAAAAACA | GGCGTTTGCG | GATTCATTTT | 5570 |
177 635
TCTACTTTAT AGCCTGGAGT AACCTGTGAA CATATCTTCT ATTTCCCGTC TdCGCTdC
ΑΤΤΊΊΤΤΤΤΤ GGTGCGACGT TGACCGTTTG TATSTTCCCC CCGCCCGACC AACCTCCTTC
ΤΊΑΤΤΑΑΑΤΤ ΊΤΊΤΤΤΊΊΤΑ CTGAGCTTGA ATTCCTCCGG GCATGCAAGC TT (0) informacja o SEQ lD Nr: 7:
(i) CHARAKTERYSTYKA:
(A) DŁUGOŚĆ: 384 aminokwasy (B) TYP: iminokwasowy (D) TOrOLOGlA: liniowa (ii) TYP TZĄeTETZKl: protrina (xi) OPlS SEKWENCJl: SEQ lD Nr: 7:
5760
5800
5870
Mrt 1 | Sro | Top | Glu (Glu 5 | Lys | Ile Asn Ala Ala Leu Asp Ala Arg Arg Ala | ||||||||||
10 | 15 | ||||||||||||||
AUi | Asp | AUa | Leu | (Arg | Arg | JArg | Tyo | Pro | Val | (ALa | Gln | Gly | Ala | Gly | (Arg |
00 | 251 | 33 | |||||||||||||
Trp | Ieu | Val | Ali | Asp | Asp | Ag- | Gln | Tyo | Iru | Asn | Phr | Sro | Sro | Asn | Asp |
35 | 40 | 45 | |||||||||||||
Tyo | Lru | Gly | Leu | ero | His | His | Poo | Gln | llr | lle | Arg | AUi | Top | Gln | Gln |
50 | 55 | 60 | |||||||||||||
Gly | Ali | Glu | Gln | Phr | Gly | lle | Gly | Seo | Gly | Gly | Sro | Gly | His | aiU | Seo |
65 | 70 | 75 | 80 | ||||||||||||
Gly | Tyo | Sro | Val | Val | His | Gln | Ali | Leu | Glu | Glu | Glu | Lru | Ala | Glu | Trp |
85 | 90 | 95 | |||||||||||||
Lru | Gly | Tyo | Ser | (Arg | Ala | Leu | Leu | Phe | Ile | Ser | Gly | Phr | Ala | Ala | Asn |
100
105
111
177 635
Gln Ala Val | Ile | Ala AUl Met Met Ala Lys Alu As^pi (sg Ile Ala | Ala | ||||||||||||
115 | 110 | 112 | |||||||||||||
Asp | Arg | Leu | Ser | His | da | Ser | Leu | Leu | llu | Ala | Ala | Ser | Leu | Ser | Pro |
130 | 113 | 140 | |||||||||||||
Suo | Gln | Leu | Arg | Aog | Phe | da | His | Asn | Asp | VaU | Thr | His | Leu | Ala | Arg |
150 | 155 | 160 | |||||||||||||
Luu | Leu | Ala | Ser | Poo | Cys | Poo | Gly | Gln | lln | Met | Val | Val | Thr | Glu | Gly |
165 | 170 | 175 | |||||||||||||
aal | Phe | Ser | Met | Asp | Gly | Asp | Ser | AT u | Pro | Leu | Ala | Glu | Ile | Gln | Gln |
180 | 118 | 190 | |||||||||||||
aau | Th: | Gln | lln | ΗΪ( | Asn | Gly | Topę | Llu | Met | Val | Asp | Asp | Ala | His | Gly |
195 | 200 | 205 | |||||||||||||
Tho | TUy | Val | Ile | Gly | ilu | Gln | lly | Aorg | lly | Seo | Cys | Trp | Leu | Gln | Lys |
210 | 215 | 220 | |||||||||||||
aau | Lys | Pro | Glu | Leu | Leu | Val | Val | Tło | Phe | Gly | Lys | Gly | Phe | Gly | Val |
225 | 230 | 235 | 240 | ||||||||||||
Suo | lly | Ala | da | Val | Leu | Cys | Ser | Ser | Tho | Val | Ala | Asp | Leu | Leu | |
245 | 250 | 255 | |||||||||||||
Gln | Phu | da | ASog | ΗΪ( | Leu | ^U( | Tor | Ssu | Thr | Ser | Mut | Pro | Pro | Ala | Gln |
260 | 226 | 270 | |||||||||||||
Ala | lln | Ala | Luu | AOgg | da | Ser | Leu | Ala | Val | Ile | Tog | Ser | Asp | Glu | Gly |
275 | 228 | 225 | |||||||||||||
Asp | Ala | Mg | Arg | Glu | Lys | Leu | Ala | da | Luu | Ile | Thr | Arg | Phe | Arg | Ala |
290 | 22^ | 300 | |||||||||||||
Aly | Val | Gln | Asp | Luu | Pro | Phu | Thr | Luu | Ala | Asp | Ser | Cys | Ser | Ala | Ile |
305 | 330 | 315 | 330 |
177 635
Gln Pro Leu | Ilu | Val Gly 325 | Asp Asn Ssu Arg Ala Ltu Gln Leu Ala Glu | ||||||||||||
330 | 333 | ||||||||||||||
Lys | etu | Asg | Gln | Gln | Gly | Cyy | Trp | Val | Thr | Ala | Ile | AOgg | Pro | Pro | Thr |
340 | 334 | 350 | |||||||||||||
Val | Pro | Ais | Gly | Thr | AL a | CArg | etu | Arg | Lu u | Thr | Ltu | Thr | Ala | Ala | His |
355 | 360 | 335 | |||||||||||||
Glu | Mtt | Gln | Asp | Tle | Asp | <Crq | Ltu | Leu | Glu | Val | Leu | HHs | Gly | Asn | Gly |
370 | 337 | 380 |
(2) INFORMACJA O SEQ ID Nr: 8:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 236 aminokwasów (B) TYP: iminokwasowy (D) TOPOLOGIA: liniowi (ii) TYP CZĄSTECZKI: proteina (xi) OPIS SEKWENCJI: SEQ ID Nr: 8:
ViL Ser lys Arg Tyig PPe Val Thr Gly Thr Asp Thr Glu Val Gly Lys 15 11 11
Thr Val ACu Tsu Cys Ala Ltu Leu Gln Ala Ala Lys Ala ACa Gly Tyr 20 22 30
Arg Thr ACu AGu Tyr Lys Pro Val Ala Ser Gly Ser Glu Lyy Thr Pro 35 40 45
Glu Gly Leu Arg Asn Ser Asp Ala Leu Ala Leu Gln Arg Asn Ser Ser 50 55 60
Ltu Gln Leu Asp Tyr Ala Thr Val Asn Pro <iyr Tho Phe Ala Glu Pro 65 77 77
177 635
Thr | Ser | Pro | His | Ilt 85 | Ilt | Str Ala Gln Glu Gly Ar9 Pro Ilt Glu | Str | ||||||||
90 | 915 | ||||||||||||||
Leu | Val | Met | Ser | Ala | Tly | Leu | Arg | Ala | Ltu | Glu | Gln | Gln | Ala | Asp | Trp |
100 | 105 | 110 | |||||||||||||
Val | Leu | Wl | Glu | Gly | GlLa | Gly | Gly | Trp | Phe | Thr | PrO | Leu | Ssu | Asp | Thr |
115 | 120 | 115 | |||||||||||||
Phe | Thr | PPe | Ala | Asp | Trp | Val | Thr | Gln | Glu | Gln | Leu | Pro | vaa | Ile | Leu |
130 | 135 | 140 | |||||||||||||
Val | Val | GT. | Vai | LjT | LtU | Gly | Cys | Ile | Asn | His | Ala | Met | Leu | TłA | Ala |
145 | 150 | 115 | 110 | ||||||||||||
Gln | Val | iIu | Gln | Ηί-S | Ala | Gly | Leu | Thr | Leu | Ala | Gly | Tir? | Val | Ala | Asn |
165 | 110 | 115 | |||||||||||||
Asp | Val | Thr | Pro | Pro | Gly | Lys | Arg | His | Ala | Glu | Tyr | Met | Thr | Thr | Leu |
180 | 185 | 190 | |||||||||||||
Thr | Arg | MMt | Ile | Pro | Ala | Pro | Leu | Leu | Gly | guu | Ile | Pro | Typ | Leu | Ala |
195 | 200 | 205 | |||||||||||||
Glu | Asn | P^o | Glu | Asn | Ala | Ala | Thr | Gly | Lys | Tyr | Ile | Asn | Leu | Ala | Phe |
210 | 215 | 220 | |||||||||||||
Val | Asp | ACa | Ser | Thr | Ltu | Gyy | Phe | Thr | Ser | CAg | Ltu | ||||
225 | 230 | 225 |
(2) INFORMACJA O SEQ ID Nr: 9:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆc 14C psy zasad (B) TYP: kwas nukleinowy (C) TYP NICI: podwójna (D) TOPOLOGIA: liniowa
277 635 (ii) AYP CZĄSTECZKI: DNS ^^unomowu) (iii) HIPOGEhYCZNOŚĆ: NIE (iii) ANTYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:
(T) ORGANIZM: Escherichii coli (vii) BEZPOŚREDNIE POCHODZENIE:
(B) KLON: pBO30 (ix) CECHY:
(T) NTZWT/KLUCZ: CDS (B) POŁOŻENIE: 2..95 (D) POZOSGTŁE DANE: /paotiil /EC numbe^ 6.3.3.3 /pr-dIct= Dethiobiotin erntease /9unu= ” b i oD /genu^bi^ (ix) CECHY:
(T) NAZWT/KLUCZ: CDS (B) POŁOŻENIE: 2332.253 (D) POZOSGTŁE DANE: /pirtiil /codon start= 230 /EC numbe^ 3.6.2.63 /product= DAPA Srnteipu /gune= bioA /pseudo (ix) CECHY:
(T) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 222..433 (D) POZOSGTŁE DTNE: /standard namu= bioT RBS (ix) CECHY:
(T) NTZWT/KLUCZ: stum-l-p (B) POŁOŻENIE: 33..1
177 635 (x) informacja dot. OPUBLlKOWANlA:
(H) NUMER DOKUMENTU: WO 87/01301 B1 (l) DATA ZGŁOSZENlA: 06-08-1086 (J) DZlEŃ OPUBLlKOWANlA: 07-04-1003 (xi) OPlS SEKWENCJl: SEQ lD No: 0:
TAC ATA AAC CTT GCC TTG CTG TAGCCACCCT GTACCTGGTT ATACTTGCGAG Tyr llr Asn Leu Ali Lru Lru
5
CGAGATCGCG TCCTCGATTG ACTGCAACCT AACCCCCTAG AGCCGACTCT AGGGCTTACA
AGTCGATT ΑΤΊ ACA ACG GAC GAT CTT GCC TCT Mrt Thr Tho Asp Asp Iru Ali Phr
5 (0) lNFORMACJA O SEQ lD Nr: 10 (i) CHARAKTERYSTYKA (A) DŁUGOŚĆ: 8 aminokwasów (B) TYP: iminokwmowy (D) TOPOeOGlA: Uiniowa (ii) TYP CZĄSTECZKl: protrina (xi) OPlS SEKWENCJl: SEQ lD No: 10:
Tyr lle Asn Leu AUa Leu Lru 1 5 (0) lNFORMACJA O SEQ lD Nr: 11:
111
143 (i) CHARAKTERYSTYKA SEKWENCJl:
(A) DŁUGOŚĆ: 7 aminokwasów (B) TYP: aminokwasowy
177 635 (D) GOPOLOGIT: liniowi (ii) GYP CZĄSTECZKI: proteina (xi) OPIS SEKWENCJI: SEQ ID Nr: 22:
Met Tho Gho Tsp Tsp Leu Ala Phe 2 5 (3) INFORMACJA O SEQ ID Nr: 23 (i) CHARAKTERYSTYKA SEKWENCJI:
(T) DŁUGOŚĆ: 93 pary zisid (B) GYP: kwis nukleinowy (C) FORMT NICI: podwójna (D) GOPOLOGIT: liniowa (ii) AYP CZĄSTECZKI: DNS (genomowe^) (iii) HIPOGETYCZNOŚĆ: NIE (iii) TNCYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:
(T) ORGANIZM: Escherichii coli (vii) BEZPOŚREDNIE POCHODZENIE: (B) KLON: pBO30T-9 (ix) CECHY:
(T) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 4..94 (D) POZOSGTŁE DANE: /partiil /codon stirt= 2 /EC numbur= 6.3.5.3 /product= DGB eynthapu /gunu= bioD
177 635 (ix) CECHY:
(A) NAZWA/KLUCZ: CDS (B) hOŁOŻENlE: 75..93 (D) POZOSTAŁE DANE: /partial /codon starta 70 /ET number= 2.0.1.00 /ppoduct= DAPC Synthase /gunu= bioA (ix) CECHY:
(A) NAZWA/KLUCZ: RBS (B) POŁOŻENlE: 01..72 (D) POZOSTAŁE DANE: /standard namu= bio A RBS (x) Informacja DOT. OPUBLIKOWANIA (H) NUMER DOKUMENTU: WO 87/01301 B1 (I) DATA ZTŁOSZENlC: 20-00-1900 (J) dzień opublikowania: 07-04-19 93 (xi) OPIS SEKWENCJI: SEQ ID Nr: 12:
TAC ATA CCC CTT GCC TTT TTC TAGCCATTCT GTATTT<AATT CGTCGACTCT Tyr lle Asn Leu Ala Leu Llu
5
ATGTATTCCC AGTCGATT ATT ACA ACG GAC GAT CGA CGC TTT Met TCt Thr Asp Asp Leu Ala PUe
5 (2) INFORMACJA O SEQ ID Nr: 13 (i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 8 aminokwasów (B) TYP: aminokwlsowy (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: proteina
177 635 (xi) OPle SEKWENCJlc SEQ lD Nr: 13:
Tyo lle Asn Lru AUi Lru Lru 1 5 (0) lNFORMACJA O SEQ lD No: 14:
(i) CHARAKTERYSTYKA SEKWENCJl:
(A) DŁUGOŚĆ: 7 aminokwasów (B) TYP: aminokwanowy (D) TOrOLOGlA: liniowa (ii) TYP CZĄSTECZKl: proteina (xi) OPlS SEKWENCJl: SEQ lD No: 14:
Met Tho Thr Asp Asp Lru Ali Phe 1 5 (0) lNFORMACJA O SEQ lD No: 15:
(i) CHARAKTERYSTYKA SEKWENCJl:
(A) DŁUGOŚĆ: 77 par zasad (B) TYP: kwas nukleinowy (C) FORMA NlCl: podwójna (D) TOPOLOGlA: liniowa (ii) TYP CZĄSTECZKl: DIS (genomowr) (iii) HlPOTETYCZNOŚĆ: NlE (iii) AANTSENSOWNOŚĆ: LIl (vi) PIERWOTNE POCHODZENIE:
(A) ORGCIilZM: Ε^1ιπ^1ιΪ3 coli
177 635 (vii) BEZPOŚREDNIE POCHODZENIE:
(B) KLON: pBO30A-15 (ix) CECHY:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 1..57 (D) POZOSTAŁE DANE: /partiil /codon stio^ 1 /functSon=altered 3'-und /EC number= 6.3.3.3 /product= DTB Synthise” /genu= bioD (ix) CECHY:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 54..77 (D) POZOSTAŁE DANE: /partial /codon stiot= 54 /EC numbur= 2.6.1.60 /product= DAPA Synthase /gene= bioA (ix) CECHY:
(A) NAZWA/KIUCZ: RBS (B) POŁOŻENIE: 45..56 (D) POZOSTAŁE DANE: /standard nime= bioA RBS (x) INFORMACJA DOT. OPUBLIKOWANIA (H) NUUffiR CDOKUfflNTU: WO 17/7/013 B i (I) DATA TGTOSZENIA: 22-08-1186 (J) DZIEŃ OPUBLIKOWANIA: 07-04-1993 (xi) OPIS SEKWENCJI: SEQ ID No: 15:
TAC ATA AAC CTT ACC ATC ATT CTC CTC CCG ACT CTA <GCG TTT AGA AGT
Tyr Ile Asn Leu ACu CPh Tal Ass ASu T er Thr Leu Gly Phe Thr Ser
10 15
GT
177 635
CGT TGT TGACAACGAT CGTTGCGGCC TGC
Tog Leu (3) INFORMACJA O SEQ ID No: 26 (i) CHARAKTERYSTYKA SEKWENCJI:
(T) DŁUGOŚĆ: 23 iminokwasów (B) AYP: amin-kwip-wr (D) TOPOLOGIA: liniowi (ii) GYP CZĄSTECZKI: proteina (xi) OPIS SEKWENCJI: SEQ ID Nr: 26:
Gyo Ile Tsn Leu Tli Phe aal Asp Ala Ser Tho Leu Gly Phe Gho Ser 15 10 15
Aog Leu (3) INFORMACJA O SEQ ID Nr: 27:
(i) CHARAKTERYSTYKA SEKWENCJI:
(T) DŁUGOŚĆ: 431 par zisid (B) AYP: kwis nukleinowy (C) FORMT NICI: podwójna (D) GOPOLOGIT: liniowi (ii) GYP CZĄSTECZKI: DNS (gen-m-we) (iii) HIPOGETYCZNOŚĆ: NIE (iii) ANTYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:
(T) ORGANIZM: Eschu-ic^ii coli
177 635 (vii) bezpośrednie POCHODZENlE:
(B) KLON: pBO30A-15/085E (ix) CECHY:
(A) NAZWA/KLUCZ: -10_nSΑnal (B) POŁOŻENlE: 45..40 (D) POZOSTAŁE DANE: /standaod_naIne=,,sromGtrr ptay (ix) CECHY:
(A) NAZWA/KLUCZ: poomotro (B) POŁOŻENlE: 1..06 (C) RODZAJ OZNACZENlA: eksperymentalny (D) POZOSTAŁE DANE: /funytŚGn=pgomotrg ptac /rvidrncr= EXPERlMENTAL (X) lNFORMACJA DOT. opublikowania (H) NUMER DOKUMENTU: WO 87/01301 B1 (l) DATA ZGŁOSZENlA: 06-08-1086 (J) DZlEŃ OPUBLlKOWANlA: 07-04-1003 (xi) OPlS SEKWENCJl: SEQ lD No: 17:
AAGCTTACTC CCCATCCCCC TGTTGACAAT TCATCCCTCd CTCGTATAAT GTGTGlAACT
ΊΤΊΑΊΤΊΊΑΤ AACAATTTCA CACAGGAAAC AdATCCGTT CCTTAGGAGG TGACTAGTCA
TGGCT (0) lNFORMACJA o SEQ lD Nr: 18:
(i) CHARAKTERYSTYKA SEKWENCJl:
(A) DŁUGOŚĆ: 106 pao zasad (B) TYP: kwas nukleinowy (C) FORMA NlCl: podwójna (D) TOPOLOGlA: liniowa
120
125 (ii) TYP CZĄSTECZKl: DIS ^^enomowr)
277 635 (iii) HIPOTETYGZNOŚĆ: NIE (iii) ANCYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:
(T) ORGANIZM: Epceurichii coli (vii) BEZPOŚREDNIE POCHODZENIE: (B) KLON: pBO30T.-21/26 (ix) CECHY:
(T) NTZWT/KLUCZ: promotur (B) POŁOŻENIE: 4..96 (C) RODZTJ OZNACZENIA: eksperymentalny (D) POZOSTAŁE DTNE: /fIycti-o=pr-m-teo ptac /uviduncu= EXPERIMENAAL (ix) CECHY:
(T) NAZWA/KLUCZ: RBS (B) POŁOŻENIE: 231..233 (C) RODZTJ OZNACZENIA: eksperymentalny (D) POZOSTAŁE DANE: /uvidunce= EXPEReeENTAL /standard namu=bioB RBS no.26 (X) INFORMACJA DOG. OPUBLIKOWANIA (H) NUMER DOKUMENTU: WO 4/32392 B2 (I) DTTT ZGŁOSZENIA: 36-03-2936 (J) DZIEŃ OPUBLIKOWANIA: 07-05-2993 (xi) OPIS SEKWENCJI: SEQ ID Nr: 23:
AAGCCTAGTC CGCACGCCCC TACTGTCATT ΤΤΤΤΤεΑΤΟΑ:; CTCGTATAAT GTGTGGTTTT
GTATGCGGTT AACTTTTCCA CACTTATTAG A<^T^C^<^(G^T^A CCTAACKCAdS TTTACTAGTC
TTAGCG (50
120
126
177 635 (2) INFORMACJA O SEQ ID Nr: 19:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 122 par zasad (B) TYP: kwas nukleinowy (C) FORMA NITl: podwójna (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: DNS (genomowe) (iii) HIPOTETYCZNOŚĆ: NIE (iii) ANTYSENSOWNOŚĆ: NIE (vi) PIERWOTNE POCHODZENIE:
(A) ORGANIZM: Es^erich-ia coli (vii) BEZPOŚREDNIE POCHODZENIE:
(B) KLON: pBO65A—10/0 (ix) CECHY:
(A) NAZWA/KLUCZ: promoter (B) POŁOŻENIE: 5.o90 (C) RODZAJ OZNACZENIA: eksperymentalny (D) POZOSTAŁE DANE: /function=promotur ptac /evidence= EXPERieENTTL (ix) CECHY:
(A) NAZWA/KLUCZ: RBS (B) POŁOŻENIE:
(C) RODZAJ OZNACZENIA: eksperymentalny (D) POZOSTAŁE DANE: /evidence= EXPERIMENTCy /standard name=bioB RBS no.9 (x) INFORMACJA DOT. OPUBLIKOWANIA (i) NUMER DOKUMENTU: WO 87/51305 B1 (I) DATA ZGŁOSZENIA: 20-08-5900 (J) DZIEŃ OPUBLIKOWANIA: 07-54-5093
177 635 (xi) OPIS SEKWENCJI: SEQ ID Nr: 19:
AAGCTTACTC CCCATCCCCC TGTTGACTAST CAACCA.CCGG CCCGTACSA.T GTGT<GAATTT
GCTAGCCTAC ΑΤΤΑΛ^^Α (GSCCAGGCAAC ΤΙΤΑ^Ι^Α CCCAA,.GGAGA ^JGC^^TCGI
CT
120
122
177 635
177 635
Fig. 2B
177 635 co co σ
Χ3
X <
ο <
υ
Ε* υ
υ ο
<
<
ε<
Eh
Ε* <
<
υ
Οφ
Εη υ
<
ο η
ϋ •Η
Εη
ΕΟ
Ο
Η
Ε*
Η <
Eh
Ο
Εη υ
η
Ε<
<
υ υ
Ο :
<:
Η:
Ο
Ε«
Η
Ο
O
CO σ
to
Ο co
Ο
G0
Ω_
C3J
Ο
Ο
U
U
O
F<
Eh u
υ <
Eh <
υ «c
Eh v
V tj (0
Ή <
□
0) i4
C
Ol <
u
Eh
Lf>
EEh E-> O U O Eh Ευ Eh < o u < o o o «c < υ u H < Eh E-> < O O Eh U < < o < E->
o o
o <
E<
O
Eh
U «C
O u
E->
o u X CU (0 r-1
0)
o.
VI <
Od
0) <
u
X
Eh
U
X
Eh
Eh ω
ε( <
o jo i
I l
i
2.
EEh
Eh υ
u o
Eh
Eh
O
Eh <
O u
<
o o
u <
u
X cu r-l <
0)
O
CU <
cu
0) <
H
X
Eh tu
X
Eh §11
O
CO σ
to
Eh
O
U £h
O
U
E<
Eh
Eh
O
O
O
Eh
U
Eh
U <
O
U
Eh
O u
Eh
Eh
O o
Eh
Eh
Eh <
Eh
O
Eh
U
Eh
Eh <
U
U u«£:
EhCD
O
CO
O
CD
CL
O o
jo i
I
O | 3 | |
Eh | oi | |
Eh | U) | |
o | 3 | |
Eh | 01 | |
Eh | o | |
υ | to | |
u | ||
o | < | |
Eh Eh | 3 01 | LQ |
U | tj | 'T |
u | c 01 | < |
2 | < | o |
2 | ai | co |
Eh < | »-H W | O |
O < | U >1 | ω CL |
in |
LD
O jo i
Sal I Sali SD i----bioA-----5‘-tacataaaccttgccttcgtcgacgcgtcgactctagggtttacaagtcgattatgacaacggacgatcttgccttt-3'
TyrIleAsnLeuAlaPheValAspAlaSerThrLeuGlyPheThrSerArgLeu £1ETThrThrAspAspLeuAla Phe
177 635
Fig. 4A pbioB::lacZ-2 bioB - 0=
BamHI NcoI
5'-AGGAAACAGGATCCATGGCT 3 *-TCCTTTGTCCTAGGTACCGA
SD SD Met
BamHI
5'-AGGAAACAG 3' -TCCTTTGTCCTAG^
SD
GATCCATGGCT
GTACCGA
Met
Klenow fill-in * -AGGAAACAGgATjZ· 3'-TCCTTTGTCĆTAfif
SD SD
NcoI
GATCCATGGCT jCTAGjGTACCGA
Met
KpnI linker pbioB:;lacZ/KpnI (BamHI) Kpnl_BamHI NcoI 5' -AGGAAACAGGATifcGGTAĆĆGfeATCCATGGCT 3' -TCCTTTGTCCTAgjGCCATGGCĆTAGGTACCGA
SD SD Met | KpnI / NcoI (BamHI)
5' -AGGAAACAGGATJZCGGTAC CATGGCT
3'-TCCTTTGTCCTAgGC CGA
SD SD
Ligation with 985E (BamHI) ’ -AGGAAACAGGATJZCGGTAC CATGGCT ’ -TCCTTTGTCCTAgGC^TG7iAAfĆĆTĆĆACTGATC~AGTAŚCGA
SD SD ' “Mef
Klenow fill-in pbioB::lacZ/985E (BamHI) Kpnty SpeI ’ -AGGAAACAGGAT^CGGTACCTTAGGAGGTGĄCTAGńCATGGCT 3 ’ -TCCTTTGTCCTAgGCCATGGAATCĆTĆĆACTGATĆAGTACCGA SD
SD
SD
Met
177 635
Fig. 4B bioBc
Kpnl . Spel pbioB: : lacZ/985E 5 ’ - AGGAAACAGGATCGGTACCTTAGGAGGTGACTAGTCATGGCT 3 ' -TCCTTTGTCCTAGCCATGGAATCCTCCACTGATCAGTACCGA
SD SD SD Met
Kpnl / Spel
5'-AGGAAACAGGATCGGTAC 3'-TCCTTTGTCCTAGC
CTAGTCATGGCT
AGTACCGA
Met
Oligonucleotides
SD17
TT
3'-CATGGAATCCTCTGATC
SD19
TT TT
3' -CATGGAATCCTCAATGATC C
SD21
TT TTTT ' -CATGGAATCCTCAAAATGATC C C
Ligation Klenow fill-in pbioB::lacZ/16
Kpnl Spel
5' -AGGAAACAGGATCGGTACCTAAGGAGGTTTACTAGTCATGGCT 3' -TCCTTTGTCCTAGCCATGGATTCCTCCAAATGATCAGTACCGA
SD SD SD Met pbioB::iacZ/9
Kpnl Spel ’ -AGGAAAĆAGGATCGGTACCTAAGGAGACTAGTCATGGCT 3 ’ -TCCTTTCTCCTAGCCATGGATTCCTCTGATCAGTACCGA
SD SD SD Met
177 635
177 635
Fig. 6A
Hindlll Hindll
5'-AagctTactccccatccccctgttgacAattaatcatcggctcgtataatgtgtggaatt
-35 pfcas. -10 +i
KpnI Saul , Spel bioB 61 GTGAGCGGATAACAATTTCACACAGGAAACAGGATCGGTACCTAĄGGĄGACTAGTCATGG
SD METAla
121 CTCACCGCCCACGCTGGACATTGTCGCAAGTCACAGAATTATTTGAAAAACCGTTGCTGG
HisArgProArgTrpThrLeuSerGlnValThrGluLeuPheGluLysProLeuLeuAsp
181 ATCTGCTGTTTGAAGCGCAGCAGGTGCATCGCCAGCATTTCGATCCTCGTCAGGTGCAGG
LeuLeuPheGluAlaGlnGlnValHisArgGlnHisPheAspProArgGlnValGlnVal
241 TCAGCACGTTGCTGTCGATTAAGACCGGAGCTTGTCCGGAAGATTGCAAATACTGCCCGC
SerThrLeuLeuSerlleLysThrGlyAlaCysProGluAspCysLysTyrCysProGln
01 AAAGCTCGCGCTACAAAACCGGGCTGGAAGCCGAGCGGTTGATGGAAGTTGAACAGGTGC
SerSerArgTyrLysThrGlyLeuGluAlaGluArgLeuMETGluValGluGlnValLeu pssHII
361 TGGAGTCGGCGCGCAAAGCGAAAGCGGCAGGATCGACGCGCTTCTGTATGGGCGCGGCGT
GluSerAlaArgLysAlaLysAlaAlaGlySerThrArgPheCysMETGlyAlaAlaTrp
21 GGAAGAATCCCCACGAACGCGATATGCCGTACCTGGAACAAATGGTGCAGGGGGTAAAAG
LysAsnProHisGluArgAspMETProTyxLeuGluGlnMETValGlnGlyValLysAla
81 CGATGGGGCTGGAGGCGTGTATGACGCTGGGCACGTTGAGTGAATCTCAGGCGCAGCGCC
METGlyLeuGluAlaCysMETThrLeuGlyThrLeuSerGluSerGlnAlaGlnArgLeu
Nrul
541 tćgcgSacgccgggctggattactacaaccacaacctggacacctcgccggagttttacg
AlaAsnAlaGlyLeuAspTyrTyrAsnHisAsnLeuAspThrSerProGluPheTyrGly
01 GCAATATCATCACCACACGCACTTATCAGGAACGCCTCGATACGCTGGAAAAAGTGCGCG
AsnIleIleThrThrArgThrTyrGlnGluArgLeuAspThrLeuGluLysValArgAsp
61 ATGCCGGGATC AAAGTCTGTTCTGGCGGCATTGTGGGCTTAGGCG AAACGGTAA AAGATC
AlaGlyIleLysValCysSerGlyGlyIleValGlyLeuGlyGluThrValLysAspArg
21 gcgccggattattgctgcaactggcaaacctgccgacgccgccggaaagcgtgccaatca
AlaGlyLeuLeuLeuGlnLeuAlaAsnLeuProThrProProGluSerValProIleAsn
781 ACATGCTGGTGAAGGTGAAAGGCACGCCGCTTGCCGATAACG ATG ATGTCGATGCCTTTG
METLeuValLysValLysGlyThrProLeuĄlaAspAsnAspAspValAspAlaPheAsp
177 635
Fig. 6B (BspHI)
841 attttattcgcaccattgcggtcgcgcggatcatgStgccaacctcttacgtgcgccttt PheIleArgThxIleAlaValAlaArgIleMETMETProThrSerTyrValArgLeuSer
01 CTGCCGGACGCGAGCAGATGAACGAACAGACTCAGGCGATGTGCTTTATGGCAGGCGCAA
AlaGlyArgGluGlnMETAsnGluGlnThrGlnAlaMETCysPheMETAlaGlyAlaAsn
61 ACTCGATTTTCTACGGTTGCAAACTGCTGACCACGCCGAATCCGGAAGAAGATAAAGACC
SerllePheTyrGlyCysLysLeuLeuThrThrProAsnProGluGIuAspLysAspLeu
1021 TGCAACTGTTCCGCAAACTGGGGCTAAATCCGCAGCAAACTGCCGTGCTGGCAGGGGATA
GlnLeuPheArgLysLeuGlyLeuAsnProGlnGlnThrAlaValI»euAlaGlyAspAsn
Sspl
1081 acgaacaacagcaacgtcttgaacaggcgctgatgaccccggacaccgacćaatatAca
GluGlnGlnGlnArgLeuGluGlnAlaLeuMETThrProAspThrAspGluTyrTyrAsn bioF
1141 ĄCGCGGCAGCATTATGAGCTGGCAGGAGAAAATCAACGCGGCGCTCGATGCGCGGCGTGC SD METSerTrpGlnGluLysIleAsnAlaAlaLeuAspAlaArgArgAla
AlaAlaAlaLeu***
1201 TGCCGATGCCCTGCGTCGCCGTTATCCGGTGGCGCAAGGAGCCGGACGCTGGCTGGTGGC AlaAspAlaLeuArgArgArgTyrProValAlaGlnGlyAlaGlyArgTrpLeuValAla
1261 GGATGATCGCCAGTATCTGAACTTTTCCAGTAACGATTATTTAGGTTTAAGCCATC ATCC AspAspArgGlnTyrLeuAsnPheSerSerAsnAspTyrLeuGlyLeuSerHisHisPro
1321 GCAAATTATCCGTGCCTGGCAGCAGGGGGCGGAGCAATTTGGCATCGGTAGCGGCGGCTC GlnllelleArgAlaTrpGlnGlnGlyAlaGluGlnPheGlylleGlySerGlyGlySer
1381 CGGTCACGTCAGCGGTTATAGCGiTGGTGCATCAGGCACTGGAAGAAGAGCTGGCCGAGTG GlyHisValSerGlyTyrSerValValHisGlnAlaLeuGluGluGluLeuAlaGluTrp
1441 GCTTGGCTATTCGCGGGCACTGCTGTTTATCTCTGGTTTCGCCGCTAATCAGGCAGTTAT LeuGlyTyrSerArgAlaLeuLeuPheIleSerGlyPheAlaAlaAsnGlnAlaValIle
AvaII
1501 TGCCGCGATGATGGCGAAAGASGACĆfeTATTGCTGCCGACCGGCTTAGCCATGCCTC ATT AlaAlaMETMETAlaLysGluAspArglleAlaAlaAspArgLeuSerHisAlaSerLeu
1561 GCTGGAAGCTGCCAGTTTAAGCCCGTCGCAGCTTCGCCGTTTTGCTCATAACGATGTCAC LeuGluAlaAlaSerLeuSerProSerGlnLeuArgArgPheAlaHisAsnAspValThr
1621 TCATTTGGCGCGATTGCTTGCTTCCCCCTGTCCGGGGCAGCAAATGGTGGTGACAGAAGG HisLeuAlaArgLeuLeuAlaSerProCysProGlyGlnGlnMETValValThrGluGly
177 635
Fig. 6C
1681 CGTGTTCAGCATGGACGGCGATAGTGCGCCACTGGCGGAAATCCAGCAGGTAACGCAACA ValPheSerMETAspGłyAspSerAlaProLeuAlaGluIleGlnGlnValThrGlnGln
1741 GCACAATGGCTGGTTGATGGTCGATGATGCCCACGGCACGGGCGTTATCGGGGAGCAGGG HisAsnGlyTrpLeuMETValAspAspAlaHisGlyThrGlyValIleGlyGluGlnGly
PvuII
1801 GCGCGGSAGCTGĆTGGCTGCAAAAGGTAAAACCAGAATTGCTGGTAGTGACTTTTGGC AA ArgGlySerCysTrpLeuGlnLysValLysProGluLeuLeuValValThrPheGlyLys
1861 AGGATTTGGCGTCAGCGGGGCAGCGGTGCTTTGCTCCAGTACGGTGGCGGATTATCTGCT GlyPheGlyValSerGlyAlaAlaValLeuCysSerSerThrValAlaAspTyrLeuLeu
1921 GCAATTCGCCCGCCACCTTATCTACAGCACCAGTATGCCGCCCGCTCAGGCGCAGGCATT GlnPheAlaArgHi sLeulleTyrS erThrS erMETProPr oAlaGlnAl aGlnAl aLeu
1981 ACGTGCGTCGCTGGCGGTCATTCGCAGTGATGAGGGTGATGCACGGCGCGAAAAACTGGC ArgAlaSerLeuAlaValIleArgSerAspGluGlyAspAlaArgArgGluLysLeuAla
Wlul
2041 GGCACTCATTACGCGŻFTTTCGTGCCGGAGTACAGGATTTGCCGTTTACGCTTGCTGATTC AlaLeuIleThrArgPheArgAlaGlyyalGlnAspLeuProPheThrLeuAlaAspSer
2101 ATGCAGCGCCATCCAGCCATTGATTGTCGGTGATAACAGCCGTGCGTTACAACTGGCAGA CysSerAlaIleGlnProLeuIleValGlyAspAsnSerArgAlaLeuGlnLeuAlaGlu
2161 AAAACTGCGTCAGCAAGGCTGCTGGGTCACGGCGATTCGCCCGCCAACCGTACCCGCTGG LysLeuArgGlnGlnGlyCysTrpValThrAlaIleArgProProThrValProAlaGly
Fspl , EcoRV
2221 TACTGCGCGACTGCGCTTAACGCTAACCGĆTGCGCATG AAATGCAÓGATATĆGACCGTCT ThrAlaArgLeuArgLeuThrLeuThrAlaAlaHisGluMETGlnAspIleAspArgLeu bioC
2281 GCTGGAGGTGCTGCATGGCAACGGTTAATAAACAAGCCATTGCAGCGGCATTTGGTCGGG
SD METAlaThrValAsnLysGlnAlaIleAlaAlaAlaPheGlyArgAla
LeuGluValLeuHisGlyAsnGly******
Bglll
2341 CAGCCGCACACTATGAGC AACATGCSGATC?ACAGCGCC AGAGTGCTG ACGCCTTACTGG
AlaAlaHisTyrGluGlnHisAlaAspLeuGlnArgGlnSerAlaAspAlaLeuLeuAla (AvaII)
2401 CAATGCTTCCACAGCGTAAATACACCCACGTACTGGACGCGGGTTGTGG ACCTGGCTGGA
METLeuProGlnArgLysTyrThrHisValLeuAspAlaGlyCysGlyProGlyTrpMET
Bąlll
2461 tgagccgccactggcgggaacgtcacgcgcaggtgacggccttSgatcTctcgccgccaa
SerArgHisTrpArgGluArgHisAlaGlnValThrAlaLeuAspLeuSerProProMET
177 635
Fig. 6D
EcoRV
2521 TGCTTGTTCAGGCACGCCAGAAGGATGCCGCAGACCATTATCTGGCGGGAGATATCGAAT LeuValGXnAlaArgGlnLysAspAlaAlaAspHisTyrLeuAlaGlyAspIleGluSer
2581 CCCTGCCGTTAGCGACTGCGACGTTCGATCTTGCATGGAGCAATCTCGCAGTGCAGTGGT
LeuProLeuAXaThxAlaThrPheAspLeuAlaTrpSerAsnLe.uAlaValGlnTxpCys
2641 GCGGTAATTTATCCACGGCACTCCGCGAGCTGTATCGGGTGGTGCGCCCCAAAGGCGTGG GXyAsnLeuSexThrAlaLeuArgGluLeuTyrArgValValArgProLysGlyValVal
2701 TCGCGTTTACCACGCTGGTGCAGGGATCGTTACCCGAACTGCATCAGGCGTGGCAGGCGG
AXaPheThrThrI.euValGXnGlySerLeuProGluLeuHisGlnAlaTrpGlnAlaVal
SphI
2761 TGGACGAGCGTCCSĆATG&AATCGCTTTTTACCGCCAGATGAAATCGAACAGTCGCTGA
AspGluArgProHisAlaAsnArgPheLeuProProAspGluIleGluGlnSerLeuAsn
2821 ACGGCGTGCATTATCAACATCATATTCAGCCCATCACGCTGTGGTTTGATGATGCGCTCA
G2.yValHisTyxGlnHisHisIleGlnProIleThrLeuTrpPheAspAspAlaLeuSer
BspHI
2881 gtgccatgcgttcgctgaaaggcatcggtgccacgcatct5catgSagggcgcgacccgc AlaMETArgSerLeuLysGlylleGlyAlaThrHisLeuHisGluGlyArgAspProArg Sspl Mlul
2941 GAATATTAACGCGTTCGCAGTTGCAGCGATTGCAACTGGCCTGGCCGCAACAGCAGGGGC
IleLeuThrArgSerGlnLeuGlnArgLeuGlnLeuAlaTrpProGlnGlnGlnGlyArg
EcoRV bioD15
3001 SatatEctctgacgtatcatctttttttgggągtgattgctcgtgagtaaacgttatttt SD xMETSerLysArgTyrPhe
TyrProLeuThrTyrHisLeuPheLeuGlyValIXeAlaArgGlu***
Snol
3061 GTCACCGGAACGGATACCGAAGTGGGGAAAACTGTCGCCAGTI^TGCASrTTTACAAGCC ValThrGXyThxAspThxGluValGlyLysThrValAlaSerCysAlaLeuLeuGlnAla
3121 GCAAAGGCAGCAGGCTACCGGACGGCAGGTTATAAACCGGTCGCCTCTGGCAGCGAAAAG AlaLysAlaAlaGlyTyrArgThrAlaGlyTyrLysProValAlaSerGlySerGluLys
Pstl
3181 accccggaaggtttacgcaatagcgacgcgctggcgttacagcgcaacagcagc5t5ca<? ThrProGluGlyLeuArgAsnSerAspAlaLeuAlaLeuGlnArgAsnSerSerLeuGln
PvuII _
3241 ĆT^GATTACGCAACAGTAAATCCTTACACCTTCGCAGAACCCACTTCGCCGCACATCATC
LeuAspTyxAlaThrValAsnProTyrThrPheAlaGluProThrSerProHisIleIle
177 635
Fig. 6E
BssHII BssHII
3301 AGCGCGCkAGAGGGCAGACCGATAGAATCATTGGTAATGAGCGCCGGATTAĆGCGCGC^TT
S erAlaGlnGluGl yArgProIleGluSerLeuValMETS er AlaGl yL euAr g Al aLeu
3361 GAACAACAGGCTGACTGGGTGTTAGTGGAAGGTGCTGGCGGCTGGTTTACGCCGCTTTCT GluGlnGlnAlaAspTrpValLeuValGluGlyAlaGlyGlyTrpPheThrProLeuSer
3421 GACACTTTCACTTTTGCAGATTGGGTAACACAGGAACAACTGCCGGTGATACTGGTAGTT AspThr PheThrPhe AlaAspTrpValThr GlnGluGlnLeuProVal IleLeuVal Val
Hindll
3481 GGTGTGAAACTCGGCTGTATTAATCACGCGATGTTGACTGCACAGGTAATACAACACGCC GlyValLysLeuGlyCysIleAsnHisAlaMETLeuThrAlaGlnValIleGlnHisAla
3541 GGACTGACTCTGGCGGGTTGGGTGGCGAACGATGTTACGCCTCCGGGAAAACGTCACGCT GlyLeuThrLeuAlaGlyTrpVaJLAlaAsnAspValThrProProGlyLysArgHisAla
3601 GAATATATGACCACGCTCACCCGCATGATTCCCGCGCCGCTGCTGGGAGAGATCCCCTGG GluTy rMETThrThrLeuThr Ar gMETI 1 eProAlaProL euLeuGlyGlulleProTrp
Hindll
Sali
3661 CTTGCAGAAAATCCAGAAAATGCGGCAACCGGAAAGTACATAAACCTTGCCTTCGTCGAĆ’ LeuAlaGluAsnProGluAsnAlaAlaThrGlyLysTyrIleAsnLeuAlaPheValAsp
Hindll
Mlul Sali bioA
3721 GCGTCGAĆTCTAGGGTTTACAAGTCGATTATGACAACGGACGATCTTGCCTTTGACCAAC
SD METThrThrAspAspLeuAlaPheAspGlnArg Al_aSerT_hrL,euG_l_y_PheThrSer_ArgLeu***
3781 GCCATATCTGGCACCCATACACATCCATGACCTCCCCTCTGCCGGTTTATCCGGTGGTGA
HisIleTrpHisProTyrThrSerMETThrSerProLeuProValTyrProValValSer
Hindll
3841 GCGCCGAAGGTTGCG AGCTGATTTTGTCTGACGGCAGACGCCTGSiTGACGGTATGTCGT
AlaGluGlyCysGluLeuIleLeuSerAspGlyArgArgLeuValAspGlyMETSerSer
3901 CCTGGTGGGCGGCGATCCACGGCTACAATCACCCGCAGCTTAATGCGGCGATGAAGTCGC
TrpTrpAlaAlalleHisGlyTyrAsnHisProGlnLeuAsnAlaAlaMETLysSerGln
3961 AAATTGATGCCATGTCGCATGTGATGTTTGGCGGTATCACCCATGCGCC AGCCATTGAGC
IleAspAlaMETSerHisValMETPheGlyGlyIleThrHisAlaProAlaIleGluLeu
021 TGTGCCGCAAACTGGTGGCGATGACGCCGCAACCGCTGGAGTGCGTTTTTCTCGCGGACT
CysArgLysLeuValAlaMETThrProGlnProLeuGluCysValPheLeuAlaAspSer
Scal
4081 CCGGTTCCGTAGCGGTGGAAGTGGCGATGAAAATGGCGTTGĆAGTACTGGC AAGCCAA AG
GlySerValAlaValGluValAlaMETLysMETAlaLeuGlnTyrTrpGlnAlaLysGly
ΠΊ 635
Fig. 6F
BssHII
4141 gcgaa'gcgćg?cagcgttttctgaccttccgcaatggttatcatggcgatacctttggcg GluAlaArgGlnArgPheLeuThrPheArgAsnGlyTyrHisGlyAspThrPheGlyAla
4201 CGATGTCGGTGTGCGATCCGGATAACTCAATGCACAGTCTGTGGAAAGGCTACCTGCCAG
METSerValCysAspProAspAsnSerMETHisSerLeuTrpLysGlyTyrLeuProGlu
4261 AAAACCTGTTTGCTCCCGCCCCGCAAAGCCGCATGGATGGCGAATGGGATGAGCGCG ATA
AsnLeuPheAlaProAlaProGlnSerArgMETAspGlyGluTrpAspGluArgAspMET
BspHI
4321 tggtgggctttgcccgcctgatggcggcgcatc<&catga!aatcgcggcggtgatcattg ValGlyPheAlaArgLeuMETAlaAlaHisArgHisGluIleAlaAlaValIleIleGlu FśpI
4381 AGCCGATTGTCCAGGGCGCAGGCGGGATGCGcjirGTACCATCCGGAATGGTTAAAACGAA
PxoXleValGlnGlyAlaGlyGlyMETArgMETTyrHisProGluTrpLeuLysArgIle Pvul NruI
4441 TCCGCAAAATATGCGATCGCGAAGGTATCTTGCTGATTGCCGACGAGATCGCCACTGGAT
ArgLy s I leCy sAspAr gGluGly IleLeuLeuI leAlaAspGluI 1 eAl aThrGlyPhe
4501 TTGGTCGTACCGGGAAACTGTTTGCCTGTGAACATGCAGAAATCGCGCCGGACATTTTGT
GlyArgThrGlyLysLeuPheAlaCysGluHisAlaGluIleAlaProAspIleLeuCys
4561 GCCTCGGTAAAGCCTTAACCGGCGGCACAATG ACCCTTTCCGCCACACTCACCACGCGCG
LeuGlyLysAlaLeuThrGlyGlyThrMETThrLeuSerAlaThrLeuThrThrArgGlu
Nsil
4621 AGGTTGCAGAAACCATCAGTAACGGTG AAGCCGGTTGCTTTATGCATGGGCCAACTTTTA
ValAlaGluThrIleSerAsnGlyGluAlaGlyCysPheMETHisGlyProThrPheMET
4681 TGGGCAATCCGCTGGCCTGCGCGGCAGCAAACGCCAGCCTGGCGATTCTCGAATCTGGCG
GlyAsnProLeuAlaCysAlaAlaAlaAsnAlaSerLeuAlalleLeuGluSerGlyAsp
PvuII
4741 actggcagcaacaggtggcggatattgaagtacagćtScgcgagcaacttgcccccgccc
TrpGlnGlnGlnValAlaAspIleGluValGlnLeuArgGluGlnLeuAlaProAlaArg
4801 GTGATGCCGAAATGGTTGCCGATGTGCGCGTACTGGGGGCCATTGGCGTGGTCGAAACCA
AspAlaGluMETValAlaAspValArgValLeuGlyAlaIleGlyValValGluThrThr
BamHI
4861 CTCATCCGGTGAATATGGCGGCGCTGCAAAAATTCTTTGTCGAACAGGGTGTCT^GATCĆ
HisProValAsnMETAlaAlaLeuGlnLysPhePheValGluGlnGlyValTrpIleArg
4921 GGCCTTTTGGCAAACTGATTTACCTGATGCCGCCCTATATTATTCTCCCGCAACAGTTGC
ProPheGlyLysLeuIleTyrLeuMETProProTyrllelleLeuProGlnGlnLeuGln
177 635
Fig. 6G
Hindll Hpal
4981 AGCGTCTGACCGCAGCGGTTAACCGCGCGGTACAGGATGAAACATTTTTTTGCCAATAAC ArgLeuThrAlaAlaValAsnArgAlaValGlnAspGluThrPhePheCysGln***
BspHI
5041 GAGAAGTCCGCGTGAGGGTTTCTGGCTACACTTTCTGCAAACAAGAAAGGAGGGTfrCATĆ SD MET
ORFI
5101 fiAACTCATCAGTAACGATCTGCGCGATGGCGATAAATTGCCGCATCGTCATGTCTTTAAC LysLeuIleSerAsnAspLeuArgAspGlyAspLysLeuProHisArgHisValPheAsn
Sspl
5161 GGCATGGGTTACGATGGCGATAATATTTCACCGCATCTGGCGTGGGATG ATGTTCCTGCG GlyMETGlyTyrAspGlyAspAsnIleSerProHisLeuAlaTrpAspAspValProAla
5221 GGAACGAAAAGTTTTGTTGTCACCTGCTACGACCCGGATGCGCCAACCGGCTCCGGCTGG GlyThrLysSerPheValValThrCysTyrAspProAspAlaProThrGlySerGlyTrp
Hindll
Hpal
5281 TGGCACTGGGTAGTTSTTAASrTACCCGCTGATACCCGCGTATTACCGCAAGGGTTTGGC TrpHisTrpValValValAsnLeuProAlaAspThrArgValLeuProGlnGlyPheGly
Mlul
5341 TCTGGTCTGGTAGCAATGCCAGACGGCGTTTTGCAGACGCG?ACCGACTTTGGTAAAACC SerGlyLeuValAlaMETProAspGlyValLeuGlnThrArgThrAspPheGlyLysThr
5401 GGGTACGATGGCGCAGCACCGCCGAAAGGCGAAACTCATCGCTACATTTTTACCGTTCAC GlyTyrAspGlyAlaAlaProProLysGlyGluThrHisArgTyrIlePheThrValHis
5461 GCGCTGGATATAGAACGTATTGATGTCGATGAAGGTGCCAGCGGCGCGATGGTCGGGTTT AlaLeuAspIleGluArgIleAspValAspGluGlyAlaSerGlyAlaMETValGłyPhe
5521 AACGTTCATTTCCACTCTCTGGCAAGCGCCTCGATTACTGCGATGTTTAGTTAATCACTC AsnValHisPheHisSerLeuAlaSerAlaSerIleThrAlaMETPheSer***
5581 TGCCAGATGGCGCAATGCCATCTGGTATCACTTAAAGGTATTAAAAACAACTTTTTGTCT
5641 TTTTACCTTCCCGTTTCGCTCAAGTTAGTATAAAAAAGCAGGCTTCAACGG ATTCATTTT
5701 TCTATTTCATAGCCCGGAGCAACCTGTGAACACATTTTCAGTTTCCCGTCTGGCGCTGGC
5761 ATTGGCTTTTGGCGTGACGCTGACCGCCTGTAGCTCAACCCCGCCCGATCAACGTCCTTC
Kpnl SacI EcoRl Pstl SphI Hindlll 5821 TGATCAAACCGCGCCTGGTACĆGAGCTĆGAATTĆCTGCAĆGCATGĆAAGCTT'- 3 '
177 635
Fig. 7 pB03
SspI
SphI
1.66 kb fragment — Ό —
Nru I
Smal
SphI kb fragment — n —
Claims (46)
- Zastrzeżenia patentowe1 .Rekombinacyjny materiał genetyczny, stanowiący fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty, znamienny tym, że geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz są transkrybowane od wspólnego promotora.
- 2. Fragment DNA według zastrz. 1, -znamienny tym, że zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter.
- 3. Fragment DNA według zastrz. 1 albo 2, znamienny tym, że zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli.
- 4. Fragment DNA według zastrz. 1, znamienny tym, że jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
- 5. Fragment DNA według zastrz. 1, znamienny tym, że regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC
- 6. Fragment DNA według zastrz. 1, znamienny tym, że regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
- 7. Fragment DNA według zastrz. 1, znamienny tym, że regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
- 8. Fragment DNA według zastrz. 1, znamienny tym, że odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
- 9. Fragment DNA według zastrz. 1, znamienny tym, że geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.
- 10. Plazmid, znamienny tym, że zawiera fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty cechujący się tym, że we fragmencie dNa geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz są transkrybowane od wspólnego promotora.
- 11. Plazmid według zastrz. 10, znamienny tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter.
- 12. Plazmid według zastrz. 10 albo 11, znamienny tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli.
- 13. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
- 14. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC177 635
- 15. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
- 16. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
- 17. Plazmid według zastrz. 10, znamienny tym, że we fragmencie DNA odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
- 18. Plazmid według zastrz. 10, znamienny tym, ze we fragmencie DNA geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.
- 19. Plazmid pBO30A-15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 względnie DSM 8554.
- 20. Plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozytu DSM 8555.
- 21. Mikroorganizm zawierający fragment DNA lub plazmid obejmujący ten fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty, cechujący się tym, że we fragmencie DNA geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz są transkrybowane od wspólnego promotora.
- 22. Mikroorganizm według zastrz. 21, znamienny tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter.
- 23. Mikroorganizm według zastrz. 21 albo 22, znamienny tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli..
- 24. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
- 25. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC
- 26. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
- 27. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
- 28. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
- 29. Mikroorganizm według zastrz. 21, znamienny tym, że we fragmencie DNA geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.177 635
- 30. Mikroorganizm według zastrz. 21, znamienny tym, że zawiera plazmid pBO30A15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 względnie DSM 8554.
- 31. Mikroorganizm według zastrz. 21, znamienny tym, że zawiera plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozytu DSM 8555.
- 32. Mikroorganizmy E. coli XL1-Blue, E. coli BM4062 i E. coli ED8767, każdy z nich zawierający plazmid pBO30A-13/9, złożone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak również ich genetyczne warianty i mutanty.
- 33. Mikroorganizm Agrobacterium/Rhizobium sp. HK4, zawierający plazmid pBO47, złożony pod numerem zgłoszenia DSM 8555, jak również jego genetyczne warianty i mutanty.
- 34. Biotechnologiczny sposób syntezy biotyny, w którym ulegające przemianie materii źródło węgla poddaje się fermentacji do biotyny z zastosowaniem mikroorganizmu, znamienny tym, że stosuje się mikroorganizm zawierający fragment DNA lub plazmid obejmujący ten fragment DNA zawierający geny biosyntezy biotyny bioB, bioF, bioC, bioD oraz bioA z enterobakterii lub ich funkcjonalnie równoważne genetyczne warianty i mutanty, cechujący się tym, że we fragmencie DNA geny te ustawione są w jednostce transkrypcyjnej i w jednym kierunku transkrypcji oraz sątranskrybowane od wspólnego promotora.
- 35. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z grupy obejmującej gatunki Escherichia, Salmonella oraz Citrobacter.
- 36. Sposób według zastrz. 34 albo 35, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że fragment DNA zawiera geny biosyntezy biotyny z enterobakterii wybranych z gatunku Escherichia coli.
- 37. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA jednostka transkrypcyjna jako wspólny promotor zawiera promotor tac.
- 38. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTTAGGAGG TGACTAGTC
- 39. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGG TTTACTAGTC
- 40. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA regulujący geny element jednostki transkrypcyjnej, w bezpośrednim powiązaniu z genem bioB, zawiera sekwencję:AAGCTTACTC CCCATCCCCC TGTTGACAAT TAATCATCGG CTCGTATAAT GTGTGGAATTGTGAGCGGAT AACAATTTCA CACAGGAAAC AGGATCGGTA CCTAAGGAGA CTAGTC
- 41. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA odległość między następującymi po sobie w jednostce transkrypcyjnej genami bioD i bioA wynosi nie więcej niż 50 bp (par zasad).
- 42. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że we fragmencie DNA geny bioD i bioA są ustawione w ten sposób, że koniec 3’ genu bioD obejmuje miejsce wiązania rybosomów dla genu bioA.
- 43. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że zawiera plazmid pBO30A-15/9, taki jak złożony w E. coli XL1-Blue, E. coli BM4062 lub E. coli ED8767 pod numerami depozytu DSM 7246, DSM 7247 względnie DSM 8554.
- 44. Sposób według zastrz. 34, znamienny tym, że stosuje się mikroorganizm cechujący się tym, że zawiera plazmid pBO47, taki jak złożony w Agrobacterium/Rhizobium sp. HK4 pod numerem depozytu DSM 8555.177 635
- 45. Sposób według zastrz. 34, znamienny tym, że jako mikroorganizm stosuje się mikroorganizm wybrany z grupy obejmującej E. coli XL1-Blue, E. coli BM4062 i E. coli ED8767, z których każdy zawiera plazmid pBO30A-13/9, złożone pod numerami depozytów DSM 7246, DSM 7247 i DSM 8554, jak również ich genetyczne warianty i mutanty.
- 46. Sposób według zastrz. 34, znamienny tym, że jako mikroorganizm stosuje się mikroorganizm wybrany z grupy obejmującej Agrobacterium/Rhizobium sp. HK4, zawierający plazmid pBO47, złożony pod numerem zgłoszenia DSM 8555, jak również jego genetyczne warianty i mutanty.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CH312492 | 1992-10-02 | ||
CH213493 | 1993-07-15 | ||
PCT/EP1993/002688 WO1994008023A2 (de) | 1992-10-02 | 1993-10-01 | Biotechnologisches verfahren zur herstellung von biotin |
Publications (2)
Publication Number | Publication Date |
---|---|
PL308301A1 PL308301A1 (en) | 1995-07-24 |
PL177635B1 true PL177635B1 (pl) | 1999-12-31 |
Family
ID=25689605
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL93333484A PL179166B1 (pl) | 1992-10-02 | 1993-10-01 | Sposób wytwarzania biotyny PL PL PL |
PL93308301A PL177635B1 (pl) | 1992-10-02 | 1993-10-01 | Rekombinacyjny materiał genetyczny, plazmidy i mikroorganizmy zawierające ten rekombinacyjny materiał genetyczny oraz biotechnologiczny sposób syntezy biotyny |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL93333484A PL179166B1 (pl) | 1992-10-02 | 1993-10-01 | Sposób wytwarzania biotyny PL PL PL |
Country Status (16)
Country | Link |
---|---|
US (1) | US6083712A (pl) |
EP (2) | EP0667909B1 (pl) |
JP (2) | JP3566287B2 (pl) |
KR (1) | KR100200542B1 (pl) |
AT (1) | ATE163198T1 (pl) |
AU (1) | AU4820293A (pl) |
CA (1) | CA2145400C (pl) |
CZ (1) | CZ285533B6 (pl) |
DE (1) | DE59308149D1 (pl) |
DK (1) | DK0667909T3 (pl) |
ES (1) | ES2112995T3 (pl) |
FI (1) | FI117515B (pl) |
HU (1) | HU219827B (pl) |
PL (2) | PL179166B1 (pl) |
SK (1) | SK279669B6 (pl) |
WO (1) | WO1994008023A2 (pl) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5859335A (en) * | 1994-12-08 | 1999-01-12 | Novartis Finance Corporation | Enhanced biotin biosynthesis in plant tissue |
US5869719A (en) * | 1995-03-08 | 1999-02-09 | Novartis Finance Corporation | Transgenic plants having increased biotin content |
US6020173A (en) * | 1995-11-02 | 2000-02-01 | Takeda Chemical Industries, Ltd. | Microorganism resistant to threonine analogue and production of biotin |
EP0806479B1 (en) * | 1996-05-06 | 2003-06-18 | F. Hoffmann-La Roche Ag | Fermentative production of biotin |
DE69731451T2 (de) | 1996-09-27 | 2005-11-24 | Dsm Ip Assets B.V. | Biotin-Biosynthese-Gene II |
US6737256B2 (en) | 1997-07-14 | 2004-05-18 | Roche Vitamins Inc. | Overcoming DAPA aminotransferase bottlenecks in biotin vitamers biosynthesis |
DE19731274A1 (de) | 1997-07-22 | 1999-01-28 | Basf Ag | Verfahren zur Herstellung von Biotin |
IL135776A0 (en) * | 1997-10-24 | 2001-05-20 | Life Technologies Inc | Recombinational cloning using nucleic acids having recombination sites |
WO2001018195A2 (en) * | 1999-09-08 | 2001-03-15 | Xenogen Corporation | Luciferase expression cassettes and methods of use |
US6660907B2 (en) | 2000-07-10 | 2003-12-09 | Pioneer Hi-Bred International, Inc. | Genes encoding SCIP-1 orthologs and methods of use |
US7198924B2 (en) | 2000-12-11 | 2007-04-03 | Invitrogen Corporation | Methods and compositions for synthesis of nucleic acid molecules using multiple recognition sites |
EP1386008A4 (en) * | 2001-05-07 | 2005-01-19 | Paradigm Genetics Inc | METHODS FOR IDENTIFYING INHIBITORS OF BIOTIN SYNTHASE EXPRESSION OR ACTIVITY IN PLANTS |
ATE469984T1 (de) | 2003-12-01 | 2010-06-15 | Life Technologies Corp | Rekombinationsstellen enthaltende nukleinsäuremoleküle und verfahren zur verwendung davon |
AU2009224600A1 (en) * | 2008-03-14 | 2009-09-17 | Merck Serono S.A. | Variation of recombinant expression titres by optimising bacterial ribosome binding sites |
GB0920775D0 (en) * | 2009-11-26 | 2010-01-13 | King S College | Cells |
EP3488006B1 (en) * | 2016-07-25 | 2023-06-07 | INVISTA Textiles (U.K.) Limited | Materials and methods utilizing biotin producing mutant hosts for the production of 7-carbon chemicals |
KR20230070943A (ko) * | 2021-11-15 | 2023-05-23 | 씨제이제일제당 (주) | 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0740922B2 (ja) * | 1985-03-05 | 1995-05-10 | 株式会社資生堂 | ビオチン生産性微生物 |
CA1317245C (en) * | 1985-08-26 | 1993-05-04 | Eric F. Fisher | System for biotin synthesis |
US5110731A (en) * | 1985-08-26 | 1992-05-05 | Amgen, Inc. | System for biotin synthesis |
JPS62155081A (ja) * | 1985-12-27 | 1987-07-10 | Shiseido Co Ltd | 新規微生物およびそれを用いる醗酵法によるビオチンの製造法 |
AU616380B2 (en) * | 1986-09-30 | 1991-10-31 | Transgene S.A. | Cloning of the bioA, bioD, bioF, bioC, and bioH genes of Bacillus sphaericus, vectors and transformed cells and method for preparing biotin |
CA1322735C (en) * | 1987-11-07 | 1993-10-05 | Shinichiro Haze | Microorganism having low acetate forming capability, and process for production of useful substrate using same |
GB2216530B (en) * | 1988-03-22 | 1992-07-08 | Mini Agriculture & Fisheries | Genetic material for expression of biotin synthetase enzymes |
JP3006847B2 (ja) * | 1990-03-27 | 2000-02-07 | 株式会社資生堂 | 新規微生物およびそれを用いるビオチン類の製造方法 |
JPH04169180A (ja) * | 1990-11-02 | 1992-06-17 | Shiseido Co Ltd | 新規微生物及びそれを用いるビオチン活性物質の製造方法 |
JP3290473B2 (ja) * | 1991-09-13 | 2002-06-10 | 株式会社資生堂 | ビオチンオペロン |
JP3192704B2 (ja) * | 1991-10-17 | 2001-07-30 | 株式会社資生堂 | デスチオビオチンからビオチンへの変換方法 |
US5374543A (en) * | 1992-10-02 | 1994-12-20 | Amgen Inc. | Enhanced indole biosynthesis |
US5445952A (en) * | 1993-01-22 | 1995-08-29 | Basf Aktiengesellschaft | Method to produce biotin |
-
1993
- 1993-10-01 CZ CZ95809A patent/CZ285533B6/cs not_active IP Right Cessation
- 1993-10-01 AT AT93920855T patent/ATE163198T1/de active
- 1993-10-01 DK DK93920855T patent/DK0667909T3/da active
- 1993-10-01 US US08/411,768 patent/US6083712A/en not_active Expired - Lifetime
- 1993-10-01 CA CA002145400A patent/CA2145400C/en not_active Expired - Lifetime
- 1993-10-01 PL PL93333484A patent/PL179166B1/pl unknown
- 1993-10-01 EP EP93920855A patent/EP0667909B1/de not_active Expired - Lifetime
- 1993-10-01 WO PCT/EP1993/002688 patent/WO1994008023A2/de active IP Right Grant
- 1993-10-01 DE DE59308149T patent/DE59308149D1/de not_active Expired - Lifetime
- 1993-10-01 PL PL93308301A patent/PL177635B1/pl unknown
- 1993-10-01 ES ES93920855T patent/ES2112995T3/es not_active Expired - Lifetime
- 1993-10-01 JP JP50871694A patent/JP3566287B2/ja not_active Expired - Fee Related
- 1993-10-01 KR KR1019950701255A patent/KR100200542B1/ko not_active IP Right Cessation
- 1993-10-01 HU HU9500951A patent/HU219827B/hu unknown
- 1993-10-01 SK SK420-95A patent/SK279669B6/sk not_active IP Right Cessation
- 1993-10-01 EP EP97107803A patent/EP0798384A1/de not_active Withdrawn
- 1993-10-01 AU AU48202/93A patent/AU4820293A/en not_active Abandoned
-
1995
- 1995-03-31 FI FI951547A patent/FI117515B/fi not_active IP Right Cessation
-
2003
- 2003-09-04 JP JP2003312645A patent/JP3577075B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6083712A (en) | 2000-07-04 |
PL179166B1 (pl) | 2000-07-31 |
FI117515B (fi) | 2006-11-15 |
ATE163198T1 (de) | 1998-02-15 |
EP0667909B1 (de) | 1998-02-11 |
JP3566287B2 (ja) | 2004-09-15 |
CA2145400C (en) | 2005-08-09 |
ES2112995T3 (es) | 1998-04-16 |
SK42095A3 (en) | 1995-11-08 |
JP3577075B2 (ja) | 2004-10-13 |
HU219827B (hu) | 2001-08-28 |
FI951547A0 (fi) | 1995-03-31 |
JP2004000283A (ja) | 2004-01-08 |
CZ285533B6 (cs) | 1999-08-11 |
DE59308149D1 (de) | 1998-03-19 |
WO1994008023A3 (de) | 1994-06-23 |
CZ80995A3 (en) | 1995-09-13 |
EP0798384A1 (de) | 1997-10-01 |
WO1994008023A2 (de) | 1994-04-14 |
FI951547A (fi) | 1995-03-31 |
HUT71781A (en) | 1996-02-28 |
CA2145400A1 (en) | 1994-04-14 |
SK279669B6 (sk) | 1999-02-11 |
JPH08501694A (ja) | 1996-02-27 |
KR100200542B1 (ko) | 1999-06-15 |
PL308301A1 (en) | 1995-07-24 |
AU4820293A (en) | 1994-04-26 |
EP0667909A1 (de) | 1995-08-23 |
KR950703648A (ko) | 1995-09-20 |
DK0667909T3 (da) | 1998-09-23 |
HU9500951D0 (en) | 1995-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PL177635B1 (pl) | Rekombinacyjny materiał genetyczny, plazmidy i mikroorganizmy zawierające ten rekombinacyjny materiał genetyczny oraz biotechnologiczny sposób syntezy biotyny | |
Campbell et al. | A polyketide-synthase-like gene is involved in the synthesis of heterocyst glycolipids in Nostoc punctiforme strain ATCC 29133 | |
DK175477B1 (da) | Fremgangsmåde til integration af et gen eller en DNA-sekvens i en bakteries chromosom eller episom samt bakterie frembragt ved fremgangsmåden | |
JP5091330B2 (ja) | 遺伝子増幅によるリジン産生の増加 | |
Nagórska et al. | Importance of eps genes from Bacillus subtilis in biofilm formation and swarming | |
EP0405370B2 (en) | Riboflavinoverproducing strains of bacteria | |
Hamblin et al. | Evidence for two chemosensory pathways in Rhodobacter sphaeroides | |
Neidle et al. | 5-Aminolevulinic acid availability and control of spectral complex formation in HemA and HemT mutants of Rhodobacter sphaeroides | |
Chen et al. | Chromosome-mediated 2, 3-dihydroxybenzoic acid is a precursor in the biosynthesis of the plasmid-mediated siderophore anguibactin in Vibrio anguillarum | |
US5759824A (en) | Genes for butyrobetaine/crotonobetaine-l-carnitine metabolism and their use for the microbiological production of l-carnitine | |
Glazebrook et al. | Genetic analysis of Rhizobium meliloti bacA-phoA fusion results in identification of degP: two loci required for symbiosis are closely linked to degP | |
Dijkhuizen et al. | Genetic manipulation of the restricted facultative methylotroph Hyphomicrobium X by the R-plasmid-mediated introduction of the Escherichia coli pdh genes | |
Mühlenhoff | The FAPY-DNA glycosylase (Fpg) is required for survival of the cyanobacterium Synechococcus elongatus under high light irradiance | |
Fawaz | Characterization and role of a Streptomyces antibioticus DNA sequence in the activation of a silent gene for phenoxazinone synthase in Streptomyces lividans | |
Datta et al. | Genetic and physical characterization of proBA genes of the marine bacterium Vibrio parahaemolyticus | |
Streit et al. | Are Key Growth Factors for Alfalfa Root Colonization by Rhizobium meliloti 1021 | |
Estévenon et al. | Genetic basis of the MbrC “ploidy” phenotype in Escherichia coli | |
Koffas | Metabolic engineering of C. glutamicum for amino acid production improvement | |
Fuller | Cloning and characterization of a polyketide-like gene cluster from Streptomyces murayamaensis | |
NEIDLE et al. | Rhodobacter sphaeroides | |
Cai | Molecular genetic analysis of acetoacetate metabolism in Sinorhizobium meliloti | |
Hsieh | Molecular analysis of the phenoxazinone synthase (phsA) and its homologues in Streptomyces antibioticus and Streptomyces lividans | |
Vander Horn | A mutation in the leucyl-tRNA synthetase gene affects expression of theilv-leu biosynthetic operon of Bacillus subtilis | |
Jones | The involvement of the stringent response in temperature physiology of Escherichia coli | |
Wragg-Légaré | Characterization of the regulatory region of the Mu-like Pseudomonas aeruginosa transposable phage D3112 |