KR20230112679A - 아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균 - Google Patents
아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균 Download PDFInfo
- Publication number
- KR20230112679A KR20230112679A KR1020237021062A KR20237021062A KR20230112679A KR 20230112679 A KR20230112679 A KR 20230112679A KR 1020237021062 A KR1020237021062 A KR 1020237021062A KR 20237021062 A KR20237021062 A KR 20237021062A KR 20230112679 A KR20230112679 A KR 20230112679A
- Authority
- KR
- South Korea
- Prior art keywords
- polypeptide
- seq
- amino acid
- acid sequence
- activity
- Prior art date
Links
- 241000894006 Bacteria Species 0.000 title claims abstract description 322
- 239000004062 cytokinin Substances 0.000 title claims abstract description 151
- UQHKFADEQIVWID-UHFFFAOYSA-N cytokinin Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1CC(O)C(CO)O1 UQHKFADEQIVWID-UHFFFAOYSA-N 0.000 title claims abstract description 150
- 125000002298 terpene group Chemical group 0.000 title 1
- 150000003505 terpenes Chemical group 0.000 claims abstract description 78
- 230000000694 effects Effects 0.000 claims description 480
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 470
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 469
- 229920001184 polypeptide Polymers 0.000 claims description 467
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 397
- 102000004190 Enzymes Human genes 0.000 claims description 287
- 108090000790 Enzymes Proteins 0.000 claims description 287
- 108090000623 proteins and genes Proteins 0.000 claims description 210
- 230000014509 gene expression Effects 0.000 claims description 154
- 108010050516 adenylate isopentenyltransferase Proteins 0.000 claims description 119
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 claims description 111
- 101710198130 NADPH-cytochrome P450 reductase Proteins 0.000 claims description 106
- 150000008223 ribosides Chemical class 0.000 claims description 74
- 102000004169 proteins and genes Human genes 0.000 claims description 73
- 230000006696 biosynthetic metabolic pathway Effects 0.000 claims description 70
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 65
- 244000063299 Bacillus subtilis Species 0.000 claims description 64
- 238000004519 manufacturing process Methods 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 62
- 102000003960 Ligases Human genes 0.000 claims description 60
- 108090000364 Ligases Proteins 0.000 claims description 60
- 150000003212 purines Chemical class 0.000 claims description 53
- 239000002213 purine nucleotide Substances 0.000 claims description 51
- UZKQTCBAMSWPJD-UQCOIBPSSA-N trans-Zeatin Natural products OCC(/C)=C\CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-UQCOIBPSSA-N 0.000 claims description 49
- 101710162890 Cytokinin riboside 5'-monophosphate phosphoribohydrolase Proteins 0.000 claims description 46
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 claims description 46
- UZKQTCBAMSWPJD-FARCUNLSSA-N trans-zeatin Chemical compound OCC(/C)=C/CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-FARCUNLSSA-N 0.000 claims description 39
- GOSWTRUMMSCNCW-UHFFFAOYSA-N trans-zeatin riboside Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 claims description 38
- GOSWTRUMMSCNCW-HNNGNKQASA-N 9-ribosyl-trans-zeatin Chemical compound C1=NC=2C(NC\C=C(CO)/C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GOSWTRUMMSCNCW-HNNGNKQASA-N 0.000 claims description 36
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 35
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 claims description 23
- 235000013928 guanylic acid Nutrition 0.000 claims description 23
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 22
- 230000006652 catabolic pathway Effects 0.000 claims description 20
- 229960005305 adenosine Drugs 0.000 claims description 19
- 241000186216 Corynebacterium Species 0.000 claims description 18
- 229930024421 Adenine Natural products 0.000 claims description 17
- 229960000643 adenine Drugs 0.000 claims description 17
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 16
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 16
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 claims description 16
- XXFACTAYGKKOQB-SSDOTTSWSA-N Dihydrozeatin Natural products OC[C@H](C)CCNC1=NC=NC2=C1NC=N2 XXFACTAYGKKOQB-SSDOTTSWSA-N 0.000 claims description 16
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 claims description 16
- 239000001963 growth medium Substances 0.000 claims description 16
- XXFACTAYGKKOQB-ZETCQYMHSA-N dihydrozeatin Chemical compound OC[C@@H](C)CCNC1=NC=NC2=C1NC=N2 XXFACTAYGKKOQB-ZETCQYMHSA-N 0.000 claims description 15
- 102100032534 Adenosine kinase Human genes 0.000 claims description 14
- 108010060155 deoxyxylulose-5-phosphate synthase Proteins 0.000 claims description 13
- DBVVQDGIJAUEAZ-YXYADJKSSA-N Dihydrozeatin riboside Chemical compound C1=NC=2C(NCCC(CO)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O DBVVQDGIJAUEAZ-YXYADJKSSA-N 0.000 claims description 12
- 108010007666 IMP cyclohydrolase Proteins 0.000 claims description 12
- 102100020796 Inosine 5'-monophosphate cyclohydrolase Human genes 0.000 claims description 12
- 102100039239 Amidophosphoribosyltransferase Human genes 0.000 claims description 11
- 108010039224 Amidophosphoribosyltransferase Proteins 0.000 claims description 11
- 108010087227 IMP Dehydrogenase Proteins 0.000 claims description 11
- 102000006674 IMP dehydrogenase Human genes 0.000 claims description 11
- 238000012258 culturing Methods 0.000 claims description 11
- 108090000926 GMP synthase (glutamine-hydrolyzing) Proteins 0.000 claims description 10
- 102100033452 GMP synthase [glutamine-hydrolyzing] Human genes 0.000 claims description 10
- 108010076278 Adenosine kinase Proteins 0.000 claims description 9
- 102000055161 Adenylosuccinate lyases Human genes 0.000 claims description 9
- 102000030764 Purine-nucleoside phosphorylase Human genes 0.000 claims description 9
- 108030004891 Ribose-phosphate diphosphokinases Proteins 0.000 claims description 9
- OOXNYFKPOPJIOT-UHFFFAOYSA-N 5-(3-bromophenyl)-7-(6-morpholin-4-ylpyridin-3-yl)pyrido[2,3-d]pyrimidin-4-amine;dihydrochloride Chemical compound Cl.Cl.C=12C(N)=NC=NC2=NC(C=2C=NC(=CC=2)N2CCOCC2)=CC=1C1=CC=CC(Br)=C1 OOXNYFKPOPJIOT-UHFFFAOYSA-N 0.000 claims description 8
- 101001131930 Homo sapiens Transcriptional activator protein Pur-beta Proteins 0.000 claims description 8
- 101710101148 Probable 6-oxopurine nucleoside phosphorylase Proteins 0.000 claims description 8
- 241000186308 Corynebacterium stationis Species 0.000 claims description 6
- 108010045040 Phosphoribosylaminoimidazolecarboxamide formyltransferase Proteins 0.000 claims description 6
- 239000002253 acid Substances 0.000 claims description 5
- 102000004357 Transferases Human genes 0.000 claims description 4
- 108090000992 Transferases Proteins 0.000 claims description 4
- NRGONRDRXCPMIC-GDKBPFBDSA-N N1C=2C(=O)NC(N)=NC=2NCC1CNC1=CC=C(C(=O)N[C@@H](CC(C=O)C(O)=O)C(O)=O)C=C1 Chemical compound N1C=2C(=O)NC(N)=NC=2NCC1CNC1=CC=C(C(=O)N[C@@H](CC(C=O)C(O)=O)C(O)=O)C=C1 NRGONRDRXCPMIC-GDKBPFBDSA-N 0.000 claims description 3
- 241001112741 Bacillaceae Species 0.000 claims description 2
- 241000186031 Corynebacteriaceae Species 0.000 claims description 2
- 241000192125 Firmicutes Species 0.000 claims 3
- 238000002360 preparation method Methods 0.000 abstract description 2
- 150000007523 nucleic acids Chemical class 0.000 description 90
- 102000039446 nucleic acids Human genes 0.000 description 88
- 108020004707 nucleic acids Proteins 0.000 description 88
- 230000001965 increasing effect Effects 0.000 description 76
- CBIDRCWHNCKSTO-UHFFFAOYSA-N prenyl diphosphate Chemical compound CC(C)=CCO[P@](O)(=O)OP(O)(O)=O CBIDRCWHNCKSTO-UHFFFAOYSA-N 0.000 description 55
- 239000012634 fragment Substances 0.000 description 53
- 230000001580 bacterial effect Effects 0.000 description 50
- 101000624356 Homo sapiens tRNA dimethylallyltransferase Proteins 0.000 description 47
- 108020004999 messenger RNA Proteins 0.000 description 45
- 102100023397 tRNA dimethylallyltransferase Human genes 0.000 description 45
- 235000001014 amino acid Nutrition 0.000 description 44
- 238000006243 chemical reaction Methods 0.000 description 44
- 239000013598 vector Substances 0.000 description 44
- 229940024606 amino acid Drugs 0.000 description 43
- 108020004414 DNA Proteins 0.000 description 39
- 230000004048 modification Effects 0.000 description 38
- 238000012986 modification Methods 0.000 description 38
- 210000004027 cell Anatomy 0.000 description 37
- 239000002773 nucleotide Substances 0.000 description 37
- 230000002829 reductive effect Effects 0.000 description 36
- 241000196324 Embryophyta Species 0.000 description 34
- 229950006790 adenosine phosphate Drugs 0.000 description 31
- 101001030676 Fusarium pseudograminearum (strain CS3096) Cytokinin riboside 5'-monophosphate phosphoribohydrolase Proteins 0.000 description 30
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 230000037361 pathway Effects 0.000 description 29
- 150000001413 amino acids Chemical class 0.000 description 28
- 230000009368 gene silencing by RNA Effects 0.000 description 28
- 230000015572 biosynthetic process Effects 0.000 description 27
- 230000006870 function Effects 0.000 description 27
- 108091030071 RNAI Proteins 0.000 description 26
- 239000002609 medium Substances 0.000 description 25
- 235000018102 proteins Nutrition 0.000 description 25
- 241000894007 species Species 0.000 description 25
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 24
- 108010077805 Bacterial Proteins Proteins 0.000 description 21
- 210000002230 centromere Anatomy 0.000 description 21
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 20
- MDSIZRKJVDMQOQ-GORDUTHDSA-N (2E)-4-hydroxy-3-methylbut-2-en-1-yl diphosphate Chemical compound OCC(/C)=C/COP(O)(=O)OP(O)(O)=O MDSIZRKJVDMQOQ-GORDUTHDSA-N 0.000 description 19
- 239000000499 gel Substances 0.000 description 17
- 238000006467 substitution reaction Methods 0.000 description 17
- 239000000758 substrate Substances 0.000 description 17
- 102100039654 Phosphoribosylglycinamide formyltransferase Human genes 0.000 description 16
- 108010064209 Phosphoribosylglycinamide formyltransferase Proteins 0.000 description 16
- 101150056470 dxs gene Proteins 0.000 description 16
- 101150000417 izt gene Proteins 0.000 description 16
- 230000001413 cellular effect Effects 0.000 description 15
- 230000035772 mutation Effects 0.000 description 15
- -1 nucleoside monophosphates Chemical class 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 14
- 230000002401 inhibitory effect Effects 0.000 description 14
- 230000010354 integration Effects 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 13
- 101100344930 Drosophila melanogaster MED20 gene Proteins 0.000 description 13
- 241000588724 Escherichia coli Species 0.000 description 13
- HYVABZIGRDEKCD-UHFFFAOYSA-N N(6)-dimethylallyladenine Chemical compound CC(C)=CCNC1=NC=NC2=C1N=CN2 HYVABZIGRDEKCD-UHFFFAOYSA-N 0.000 description 13
- 239000013587 production medium Substances 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 230000001939 inductive effect Effects 0.000 description 12
- 108010042407 Endonucleases Proteins 0.000 description 11
- 229910019142 PO4 Inorganic materials 0.000 description 11
- 239000000872 buffer Substances 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 239000010452 phosphate Substances 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- MKPCNMXYTMQZBE-UHFFFAOYSA-N 7h-purin-6-amine;sulfuric acid;dihydrate Chemical compound O.O.OS(O)(=O)=O.NC1=NC=NC2=C1NC=N2.NC1=NC=NC2=C1NC=N2 MKPCNMXYTMQZBE-UHFFFAOYSA-N 0.000 description 10
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 10
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 10
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 10
- 108091027967 Small hairpin RNA Proteins 0.000 description 10
- 108020004459 Small interfering RNA Proteins 0.000 description 10
- 239000007795 chemical reaction product Substances 0.000 description 10
- 230000005764 inhibitory process Effects 0.000 description 10
- 125000001844 prenyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 10
- 235000008170 thiamine pyrophosphate Nutrition 0.000 description 10
- 239000011678 thiamine pyrophosphate Substances 0.000 description 10
- YXVCLPJQTZXJLH-UHFFFAOYSA-N thiamine(1+) diphosphate chloride Chemical compound [Cl-].CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N YXVCLPJQTZXJLH-UHFFFAOYSA-N 0.000 description 10
- IRILMCCKFANGJQ-HNNGNKQASA-N 9-ribosyl-trans-zeatin 5'-monophosphate Chemical compound C1=NC=2C(NC\C=C(CO)/C)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O IRILMCCKFANGJQ-HNNGNKQASA-N 0.000 description 9
- 108010056443 Adenylosuccinate synthase Proteins 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 9
- DBVVQDGIJAUEAZ-UHFFFAOYSA-N dihydrozeatin riboside Natural products C1=NC=2C(NCCC(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O DBVVQDGIJAUEAZ-UHFFFAOYSA-N 0.000 description 9
- 238000000605 extraction Methods 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 9
- 150000002500 ions Chemical class 0.000 description 9
- 108091008146 restriction endonucleases Proteins 0.000 description 9
- 238000011218 seed culture Methods 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 229960002363 thiamine pyrophosphate Drugs 0.000 description 9
- 238000001262 western blot Methods 0.000 description 9
- PQGCEDQWHSBAJP-TXICZTDVSA-N 5-O-phosphono-alpha-D-ribofuranosyl diphosphate Chemical compound O[C@H]1[C@@H](O)[C@@H](O[P@](O)(=O)OP(O)(O)=O)O[C@@H]1COP(O)(O)=O PQGCEDQWHSBAJP-TXICZTDVSA-N 0.000 description 8
- 108090000994 Catalytic RNA Proteins 0.000 description 8
- 102000053642 Catalytic RNA Human genes 0.000 description 8
- 241000186226 Corynebacterium glutamicum Species 0.000 description 8
- 238000002965 ELISA Methods 0.000 description 8
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 8
- 108700011259 MicroRNAs Proteins 0.000 description 8
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 8
- 239000000074 antisense oligonucleotide Substances 0.000 description 8
- 238000012230 antisense oligonucleotides Methods 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 239000002585 base Substances 0.000 description 8
- 238000005520 cutting process Methods 0.000 description 8
- 239000008103 glucose Substances 0.000 description 8
- 238000003364 immunohistochemistry Methods 0.000 description 8
- 230000000415 inactivating effect Effects 0.000 description 8
- 235000015097 nutrients Nutrition 0.000 description 8
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 8
- 108091092562 ribozyme Proteins 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 230000002103 transcriptional effect Effects 0.000 description 8
- 102000004316 Oxidoreductases Human genes 0.000 description 7
- 108090000854 Oxidoreductases Proteins 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 230000003197 catalytic effect Effects 0.000 description 7
- 230000001351 cycling effect Effects 0.000 description 7
- 239000001177 diphosphate Substances 0.000 description 7
- 239000013613 expression plasmid Substances 0.000 description 7
- 101150012864 ipt gene Proteins 0.000 description 7
- 230000002503 metabolic effect Effects 0.000 description 7
- 244000005700 microbiome Species 0.000 description 7
- 239000002243 precursor Substances 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 6
- 108020000543 Adenylate kinase Proteins 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 6
- 238000010446 CRISPR interference Methods 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 102000004533 Endonucleases Human genes 0.000 description 6
- 108030006765 Formyltetrahydrofolate deformylases Proteins 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- RRHGJUQNOFWUDK-UHFFFAOYSA-N Isoprene Chemical compound CC(=C)C=C RRHGJUQNOFWUDK-UHFFFAOYSA-N 0.000 description 6
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 6
- 108020000772 Ribose-Phosphate Pyrophosphokinase Proteins 0.000 description 6
- 108700005078 Synthetic Genes Proteins 0.000 description 6
- 108020004566 Transfer RNA Proteins 0.000 description 6
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 6
- 102000005130 adenylosuccinate synthetase Human genes 0.000 description 6
- 239000011543 agarose gel Substances 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 6
- 235000011180 diphosphates Nutrition 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- 239000003112 inhibitor Substances 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 6
- 108010034343 phosphoribosylamine-glycine ligase Proteins 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 108020003589 5' Untranslated Regions Proteins 0.000 description 5
- 241000276408 Bacillus subtilis subsp. subtilis str. 168 Species 0.000 description 5
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 5
- 101100096533 Drosophila melanogaster SelD gene Proteins 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- 241000588722 Escherichia Species 0.000 description 5
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- 101710115186 N5-carboxyaminoimidazole ribonucleotide mutase Proteins 0.000 description 5
- 101710135245 N5-carboxyaminoimidazole ribonucleotide synthase Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 5
- 239000003242 anti bacterial agent Substances 0.000 description 5
- 229940088710 antibiotic agent Drugs 0.000 description 5
- 238000000855 fermentation Methods 0.000 description 5
- 230000004151 fermentation Effects 0.000 description 5
- 235000011187 glycerol Nutrition 0.000 description 5
- 238000005805 hydroxylation reaction Methods 0.000 description 5
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 239000002777 nucleoside Substances 0.000 description 5
- 238000011002 quantification Methods 0.000 description 5
- 230000014621 translational initiation Effects 0.000 description 5
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 4
- AJPADPZSRRUGHI-RFZPGFLSSA-N 1-deoxy-D-xylulose 5-phosphate Chemical compound CC(=O)[C@@H](O)[C@H](O)COP(O)(O)=O AJPADPZSRRUGHI-RFZPGFLSSA-N 0.000 description 4
- 108020005345 3' Untranslated Regions Proteins 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- SKCBPEVYGOQGJN-TXICZTDVSA-N 5-phospho-beta-D-ribosylamine Chemical compound N[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O SKCBPEVYGOQGJN-TXICZTDVSA-N 0.000 description 4
- 241000589158 Agrobacterium Species 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 4
- 241000219194 Arabidopsis Species 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 4
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- 241000186660 Lactobacillus Species 0.000 description 4
- 101100399514 Oryza sativa subsp. japonica LOG gene Proteins 0.000 description 4
- 101150053185 P450 gene Proteins 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 101800000628 PDH precursor-related peptide Proteins 0.000 description 4
- 108030004873 Phosphoribosylformylglycinamidine synthases Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 125000003118 aryl group Chemical group 0.000 description 4
- 101150099875 atpE gene Proteins 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 4
- 229960003276 erythromycin Drugs 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 229940039696 lactobacillus Drugs 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 150000004712 monophosphates Chemical class 0.000 description 4
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 4
- 230000002018 overexpression Effects 0.000 description 4
- 238000012261 overproduction Methods 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 235000002639 sodium chloride Nutrition 0.000 description 4
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000004809 thin layer chromatography Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- MAKBWIUHFAVVJP-HAXARLPTSA-N (2R,3S)-pentane-1,2,3,4-tetrol phosphoric acid Chemical compound OP(O)(O)=O.CC(O)[C@H](O)[C@H](O)CO MAKBWIUHFAVVJP-HAXARLPTSA-N 0.000 description 3
- AUFGTPPARQZWDO-YPMHNXCESA-N 10-formyltetrahydrofolic acid Chemical compound C([C@H]1CNC=2N=C(NC(=O)C=2N1)N)N(C=O)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 AUFGTPPARQZWDO-YPMHNXCESA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 102100020786 Adenylosuccinate synthetase isozyme 2 Human genes 0.000 description 3
- 101100494406 Arabidopsis thaliana CYP735A1 gene Proteins 0.000 description 3
- 101100494407 Arabidopsis thaliana CYP735A2 gene Proteins 0.000 description 3
- 101100325906 Bacillus subtilis (strain 168) ganA gene Proteins 0.000 description 3
- 241000588923 Citrobacter Species 0.000 description 3
- 241000193403 Clostridium Species 0.000 description 3
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 3
- KTVPXOYAKDPRHY-MBMOQRBOSA-N D-Ribose 5-phosphate Natural products O[C@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O KTVPXOYAKDPRHY-MBMOQRBOSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 241000588921 Enterobacteriaceae Species 0.000 description 3
- 241000588698 Erwinia Species 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 101150085452 IPT1 gene Proteins 0.000 description 3
- 102100026819 Inositol polyphosphate 1-phosphatase Human genes 0.000 description 3
- 241000588748 Klebsiella Species 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 229930195714 L-glutamate Natural products 0.000 description 3
- 229930182816 L-glutamine Natural products 0.000 description 3
- 241000194036 Lactococcus Species 0.000 description 3
- 238000000636 Northern blotting Methods 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 102100027330 Phosphoribosylaminoimidazole carboxylase Human genes 0.000 description 3
- 108090000434 Phosphoribosylaminoimidazolesuccinocarboxamide synthases Proteins 0.000 description 3
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 3
- 238000002105 Southern blotting Methods 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 101100111413 Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E) lacZ gene Proteins 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 244000000005 bacterial plant pathogen Species 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 230000001851 biosynthetic effect Effects 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 101150118992 dxr gene Proteins 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 238000001952 enzyme assay Methods 0.000 description 3
- VWWQXMAJTJZDQX-UYBVJOGSSA-N flavin adenine dinucleotide Chemical compound C1=NC2=C(N)N=CN=C2N1[C@@H]([C@H](O)[C@@H]1O)O[C@@H]1CO[P@](O)(=O)O[P@@](O)(=O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C2=NC(=O)NC(=O)C2=NC2=C1C=C(C)C(C)=C2 VWWQXMAJTJZDQX-UYBVJOGSSA-N 0.000 description 3
- 235000019162 flavin adenine dinucleotide Nutrition 0.000 description 3
- 239000011714 flavin adenine dinucleotide Substances 0.000 description 3
- 229940093632 flavin-adenine dinucleotide Drugs 0.000 description 3
- 230000004907 flux Effects 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 230000033444 hydroxylation Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 239000002054 inoculum Substances 0.000 description 3
- 101150086432 lacA gene Proteins 0.000 description 3
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 3
- GPSDUZXPYCFOSQ-UHFFFAOYSA-N m-toluic acid Chemical compound CC1=CC=CC(C(O)=O)=C1 GPSDUZXPYCFOSQ-UHFFFAOYSA-N 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 239000002207 metabolite Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 108010035774 phosphoribosylaminoimidazole carboxylase Proteins 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 101150008241 purT gene Proteins 0.000 description 3
- 229940076788 pyruvate Drugs 0.000 description 3
- 229940107700 pyruvic acid Drugs 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 235000019192 riboflavin Nutrition 0.000 description 3
- 239000002151 riboflavin Substances 0.000 description 3
- 229960002477 riboflavin Drugs 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- VDXLUNDMVKSKHO-XVFCMESISA-N 5'-phosphoribosyl-n-formylglycinamide Chemical compound O[C@H]1[C@@H](O)[C@H](NC(=O)CNC=O)O[C@@H]1COP(O)(O)=O VDXLUNDMVKSKHO-XVFCMESISA-N 0.000 description 2
- DCTLYFZHFGENCW-UUOKFMHZSA-N 5'-xanthylic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 DCTLYFZHFGENCW-UUOKFMHZSA-N 0.000 description 2
- MSTNYGQPCMXVAQ-KIYNQFGBSA-N 5,6,7,8-tetrahydrofolic acid Chemical compound N1C=2C(=O)NC(N)=NC=2NCC1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 MSTNYGQPCMXVAQ-KIYNQFGBSA-N 0.000 description 2
- XFVULMDJZXYMSG-ZIYNGMLESA-N 5-amino-1-(5-phospho-D-ribosyl)imidazole-4-carboxylic acid Chemical compound NC1=C(C(O)=O)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 XFVULMDJZXYMSG-ZIYNGMLESA-N 0.000 description 2
- PDACUKOKVHBVHJ-XVFCMESISA-N 5-amino-1-(5-phospho-beta-D-ribosyl)imidazole Chemical compound NC1=CN=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 PDACUKOKVHBVHJ-XVFCMESISA-N 0.000 description 2
- JHLXDWGVSYMXPL-XVFCMESISA-N 5-carboxyamino-1-(5-phospho-D-ribosyl)imidazole Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NC(O)=O)=CN=C1 JHLXDWGVSYMXPL-XVFCMESISA-N 0.000 description 2
- ABCOOORLYAOBOZ-KQYNXXCUSA-N 5-formamido-1-(5-phospho-D-ribosyl)imidazole-4-carboxamide Chemical compound O=CNC1=C(C(=O)N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 ABCOOORLYAOBOZ-KQYNXXCUSA-N 0.000 description 2
- GOSWTRUMMSCNCW-BAJUWZQUSA-N 9-ribosyl-cis-zeatin Chemical compound C1=NC=2C(NC/C=C(CO)/C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GOSWTRUMMSCNCW-BAJUWZQUSA-N 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 2
- 108050009505 Adenylate dimethylallyltransferases Proteins 0.000 description 2
- 241000506839 Agrobacterium fabrum Species 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 241000046135 Cedecea Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- KJTLQQUUPVSXIM-UHFFFAOYSA-N DL-mevalonic acid Natural products OCCC(O)(C)CC(O)=O KJTLQQUUPVSXIM-UHFFFAOYSA-N 0.000 description 2
- 238000007702 DNA assembly Methods 0.000 description 2
- 101000802895 Dendroaspis angusticeps Fasciculin-1 Proteins 0.000 description 2
- 241000607473 Edwardsiella <enterobacteria> Species 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000626621 Geobacillus Species 0.000 description 2
- 241000588731 Hafnia Species 0.000 description 2
- 108090001102 Hammerhead ribozyme Proteins 0.000 description 2
- 108010072462 Hydroxymethyl and Formyl Transferases Proteins 0.000 description 2
- 102000006933 Hydroxymethyl and Formyl Transferases Human genes 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 108010081409 Iron-Sulfur Proteins Proteins 0.000 description 2
- 102000005298 Iron-Sulfur Proteins Human genes 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- OJMMVQQUTAEWLP-UHFFFAOYSA-N Lincomycin Natural products CN1CC(CCC)CC1C(=O)NC(C(C)O)C1C(O)C(O)C(O)C(SC)O1 OJMMVQQUTAEWLP-UHFFFAOYSA-N 0.000 description 2
- 108010048581 Lysine decarboxylase Proteins 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 241000588771 Morganella <proteobacterium> Species 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- PMCOGCVKOAOZQM-XVFCMESISA-N Phosphoribosylformylglycineamidine Chemical compound O=CNCC(/N)=N/[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O PMCOGCVKOAOZQM-XVFCMESISA-N 0.000 description 2
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 2
- 241000218976 Populus trichocarpa Species 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000588768 Providencia Species 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 2
- 241000187694 Rhodococcus fascians Species 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 102100022604 Ribose-phosphate pyrophosphokinase 3 Human genes 0.000 description 2
- NAQGHJTUZRHGAC-ZZZDFHIKSA-N SAICAR Chemical compound NC1=C(C(=O)N[C@@H](CC(O)=O)C(O)=O)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 NAQGHJTUZRHGAC-ZZZDFHIKSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 102000014701 Transketolase Human genes 0.000 description 2
- 108010043652 Transketolase Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 241000607734 Yersinia <bacteria> Species 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- VZTDIZULWFCMLS-UHFFFAOYSA-N ammonium formate Chemical compound [NH4+].[O-]C=O VZTDIZULWFCMLS-UHFFFAOYSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 101150026213 atpB gene Proteins 0.000 description 2
- 101150090348 atpC gene Proteins 0.000 description 2
- 101150035600 atpD gene Proteins 0.000 description 2
- 101150038923 atpF gene Proteins 0.000 description 2
- 101150105110 atpF2 gene Proteins 0.000 description 2
- 101150018639 atpFH gene Proteins 0.000 description 2
- 101150103189 atpG gene Proteins 0.000 description 2
- 101150048329 atpH gene Proteins 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000005251 capillar electrophoresis Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 239000005515 coenzyme Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000003831 deregulation Effects 0.000 description 2
- 239000008121 dextrose Substances 0.000 description 2
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical group OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000008713 feedback mechanism Effects 0.000 description 2
- 239000011768 flavin mononucleotide Substances 0.000 description 2
- 229940013640 flavin mononucleotide Drugs 0.000 description 2
- FVTCRASFADXXNN-SCRDCRAPSA-N flavin mononucleotide Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-SCRDCRAPSA-N 0.000 description 2
- FVTCRASFADXXNN-UHFFFAOYSA-N flavin mononucleotide Natural products OP(=O)(O)OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-UHFFFAOYSA-N 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- OBQMLSFOUZUIOB-SHUUEZRQSA-N glycineamide ribonucleotide Chemical compound NCC(=O)N[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O OBQMLSFOUZUIOB-SHUUEZRQSA-N 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- CJNBYAVZURUTKZ-UHFFFAOYSA-N hafnium(IV) oxide Inorganic materials O=[Hf]=O CJNBYAVZURUTKZ-UHFFFAOYSA-N 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- OJMMVQQUTAEWLP-KIDUDLJLSA-N lincomycin Chemical compound CN1C[C@H](CCC)C[C@H]1C(=O)N[C@H]([C@@H](C)O)[C@@H]1[C@H](O)[C@H](O)[C@@H](O)[C@@H](SC)O1 OJMMVQQUTAEWLP-KIDUDLJLSA-N 0.000 description 2
- 229960005287 lincomycin Drugs 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 229950006238 nadide Drugs 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N phosphoric acid Substances OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- QVLTXCYWHPZMCA-UHFFFAOYSA-N po4-po4 Chemical compound OP(O)(O)=O.OP(O)(O)=O QVLTXCYWHPZMCA-UHFFFAOYSA-N 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000013823 prenylation Effects 0.000 description 2
- 101150002764 purA gene Proteins 0.000 description 2
- 101150076045 purF gene Proteins 0.000 description 2
- 101150103875 purH gene Proteins 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 235000019231 riboflavin-5'-phosphate Nutrition 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 229940054269 sodium pyruvate Drugs 0.000 description 2
- 230000000707 stereoselective effect Effects 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 108010036627 tRNA isopentenyltransferase Proteins 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000009752 translational inhibition Effects 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- SPOMEWBVWWDQBC-UHFFFAOYSA-K tripotassium;dihydrogen phosphate;hydrogen phosphate Chemical compound [K+].[K+].[K+].OP(O)([O-])=O.OP([O-])([O-])=O SPOMEWBVWWDQBC-UHFFFAOYSA-K 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- MSTNYGQPCMXVAQ-RYUDHWBXSA-N (6S)-5,6,7,8-tetrahydrofolic acid Chemical compound C([C@H]1CNC=2N=C(NC(=O)C=2N1)N)NC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 MSTNYGQPCMXVAQ-RYUDHWBXSA-N 0.000 description 1
- KJTLQQUUPVSXIM-ZCFIWIBFSA-N (R)-mevalonic acid Chemical compound OCC[C@](O)(C)CC(O)=O KJTLQQUUPVSXIM-ZCFIWIBFSA-N 0.000 description 1
- IGUZJYCAXLYZEE-RFZPGFLSSA-N 1-deoxy-D-xylulose Chemical compound CC(=O)[C@@H](O)[C@H](O)CO IGUZJYCAXLYZEE-RFZPGFLSSA-N 0.000 description 1
- 101710094045 1-deoxy-D-xylulose-5-phosphate synthase Proteins 0.000 description 1
- GCUVWBFOTMJVLI-UHFFFAOYSA-N 2-(3-methylbut-3-enyl)-7h-purin-6-amine Chemical class CC(=C)CCC1=NC(N)=C2NC=NC2=N1 GCUVWBFOTMJVLI-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- FCZOVUJWOBSMSS-UHFFFAOYSA-N 5-[(6-aminopurin-9-yl)methyl]-5-methyl-3-methylideneoxolan-2-one Chemical compound C1=NC2=C(N)N=CN=C2N1CC1(C)CC(=C)C(=O)O1 FCZOVUJWOBSMSS-UHFFFAOYSA-N 0.000 description 1
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 1
- 229960005508 8-azaguanine Drugs 0.000 description 1
- NOTGFIUVDGNKRI-UUOKFMHZSA-N AICA ribonucleotide Chemical compound NC1=C(C(=O)N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 NOTGFIUVDGNKRI-UUOKFMHZSA-N 0.000 description 1
- 241001156739 Actinobacteria <phylum> Species 0.000 description 1
- 241000203809 Actinomycetales Species 0.000 description 1
- 102100029457 Adenine phosphoribosyltransferase Human genes 0.000 description 1
- 102000002281 Adenylate kinase Human genes 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 241000589176 Agrobacterium vitis Species 0.000 description 1
- 241001135756 Alphaproteobacteria Species 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101100343612 Arabidopsis thaliana LOG8 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 241001249117 Bacillus mojavensis Species 0.000 description 1
- 241001135755 Betaproteobacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 108010088986 Camphor 5-Monooxygenase Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 241000186321 Cellulomonas Species 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 240000003966 Chrysopogon subtilis Species 0.000 description 1
- 241000221751 Claviceps purpurea Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- LMKYZBGVKHTLTN-NKWVEPMBSA-N D-nopaline Chemical compound NC(=N)NCCC[C@@H](C(O)=O)N[C@@H](C(O)=O)CCC(O)=O LMKYZBGVKHTLTN-NKWVEPMBSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- KTVPXOYAKDPRHY-SOOFDHNKSA-N D-ribofuranose 5-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O KTVPXOYAKDPRHY-SOOFDHNKSA-N 0.000 description 1
- 125000000824 D-ribofuranosyl group Chemical group [H]OC([H])([H])[C@@]1([H])OC([H])(*)[C@]([H])(O[H])[C@]1([H])O[H] 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 241000192091 Deinococcus radiodurans Species 0.000 description 1
- 241000168726 Dictyostelium discoideum Species 0.000 description 1
- 101100126053 Dictyostelium discoideum impdh gene Proteins 0.000 description 1
- 101100410642 Dictyostelium discoideum purC/E gene Proteins 0.000 description 1
- 108010082495 Dietary Plant Proteins Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 108010074122 Ferredoxins Proteins 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000192128 Gammaproteobacteria Species 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 101100484521 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) atpF gene Proteins 0.000 description 1
- 101000611023 Homo sapiens Tumor necrosis factor receptor superfamily member 6 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- GRSZFWQUAKGDAV-KQYNXXCUSA-N IMP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NC=NC2=O)=C2N=C1 GRSZFWQUAKGDAV-KQYNXXCUSA-N 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- 241000588752 Kluyvera Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241001468155 Lactobacillaceae Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241001625930 Luria Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- DUISZFLWBAPRBR-SDBHATRESA-N N(6)-(dimethylallyl)adenosine 5'-monophosphate Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O DUISZFLWBAPRBR-SDBHATRESA-N 0.000 description 1
- 108010045510 NADPH-Ferrihemoprotein Reductase Proteins 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000008021 Nucleoside-Triphosphatase Human genes 0.000 description 1
- 108010075285 Nucleoside-Triphosphatase Proteins 0.000 description 1
- 241000588912 Pantoea agglomerans Species 0.000 description 1
- 102100036473 Phosphoribosylformylglycinamidine synthase Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 101000745603 Pseudomonas putida Camphor 5-monooxygenase Proteins 0.000 description 1
- 241001148183 Pseudomonas savastanoi Species 0.000 description 1
- 108700006317 Purine-nucleoside phosphorylases Proteins 0.000 description 1
- 102000011346 Pyruvate Dehydrogenase (Lipoamide) Human genes 0.000 description 1
- 108010023576 Pyruvate Dehydrogenase (Lipoamide) Proteins 0.000 description 1
- 241000589771 Ralstonia solanacearum Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- IGQLDUYTWDABFK-UHFFFAOYSA-N Roseoflavin Natural products OCC(O)C(O)C(O)CN1C2=NC(=O)NC(=O)C2=NC2=C1C=C(N(C)C)C(C)=C2 IGQLDUYTWDABFK-UHFFFAOYSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241001414987 Strepsiptera Species 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 235000014897 Streptococcus lactis Nutrition 0.000 description 1
- 101100380695 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) atpB gene Proteins 0.000 description 1
- 101100110710 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) atpH gene Proteins 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 101100156073 Sulfurisphaera tokodaii (strain DSM 16993 / JCM 10545 / NBRC 100140 / 7) atpD gene Proteins 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001137870 Thermoanaerobacterium Species 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- GSEJCLTVZPLZKY-UHFFFAOYSA-N Triethanolamine Chemical compound OCCN(CCO)CCO GSEJCLTVZPLZKY-UHFFFAOYSA-N 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 102100040403 Tumor necrosis factor receptor superfamily member 6 Human genes 0.000 description 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- YPXGTKHZRCDZTL-KSFOROOFSA-N [(2r,3s)-2,3,4-trihydroxypentyl] dihydrogen phosphate Chemical compound CC(O)[C@H](O)[C@H](O)COP(O)(O)=O YPXGTKHZRCDZTL-KSFOROOFSA-N 0.000 description 1
- NOTGFIUVDGNKRI-LZGMGDPASA-N [(2r,3s,4r)-5-(5-amino-4-carbamoylimidazol-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl dihydrogen phosphate Chemical class NC1=C(C(=O)N)N=CN1C1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 NOTGFIUVDGNKRI-LZGMGDPASA-N 0.000 description 1
- HQDIRMPLDXINKZ-BARLVKFPSA-N [2-carbamoyl-4-[[(3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]amino]-1H-imidazol-5-yl]phosphonic acid Chemical compound N1C(C(=O)N)=NC(NC2[C@@H]([C@H](O)[C@@H](CO)O2)O)=C1P(O)(O)=O HQDIRMPLDXINKZ-BARLVKFPSA-N 0.000 description 1
- 229960001456 adenosine triphosphate Drugs 0.000 description 1
- OFBHPPMPBOJXRT-VWJPMABRSA-N adenylosuccinic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C2=NC=NC(N[C@@H](CC(O)=O)C(O)=O)=C2N=C1 OFBHPPMPBOJXRT-VWJPMABRSA-N 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 229960003767 alanine Drugs 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- YXJDFQJKERBOBM-TXICZTDVSA-N alpha-D-ribose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H]1O YXJDFQJKERBOBM-TXICZTDVSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000010775 animal oil Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 101150088806 atpA gene Proteins 0.000 description 1
- 230000001651 autotrophic effect Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- OGBUMNBNEWYMNJ-UHFFFAOYSA-N batilol Chemical class CCCCCCCCCCCCCCCCCCOCC(O)CO OGBUMNBNEWYMNJ-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 101150072043 deoD gene Proteins 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 229940120503 dihydroxyacetone Drugs 0.000 description 1
- AIUDWMLXCFRVDR-UHFFFAOYSA-N dimethyl 2-(3-ethyl-3-methylpentyl)propanedioate Chemical class CCC(C)(CC)CCC(C(=O)OC)C(=O)OC AIUDWMLXCFRVDR-UHFFFAOYSA-N 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 235000003891 ferrous sulphate Nutrition 0.000 description 1
- 239000011790 ferrous sulphate Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 238000003208 gene overexpression Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- MNQZXJOMYWMBOU-UHFFFAOYSA-N glyceraldehyde Chemical compound OCC(O)C=O MNQZXJOMYWMBOU-UHFFFAOYSA-N 0.000 description 1
- 150000002313 glycerolipids Chemical class 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 101150114741 guaA gene Proteins 0.000 description 1
- 101150093309 guaAA gene Proteins 0.000 description 1
- 101150085008 guaAB gene Proteins 0.000 description 1
- 101150035744 guaB gene Proteins 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000000640 hydroxylating effect Effects 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 235000014705 isoleucine Nutrition 0.000 description 1
- UFHLMYOGRXOCSL-UHFFFAOYSA-N isoprothiolane Chemical compound CC(C)OC(=O)C(C(=O)OC(C)C)=C1SCCS1 UFHLMYOGRXOCSL-UHFFFAOYSA-N 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000014634 leaf senescence Effects 0.000 description 1
- 229960003136 leucine Drugs 0.000 description 1
- 235000005772 leucine Nutrition 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000001853 liver microsome Anatomy 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 229940099596 manganese sulfate Drugs 0.000 description 1
- 235000007079 manganese sulphate Nutrition 0.000 description 1
- 239000011702 manganese sulphate Substances 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 210000001700 mitochondrial membrane Anatomy 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000006870 ms-medium Substances 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- MRWXACSTFXYYMV-FDDDBJFASA-N nebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC=C2N=C1 MRWXACSTFXYYMV-FDDDBJFASA-N 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 229910017464 nitrogen compound Inorganic materials 0.000 description 1
- 150000002830 nitrogen compounds Chemical class 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229940066779 peptones Drugs 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 108010083127 phage repressor proteins Proteins 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 101150009573 phoA gene Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 229930195732 phytohormone Natural products 0.000 description 1
- 230000003032 phytopathogenic effect Effects 0.000 description 1
- 230000008638 plant developmental process Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 230000036515 potency Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 101150042478 punA gene Proteins 0.000 description 1
- 101150028995 purC gene Proteins 0.000 description 1
- 101150105087 purC1 gene Proteins 0.000 description 1
- 101150084005 purD gene Proteins 0.000 description 1
- 101150035806 purK gene Proteins 0.000 description 1
- 101150056177 purM gene Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000002212 purine nucleoside Substances 0.000 description 1
- 230000006825 purine synthesis Effects 0.000 description 1
- 108010060537 putidaredoxin Proteins 0.000 description 1
- 108010043434 putidaredoxin reductase Proteins 0.000 description 1
- LJXQPZWIHJMPQQ-UHFFFAOYSA-N pyrimidin-2-amine Chemical group NC1=NC=CC=N1 LJXQPZWIHJMPQQ-UHFFFAOYSA-N 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 101150060382 ribC gene Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- IGQLDUYTWDABFK-GUTXKFCHSA-N roseoflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C2=NC(=O)NC(=O)C2=NC2=C1C=C(N(C)C)C(C)=C2 IGQLDUYTWDABFK-GUTXKFCHSA-N 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 101710103876 tRNA dimethylallyltransferase Proteins 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 239000005460 tetrahydrofolate Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 150000003626 triacylglycerols Chemical class 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 101150065206 tzs gene Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 235000014393 valine Nutrition 0.000 description 1
- 239000006200 vaporizer Substances 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 229940023877 zeatin Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/16—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
- C12P17/165—Heterorings having nitrogen atoms as the only ring heteroatoms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1022—Transferases (2.) transferring aldehyde or ketonic groups (2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2497—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/14—Nitrogen or oxygen as hetero atom and at least one other diverse hetero ring atom in the same ring
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/38—Nucleosides
- C12P19/40—Nucleosides having a condensed ring system containing a six-membered ring having two nitrogen atoms in the same ring, e.g. purine nucleosides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y202/00—Transferases transferring aldehyde or ketonic groups (2.2)
- C12Y202/01—Transketolases and transaldolases (2.2.1)
- C12Y202/01007—1-Deoxy-D-xylulose-5-phosphate synthase (2.2.1.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01027—Adenylate dimethylallyltransferase (2.5.1.27)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/02—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 일반적으로 생물공학에 관한 것으로, 구체적으로 아이소프레노이드 측쇄가 있는 사이토키닌(아이소프레노이드 사이토키닌)을 생산할 수 있는 유전자 조작된 세균 및 이의 제조 및 적용에 관한 것이다.
Description
본 발명은 일반적으로 생물공학에 관한 것으로, 구체적으로 아이소프레노이드 측쇄가 있는 사이토키닌(아이소프레노이드 사이토키닌)을 생산할 수 있는 유전자 조작된 세균 및 이의 제조 및 적용에 관한 것이다.
사이토키닌은 종자 발아에서부터 식물 및 잎 노화에 이르기까지 수많은 식물 성장 및 발달 과정을 제어하는 필수적인 식물 호르몬으로, 세포 분열 유도 능력을 특징으로 한다(Mok, Martin, and Mok 2000). 자연적으로 발생하는 사이토키닌은 방향족 측쇄(방향족 사이토키닌) 또는 아데닌의 N 6 -말단에 아이소프렌-유래 측쇄(아이소프레노이드 사이토키닌)가 있는 아데닌 유도체이다. N 6 -측쇄 구조 및 구성은 사이토키닌의 유형 및 활성 모두를 결정한다. 아이소프레노이드 사이토키닌은 광범위하며 자연적으로 식물 및 조류에서 생산되고 많은 종의 세균, 진균, 선충 및 기생성 곤충에서도 생산된다(Stirk and van Staden 2010). 천연 아이소프레노이드 사이토키닌은 N 6 -(D2-아이소펜테닐)아데닌[N 6 -(D2-isopentenyl)adenine: iP], 트랜스-제아틴(trans-zeatin: tZ), 시스-제아틴(cis-zeatin: cZ) 및 다이하이드로제아틴(dihydrozeatin: DZ)이다(도 1).
아이소프레노이드 사이토키닌은 아데닌 또는 아데노신의 유도체로서, 6번 위치의 고리 외 아미노기가 다이메틸알릴 측쇄의 부착으로 변형되어 모 화합물인 N 6 -(D2-아이소펜테닐)아데닌(iP) 및 이의 리보사이드인 N 6 -(D2-아이소펜테닐)아데노신(iPR)이 생성된다. 다이메틸알릴 측쇄는 9' 위치에서 수산화되어 트랜스-제아틴(tZ) 또는 이의 리보사이드인 트랜스-리보실제아틴(tZR)을 생성할 수 있다. 또한, 고리 외 이중 결합은 환원되어 다이하이드로제아틴(DZ) 또는 이의 리보사이드인 리보실 다이하이드로제아틴(DZR)을 생성할 수 있다(도 1). iP, iPR, tZ, tZR, DZ 및 DZR의 여섯 가지 화합물 모두 생물학적으로 활성이 있으며 자연적으로 발생한다.
자연적으로 발생하는 사이토키닌의 대부분은 유리 염기, 리보사이드 및 뉴클레오타이드, 또는 글루코스, 자일로스 또는 아미노산 잔기와의 접합체와 같은 독특한 구조적 유도체 또는 형태로 존재한다. 식물에서, 사이토키닌 유리 염기는 가장 생물학적으로 활성이 있는 형태로 간주되며, 글루코스 접합체는 글리코실화 위치에 따라 영구적으로 비활성이거나 가역적 저장 형태로 간주된다.
제아틴은 식물에서 사이토키닌의 주요 형태이다. 제아틴은 아데닌의 N 6 위치에 수산화 아이소프렌-유래 측쇄가 있는 아데닌 유도체로서, 시스- 또는 트랜스-배치로 존재할 수 있다(도 1). 트랜스-제아틴은 가장 효과적인 자연적으로 발생하는 사이토키닌 중 하나이다. 많은 이전 연구에서, 분석 방법이 시스- 및 트랜스-제아틴을 구별하지 못했기 때문에, 관찰된 생리학적 과정에서 두 화합물의 존재 및 역할의 이해를 어렵게 했다.
구조적 유사성에도 불구하고, 시스-제아틴은 tRNA 경로를 통해 합성되는 반면, 트랜스-제아틴 및 생합성적으로 연관된 화합물인 iP 및 DZ는 식물 세포에서 드노보(de novo)(또는 AMP) 생합성 경로를 통해 합성된다.
tRNA 경로에서, 시스-제아틴은 아이소펜테닐화 tRNA 분해의 재활용 생성물이다. 시스-제아틴은 특정 (UNN-)tRNA에서 37번 아데닌의 프레닐화를 촉매하여 아이소펜테닐 아데닌(IP)-함유 tRNA의 형성을 유도하는 tRNA-아이소펜테닐 전이효소(tRNA-IPT)에 의해 매우 낮은 비율로 고세균을 제외한( et al. 2015) 거의 모든 유기체에서 합성된다. 드노보 사이토키닌 생합성 경로에서, 첫 번째 단계는 아데닐레이트 아이소펜테닐 전이효소(IPT, EC 2.5.1.27)에 의한 촉매로 아데노신 5'-인산(AMP, ADP 또는 ATP)이 다이메틸알릴 이인산(DMAPP)으로 N-프레닐화되어, 아이소펜테닐아데닌 뉴클레오타이드(iP)를 생성하는 것이다. 이후 식물에서 IPT에 의해 생성되는 iP는 프레닐 측쇄에서 수산화되어 tZ-뉴클레오타이드를 생성한다. 애기장대에서, CYP735A1 및 CYP735A2의 2가지 사이토크롬 P450 모노옥시게나제는 수산화 반응을 촉매한다. CYP735A는 iP-뉴클레오사이드 및 iP보다 iP-뉴클레오타이드를 우선적으로 사용한다. 이 반응은 입체-특이적(stereo-specific)이므로, CYP735A는 tZ-뉴클레오타이드를 생성한다(Takei, Yamaya, and Sakakibara 2004). 드노보 및 tRNA 경로 모두의 마지막 단계에서, 사이토키닌-활성화 효소 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 'Lonely guy'(LOG, EC 3.2.2.n1)는 리보실 모이어티를 제거하고 사이토키닌 뉴클레오타이드를 이의 활성 핵염기로 전환한다(Kurakawa et al. 2007). iPRMP, tZRMP, DZRMP 및 cZRMP의 4가지 사이토키닌 뉴클레오사이드 일인산 모두 LOG에 의해 이용된다.
아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)와 같은 식물병원성 세균에 의한 식물 감염의 경우, tZ의 생합성은 감염을 촉진하기 위해 시작된다. 감염 과정 중에서, tZ 또는 iP 생합성이 세균 세포 내부에서 발생할 수 있거나 세균성 IPT 유전자 동족체가 숙주의 핵 게놈에 통합되어 감염된 식물 세포에서 발현될 수 있다.
중요한 것은 세균과 보다 고등생물인 식물의 IPT 사이의 기질 특이성이 다르다는 것이다(Kakimoto 2001; Sakakibara 2005). 첫 번째 양상에서, 아그로박테리움 투메파시엔스의 Tmr 및 Tzs와 같은 세균성 IPT는 수용체로서 AMP만을 사용하여(반면 식물의 IPT 효소는 ADP 및 ATP를 우선적으로 사용함) 트랜스-제아틴 리보사이드 5'-일인산(tZRMP)을 형성한다(Sakakibara 2006; Kamada-Nobusada and Sakakibara 2009). 또한, Tzs 및 Tmr과 같은 아그로박테리움의 IPT는 측쇄 공여체로서 DMAPP 또는, 메틸에리스리톨 인산(MEP) 경로에서 DMAPP의 수산화 전구체인, 1-하이드록시-2-메틸-2-부테닐 4-이인산(1-hydroxy-2-methyl-2-butenyl 4-diphosphate: HMBDP)을 사용할 수 있다. DMAPP가 기질로 사용되는 경우, 1차 생성물은 iPRMP인 반면, tZRMP는 IPT가 HMBDP를 이용할 때 형성된다. 따라서, 감염 중 식물 세포의 엽록체에서 아그로박테리움의 IPT인 Tmr이 발현되면 tZRMP의 직접 합성을 위한 대사적 우회가 생성되어, 식물 세포의 색소체에 아이소프레노이드 전구체 HMBDP의 효율적인 기질 공급이 격리된다. 천연 경로에서와 같이, LOG 포스포리보하이드롤라제는 마지막으로 iP- 또는 tZ-뉴클레오사이드 일인산(iPRMP, tZRMP)으로부터 리보스 일인산 모이어티를 방출시켜 생물학적 활성 분자인 iP 및 tZ를 생성한다.
종양-유발 식물 병원성 세균인 아그로박테리움 투메파시엔스는 Tmr 및 Tzs의 2가지 IPT를 갖는다. Tmr 및 Tzs는 상동성 단백질이며, 둘 다 DMAPP : AMP 아이소펜테닐 전이효소이지만, 기질 인식에 중요한 아미노산이 식물 아데닐레이트 IPT의 것과 다르다(Chu et al., 2010). tmr(ipt) 유전자는 숙수 식물에 감염을 매개하는 Ti-플라스미드의 T-영역에 위치한다. tmr 유전자는 세균에서 식물 게놈으로 전이되어 숙주 식물이 사이토키닌을 생산하게 만들어 종양 형성을 초래한다. 시험관 내 실험으로 Tmr이 DMAPP 및 HMBDP 모두를 유사한 Km 값으로 AMP로 바꾼다는 것이 입증되었다(Sakakibara et al. 2005). 아그로박테리움 투메파시엔스의 노팔린(nopaline)-생산 균주는 DMAPP : AMP 아이소펜테닐 전이효소에 대한 다른 유전자인 tzs를 보유하며, 이는 Ti-플라스미드의 vir 영역에 존재하며 식물 세포로 전위되지 않는다. Tzs는 이러한 아그로박테리움 투메파시엔스 균주에 의한 높은 수준의 사이토키닌 생산 및 분비를 가능하게 하며(Morris et al. 1993), 또한 HMBDP 또는 DMAPP를 사용하여 iPRMP 및 tZRMP를 생산할 수 있다. Tzs는 Tmr에 대해 51.3%의 단백질 서열 동일성을 갖는다. tmr/tzs에 상동적인 DMAPP : AMP 아이소펜테닐 전이효소를 암호화하는 유전자는 아그로박테리움 속의 다른 세균인 아그로박테리움 비티스(A. vitis) 및 아그로박테리움 라이조게네스(A. rhizogenes)뿐만 아니라 슈도모나스 시린개 피브이 사바스타노이(Pseudomonas syringae pv. savastanoi), 슈도모나스 솔라나세아룸(Pseudomonas solanacearum), 판토에아 아글로메란스(Pantoea agglomerans) 및 로도코쿠스 파시앤스(Rhodococcus fascians)와 같은 다른 식물-병원성 세균에 존재한다(Kakimoto, 2003).
아이소펜테닐 공여체인 다이메틸알릴 이인산(DMAPP) 및 이의 전구체인 1-하이드록시-2-메틸-2-부테닐 4-이인산(HMBDP)은 식물 및 세균의 엽록체에서, 또한 바실러스 서브틸리스(Bacillus subtilis)에서 메틸에리스리톨 인산(methylerythritol phosphate: MEP) 경로를 통해 생산된다. MEP 경로에서, 피루브산 및 글리세르알데하이드-3-인산(glyceraldehyde-3-phosphate)은 1-데옥시-D-자일룰로스-5-인산 합성효소(1-deoxy-D-xylulose-5-phosphate synthase: Dxs, EC 2.2.1.7)에 의해 궁극적으로 HMBDP, DMAPP 및 아이소프렌 또는 더 큰 터페노이드(terpenoid) 화합물을 생산하는 대사 캐스케이드로 응축된다. MEP 경로에서 DXS에 의해 매개되는 첫 번째 단계는 식물 및 세균에서 아이소프레노이드를 생산하기 위한 속도-제한 단계이다(Julsing et al. 2007).
감염 중 식물-병원성 세균에서 드노보 경로를 통한 사이토키닌의 천연 생합성율은 매우 낮다. 이는 세균 기원의 IPT 효소, LOG 효소 및, 숙주 세포의 대사에 의해 공급되는, 빌딩 블록의 발현에 의존한다. 이러한 감염-기반 시스템은 산업적 규모의 생산으로 쉽게 전환될 수 없다. 농업적 적용에서 사이토키닌 호르몬 사용의 높은 활성 및 잠재력에 따라, 유전적이고 생물공학적으로 다루기 쉬운 숙주에서 iP, tZ 및 리보사이드 tZR 및 iPR과 같은 사이토키닌의 효율적이고 지속가능한 생산이 필요하다.
본 발명의 목적은 tZ 및 iP와 같은 아이소프레노이드 측쇄가 있는 사이토키닌(아이소프레노이드 사이토키닌) 및 이들의 리보사이드인 tZR 및 iPR의 보다 효율적인 생산을 가능하게 하는 수단을 제공하는 것이다. 보다 구체적으로, 본 발명의 목적은 tZ 및 iP와 같은 아이소프레노이드 측쇄가 있는 사이토키닌(아이소프레노이드 사이토키닌) 및 이들의 리보사이드인 tZR 및 iPR을 보다 높은 명목 수율로 생산하는 것을 가능하게 하는 수단을 제공하는 것이다.
이는 조작된 세균 균주로서, a) 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 선택적으로 b) 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 조작된 세균 균주를 갖는 본 발명자들에 의해 달성된다. 실시예에 나타난 바와 같이, 이러한 조작된 세균 균주는 놀랍게도 상등액에서 10㎎/ℓ를 초과하는 비정상적으로 높은 역가의 아이소프레노이드 사이토키닌을 나타낸다. 결과적으로, 이것은 식물 세포 감염이 더 이상 필요하지 않으며 tZ 및 iP와 같은 아이소프레노이드 사이토키닌 및 이들의 리보사이드인 tZR 및 iPR의 효율적인 생합성을 위한 생합성 기질 및 보조인자가 조작된 세균 세포에 의해 효과적으로 공급됨을 의미한다.
따라서 본 발명은 첫 번째 양상에서 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 세균을 제공한다. 보다 구체적으로, 본 발명은 세균으로서, a) 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 선택적으로 b) 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 세균을 제공한다.
또한 본 발명은 두 번째 양상에서 적합한 배양 배지에서 적합한 배양 조건 하에서 본 발명에 따른 세균을 배양하는 단계를 포함하는 사이토키닌 또는 이의 리보사이드 유도체, 특히 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법을 제공한다.
본 발명은 다음 항목으로 요약될 수 있다:
1. 세균으로서, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 세균.
2. 항목 1에 있어서, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
3. 항목 1에 있어서, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
4. 항목 1에 있어서, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
5. 항목 1 내지 항목 4 중 어느 하나에 있어서, 세균은 상기 이종의 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자를 포함하는, 세균.
6. 항목 5에 있어서, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 상기 이종의 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함하는, 세균.
7. 항목 5 또는 항목 6에 있어서, 외인성 핵산 분자는 벡터인, 세균.
8. 항목 5 또는 항목 6에 있어서, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합되는, 세균.
9. 항목 1 내지 항목 8 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 세균.
10. 항목 9에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 상기 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시키는 것으로 달성되는, 세균.
11. 항목 10에 있어서, 유전자의 카피수 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하는 것으로 달성되는, 세균.
12. 항목 9 내지 항목 11 중 어느 하나에 있어서, 세균은 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함하는, 세균.
13. 항목 12에 있어서, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함하는, 세균.
14. 항목 11 내지 항목 13 중 어느 하나에 있어서, 외인성 핵산 분자는 벡터인, 세균.
15. 항목 11 내지 항목 13 중 어느 하나에 있어서, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합되는, 세균.
16. 항목 9 내지 항목 15 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 리보솜 결합 부위를 변형하는 것으로 달성되는, 세균.
17. 항목 9 내지 항목 16 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시키는 것으로 달성되는, 세균.
18. 항목 9 내지 항목 17 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
19. 항목 9 내지 항목 18 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
20. 항목 9 내지 항목 18 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
21. 항목 9 내지 항목 20 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 세균성 폴리펩타이드인, 세균.
22. 항목 1 내지 항목 21 중 어느 하나에 있어서, 세균은 변형되지 않은 다른 동일한 세균과 비교하여 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 추가 변형된, 세균.
23. 항목 22에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 상기 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시키는 것으로 달성되는, 세균.
24. 항목 23에 있어서, 유전자의 카피수 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하는 것으로 달성되는, 세균.
25. 항목 22 내지 항목 24 중 어느 하나에 있어서, 세균은 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함하는, 세균.
26. 항목 25에 있어서, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함하는, 세균.
27. 항목 24 내지 항목 26 중 어느 하나에 있어서, 외인성 핵산 분자는 벡터인, 세균.
28. 항목 24 내지 항목 26 중 어느 하나에 있어서, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합되는, 세균.
29. 항목 22 내지 항목 28 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 리보솜 결합 부위를 변형하는 것으로 달성되는, 세균.
30. 항목 22 내지 항목 29 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시키는 것으로 달성되는, 세균.
31. 항목 22 내지 항목 30 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
32. 항목 22 내지 항목 31 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63 내지 65 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 65 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
33. 항목 22 내지 항목 32 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
34. 항목 22 내지 항목 32 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 64의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 64의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
35. 항목 22 내지 항목 34 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 세균성 폴리펩타이드인, 세균.
36. 항목 1 내지 항목 35 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 하나의 효소)의 발현 및/또는 활성이 증가되도록 추가 변형된, 세균.
37. 항목 36에 있어서, 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실 전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀 전이효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소 및 아데노신 키나제 활성이 있는 효소로 이루어진 군으로부터 선택된, 세균.
38. 항목 1 내지 항목 37 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 추가 변형된, 세균.
39. 항목 38에 있어서, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소 및 아데노신-포스포리보실 전이효소 활성이 있는 효소로 이루어진 군으로부터 선택된, 세균.
40. 항목 38 또는 항목 39에 있어서, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소인, 세균.
41. 항목 38 내지 항목 40 중 어느 하나에 있어서, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 아데노신-포스포리보실 전이효소 활성이 있는 효소인, 세균.
42. 항목 1 내지 항목 41 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 추가 변형된, 세균.
43. 항목 42에 있어서, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소는 IMP 탈수소효소 활성이 있는 효소 및 GMP 합성효소 활성이 있는 효소로 이루어진 군으로부터 선택된, 세균.
44. 항목 42 또는 항목 43에 있어서, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소는 IMP 탈수소효소 활성이 있는 효소인, 세균.
45. 항목 42 내지 항목 44 중 어느 하나에 있어서, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소는 GMP 합성효소 활성이 있는 효소인, 세균.
46. 항목 1 내지 항목 45 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 추가 변형된, 세균.
47. 항목 46에 있어서, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 상기 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시키는 것으로 달성되는, 세균.
48. 항목 47에 있어서, 유전자의 카피수 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하는 것으로 달성되는, 세균.
49. 항목 1 내지 항목 48 중 어느 하나에 있어서, 세균은 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함하는, 세균.
50. 항목 49에 있어서, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함하는, 세균.
51. 항목 48 내지 항목 50 중 어느 하나에 있어서, 외인성 핵산 분자는 벡터인, 세균.
52. 항목 48 내지 항목 50 중 어느 하나에 있어서, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합되는, 세균.
53. 항목 46 내지 항목 52 중 어느 하나에 있어서, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 i) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.
54. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 장내세균과(Enterobacteriaceae), 바실러스과(Bacillaceae), 유산균과(Lactobacillaceae) 및 코리네박테리움과(Corynebacteriaceae)로 이루어진 군으로부터 선택된 과(family)의 세균인, 세균.
55. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스과 및 코리네박테리움과로 이루어진 군으로부터 선택된 과의 세균인, 세균.
56. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스과의 세균인, 세균.
57. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 코리네박테리움과의 세균인, 세균.
58. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스(Bacillus), 락토코커스(Lactococcus), 락토바실러스(Lactobacillus), 클로스트리듐(Clostridium), 코리네박테리움(Corynebacterium), 지오바실러스(Geobacillus), 써모안에어로박테리움(Thermoanaerobacterium), 스트렙토코커스(Streptococcus), 에스체리치아(Escherichia), 쉬겔라(Shigella), 아시네토박터(Acinetobacter), 시트로박터(Citrobacter), 살모넬라(Salmonella), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 클루이베라(Kluyvera), 세라티아(Serratia), 세데세아(Cedecea), 모르가넬라(Morganella), 하프니아(Hafnia), 에드워드시엘라(Edwardsiella), 프로비덴시아(Providencia), 프로테우스(Proteus) 또는 예르시니아(Yersinia) 속의 세균인, 세균.
59. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스 또는 코리네박테리움 속의 세균인, 세균.
60. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스 속의 세균인, 세균.
61. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 코리네박테리움 속의 세균인, 세균.
62. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스 서브틸리스(Bacillus subtilis)인, 세균.
63. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 코리네박테리움 스테이셔니스(Corynebacterium stationis)인, 세균.
64. 적합한 배양 배지에서 적합한 배양 조건 하에서 항목 1 내지 항목 63 중 어느 하나에 따른 세균을 배양하는 단계를 포함하는, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.
65. 항목 64에 있어서, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 트랜스-제아틴(tZ), 트랜스-제아틴 리보사이드(tZR), N 6 -(D2-아이소펜테닐)아데닌(iP), N(6)-(다이메틸알릴)아데노신(iPR), 다이하이드로제아틴(DZ), 리보실 다이하이드로제아틴(DZR) 및 이들의 조합으로 이루어진 군으로부터 선택된, 방법.
66. 항목 65에 있어서, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 각각 트랜스-제아틴(tZ) 및 트랜스-제아틴 리보사이드(tZR)인, 방법.
67. 항목 64에 있어서, 방법은 트랜스-제아틴(tZ)을 생산하기 위한 것인, 방법.
도 1: 아이소프레노이드 사이토키닌: A) 리보사이드: N 6 -(D2-아이소펜테닐)아데닌 리보사이드(iPR), 트랜스-제아틴 리보사이드(tZR), 시스-제아틴 리보사이드(cZR) 및 다이하이드로제아틴 리보사이드(DZR). B) 유리 염기: N 6 -(D2-아이소펜테닐)아데닌(iP), 트랜스-제아틴(tZ), 시스-제아틴(cZ) 및 다이하이드로제아틴(DZ).
도 2: MEP 대사 경로의 개략도.
도 3: IPT(EC 2.5.1.27) 및 LOG(EC 3.2.2.n1)의 이종 발현을 사용한 아이소프레노이드 사이토키닌 생합성 경로.
도 4: 진탕기-규모의 실험에서 바실러스 서브틸리스 균주의 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB14, TZAB15 - IPT-LOG.
도 5: 황산 아데닌을 사용한 진탕기-규모 실험에서 바실러스 서브틸리스 균주의 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB14 - IPT-LOG.
도 6: 진탕기-규모 실험에서 IPT 및 LOG 유전자 및 DXS 유전자가 있는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB15 - IPT-LOG, TZAB43 - IPT-LOG-DXS.
도 7: 진탕기-규모 실험에서 28시간 후 IPT(서열번호 1) 및 LOG(서열번호 34) 또는 IPT(서열번호 2) 및 LOG(서열번호 34)를 발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB1, TZAB2, TZAB3, TZAB4 - IPT(서열번호 2) 및 LOG(서열번호 34)가 있는 균주, TZAB14, TZAB15 - IPT(서열번호 1) 및 LOG(서열번호 34)가 있는 균주.
도 8: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 24시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 168에서의 사이토키닌의 생산.
도 9: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 18시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 RB50에서의 사이토키닌의 생산.
도 10: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 24시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 VKPM B2116에서의 사이토키닌의 생산.
도 11: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 10시간 후 DXS(서열번호 63)를 과발현하는 대장균 균주 BL21(DE3)에서의 사이토키닌의 생산.
도 12: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 48시간 후 DXS(서열번호 63)를 과발현하는 코리네박테리움 스테이셔니스에서의 사이토키닌의 생산.
도 13: 진탕기-규모 실험에서 18시간 후 다양한 IPT(서열번호 1, 서열번호 6, 서열번호 7 및 서열번호 9)와의 조합으로 LOG8(서열번호 41)을 발현하는 바실러스 서브틸리스 균주에서의 사이토키닌의 생산.
도 14: 진탕기-규모 실험에서 18시간 후 다양한 LOG(서열번호 34 내지 44)와의 조합으로 IPT(서열번호 1)를 발현하는 바실러스 서브틸리스 균주에서의 사이토키닌의 생산.
이하 본 발명을 보다 상세하게 설명한다.
도 2: MEP 대사 경로의 개략도.
도 3: IPT(EC 2.5.1.27) 및 LOG(EC 3.2.2.n1)의 이종 발현을 사용한 아이소프레노이드 사이토키닌 생합성 경로.
도 4: 진탕기-규모의 실험에서 바실러스 서브틸리스 균주의 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB14, TZAB15 - IPT-LOG.
도 5: 황산 아데닌을 사용한 진탕기-규모 실험에서 바실러스 서브틸리스 균주의 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB14 - IPT-LOG.
도 6: 진탕기-규모 실험에서 IPT 및 LOG 유전자 및 DXS 유전자가 있는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB15 - IPT-LOG, TZAB43 - IPT-LOG-DXS.
도 7: 진탕기-규모 실험에서 28시간 후 IPT(서열번호 1) 및 LOG(서열번호 34) 또는 IPT(서열번호 2) 및 LOG(서열번호 34)를 발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB1, TZAB2, TZAB3, TZAB4 - IPT(서열번호 2) 및 LOG(서열번호 34)가 있는 균주, TZAB14, TZAB15 - IPT(서열번호 1) 및 LOG(서열번호 34)가 있는 균주.
도 8: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 24시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 168에서의 사이토키닌의 생산.
도 9: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 18시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 RB50에서의 사이토키닌의 생산.
도 10: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 24시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 VKPM B2116에서의 사이토키닌의 생산.
도 11: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 10시간 후 DXS(서열번호 63)를 과발현하는 대장균 균주 BL21(DE3)에서의 사이토키닌의 생산.
도 12: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 48시간 후 DXS(서열번호 63)를 과발현하는 코리네박테리움 스테이셔니스에서의 사이토키닌의 생산.
도 13: 진탕기-규모 실험에서 18시간 후 다양한 IPT(서열번호 1, 서열번호 6, 서열번호 7 및 서열번호 9)와의 조합으로 LOG8(서열번호 41)을 발현하는 바실러스 서브틸리스 균주에서의 사이토키닌의 생산.
도 14: 진탕기-규모 실험에서 18시간 후 다양한 LOG(서열번호 34 내지 44)와의 조합으로 IPT(서열번호 1)를 발현하는 바실러스 서브틸리스 균주에서의 사이토키닌의 생산.
이하 본 발명을 보다 상세하게 설명한다.
본 명세서에서 특별히 정의하지 않는 한, 사용된 모든 기술적 용어 및 과학적 용어는 생화학, 유전학 및 미생물학 분야의 숙련된 기술자가 일반적으로 이해하는 것과 같은 의미를 갖는다.
본 명세서에 기술된 것과 유사하거나 동등한 모든 방법 및 재료가, 본 명세서에 기술된 적합한 방법 및 재료와 함께, 본 발명을 실행하거나 시험하는데 사용될 수 있다. 본 명세서에 언급된 모든 공개 문헌, 특허 출원, 특허 및 다른 참고 문헌들은 그 전체가 참조에 의해 원용된다. 상충하는 경우, 정의를 포함하여, 본 명세서가 우선될 것이다. 또한, 재료, 방법 및 실시예는 단지 예시일 뿐이며, 달리 명시되지 않는 한, 제한하려는 의도가 아니다.
본 발명의 실행은, 달리 나타내지 않은 한, 이 분야의 기술 내에 있는, 세포 생물학, 세포 배양, 분자 생물학, 유전자 이식 생물학, 미생물학 및 재조합 DNA의 통상적인 기술을 사용할 것이다. 이러한 기술들은 문헌에 충분히 설명되어 있다. 예를 들어, 문헌[Current Protocols in Molecular Biology(Frederick M. AUSUBEL, 2000, Wiley and son Inc, Library of Congress, USA)]; 문헌[Molecular Cloning: A Laboratory Manual, Third Edition(Sambrook et al, 2001, Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press)]; 문헌[Oligonucleotide Synthesis(M. J. Gait ed., 1984)]; Mullis 등의 미국 특허 제4,683,195호; 문헌[Nucleic Acid Hybridization(B. D. Harries & S. J. Higgins eds. 1984)]; 문헌[Transcription And Translation(B. D. Hames & S. J. Higgins eds. 1984)]; 문헌[Culture Of Animal Cells(R. I. Freshney, Alan R. Liss, Inc., 1987)]; 문헌[Immobilized Cells And Enzymes(IRL Press, 1986)]; 문헌[B. Perbal, A Practical Guide To Molecular Cloning(1984)]; 문헌[the series, Methods In ENZYMOLOGY(J. Abelson and M. Simon, eds.-in-chief, Academic Press, Inc., New York)], specifically, Vols.154 and 155 (Wu et al. eds.) and Vol. 185, "Gene Expression Technology" (D. Goeddel, ed.)]을 참고할 수 있다.
발명의 세균
위에 나타낸 바와 같이, 본 발명자들은 조작된 세균 균주로서, a) 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 선택적으로 b) 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 조작된 세균 균주를 갖는다. 실시예에 나타난 바와 같이, 이러한 조작된 세균 균주는 놀랍게도 상등액에서 10㎎/ℓ를 초과하는 비정상적으로 높은 역가의 아이소프레노이드 사이토키닌을 나타낸다. 결과적으로, 이것은 식물 세포 감염이 더 이상 필요하지 않으며 tZ 및 iP와 같은 아이소프레노이드 사이토키닌 및 이들의 리보사이드인 tZR 및 iPR의 효율적인 생합성을 위한 생합성 기질 및 보조인자가 조작된 세균 세포에 의해 효과적으로 공급됨을 의미한다.
따라서 본 발명은 첫 번째 양상에서 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 세균을 제공한다. 보다 구체적으로, 본 발명은 세균으로서, a) 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 선택적으로 b) 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 세균을 제공한다.
아데닐레이트 아이소펜테닐 전이효소(IPT)는 드노보 사이토키닌 생합성 경로에서 첫 번째 단계로서 아데노신 5'-인산(AMP, ADP 또는 ATP)을 다이메틸알릴 이인산(DMAPP) 또는 1-하이드록시-2-메틸-2-부테닐 4-이인산(HMBDP)으로 N-프레닐화(N-prenylation)하는 것을 촉매하는 잘 정의된 분류의 효소이다. 여기에는 두 가지 유형의 IPT(EC 2.5.1.27 및 EC 2.5.1.112)가 있다. IPT 효소는 세균과 식물에 존재한다. 두 가지 IPT 동족체인 Tzs 및 Tmr을 함유하는 아그로박테리움의 것과 같은 세균의 IPT는 프레닐 수용체로서 AMP를 사용하고 공여체로서 HMBDP 또는 DMAPP를 사용한다(EC 2.5.1.27). HMBDP를 사용한 반응 산물은 tZ-뉴클레오타이드이다. 또한, 세균의 IPT는 단백질 패밀리 및 도메인의 Pfam 데이터베이스(https://pfam.xfam.org/family/ipt)에서 Pfam 패밀리 IPT(PF01745)에 속한다. IPT Pfam 도메인 유전자들은 계통발생적으로 산재되어 있고 방선균(Actinobacteria), 남세균(Cyanobacteria), 알파-프로테오박테리아(α-Proteobacteria), 베타-프로테오박테리아(β-Proteobacteria) 및 감마-프로테오박테리아(γ-Proteobacteria)의 일부 구성원에서 그리고 진핵생물인 딕티오스텔리움 디스코이데움(Dictyostelium discoideum)에서만 발견된다(Nishii et al., 2018). 보다 고등생물인 식물의 IPT는 프레닐 수용체로서 ATP 또는 ADP를 주로 사용하고 공여체로서 DMAPP를 주로 사용하며(EC 2.5.1.112) Pfam 패밀리 IPPT(PF01715)에 속한다(https://pfam.xfam.org/family/ippt). 반응 산물은 iP이며, 이후 프레닐 측쇄에서 수산화되어 tZ-뉴클레오타이드가 된다.
아그로박테리움 투메파시엔스의 Tzs(IPT(PF01745); EC 2.5.1.27; 서열번호 1)는 3개의 알파-헬릭스(알파1 내지 알파3)로 둘러쌓인 5가닥 평행 베타-시트가 있는 N-말단 도메인 및 5개의 알파 헬릭스(알파4 내지 알파8)가 있는 C-말단 도메인의 2개의 도메인으로 이루어진다. N-말단 도메인은 뉴클레오타이드-결합 p 루프 모티프 Gly-8-Pro-Thr-Cys-Ser-Gly-Lys-Thr-15를 함유하고, p 루프-함유 뉴클레오사이드 삼인산 가수분해효소(pNTPase) 슈퍼패밀리와 구조적으로 연관된다. 알파8의 C-말단 측면은 N-말단까지 연장되어 부착된다. 도메인들 사이의 경계부는 AMP에 결합하는 용매-접근가능한 통로를 형성한다. AMP의 프레닐화 부위는 Asp-33 및 Ser-45에 결합한다. DMAPP는 Asp-173, Tyr-211 및 His-214에 결합된다. Thr-10, Asp-33 및 Arg-138은 IPT들 사이에 완전히 보존되어 있다. Tzs에서, 측쇄에 의해 형성되는 친수성 영역은 프레닐-공여체 기질의 수산기의 존재 또는 부재를 구별하는 기질-결합 포켓 내 2개의 중요한 아미노산 잔기인 His-214 및 Asp-173을 함유하며, 이는 HMBDP의 사용을 가능하게 한다(Sugawara et al. 2008).
일반적으로, 본 발명에 따라 사용되는 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 세균에 대해 이종성일 것이며, 이는 상기 폴리펩타이드가 일반적으로는 상기 세균에서 발견되거나 상기 세균에 의해 만들어지지(즉, 발현되지) 않지만, 다른 종에서 유래됨을 의미한다. 또한, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 Pfam 패밀리 IPT(PF01745)의 구성원에서 유래하거나 이에 상응하며, 바람직하게는 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 세균성 폴리펩타이드이다. "아데닐레이트 아이소펜테닐 전이효소 활성이 있는 세균성 폴리펩타이드"는 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드가 아그로박테리움 투메파시엔스와 같은 세균에서 유래됨을 의미한다.
tZ, iP, tZR 및 iPR을 포함하는 아이소프레노이드 사이토키닌의 생합성에 가장 적합한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 아그로박테리움 투메파시엔스의 Tzs 또는 Tmr과 같이 프레닐 공여체로서 HMBDP 및 DMAPP 모두를 사용할 수 있는 효소이다. 또한, 이들은 Pfam 패밀리 IPT(PF01745)에 속하고 서열번호 1의 173번 위치와 동등한 위치에 Asp 잔기를 함유하고/함유하거나 서열번호 1의 211번 위치와 동등한 위치에 Tyr 잔기를 함유하고/함유하거나 서열번호 1의 214번 위치와 동등한 위치에 His 잔기를 함유한다.
본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.
본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.
본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 85%, 예를 들어 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.
본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.
본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 85%, 예를 들어 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열을 포함한다.
아데닐레이트 아이소펜테닐 전이효소 활성을 결정하기 위한 기술은 기술자에게 잘 알려져 있다. 예시적인 방법이 예를 들어 문헌[Takei, Sakakibara 및 Sugiyama(2001)] 및 문헌[ et al(2015)]에 기술되어 있다. 아데닐레이트 아이소펜테닐 전이효소 활성은 예를 들어 다음의 분석법들 중 임의의 방법에 따라 결정될 수 있다:
(1) 25℃에서 20분 동안 1mM AMP 및 340μM DMAPP가 있는 반응 혼합물(1M 베타인, 20mM 트라이에탄올아민, 50mM KCl, 10mM MgCl2, 1mM 다이티오트레이톨, 1㎎/㎖ 소 혈청 알부민, pH 8.0)에서 효소를 인큐베이션한다. 1/4부피의 10% 아세테이트를 첨가하여 반응을 중지하고 18,000×g에서 20분 동안 원심분리한다. 생성되는 상등액에 대한 사이토키닌 분석을 수행한다. 1유닛의 IPT 활성은 반응 조건 하에서 분당 1μmol의 iPMP를 생산하는 효소의 양으로 정의된다(Takei, Sakakibara, and Sugiyama 2001).
(2) 기질로서 100μM AMP 및 100μM DMAPP(Echelon BioSciences, 미국 유타주 솔트레이크시티 소재)가 있고 100㎕의 정제된 효소가 있는 200㎕의 반응 혼합물(10mM MgCl2 함유, 100mM Tris/HCl 완충액, pH 7.5)에서 25℃에서 밤새도록 활성 분석을 수행한다. IPT의 기질 선호도를 평가하기 위해, ADP 또는 ATP를 아이소프렌 사슬 수용 기질로 사용하고, 아이소펜테닐 이인산 또는 HMBPP(Echelon Bioscences)를 아이소프렌 사슬 제공 기질로 사용한다. 아이소프레노이드 기질을 첨가하여 반응을 개시하고 95℃에서 5분 동안 가열하여 효소를 비활성화하여 반응을 중지한다. IPT 활성 분석법은 268㎚에서의 UV 검출을 사용한 HPLC 또는 모세관 전기영동법으로 반응산물을 결정하는 것을 기반으로 한다. 사이토키닌 리보사이드 및 해당 일인산염은 Alliance 2695 고성능 액체 크로마토그래프(Waters)에 연결된 Symmetry C18 칼럼(2.1×150㎜, 5㎛; Waters, 미국 매사추세츠주 밀퍼드 소재) 상에서 결정한다. 다음의 용매 혼합을 사용하여 15mM 포름산 암모늄(pH 4.0)(A) 및 메탄올(B)의 선형 구배로 칼럼을 용출하였다: 0 내지 25분, 5 내지 60% B, 25 내지 26분, 60 내지 100% B, 26 내지 27분 100% B. 올리고뉴클레오타이드 가수분해물의 분석을 위해 15mM 포름산 암모늄(pH 4.0)(A) 및 아세토니트릴(B)의 선형 구배를 사용하였다(0 내지 30분, 5 내지 24% B, 30 내지 31분, 24 내지 100% B). 유속은 0.25㎖/분이고 칼럼 온도는 30℃이다. 정품 표준 화합물(Olchemim, 체코 올로모우츠 소재)을 사용한 검량 곡선법으로 산물의 농도를 결정한다. 사이토키닌 이인산 및 삼인산의 결정을 위해 모세관 전기영동을 사용한다( et al, 2015).
아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 것 이외에, 본 발명의 세균은 선택적으로 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 (추가) 변형될 수 있다.
따라서, 일부 실시형태에 따르면, 본 발명의 세균은 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형되어 있다.
"단백질 발현이 증가"는 이렇게 변형된 세균에 의해 생산된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 보다 구체적으로, "단백질 발현이 증가"는 이렇게 변형된 세균에 의해 생산된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포 내 단백질의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.
단백질 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 단백질 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 유전자를 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시켜 달성할 수 있다.
또한 단백질 발현의 증가는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 유전자의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다.
또한 단백질 발현의 증가는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시켜, 예를 들어 본래의 프로모터를 이 프로모터와 비교하여 폴리펩타이드의 더 높은 발현 및 과생성을 가능하게 하는 프로모터로 대체하여, 달성할 수 있다. 사용할 수 있는 프로모터에는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7, ParaBAD, Plac, Ptac 및 Ptrc, 및 코리네파지(corynephage) BFK20에서 유래한 P F1 프로모터가 포함된다.
또한 단백질 발현의 증가는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.
일부 실시형태에 따르면, 유전자 카피수의 증가는 숙주 세포에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상(예를 들어 둘 또는 셋)의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하여 달성할 수 있다.
일부 실시형태에 따르면, 본 발명의 세균은 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 하나 이상(예를 들어 둘, 셋 또는 넷)의 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함한다. 적합하게는, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함한다. 일부 실시형태에 따르면, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합된다.
사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제로서의 효소적 기능이 있는 사이토키닌-활성화 효소이다. Lonely Guy(LOG) 단백질로도 지칭되는 이러한 펩타이드는 다양한 유기체의 게놈에 암호화되어 있으며, 대부분의 LOG 단백질은 원핵생물의 것이다. 생화학적 및 기능적 연구를 통해 벼(Oryza sativa), 애기장대(Arabidopsis thaliana), 맥각병균(Claviceps purpurea), 결핵균(Mycobacterium tuberculosis) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)과 같은 몇몇 유기체의 효소가 LOG로 특성화되었다. LOG 단백질은 본래 식물호르몬-활성화 식물 효소로 특성화되었으나, 실험적 증거없이 세균성 LOG 동족체가 추정 라이신 탈탄산효소(lysine decarboxylase: LDC)로 잘못 지정되었다. 이들의 실제 효소 활성은 최근에 코리네박테리움 글루타미쿰 동족체의 기능적 분석을 통해 확인되었다(Seo et al. 2016). 이량체성 I형 LOG와 육량체성 II형 LOG의 두 가지 유형의 LOG 단백질이 세균에서 확인되었다. II형 LOG 단백질은 서로 다른 올리고머 상태와 프레닐-결합 부위에 서로 다른 잔기를 갖는다. I형 LOG는 Ia형과 Ib형의 두 가지 하위군으로 더 나뉠 수 있다. Ia형은 대부분의 유기체의 이량체성 LOG를 포함하고, Ib형은 방선균류(Actinomycetales)의 이량체성 LOG를 포함한다. II형 LOG는 대부분의 유기체의 육량체성 LOG를 포함하는 IIa형과 보다 고등 식물의 LOG를 포함하는 IIb형으로 나뉜다(Seo and Kim 2017).
LOG 단백질은 iPRMP 또는 트랜스-제아틴 리보사이드 5'-일인산(tZRMP)과 같은 사이토키닌 전구체에서 N 6 -치환된 염기 및 리보스 5'-일인산 사이의 결합을 가수분해하는 탈포스포리보실화(dephosphoribosylation)를 통해 활성 사이토키닌을 생산한다. 코리네박테리움 글루타미쿰의 LOG는 8개의 알파-헬릭스에 의해 둘러쌓인 7개의 평행한 베타-가닥으로 형성된 중앙 베타-시트가 있는 2개의 동일한 단량체로 구성된다. LOG 단백질은 활성 부위의 형성에 기여하는 "PGGXGTXXE" 모티프를 함유한다. 활성 부위는 이량체의 포켓에 형성되며, 보존된 "PGGXGTXXE" 모티프는 포켓의 표면에 있다. "PGGXGTXXE" 모티프는 뉴클레오타이드-결합 부위이며, 보존된 잔기는 결합된 AMP를 안정화한다(Seo et al. 2016). 이 모티프는 모든 LOG 효소에서 고도로 보존되어 있다(Seo and Kim 2017).
사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래될 수 있거나 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)될 수 있다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래된다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 이것이 발현되는 것과 다른 종에서 유래된다(즉, 이종성).
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 세균성 폴리펩타이드이다. "사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 세균성 폴리펩타이드"는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드가 자연적으로 코리네박테리움 글루타미쿰과 같은 세균에서 유래됨을 의미한다.
본 발명에 따른 사용을 위한 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드일 수 있다.
본 발명에 따른 사용을 위한 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드일 수 있다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 34의 아미노산 서열 또는 서열번호 34와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 34의 아미노산 서열 또는 서열번호 34와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 34의 아미노산 서열 또는 서열번호 34와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 34의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 35의 아미노산 서열 또는 서열번호 35와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 35의 아미노산 서열 또는 서열번호 35와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 35의 아미노산 서열 또는 서열번호 35와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 35의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 36의 아미노산 서열 또는 서열번호 36과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 36의 아미노산 서열 또는 서열번호 36과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 36의 아미노산 서열 또는 서열번호 36과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 36의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 37의 아미노산 서열 또는 서열번호 37과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 37의 아미노산 서열 또는 서열번호 37과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 37의 아미노산 서열 또는 서열번호 37과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 37의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 38의 아미노산 서열 또는 서열번호 38과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 38의 아미노산 서열 또는 서열번호 38과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 38의 아미노산 서열 또는 서열번호 38과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 38의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 39의 아미노산 서열 또는 서열번호 39와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 39의 아미노산 서열 또는 서열번호 39와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 39의 아미노산 서열 또는 서열번호 39와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 39의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 40의 아미노산 서열 또는 서열번호 40과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 40의 아미노산 서열 또는 서열번호 40과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 40의 아미노산 서열 또는 서열번호 40과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 40의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 41의 아미노산 서열 또는 서열번호 41과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 41의 아미노산 서열 또는 서열번호 41과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 41의 아미노산 서열 또는 서열번호 41과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 41의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 42의 아미노산 서열 또는 서열번호 42와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 42의 아미노산 서열 또는 서열번호 42와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 42의 아미노산 서열 또는 서열번호 42와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 42의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 43의 아미노산 서열 또는 서열번호 43과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 43의 아미노산 서열 또는 서열번호 43과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 43의 아미노산 서열 또는 서열번호 43과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 43의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 44의 아미노산 서열 또는 서열번호 44와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 44의 아미노산 서열 또는 서열번호 44와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 44의 아미노산 서열 또는 서열번호 44와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 44의 아미노산 서열을 포함한다.
사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성을 결정하기 위한 기술은 기술자에게 잘 알려져 있다. 예시적인 방법이 예를 들어 문헌[Seo et al.(2016)]에 기술되어 있다. 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성은 예를 들어 다음의 방법에 따라 결정될 수 있다:
박층 크로마토그래피(TLC) 방법으로 분리된 아데닌 고리 화합물을 검출하여 포스포리보하이드롤라제 활성을 결정한다. 30℃에서 20mM AMP, 36mM Tris-HCl(pH 8.0) 및 23μM 정제 효소의 혼합물에서 효소 반응을 수행한 다음 혼합물을 95℃에서 1.5분 동안 가열하여 반응을 중지한다. 이후 PEI-셀룰로스-F 플라스틱 TLC 시트(Merck Millipore) 상에 반응 혼합물로 점을 찍는다. 이동상은 1M 염화나트륨이다. TLC 챔버에서 전개 후, 시트를 완전히 건조시킨다. UV 램프(290㎚)로 아데닌 고리-포함 화합물을 검출한다(Seo et al. 2016).
아이소프레노이드 사이토키닌의 아이소펜테닐 측쇄 전구체의 공급을 증가시키기 위해, 메틸에리스리톨 4-인산(MEP) 경로를 통한 대사 흐름을 증가시킬 수 있다. 이는 주로 1-데옥시-D-자일룰로스 5-인산(DXP) 합성효소(DXS)의 과발현을 통해 달성할 수 있다.
따라서, 일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 (추가) 변형된 것을 특징으로 한다.
"단백질 발현이 증가"는 이렇게 변형된 세균에 의해 생산된 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 보다 구체적으로, "단백질 발현이 증가"는 이렇게 변형된 세균에 의해 생산된 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포 내 단백질의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.
단백질 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 단백질 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 유전자 또는 유전자들을 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 유전자 또는 유전자들의 카피수를 증가시켜 달성할 수 있다.
또한 단백질 발현의 증가는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 유전자의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다.
또한 단백질 발현의 증가는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시켜, 예를 들어 본래의 프로모터를 이 프로모터와 비교하여 폴리펩타이드의 더 높은 발현 및 과생성을 가능하게 하는 프로모터로 대체하여, 달성할 수 있다. 사용할 수 있는 프로모터에는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7, ParaBAD, Plac, Ptac 및 Ptrc, 및 코리네파지(corynephage) BFK20에서 유래한 P F1 프로모터가 포함된다.
또한 단백질 발현의 증가는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.
일부 실시형태에 따르면, 유전자 카피수의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상(예를 들어 둘 또는 셋)의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하여 달성할 수 있다.
일부 실시형태에 따르면, 본 발명의 세균은 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 하나 이상(예를 들어 둘, 셋 또는 넷)의 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함한다. 적합하게는, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함한다. 일부 실시형태에 따르면, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합된다.
1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 D-글리세르알데하이드 3-인산과 피루브산 사이의 축합을 촉매하여 1-데옥시-D-자일룰로스 5-인산(DXP)을 생산하는 효소(DXS; E.C. 2.2.1.7)이다. DXS는 메틸에리스리톨 인산(MEP) 경로에서 HMBDP 및 DMAPP의 아이소프레노이드 생합성의 첫 번째 효소적 단계를 촉매하며, kcat/Km값이 이 경로의 다른 효소에 대한 것보다 상당히 낮다(Kuzuyama et al. 2000). DXS는 진정세균에서 단일 카피로 존재하지만, 녹조류 및 보다 고등 식물은 DXS를 암호화하는 둘 이상의 유전자를 가지며, 이는 3개의 구별가능한 군을 형성한다. 보다 고등 식물에서, 별개의 DXS 동종효소의 발현은 조직의 유형 및 발달 단계에 따른다.
DXS는 세균과 식물에서 고도로 보존되어 있다. 이의 단백질 서열은 트랜스케톨라제(transketolase) 및 피루브산 탈수소효소 E1 서브유닛과 약 20%의 동일성을 갖는다. 세 가지 효소 모두 유사한 반응을 촉매하며 조효소 티아민 피로인산(thiamine pyrophosphate: TPP)을 필요로 한다. 대장균의 DXS는 트랜스케톨라제 및 피루브산 탈수소효소의 E1 서브유닛의 동등한 도메인에 상동적인 3개의 도메인(I, II 및 III)을 함유한다. 2개의 DXS 단량체들은 이량체에 나란히 배열된다. 도메인 I(1 내지 319번 잔기)은 같은 단량체의 도메인 II(320 내지 495번 잔기) 및 III(496 내지 629번 잔기)의 위에 있다. 3개의 도메인 모두 α 헬릭스 사이에 대부분 평행한 β-시트인 중심이 있는 α/β 폴드(fold)를 갖는다. 도메인 I은 다섯-가닥의 평행한 β-시트를 함유하고, 도메인 II는 여섯-가닥의 평행한 β-시트를 함유하고, 도메인 III은 첫 번째 가닥이 다른 4개의 가닥에 역-평행인 다섯-가닥의 β-시트를 함유한다. 도메인 I은 N-말단에(1 내지 49번 잔기), 첫 번째 가닥 뒤에(81 내지 122번 잔기), 그리고 네 번째 및 다섯 번째 가닥 사이의 연결부에(184 내지 250번 잔기) 여러 개의 확장된 표면 부분을 갖는다.
DXS의 활성 부위는 같은 단량체에서 도메인 I과 II의 경계부에 위치한다. 두 도메인의 중앙 평행 β-시트의 C-말단 끝은 서로를 향하며, TPP 조효소는 이 경계부에서 포켓의 아래 쪽에 위치한다. TPP의 아미노-피리미딘 고리는 도메인 II와 상호작용하며, 피로인산기는 도메인 I과 상호작용한다. 티아졸륨 고리의 C2 원자는 기질-결합 부위에 노출된다. C2 원자는 반응에 참여한다. TPP의 피로인산기는 효소와 수많은 극성 상호작용을 한다. 활성 부위는 두 개의 인산기와 Asp154, Asn183 및 Met185의 측쇄들 사이에 결합된 마그네슘 이온으로 이루어진다. DXS에서 Gly153-Asp-Gly155-Asn183 서열은 TPP 결합 모티프 ≫GDG-X(25-30)-N≪과 일치한다. C2는 피루브산-결합 부위를 구성한다. GAP는 포켓에 위치한다(Xiang et al., 2007).
몇몇 연구에서 DXP의 형성이 MEP 경로의 제한 단계임을 나타내므로, DXS 활성을 증가시키는 것은 바실러스 서브틸리스를 포함하여(Yang et al. 2019) 많은 종에서 터페노이드 생합성을 위한 가장 효과적인 전략으로 이식된다. 대장균과 데이노코커스 라디오두란스(Deinococcus radiodurans)의 Dxs에서 단일 아미노산의 돌연변이는 촉매 활성을 증가시켰다. 대장균 Dxs의 Y392F 돌연변이는 야생형과 비교하여 2.5배 초과로 상대적 촉매 활성을 증가시켰다(Xiang et al. 2012). DXS는 MEP 경로의 최종 산물인 IPP와 DMAPP에 의한 음성적 피드백 메커니즘에 의해 조절된다(Banerjee et al. 2013). DXS는 IPP와 DMAPP의 음성적 피드백 억제를 완화하기 위한 부위-특이적 돌연변이의 대상이었다. 검은 미루나무(Populus trichocarpa)의 DXS의 A147G/A352G 돌연변이는 이의 IPP 결합 친화성을 약간 감소시켰지만, TPP 및 피루브산에 대한 Km을 증가시켰으며, 효소의 촉매 효율을 약 15-배 감소시켰다(Banerjee et al., 2016). DXS 이외 경로의 몇몇 다른 효소들의 과발현 또한 다른 세균에서 혼합된 결과와 함께 시험이 이루어졌다. 또한, 인공 오페론(오페론 dxs-ispD-ispF-ispH 및 ispC/dxr-ispE-ispG-ispA)으로서 전체 MEP 경로의 과발현 또한 바실러스 서브틸리스에서 시험이 이루어졌다(Xue et al. 2015).
1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래할 수 있거나 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)할 수 있다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)한다.
바람직하게는, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 세균성 폴리펩타이드이다. "1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 세균성 폴리펩타이드"는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드가 바실러스 서브틸리스와 같은 세균으로부터 자연적으로 유래함을 의미한다.
본 발명에 따른 사용을 위한 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드일 수 있다.
일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 63의 아미노산 서열 또는 서열번호 63과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 63의 아미노산 서열 또는 서열번호 63과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 63의 아미노산 서열 또는 서열번호 63과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 63의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 64의 아미노산 서열 또는 서열번호 64와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 64의 아미노산 서열 또는 서열번호 64와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 64의 아미노산 서열 또는 서열번호 64와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 64의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 65의 아미노산 서열 또는 서열번호 65와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 65의 아미노산 서열 또는 서열번호 65와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 65의 아미노산 서열 또는 서열번호 65와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 65의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 66의 아미노산 서열 또는 서열번호 66과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 66의 아미노산 서열 또는 서열번호 66과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 66의 아미노산 서열 또는 서열번호 66과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 66의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 67의 아미노산 서열 또는 서열번호 67과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 67의 아미노산 서열 또는 서열번호 67과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 67의 아미노산 서열 또는 서열번호 67과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 67의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 68의 아미노산 서열 또는 서열번호 68과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 68의 아미노산 서열 또는 서열번호 68과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 68의 아미노산 서열 또는 서열번호 68과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 68의 아미노산 서열을 포함한다.
위에 언급된 바와 같이, 야생형 DXS 서열의 변형은 촉매 활성을 증가시킬 수 있다. 따라서 본 발명은 특히 이것이 유래된 야생형 DXS 효소와 비교하여 증가된 활성 또는 불활성화된 음성적 피드백 메커니즘을 갖는 돌연변이 DXS의 사용을 고려한다. 이러한 돌연변이 DXS 효소의 비-제한적 예시에는 서열번호 69 및 70에 제시된 것들이 있다.
일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 69의 아미노산 서열 또는, 392번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 392번 위치의 아미노산이 F라는 조건으로, 서열번호 69와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 69의 아미노산 서열 또는, 392번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 392번 위치의 아미노산이 F라는 조건으로, 서열번호 69와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 69의 아미노산 서열 또는, 392번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 392번 위치의 아미노산이 F라는 조건으로, 서열번호 69와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 69의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 70의 아미노산 서열 또는, 389번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 389번 위치의 아미노산이 F라는 조건으로, 서열번호 70과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 70의 아미노산 서열 또는, 389번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 389번 위치의 아미노산이 F라는 조건으로, 서열번호 70과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 70의 아미노산 서열 또는, 389번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 389번 위치의 아미노산이 F라는 조건으로, 서열번호 70과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 70의 아미노산 서열을 포함한다.
1-데옥시-D-자일룰로스-5-인산 합성효소 활성을 결정하기 위한 기술은 기술자에게 잘 알려져 있다. 예시적인 방법은 예를 들어 문헌[Kuzuyama et al(2000)] 및 문헌[Kudoh et al(2017)]에 기술되어 있다. 1-데옥시-D-자일룰로스-5-인산 합성효소 활성은 예를 들어 다음의 방법에 따라 결정할 수 있다:
(1) DXS 분석으로 1-데옥시-D-자일룰로스-5-인산 합성효소 활성을 결정한다(Kuzuyama et al., 2000): 표준 분석 시스템은 0.5㎖의 최종 부피에 1mM MgCl2, 2mM dl-다이티오트레이톨(dithiothreitol), 1mM 피루브산 나트륨, 2mM dl-글리세르알데하이드 3-인산(glyceraldehyde 3-phosphate) 및 150μM 티아민 이인산(thiamine diphosphate)을 함유하는 100mM Tris-HCl(pH 8.0)로 이루어진다. 37℃에서 완전 분석 혼합물에 효소 용액을 첨가하여 반응을 개시하고, 10분-인큐베이션 후, 1분 동안 100℃에서 인큐베이션하여 반응을 중단한다. 다음, 반응 혼합물을 60분 동안 56℃에서 알칼라인 포스파타제로 처리하여 반응 산물인 DXP를 완전히 탈인산화한다. 생성되는 탈인산화된 화합물인 1-데옥시자일룰로스(DX)의 생산을 Shodex KS-801(8×300㎜) 칼럼(Showa Denko)이 구비된 굴절률 분광기(모델 RI-71; Showa Denko, 일본 도쿄 소재)로 모니터하고, 80℃에서 1㎖/분의 유속으로 H2O로 용출시킨다. 이 조건 하에서 8.6분에 DX가 용출된다. 화학적으로 합성된 DX를 표준품으로 사용하여 DX 생산량을 정확하게 추산한다. 1유닛의 DXS 활성은 37℃에서 분당 1μmol의 DXP를 생산하는 효소의 양으로 정의한다. DXS에 의한 DXP의 생산을 Senshu Pak NH2-1251-N(4.6×250㎜) 칼럼(Senshu Science, 일본 도쿄 소재)을 사용하여 1㎖/분의 유속으로 100mM KH2PO4(pH 3.5)로 용출하면서 고성능 액체 크로마토그래피로 195㎚에서 모니터한다. 이 조건 하에서 DXP는 8.1분에 용출된다.
(2) DXS의 결합 효소 분석(Kudoh et al., 2017): 대장균의 DXR을 결합 효소로 사용한 결합 효소 분석을 사용하여 DXS 활성을 측정한다. 이 분석법에서, DXS 활성에 의해 생성되는 DXP는 추가로 MEP로 전환된다. 이 단계는 NADPH를 소모하기 때문에, 전체 반응을 340㎚에서 분광광도계로 측정할 수 있다. 분석 혼합물은 100mM Tris/HCl(pH 7.8), 10mM MgCl2, 0.3mM 티아민 피로인산(TPP), 1mM 다이티오트레이톨(DTT), 0.3mM 니코틴아마이드 아데닌 다이뉴클레오타이드 인산(NADPH), 다양한 농도의 피루브산 나트륨(0.05 내지 5mM) 및 D,L-GAP(0.2 내지 2.0mM) 및 DXR(100 또는 50㎎/㎖)을 함유한다. 혼합물을 온도-조절 분광광도계(모델 UV-1800, Shimadzu, 일본 쿄토 소재) 내에서 2분 동안 30℃에서 인큐베이션하고 DXS 시료를 첨가하여(최종 농도 50 또는 25㎎/㎖) 반응을 시작한다. 30℃에서 340㎚에서의 흡광도를 모니터하여 반응을 추적한다.
퓨린 뉴클레오타이드는 DNA와 RNA의 구조적 구성 요소, 에너지 운반체(즉, ATP 및 GTP), 효소 보조인자(즉, NAD+ 및 NADP+)이며, 세포 생리에 필수적인 대사산물이다. 퓨린 뉴클레오타이드의 합성은 D-리보스 5-인산과 ATP로부터 5'-포스포리보실-피로인산(PRPP)의 합성으로 시작된다. PRPP 합성효소(리보스-인산 다이포스포키나제; EC 2.7.6.1)는 D-리보스 5-인산에 ATP의 다이포스포릴기를 전달하는 것을 촉매하면서 동시에 AMP를 형성한다. PRPP 합성효소는 자유-생활하는 유기체들 사이에 어디에나 존재한다. 대부분의 세균은 PRPP 합성효소를 암호화하는 하나의 유전자를 가지며, 진핵생물에는 하나 초과의 유전자가 존재한다. 다음 단계는 바실러스 서브틸리스의 purF에 의해 암호화되는 글루타민 5-포스포리보실-1-피로인산(PRPP) 아미도전달효소(아미도포스포리보실전이효소; EC 2.4.2.14)에 의해 촉매되는 PRPP와 글루타민으로부터의 5-포스포-β-D-리보실아민의 합성이다. 이는 퓨린 드노보 합성의 속도-제한 반응이다. 5-포스포-β-D-리보실아민에서 이노신-5-인산(IMP)의 합성으로 이어지는 추가 10단계들은 pur 오페론에 암호화된 효소들에 의해 촉매된다. pur 오페론은 purR에 의해 암호화된 PurR 억제인자에 의해 전사 수준에서 그리고 영향받는 유전자들의 상류 제어 영역의 특정 DNA 서열인 PurBox에 의해 음성적으로 조절된다. IMP는 AMP와 GMP 합성의 분기점이다. AMP는 PurA와 PurB에 의해 촉매되는 두 개의 효소적 단계에서 IMP로부터 합성되며, GMP는 GuaB와 GuaA에 의해 IMP로부터 합성된다. 퓨린 합성의 효소들을 암호화하는 유전자들 또는 오페론들의 발현은 성장 배지 내 퓨린 염기 및 뉴클레오사이드에 의해 조절된다. PRPP 합성효소, PRPP 아미도전달효소, 아데닐로호박산 합성효소 및 IMP 탈수소효소는 경로의 최종 산물의 피드백 억제에 의해 조절된다. PurR 억제인자는 전사의 개시를 억제한다. 회수 경로(salvage pathway) 또한 하이포잔틴, 구아닌 및 아데닌을 사용하여 해당 모노뉴클레오타이드 AMP 및 GMP를 생성하는데 참여한다.
퓨린 뉴클레오타이드 생합성 경로는 일차 대사에서 퓨린 뉴클레오타이드의 역할 때문에 잘 연구되어 있다. 여기에는 드노보 합성 경로와 회수 경로 둘 다 포함된다. 전사 및 대사 수준에서 퓨린 뉴클레오타이드 생합성 경로의 조절 완화는 퓨린 뉴클레오타이드 생합성 경로를 통한 대사 흐름을 향상시켰으며 이에 따라 퓨린 뉴클레오타이드 생합성 경로에서 직접적으로 발생하는 산물(이노신, 구아노신, 아데노신 및 리보플라빈)의 수율을 증가시켰다. 퓨린 뉴클레오타이드 생합성 경로 산물의 수율을 높이기 위해 유전자 과발현, 유전자 결실 및 돌연변이에 의한 효소의 조절 완화를 포함한 다양한 변형이 성공적으로 사용되었다. 퓨린 흐름의 증가 상에서 양성적 효과가 있는 바실러스 서브틸리스 효소의 예시적인 변형이 아래 표 1에 나열되어 있다.
따라서, 일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소의 발현 및/또는 활성이 증가되도록 (추가) 변형된 것을 특징으로 한다.
일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 아데노신 일인산 생합성 경로에 관련된 적어도 하나의 효소의 발현 및/또는 활성이 증가되도록 (추가) 변형된 것을 특징으로 한다.
퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 효소)는 이것이 발현되는 세균과 같은 종에서 유래할 수 있거나 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)할 수 있다. 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 효소)는 이것이 발현되는 세균과 같은 종에서 유래한다. 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 효소)는 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)한다.
"단백질 발현 증가"는 이렇게 변형된 세균에 의해 생산된 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 보다 구체적으로, "발현 증가"는 이렇게 변형된 세균에 의해 생산된 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포 내 단백질의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.
단백질 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 단백질 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 생합성 경로에 관련된 효소)를 암호화하는 유전자를 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)를 암호화하는 유전자의 카피수를 증가시켜 달성할 수 있다.
또한 단백질 발현의 증가는 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)를 암호화하는 유전자의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다.
또한 단백질 발현의 증가는 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시켜, 예를 들어 본래의 프로모터를 이 프로모터와 비교하여 효소의 더 높은 발현 및 과생성을 가능하게 하는 프로모터로 대체하여, 달성할 수 있다. 사용할 수 있는 프로모터에는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7, ParaBAD, Plac, Ptac 및 Ptrc, 및 코리네파지 BFK20에서 유래한 P F1 프로모터가 포함된다.
또한 단백질 발현의 증가는 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.
일부 실시형태에 따르면, 유전자 카피수의 증가는 숙주 세포에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상(예를 들어 둘 또는 셋)의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하여 달성한다.
일부 실시형태에 따르면, 본 발명의 세균은 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)를 암호화하는 하나 이상(예를 들어 둘, 셋 또는 넷)의 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함한다. 적합하게는, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 퓨린 뉴클레오타이드 생합성 경로에 관련된 상기 효소(예를 들어, 아데노신 생합성 일인산 경로에 관련된 상기 효소)를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함한다. 일부 실시형태에 따르면, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합된다.
퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 포스포리보실아민-글라이신 리가제 활성이 있는 효소, 포스포리보실글라이신아마이드 포르밀전이효소 활성이 있는 효소, 포스포리보실포르밀글라이신아미딘 합성효소 활성이 있는 효소, 포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성이 있는 효소, N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성이 있는 효소, N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성이 있는 효소, 포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소, IMP 사이클로가수분해효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소, 아데닐산 키나제 활성이 있는 효소, ATP 합성효소 활성이 있는 효소, 아데노신 키나제 활성이 있는 효소, IMP 탈수소효소 활성이 있는 효소 및 GMP 합성효소 활성이 있는 효소로 이루어진 군으로부터 선택된 효소일 수 있다.
아데노신 일인산 생합성 경로에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 포스포리보실아민-글라이신 리가제 활성이 있는 효소, 포스포리보실글라이신아마이드 포르밀전이효소 활성이 있는 효소, 포스포리보실포르밀글라이신아미딘 합성효소 활성이 있는 효소, 포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성이 있는 효소, N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성이 있는 효소, N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성이 있는 효소, 포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소, IMP 사이클로가수분해효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소, 아데닐산 키나제 활성이 있는 효소, ATP 합성효소 활성이 있는 효소, 아데노신 키나제 활성이 있는 효소로 이루어진 군으로부터 선택된 효소일 수 있다.
일부 실시형태에 따르면, 퓨린 뉴클레오타이드 생합성 경로(예를 들어 아데노신 일인산 생합성 경로)에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소 및 아데노신 키나제 활성이 있는 효소로 이루어진 군으로부터 선택된다.
일부 실시형태에 따르면, 본 발명의 세균은 퓨린 뉴클레오타이드 생합성 경로에 관련된 하나 이상의 내인성 효소와 관련하여 표 1에 개시된 바와 같은 변형들 중 임의의 하나를 갖도록 (추가) 변형되었다. 특히, 세균은 문제의 효소의 억제인자에 저항하게 만드는 무작위 돌연변이 유발의 결과일 수 있다.
일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 (추가) 변형된 것을 특징으로 한다.
일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 발현이 감소되도록 변형될 수 있다.
일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 상기 적어도 하나의 내인성 효소를 암호화하는 내인성 유전자의 발현 수준이 감소되도록 변형될 수 있다. 내인성 유전자의 발현 수준은 예를 들어 다른 동일한 세균과 비교하여 적어도 50%, 예를 들어 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 감소될 수 있다.
일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 예를 들어 일부 또는 전체 유전자 서열의 결실에 의해 비활성화된다.
일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 상기 효소를 암호화하는 내인성 유전자를 DNA 절단, 바람직하게는 이중-가닥 절단으로 선택적으로 비활성화할 수 있는 희귀-절단 엔도뉴클레아제를 미생물에 도입하거나 미생물에서 발현시키는 것에 의해 비활성화된다. 내인성 유전자를 비활성화하기 위해 본 발명에 따라 사용되는 희귀-절단 엔도뉴클레아제는 예를 들어 전사 활성인자-유사 효과인자(TALE) 뉴클레아제, 메가뉴클레아제, 징크-핑거 뉴클레아제(ZFN) 또는 RNA-가이드 엔도뉴클레아제일 수 있다.
상기 효소를 암호화하는 내인성 유전자를 비활성화하기 위한 하나의 방법은 CRISPRi 시스템을 사용하는 것이다. CRISPRi 시스템은 표적화된 유전자 발현의 억제 또는 게놈 상의 표적 위치를 차단하기 위한 도구로서 개발되었다. CRISPRi 시스템은 촉매적으로 비활성적인 "데드(dead)" Cas9 단백질(dCas9) 및 DNA에 대한 dCas9의 결합 부위를 정의하는 가이드 RNA로 이루어진다.
따라서, 일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 RNA-가이드 엔도뉴클레아제를, 예를 들어 촉매적으로 비활성인 Cas9 단백질 및 세포 조건 하에서 상기 효소를 암호화하는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 단일 가이드 RNA(sgRNA)를, 세균에 도입하거나 세균에서 발현시키는 것에 의해 비활성화된다.
일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 억제에 의해 감소된다.
상기 내인성 효소의 발현의 억제는 이 분야에 알려진 임의의 적합한 수단에 의해 달성될 수 있다. 예를 들어, 발현은 억제 핵산 분자, 예를 들어 안티센스 올리고뉴클레오타이드, 리보자임 또는 간섭 RNA(RNAi) 분자, 예를 들어 마이크로RNA(miRNA), 작은 간섭 RNA(siRNA) 또는 짧은 헤어핀 RNA(shRNA)의 사용을 포함하는 유전자 침묵 기술에 의해 억제될 수 있다.
일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 상기 폴리펩타이드를 암호화하는 내인성 유전자의 전사적 및/또는 번역적 억제에 의해 감소(예를 들어, 억제)된다.
일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 억제 핵산 분자를 세균에 도입하거나 세균에서 발현시키는 것으로 억제된다. 예를 들어, 억제 핵산 분자는 세균에서 상기 억제 핵산 분자의 생산을 유발하는 기능을 하는 프로모터, 예를 들어 유도성 프로모터에 작동 가능하게 연결된 상기 억제 핵산 분자를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자로 도입될 수 있다. 적합하게는, 억제 핵산 분자는 세포 조건 하에서 내인성 효소를 암호화하는 세포 mRNA 및/또는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 것이다. 표적에 따라, 암호화 게놈 DNA의 전사 및/또는 암호화 mRNA의 번역이 억제된다.
일부 실시형태에 따르면, 억제 핵산 분자는 안티센스 올리고뉴클레오타이드, 리보자임 또는 간섭 RNA(RNAi) 분자이다. 바람직하게는, 이러한 핵산 분자는 관심있는 폴리펩타이드 또는 효소를 암호화하는 세포 mRNA 및/또는 게놈 DNA(예를 들어, 폴리펩타이드를 암호화하는 세포 mRNA 및/또는 게놈 DNA)의 보체의 적어도 10개의 연속적인 뉴클레오타이드를 포함한다.
일부 실시형태에 따르면, 억제 핵산은 안티센스 올리고뉴클레오타이드이다. 이러한 안티센스 올리고뉴클레오타이드는 세포 조건 하에서 폴리펩타이드를 암호화하는 세포 mRNA 및/또는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 핵산 분자(DNA 또는 RNA)이다.
일부 실시형태에 따르면, 억제 핵산 분자는 리보자임, 예를 들어 망치머리형 리보자임이다. 리보자임 분자는 mRNA 전사체를 촉매적으로 절단하여 폴리펩타이드의 번역을 차단하도록 설계된다.
일부 실시형태에 따르면, 억제 핵산 분자는 간섭 RNA(RNAi) 분자이다. RNA 간섭은 RNA 분자가 발현을 억제하여, 전형적으로 특정 mRNA를 파괴하는 생물학적 과정이다. 예시적인 RNAi 분자의 유형은 마이크로RNA(miRNA), 작은 간섭 RNA(siRNA) 및 짧은 헤어핀 RNA(shRNA)를 포함한다. 일부 실시형태에 따르면, RNAi 분자는 miRNA이다. 일부 실시형태에 따르면, RNAi 분자는 siRNA이다. 일부 실시형태에 따르면, RNAi 분자는 shRNA이다.
일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 활성이 감소되도록 변형되었다.
퓨린 뉴클레오타이드 분해 경로에 관련된 내인성 효소의 활성 감소는 이 분야에 알려진 임의의 적합한 수단에 의해 달성될 수 있다. 예를 들어, 활성은 활성의 감소 또는 손실을 초래하는 효소의 활성 부위에 하나 이상의 돌연변이를 도입하는 것에 의해 감소될 수 있다. 따라서, 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 내인성 효소의 활성은 활성의 감소 또는 손실을 초래하는 적어도 하나의 활성-부위 돌연변이에 의해 감소된다. 적어도 하나의 활성-부위 돌연변이는 예를 들어 적어도 하나의 비-보존성 아미노산의 치환일 수 있다.
일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 효소는 퓨린 뉴클레오사이드 포스포릴라제 및 아데노신-포스포리보실전이효소로 이루어진 군으로부터 선택된다. 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 퓨린 뉴클레오사이드 포스포릴라제이다. 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 아데노신-포스포리보실전이효소이다.
일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 (추가) 변형되었다.
일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 상기 적어도 하나의 내인성 효소를 암호화하는 내인성 유전자의 발현 수준이 감소되도록 변형될 수 있다. 내인성 유전자의 발현 수준은 예를 들어 다른 동일한 세균과 비교하여 적어도 50%, 예를 들어 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 감소될 수 있다.
일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 예를 들어 일부 또는 전체 유전자 서열의 결실에 의해 비활성화된다.
일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 상기 효소를 암호화하는 내인성 유전자를 DNA 절단, 바람직하게는 이중-가닥 절단으로 선택적으로 비활성화할 수 있는 희귀-절단 엔도뉴클레아제를 미생물에 도입하거나 미생물에서 발현시키는 것에 의해 비활성화된다. 내인성 유전자를 비활성화하기 위해 본 발명에 따라 사용되는 희귀-절단 엔도뉴클레아제는 예를 들어 전사 활성인자-유사 효과인자(TALE) 뉴클레아제, 메가뉴클레아제, 징크-핑거 뉴클레아제(ZFN) 또는 RNA-가이드 엔도뉴클레아제일 수 있다.
상기 효소를 암호화하는 내인성 유전자를 비활성화하기 위한 하나의 방법은 CRISPRi 시스템을 사용하는 것이다. CRISPRi 시스템은 표적화된 유전자 발현의 억제 또는 게놈 상의 표적 위치를 차단하기 위한 도구로서 개발되었다. CRISPRi 시스템은 촉매적으로 비활성적인 "데드" Cas9 단백질(dCas9) 및 DNA에 대한 dCas9의 결합 부위를 정의하는 가이드 RNA로 이루어진다.
따라서, 일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 RNA-가이드 엔도뉴클레아제를, 예를 들어 촉매적으로 비활성인 Cas9 단백질 및 세포 조건 하에서 상기 효소를 암호화하는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 단일 가이드 RNA(sgRNA)를, 세균에 도입하거나 세균에서 발현시키는 것에 의해 비활성화된다.
일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 억제에 의해 감소된다.
상기 내인성 효소의 발현의 억제는 이 분야에 알려진 임의의 적합한 수단에 의해 달성될 수 있다. 예를 들어, 발현은 억제 핵산 분자, 예를 들어 안티센스 올리고뉴클레오타이드, 리보자임 또는 간섭 RNA(RNAi) 분자, 예를 들어 마이크로RNA(miRNA), 작은 간섭 RNA(siRNA) 또는 짧은 헤어핀 RNA(shRNA)의 사용을 포함하는 유전자 침묵 기술에 의해 억제될 수 있다.
일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 상기 폴리펩타이드를 암호화하는 내인성 유전자의 전사적 및/또는 번역적 억제에 의해 감소(예를 들어, 억제)된다.
일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 억제 핵산 분자를 세균에 도입하거나 세균에서 발현시키는 것으로 억제된다. 예를 들어, 억제 핵산 분자는 세균에서 상기 억제 핵산 분자의 생산을 유발하는 기능을 하는 프로모터, 예를 들어 유도성 프로모터에 작동 가능하게 연결된 상기 억제 핵산 분자를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자로 도입될 수 있다. 적합하게는, 억제 핵산 분자는 세포 조건 하에서 내인성 효소를 암호화하는 세포 mRNA 및/또는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 것이다. 표적에 따라, 암호화 게놈 DNA의 전사 및/또는 암호화 mRNA의 번역이 억제된다.
일부 실시형태에 따르면, 억제 핵산 분자는 안티센스 올리고뉴클레오타이드, 리보자임 또는 간섭 RNA(RNAi) 분자이다. 바람직하게는, 이러한 핵산 분자는 관심있는 폴리펩타이드 또는 효소를 암호화하는 세포 mRNA 및/또는 게놈 DNA(예를 들어, 폴리펩타이드를 암호화하는 세포 mRNA 및/또는 게놈 DNA)의 보체의 적어도 10개의 연속적인 뉴클레오타이드를 포함한다.
일부 실시형태에 따르면, 억제 핵산은 안티센스 올리고뉴클레오타이드이다. 이러한 안티센스 올리고뉴클레오타이드는 세포 조건 하에서 폴리펩타이드를 암호화하는 세포 mRNA 및/또는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 핵산 분자(DNA 또는 RNA)이다.
일부 실시형태에 따르면, 억제 핵산 분자는 리보자임, 예를 들어 망치머리형 리보자임이다. 리보자임 분자는 mRNA 전사체를 촉매적으로 절단하여 폴리펩타이드의 번역을 차단하도록 설계된다.
일부 실시형태에 따르면, 억제 핵산 분자는 간섭 RNA(RNAi) 분자이다. RNA 간섭은 RNA 분자가 발현을 억제하여, 전형적으로 특정 mRNA를 파괴하는 생물학적 과정이다. 예시적인 RNAi 분자의 유형은 마이크로RNA(miRNA), 작은 간섭 RNA(siRNA) 및 짧은 헤어핀 RNA(shRNA)를 포함한다. 일부 실시형태에 따르면, RNAi 분자는 miRNA이다. 일부 실시형태에 따르면, RNAi 분자는 siRNA이다. 일부 실시형태에 따르면, RNAi 분자는 shRNA이다.
일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소의 활성이 감소되도록 변형되었다.
구아노신 일인산 생합성 경로에 관련된 내인성 효소의 활성 감소는 이 분야에 알려진 임의의 적합한 수단에 의해 달성될 수 있다. 예를 들어, 활성은 활성의 감소 또는 손실을 초래하는 효소의 활성 부위에 하나 이상의 돌연변이를 도입하는 것에 의해 감소될 수 있다. 따라서, 일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 내인성 효소의 활성은 활성의 감소 또는 손실을 초래하는 적어도 하나의 활성-부위 돌연변이에 의해 감소된다. 적어도 하나의 활성-부위 돌연변이는 예를 들어 적어도 하나의 비-보존성 아미노산의 치환일 수 있다.
일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 효소는 IMP 탈수소효소 및 GMP 합성효소로 이루어진 군으로부터 선택된다.
일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 효소는 IMP 탈수소효소이다.
일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 효소는 GMP 합성효소이다.
CYP450은 광범위한 산화 반응을 촉매하는 다양한 헴-함유 효소의 군이다. 또한 사이토크롬 P450 모노옥시게나제(CYP450)는 아이소펜테닐아데닌-유형의 사이토키닌의 수산화를 촉매한다. 애기장대에는 아이소펜테닐아데닌-유형의 사이토키닌의 수산화를 위한 2가지 사이토크롬 P450 모노옥시게나제인 CYP735A1 및 CYP735A2가 존재한다. CYP735A는 iP-뉴클레오타이드의 입체-특이적 수산화 반응을 촉매하며, 낮은 친화력으로 iP-뉴클레오사이드 또는 iP를 수산화하여 tZ를 생합성한다(Takei et al., 2004b). 식물 기원의 대부분의 CYP450은 소포체(ER)에 막-고정되어 있다. 사이토크롬 P450 모노옥시게나제는 로도코커스 파시안스(Rhodococcus fascians)와 같은 세균에도 존재한다. 사이토크롬 P450은 일반적으로 보조 단백질(들)의 특성에 따라 2가지의 넓은 부류로 나뉜다. I류의 P450은 미토콘드리아의 막과 세균에서 발견되며, II류의 사이토크롬 P450은 포유동물 세포의 간 마이크로솜의 효소로 대표된다. I류의 P450은 플라빈 아데닌 다이뉴클레오타이드(FAD)-함유 환원효소, 철-황 단백질(페레독신) 및 P450을 포함하는 3-성분 시스템이다. II류의 사이토크롬 P450은 FAD-함유 플라빈 모노뉴클레오타이드(FMN)-함유 NADPH-의존성 사이토크롬 P450 환원효소 및 P450으로 이루어진다. III류 및 IV류의 CYP450도 세균에서 기술되었지만, I류는 세균에서 가장 흔한 CYP450이다. 슈도모나스 푸티다(Pseudomonas putida) P450cam의 가장 잘 특성화된 세균성 사이토크롬 P450 모노옥시게나제 시스템은 푸티다레독신 환원효소; 중개성 철-황 단백질인 푸티다레독신; 및 사이토크롬 P450cam의 3가지 가용성 단백질로 이루어진다. CYP450 Fas1은 선형 플라스미드의 fas 영역에 암호화되어 있고 로도코커스 파시안스에 의해 생산되는 사이토키닌을 수산화하는 것으로 생각된다(Frebort et al., 2011).
사이토크롬 P450 모노옥시게나제(CYP450)는 iP-뉴클레오타이드를 수산화하여 AMP 및 DMAPP로부터 3개의 효소적 단계에서 트랜스-제아틴을 생산할 수 있다. 효소는 iPRMP의 프레닐 측쇄를 입체-특이적으로 수산화할 수 있고 이에 따라 tZRMP로의 우회로를 만들 수 있으며, 이는 추가로 활성화되어 트랜스-제아틴을 생산할 수 있다.
따라서, 일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 (추가) 변형된 것을 특징으로 한다.
"단백질 발현 증가"는 이렇게 변형된 세균에 의해 생산된 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 보다 구체적으로, "발현 증가"는 이렇게 변형된 세균에 의해 생산된 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포 내 단백질의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.
단백질 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 단백질 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 유전자를 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시켜 달성할 수 있다.
또한 단백질 발현의 증가는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 유전자의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다.
또한 단백질 발현의 증가는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시켜 달성할 수 있다. 사용할 수 있는 프로모터에는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7, ParaBAD, Plac, Ptac 및 Ptrc, 및 코리네파지 BFK20에서 유래한 P F1 프로모터가 포함된다.
또한 단백질 발현의 증가는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.
일부 실시형태에 따르면, 유전자 카피수의 증가는 숙주 세포에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상(예를 들어 둘 또는 셋)의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하여 달성한다.
일부 실시형태에 따르면, 본 발명의 세균은 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 하나 이상(예를 들어 둘, 셋 또는 넷)의 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함한다. 적합하게는, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함한다. 일부 실시형태에 따르면, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합된다.
사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래될 수 있거나 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)될 수 있다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래된다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 이것이 발현되는 것과 다른 종에서 유래된다(즉, 이종성). 예를 들어, 세균이 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 내인성 유전자를 갖지 않는 경우, 상기 세균에서 발현되는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 상기 세균에 대해 이종일 것이다.
일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 세균성 폴리펩타이드이다. "사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 세균성 폴리펩타이드"는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드가 로도코커스 파시안스와 같은 세균으로부터 자연적으로 유래함을 의미한다. 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 세균성 폴리펩타이드의 비-제한적 예시는 서열번호 93에 제시되어 있다.
일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 식물 폴리펩타이드이다. "사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 식물 폴리펩타이드"는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드가 애기장대와 같은 식물로부터 자연적으로 유래함을 의미한다. 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 식물 폴리펩타이드의 비-제한적 예시는 서열번호 94 및 95에 제시되어 있다.
본 발명에 따른 사용을 위한 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드일 수 있다.
일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 93의 아미노산 서열 또는 서열번호 93과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 93의 아미노산 서열 또는 서열번호 93과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 93의 아미노산 서열 또는 서열번호 93과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 93의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 94의 아미노산 서열 또는 서열번호 94와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 94의 아미노산 서열 또는 서열번호 94와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 94의 아미노산 서열 또는 서열번호 94와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 94의 아미노산 서열을 포함한다.
일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 95의 아미노산 서열 또는 서열번호 95와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 95의 아미노산 서열 또는 서열번호 95와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 95의 아미노산 서열 또는 서열번호 95와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 95의 아미노산 서열을 포함한다.
본 발명에 따른 세균은 임의의 적합한 세균으로부터 생산될 수 있다. 세균은 그람-양성 또는 그람-음성일 수 있다. 그람-음성 세균성 숙주 세포의 비-제한적 예시에는 에스체리치아, 에르위니아, 클렙시엘라 및 시트로박터 속의 종들이 포함된다. 그람-양성 세균성 숙주 세포의 비-제한적 예시에는 바실러스, 락토코커스, 락토바실러스, 클로스트리듐, 코리네박테리움, 스트렙토마이세스(Streptomyces), 스트렙토코커스 및 셀룰로모나스(Cellulomonas) 속의 종들이 포함된다. 일부 실시형태에 따르면, 본 발명의 세균은 그람-양성이다. 일부 실시형태에 따르면, 본 발명의 세균은 그람-음성이다.
일부 실시형태에 따르면, 본 발명의 세균은 장내세균과, 바실러스과, 유산균과 및 코리네박테리움과로 이루어진 군으로부터 선택된 과(family)의 세균이다. 일부 실시형태에 따르면, 재조합 숙주 세포는 장내세균과의 세균이다. 일부 실시형태에 따르면, 재조합 숙주 세포는 바실러스과의 세균이다. 일부 실시형태에 따르면, 재조합 숙주 세포는 코리네박테리움과의 세균이다.
일부 실시형태에 따르면, 본 발명의 세균은 바실러스, 락토코커스, 락토바실러스, 클로스트리듐, 코리네박테리움, 지오바실러스, 써모안에어로박테리움, 스트렙토코커스, 슈도모나스, 스트렙토마이세스, 에스체리치아, 쉬겔라, 아시네토박터, 시트로박터, 살모넬라, 클렙시엘라, 엔테로박터, 에르위니아, 클루이베라, 세라티아, 세데세아, 모르가넬라, 하프니아, 에드워드시엘라, 프로비덴시아, 프로테우스 또는 예르시니아 속의 세균일 수 있는 세균이다.
일부 실시형태에 따르면, 본 발명의 세균은 바실러스 속의 세균이다. 바실러스 속의 세균의 비-제한적 예시는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스, 바실러스 인체니포미스(Bacillus licheniformis) 및 바실러스 모자벤시스(Bacillus mojavensis)이다. 일부 실시형태에 따르면, 본 발명의 세균은 바실러스 서브틸리스이다.
일부 실시형태에 따르면, 본 발명의 세균은 코리네박테리움 속의 세균이다. 코리네박테리움 속의 세균의 비-제한적 예시는 코리네박테리움 글루타미쿰 및 코리네박테리움 스테이셔니스이다. 일부에 따르면, 본 발명의 세균은 코리네박테리움 글루타미쿰이다. 일부에 따르면, 본 발명의 세균은 코리네박테리움 스테이셔니스이다. 본 발명의 맥락에서, 코리네박테리움 스테이셔니스 및 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes)는 같은 종을 의미하며 호환 가능하게 사용될 수 있다.
일부 실시형태에 따르면, 본 발명의 세균은 에스체리치아 속의 세균이다. 에스체리치아 속의 세균의 비-제한적 예시는 대장균이다. 일부에 따르면, 본 발명의 세균은 대장균이다.
위에서 언급한 바와 같이, 본 발명의 세균은 본 명세서에 상세하게 기술된 하나 이상의 폴리펩타이드를 발현하도록 변형되며, 이는 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자, 예를 들어 DNA 분자가 세균에 도입되었음을 의미할 수 있다. 따라서, 본 발명의 세균은 문제의 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자, 예를 들어 DNA 분자를 포함할 수 있다. 세균 세포에 외인성 핵산 분자, 예를 들어 DNA 분자를 도입하기 위한 기술은 이 분야의 기술자들에게 잘 알려져 있으며 특히 형질전환(예를 들어, 열충격 또는 자연 형질전환)을 포함한다.
세균에서 폴리펩타이드의 (과)발현을 촉진하기 위해, 외인성 핵산 분자는 적합한 조절 요소, 예를 들어 세균 세포에서 mRNA 분자의 생산을 유발하는 기능을 하고 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 포함할 수 있다.
본 발명에 따른 유용한 프로모터는 주어진 숙주 세포에서 mRNA 분자의 생산을 유발하는 기능을 하는 임의의 알려진 프로모터이다. 많은 이러한 프로모터들이 기술자에게 알려져 있다. 이러한 프로모터에는 일반적으로 다른 유전자와 관련된 프로모터 및/또는 임의의 세균에서 분리된 프로모터가 포함된다. 단백질 발현을 위한 프로모터의 사용은 분자 생물학 분야의 기술자들에게 일반적으로 알려져 있으며, 예를 들어 문헌[Sambrook et al., Molecular cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 1989]을 참조할 수 있다. 사용된 프로모터는 유도성, 예를 들어 온도-유도성 프로모터(예를 들어, 온도-민감성 람다 억제인자 c1857에 의해 제어될 수 있는 pL 또는 pR 파지 람다 프로모터)일 수 있다. 프로모터의 맥락에서 사용된 용어 "유도성"은 온도의 변화 또는 화학 물질("화학적 유도제")의 존재와 같이 자극이 존재하는 경우에만 프로모터가 작동 가능하게 연결된 뉴클레오타이드 서열의 전사를 지시함을 의미한다. 본 명세서에서 사용된 바와 같이, 본 발명에 따른 "화학적 유도"는 숙주 세포에 외인성 또는 내인성 물질(거대 분자, 예를 들어 단백질 또는 핵산을 포함함)의 물리적 적용을 의미한다. 이는 숙주 세포에 존재하는 표적 프로모터가 전사율을 증가시키게 하는 효과를 갖는다. 대안적으로는, 사용된 프로모터는 구성적일 수 있다. 프로모터의 맥락에서 사용된 용어 "구성적"은 프로모터가 자극(예를 들어, 열충격, 화학적인 것 등)의 부재 하에서 작동 가능하게 연결된 뉴클레오타이드 서열의 전사를 지시할 수 있음을 의미한다.
온도 유도 시스템은 예를 들어 열민감성 억제인자에 의해 억제되는 프로모터를 사용함에 따라 작동한다. 이러한 억제인자는 낮은 온도, 예를 들어 30℃에서 활성이지만, 37℃에서는 올바르게 접힐 수 없어 비활성이다. 따라서 이러한 회로는 또한 억제인자와 함께 유전자의 게놈 통합에 의해 관심있는 유전자를 직접적으로 조절하는데 사용될 수 있다. 이러한 온도-유도성 발현 시스템의 예시는 pL 및/또는 pRλ 파지 프로모터를 기반으로 하며, 이는 열민감성 cI857 억제인자에 의해 조절된다. 게놈 통합 DE3 시스템과 유사하게, T7 RNA 중합효소 유전자의 발현 또한 온도-제어 프로모터 시스템을 사용하여 제어할 수 있으며, 관심있는 유전자의 발현은 T7 프로모터를 사용하여 제어할 수 있다.
세균에서 기능하는 프로모터의 비-제한적 예시에는 구성적 및 유도성 프로모터, 예를 들어 T7 프로모터, 베타-락타마제(lactamase) 및 락토스 프로모터 시스템; 알칼라인 포스파타제(phoA) 프로모터, 트립토판(trp) 프로모터 시스템, 테트라사이클린 프로모터, 람다-파지 프로모터, 리보솜성 단백질 프로모터; 및 하이브리드 프로모터, 예를 들어 tac 프로모터가 포함된다. 다른 세균성 및 합성적 프로모터 또한 적합하다.
프로모터 이외에, 외인성 핵산 분자는 5' 비번역 영역(5' UTR) 및 3' 비번역 영역(3' UTR)으로부터 선택된 적어도 하나의 조절 요소를 더 포함할 수 있다. 원핵생물 및 진핵생물에서 유래된 많은 이러한 5' UTR 및 3' UTR이 기술자에게 잘 알려져 있다. 이러한 조절 요소에는 일반적으로 다른 유전자와 관련된 5' UTR 및 3' UTR 및/또는 임의의 세균에서 분리된 5' UTR 및 3' UTR이 포함된다.
일반적으로, 5' UTR은 샤인-달가노 서열로도 불리는 일반적으로 개시 코돈에서 상류에 있는 3 내지 10개의 염기 쌍의 리보솜 결합 부위(RBS)를 함유한다.
외인성 핵산 분자는 벡터 또는 벡터의 일부, 예를 들어 발현 벡터일 수 있다. 일반적으로, 이러한 벡터는 세균 세포 내에서 염색체 외적으로 존재하며, 이는 세균의 핵 또는 뉴클레오이드(nucleoid) 영역의 외부에서 발견됨을 의미한다.
외인성 핵산 분자가 세균의 게놈에 안정적으로 통합되는 것 또한 본 발명에서 고려된다. 예를 들어 상동성 재조합에 의한 숙주 세포 게놈으로의 안정적인 통합을 위한 수단이 기술자에게 잘 알려져 있다.
발명의 방법
또한 본 발명은 적합한 배양 배지에서 적합한 배양 조건 하에서 본 발명에 따른 세균을 배양하는 단계를 포함하는 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법을 제공한다.
방법은 배양 배지에서 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 수집하는 단계를 더 포함할 수 있다.
일부 실시형태에 따르면, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 트랜스-제아틴(tZ), 트랜스-제아틴 리보사이드(tZR), N 6 -(D2-아이소펜테닐)아데닌(iP), N 6 -(다이메틸알릴)아데노신(iPR), 다이하이드로제아틴(DZ), 리보실 다이하이드로제아틴(DZR) 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시형태에 따르면, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 각각 트랜스-제아틴(tZ) 및 트랜스-제아틴 리보사이드(tZR)이다.
사용되는 배양 배지는 문제의 세균 세포를 배양하기에 적합한 임의의 통상적인 배지일 수 있고, 선행기술의 원리에 따라 구성될 수 있다. 배지는 일반적으로 각 세균의 성장 및 생존에 필요한 모든 영양소, 예를 들어 탄소 및 질소원 및 기타 무기염을 함유한다. 적합한 배지, 예를 들어 최소 또는 복합 배지를 상업적 공급업체로부터 구하거나 공개된 제조법, 예를 들어 미국균주은행(American Type Culture Collection: ATCC)의 균주 카탈로그에 따라 제조할 수 있다. 기술자에게 잘 알려진 비-제한적 표준 배지에는 루리아 베르타니(LB) 배지, 사부로드 덱스트로스(SD) 배지, MS 배지, 효모 펩톤 덱스트로스, BMMY, GMMY 또는 효모 맥아 추출물(YM) 배지가 포함되며, 이들 모두 상업적으로 이용가능하다. 세균 세포, 예를 들어, 바실러스 서브틸리스, 락토코커스 락티스 또는 대장균 세포를 배양하는데 적합한 배지의 비-제한적 예시에는 최소 배지 및 풍부 배지 예를 들어 루리아 배지(LB), M9 배지, M17 배지, SA 배지, MOPS 배지, 테리픽 배지(Terrific Broth), YT 등이 포함된다.
탄소원은 이 분야에 알려진 임의의 적합한 탄소 기질, 특히 미생물의 배양 및/또는 발효에 일반적으로 사용되는 임의의 탄소 기질일 수 있다. 적합한 발효가능한 탄소 기질의 비-제한적 예시에는 탄수화물(예를 들어, C5 당, 예를 들어 아라비노스 또는 자일로스, 또는 C6 당, 예를 들어 글루코스), 글리세롤, 글리세린, 아세트산염, 다이하이드록시아세톤, 단일-탄소원, 메탄올, 메탄, 오일, 동물성 지방, 동물성 오일, 식물성 오일, 지방산, 지질, 인지질, 글리세로지질, 모노글리세리드, 다이글리세리드, 트리글리세리드, 재생가능한 탄소원, 폴리펩타이드(예를 들어, 미생물성 또는 식물성 단백질 또는 펩타이드), 효모 추출물, 효모 추출물의 성분, 카사미노산 또는 전술한 것 중 둘 이상의 임의의 조합이 포함된다.
질소원으로서, 다양한 암모늄염, 예를 들어 암모니아 및 황산암모늄, 기타 질소 화합물, 예를 들어 아민, 천연 질소원, 예를 들어 펩톤, 대두-가수분해물 및 소화된 발효 미생물이 사용될 수 있다. 미네랄로서, 일인산칼륨, 황산마그네슘, 염화나트륨, 황산제1철, 황산망간, 염화칼슘 등이 사용될 수 있다.
아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체, 예를 들어 각각 트랜스-제아틴(tZ) 및 트랜스-제아틴 리보사이드(tZR)의 생산을 더 개선하기 위해, 배양 배지에 아데닌 또는 아데노신 공급원, 예를 들어 황산 아데닌을 보충할 수 있다. 따라서, 일부 실시형태에 따르면, 배양 배지는 황산 아데닌을 포함한다. 배양 배지 내 황산 아데닌의 농도는 일반적으로 약 0.1g/ℓ 내지 약 4g/ℓ, 예를 들어 약 1g/ℓ 내지 약 3.5g/ℓ의 범위일 수 있다. 일부 실시형태에 따르면, 배양 배지 내 황산 아데닌의 농도는 약 2.5g/ℓ 내지 약 3.5g/ℓ의 범위이다. 그러나, 다른 아데닌 또는 아데노신 공급원, 예를 들어 효모 추출물 또한 본 발명에 따른 사용을 위해 고려된다.
배양은 바람직하게는 약 20 내지 약 45℃, 예를 들어 약 30 내지 38℃, 예를 들어 약 37℃의 온도로 호기 조건 하에서, 예를 들어 진탕 배양을 사용하여, 그리고 에어레이션과 함께 교반 배양을 사용하여 수행할 수 있다. 일부 실시형태에 따르면, 배양은 약 30 내지 38℃, 예를 들어 약 37℃의 온도에서 수행한다. 배양 pH는 일반적으로 5 초과, 예를 들어, 약 6 내지 약 8, 바람직하게는 약 6.5 내지 약 7.5, 보다 바람직하게는 약 6.8 내지 약 7.2의 범위이다. 일부 실시형태에 따르면, 배양은 약 6 내지 약 8의 pH에서 수행한다. 배양 pH는 암모니아, 탄산칼슘, 다양한 산, 다양한 염기 및 완충제로 조정할 수 있다. 배양은 10 내지 70시간의 범위, 예를 들어 10 내지 24시간의 범위 또는 10 내지 48시간의 범위의 기간 동안 수행할 수 있다.
배양 후, 원심분리 또는 막 여과를 사용하여 고형물 예를 들어 세포를 배양 배지로부터 제거할 수 있다. 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 배지에서 화학적 화합물을 분리 및 정제하기 위한 통상적인 방법으로 수집할 수 있다. 잘 알려진 정제 공정에는 원심분리 또는 여과, 침전, 이온 교환, 크로마토그래피 방법, 예를 들어 이온 교환 크로마토그래피 또는 겔 여과 크로마토그래피 및 결정화 방법이 포함되지만 이로 제한되지 않는다.
따라서 본 발명은 본 명세서에 상세하게 기술된 방법에 의해 얻을 수 있는 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 제공한다.
약어
iP - N 6 -(D2-아이소펜테닐)아데닌
iPR - N 6 -(D2-아이소펜테닐)아데닌 리보사이드, 일명 N 6 -(D2 -아이소펜테닐)아데노신
tZ - 트랜스-제아틴
tZR - 트랜스-리보실제아틴, 일명 트랜스-제아틴 리보사이드
DZ - 다이하이드로제아틴
DZR - 리보실 다이하이드로제아틴, 일명 다이하이드로제아틴 리보사이드
cZ - 시스-제아틴
MVA 경로 - 메발론산 생합성 경로
MEP 경로 - 메틸에리스리톨 인산 생합성 경로
DMAPP - 다이메틸알릴 이인산
HMBDP - 1-하이드록시-2-메틸-2-부테닐 4-이인산
DXP - 1-데옥시-D-자일룰로스-5-인산
DXS - 1-데옥시-D-자일룰로스-5-인산 합성효소; DXP-합성효소(EC 2.2.1.7)
tZRMP - 트랜스-제아틴 리보사이드 5'-일인산
iPRMP - N 6 -(D2-아이소펜테닐)아데닌 리보사이드 5'-일인산
DZRMP - 다이하이드로제아틴 리보사이드 5'-일인산
cZRMP - 시스-제아틴 리보사이드 5'-일인산
IPT - 아데닐레이트 아이소펜테닐전이효소(EC 2.5.1.27)
LOG - 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 'Lonely guy'(EC 3.2.2.n1)
CYP450 - 사이토크롬 P450 모노옥시게나제
기타 특정 정의
본 명세서에 사용된 "아데닐레이트 아이소펜테닐전이효소 활성이 있는 폴리펩타이드" 또는 "아데닐레이트 아이소펜테닐전이효소 활성을 갖는 폴리펩타이드"는 다음의 반응을 촉매하는 폴리펩타이드를 의미한다: 다이메틸알릴 이인산 + AMP <=> 이인산 + N(6)-(다이메틸알릴)아데노신 5'-인산(EC 2.5.1.27) 및 선택적으로 1-하이드록시-2-메틸-2-부테닐 4-이인산 + AMP <=> 이인산 + 트랜스-제아틴 리보사이드 5'-인산. 이러한 폴리펩타이드의 비-제한적 예시는 서열번호 1 내지 33에 제공된다.
본 명세서에 사용된 "사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드" 또는 "사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성을 갖는 폴리펩타이드"는 다음의 반응을 촉매하는 폴리펩타이드를 의미한다: N(6)-(델타(2)-아이소펜테닐)-아데노신 5'-인산 + H(2)O <=> N(6)-(다이메틸알릴)아데닌 + D-리보스 5'-인산(EC 3.2.2.n1). 이러한 폴리펩타이드의 비-제한적 예시는 서열번호 34 내지 62에 제공된다.
본 명세서에 사용된 "1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드" 또는 "1-데옥시-D-자일룰로스-5-인산 합성효소 활성을 갖는 폴리펩타이드"는 다음의 반응을 촉매하는 폴리펩타이드를 의미한다: 피루브산 + D-글리세르알데하이드 3-인산 <=> 1-데옥시-D-자일룰로스 5-인산 + CO(2)(EC 2.2.1.7). 이러한 폴리펩타이드의 비-제한적 예시는 서열번호 63 내지 70에 제공된다.
본 명세서에 사용된 "리보스-인산 다이포스포키나제 활성이 있는 효소" 또는 "리보스-인산 다이포스포키나제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + D-리보스 5-인산 <=> AMP + 5-포스포-알파-D-리보스 1-이인산(EC 2.7.6.1). 리보스-인산 다이포스포키나제 활성이 있는 효소는 세균성 유전자 prs 또는 이의 동원체(ortholog)에 의해 암호화된다.
본 명세서에 사용된 "아미도포스포리보실전이효소 활성이 있는 효소" 또는 "아미도포스포리보실 전이효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 5-포스포-베타-D-리보실아민 + 이인산 + L-글루탐산염 <=> L-글루타민 + 5-포스포-알파-D-리보스 1-이인산 + H2O(EC 2.4.2.14). 아미도포스포리보실전이효소 활성이 있는 효소는 세균성 유전자 purF 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소" 또는 "포르밀테트라하이드로엽산 디포르밀라제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 10-포르밀테트라하이드로엽산 + H2O <=> 포름산염 + 테트라하이드로엽산(EC 3.5.1.10). 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소는 세균성 유전자 purU 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "포스포리보실아민-글라이신 리가제 활성이 있는 효소" 또는 "포스포리보실아민-글라이신 리가제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 5-포스포-베타-D-리보실아민 + 글라이신 <=> ADP + 인산염 + N1-(5-포스포-베타-D-리보실)글라이신아마이드(EC 6.3.4.13). 포스포리보실아민-글라이신 리가제 활성이 있는 효소는 세균성 유전자 purD 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "포스포리보실글라이신아마이드 포르밀전이효소 활성이 있는 효소" 또는 "포스포리보실글라이신아마이드 포르밀전이효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 10-포르밀테트라하이드로엽산 + N1-(5-포스포-베타-D-리보실)글라이신아마이드 <=> 테트라하이드로엽산 + N2-포르밀-N1-(5-포스포-베타-D-리보실)글라이신아마이드(EC 2.1.2.2). 포스포리보실글라이신아마이드 포르밀전이효소 활성이 있는 효소는 세균성 유전자 purT 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "포스포리보실포르밀글라이신아미딘 합성효소 활성이 있는 효소" 또는 "포스포리보실포르밀글라이신아미딘 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + N2-포르밀-N1-(5-포스포-베타-D-리보실)글라이신아마이드 + L-글루타민 + H2O <=> ADP + 인산염 + 2-(포름아미도)-N1-(5-포스포-베타-D-리보실)아세트아미딘 + L-글루탐산염(EC 6.3.5.3). 포스포리보실포르밀글라이신아미딘 합성효소 활성이 있는 효소는 세균성 유전자 purL 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성이 있는 효소" 또는 "포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 2-(포름아미도)-N1-(5-포스포-베타-D-리보실)아세트아미딘 <=> ADP + 인산염 + 5-아미노-1-(5-포스포-베타-D-리보실)이미다졸(EC 6.3.3.1). 포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성이 있는 효소는 세균성 유전자 purM 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성이 있는 효소" 또는 "N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 5-아미노-1-(5-포스포-D-리보실)이미다졸 + HCO3 - <=> ADP + 인산염 + 5-카복시아미노-1-(5-포스포-D-리보실)이미다졸(EC 6.3.4.18). N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성이 있는 효소는 세균성 유전자 purK 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성이 있는 효소" 또는 "N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 5-카복시아미노-1-(5-포스포-D-리보실)이미다졸 <=> 5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복시산(EC 5.4.99.18). N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성이 있는 효소는 세균성 유전자 purE 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성이 있는 효소" 또는 "포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복시산 + L-아스파르트산염 <=> ADP + 인산염 + (S)-2-(5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복사미도)숙신산(EC 6.3.2.6). 포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성이 있는 효소는 세균성 유전자 purC 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "아데닐로호박산 분해효소 활성이 있는 효소" 또는 "아데닐로호박산 분해효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: (S)-2-(5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복사미도)숙신산 <=> 푸마르산염 + 5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복사미드(EC 4.3.2.2). 아데닐로호박산 분해효소 활성이 있는 효소는 세균성 유전자 purB 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소" 또는 "포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 10-포르밀테트라하이드로엽산 + 5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복사미드 <=> 테트라하이드로엽산염 + 5-포름아미도-1-(5-포스포-D-리보실)이미다졸-4-카복사미드(EC 2.1.2.3). 포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소는 세균성 유전자 purH 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "IMP 사이클로가수분해효소 활성이 있는 효소" 또는 "IMP 사이클로가수분해효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: IMP + H2O <=> 5-포름아미도-1-(5-포스포-D-리보실)이미다졸-4-카복사미드(EC 3.5.4.10). IMP 사이클로가수분해효소 활성이 있는 효소는 예를 들어 세균성 유전자 purH 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "아데닐로호박산 합성효소 활성이 있는 효소" 또는 "아데닐로호박산 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: GTP + IMP + L-아스파르트산염 <=> GDP + 인산염 + N6-(1,2-다이카복시에틸)-AMP(EC 6.3.4.4). 아데닐로호박산 합성효소 활성이 있는 효소는 세균성 유전자 purA 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "아데닐산 키나제 활성이 있는 효소" 또는 "아데닐산 키나제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + AMP <=> 2 ADP(EC 2.7.4.3). 아데닐산 키나제 활성이 있는 효소는 세균성 유전자 adk 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "ATP 합성효소 활성이 있는 효소" 또는 "ATP 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + H2O + H+(세포기질) <=> ADP + 인산염 + H+(세포주변질)(EC 3.6.3.14). ATP 합성효소 활성이 있는 효소는 예를 들어 세균성 atp 오페론(atpB, atpF, atpE, atpD, atpG, atpA, atpH 및 atpC 유전자 포함) 또는 이의 동원체에 의해 암호화된 ATP 합성효소 F0 또는 F1 복합체이다.
본 명세서에 사용된 "아데노신 키나제 활성이 있는 효소" 또는 "아데노신 키나제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 아데노신 <=> ADP + AMP(EC 2.7.1.20). 아데노신 키나제 활성이 있는 효소는 세균성 유전자 adk 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "IMP 탈수소효소 활성이 있는 효소" 또는 "IMP 탈수소효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 이노신 5'-인산 + NAD+ + H2O <=> 잔토신 5'-인산 + NADH(EC 1.1.1.205). IMP 탈수소효소 활성이 있는 효소는 세균성 유전자 guaB 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "GMP 합성효소 활성이 있는 효소" 또는 "GMP 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + XMP + L-글루타민 + H2O <=> AMP + 이인산염 + GMP + L-글루탐산염(EC 6.3.5.2). GMP 합성효소 활성이 있는 효소는 세균성 유전자 guaA 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소" 또는 "퓨린 뉴클레오사이드 포스포릴라제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 퓨린 뉴클레오사이드 + 인산염 <=> 퓨린 + 알파-D-리보스 1-인산(EC 2.4.2.1). 퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소는 예를 들어 세균성 유전자 deoD 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "아데노신 포스포리보실전이효소 활성이 있는 효소" 또는 "아데노신 포스포리보실전이효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: AMP + 이인산염 <=> 아데닌 + 5-포스포-알파-D-리보스 1-이인산(EC 2.4.2.7). 아데노신 포스포리보실전이효소 활성이 있는 효소는 예를 들어 세균성 유전자 apt 또는 이의 동원체에 의해 암호화된다.
본 명세서에 사용된 "퓨린 뉴클레오타이드 생합성 경로"는 뉴클레오타이드가 합성되는 드노보 생합성 경로 및 회수 경로를 모두 포함하는 것으로 이해된다.
본 명세서에 사용된 "아데노신 일인산 생합성 경로"는 아데노신 일인산이 합성되는 드노보 생합성 경로 및 회수 경로를 모두 포함하는 것으로 이해된다.
본 명세서에 사용된 "구아노신 일인산 생합성 경로"는 구아노신 일인산이 합성되는 드노보 생합성 경로 및 회수 경로를 모두 포함하는 것으로 이해된다.
본 명세서에 사용된 "사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드" 또는 "사이토크롬 P450 모노옥시게나제(CYP450) 활성을 갖는 폴리펩타이드"는 다음의 트랜스-수산화 반응을 촉매하는 폴리펩타이드를 의미한다: 1) N6-(△2-아이소펜테닐)-아데노신 5'-일인산 + 환원된 [NADPH-헴단백질 환원효소] + 산소 → 트랜스-제아틴 리보사이드 일인산 + 산화된 [NADPH-헴단백질 환원효소] + H2O; 2) N6-(△2-아이소펜테닐)-아데노신 5'-삼인산 + 환원된 [NADPH-헴단백질 환원효소] + 산소 → 트랜스-제아틴 리보사이드 삼인산 + 산화된 [NADPH-헴단백질 환원효소] + H2O; 3) N6-(△2-아이소펜테닐)-아데노신 5'-이인산 + 환원된 [NADPH-헴단백질 환원효소] + 산소 → 트랜스-제아틴 리보사이드 이인산 + 산화된 [NADPH-헴단백질 환원효소] + H2O(EC 1.14.14.-). 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 예를 들어 세균성 유전자 FAS1 또는 애기장대(식물) 유전자 CYP735A1 및 CYP735A2 또는 이들의 동원체에 의해 암호화된다. 비-제한적 예시에는 서열번호 93 내지 95가 포함된다.
"폴리펩타이드" 및 "단백질"은 본 명세서에서, 길이 또는 번역-후 변형(예를 들어, 글리코실화, 인산화, 지질화, 미리스토일화, 유비퀴틴화 등)에 상관없이, 아마이드 결합에 의해 공유 결합된 적어도 2개의 아미노산의 중합체를 나타내기 위해 호환 가능하게 사용된다. D- 및 L-아미노산 및 D- 및 L-아미노산의 혼합물이 이 정의에 포함된다.
"핵산" 또는 "폴리뉴클레오타이드"는 본 명세서에서, 길이 또는 염기 변형에 상관없이, 인산다이에스터에 의해 공유 결합된 적어도 2개의 핵산 단량체 단위 또는 염기(예를 들어, 아데닌, 시토신, 구아닌, 티민)의 중합체를 나타내기 위해 호환 가능하게 사용된다.
예를 들어 세균, 핵산 또는 폴리펩타이드와 관련하여 사용될 때 "재조합" 또는 "비-천연 발생"은 자연에 존재하지 않는 방식으로 변형되거나 이와 동일하지만 합성 물질로부터 및/또는 재조합 기술을 사용한 조작으로 생산 또는 파생된 물질 또는 물질의 천연 또는 본래 형태에 상응하는 물질을 의미한다. 비-제한적 예시에는 무엇보다도 세포의 천연(비-재조합) 형태에서 발견되지 않는 유전자를 발현하거나 천연 유전자를 다른 수준으로 발현하는 재조합 세균 세포가 포함된다.
본 명세서에서 유전자 또는 핵산 분자의 맥락에서 사용되는 "이종성" 또는 "외인성"은 존재하는 세균의 게놈의 일부로서 자연적으로 발생하지 않거나 자연에서 발생하는 것과 다른 게놈의 위치 또는 위치들에서 발견되는 유전자 또는 핵산 분자(즉, DNA 또는 RNA 분자)를 의미한다. 따라서, "이종성" 또는 "외인성" 유전자 또는 핵산 분자는 세균에 대해 내인성이 아니며 미생물에 외인성으로 도입된 것이다. "이종성" 유전자 또는 핵산 분자 DNA 분자는 숙주 DNA로서 다른 유기체, 다른 종, 다른 속 또는 다른 계로부터의 것일 수 있다.
본 명세서에서 폴리펩타이드의 맥락에서 사용되는 "이종성"은 폴리펩타이드가 일반적으로 숙주 미생물에서 발견되거나 숙주 미생물에 의해 만들어지지 않지만(발현되지 않지만), 다른 유기체, 다른 종, 다른 속 또는 다른 계로부터 유래됨을 의미한다.
본 명세서에 사용된 용어 "동원체" 또는 "동원체들"은 공통의 조상 유전자에서 유래하지만 다른 종에 존재하는 유전자, 이에 의해 암호화되는 핵산 분자, 즉 mRNA 또는 이에 의해 암호화되는 단백질을 의미한다.
유전자의 "감소된 발현"은 변형된 세균에 의해 생산되는 상기 유전자에 의해 암호화되는 전사 산물의 양, 각각의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 감소됨을 의미한다. 특히, 유전자의 "감소된 발현"은 변형된 세균에 의해 생산되는 상기 유전자에 의해 암호화되는 전사 산물의 양, 각각의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 100% 감소됨을 의미한다. 유전자의 발현 수준은 PCR, 서던 블로팅 등을 포함하는 잘 알려진 방법으로 결정할 수 있다. 또한, 유전자 발현의 수준은 노던 블로팅, 정량적 RT-PCR 등을 포함하는 다양한 잘 알려진 방법을 사용하여 유전자로부터 전사된 mRNA의 양을 측정하여 추산할 수 있다. 유전자에 의해 암호화된 폴리펩타이드의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅 등을 포함하는 잘 알려진 방법으로 측정할 수 있다.
유전자의 발현은 유전자에 의해 암호화된 폴리펩타이드의 세포내 활성이 돌연변이를 수반하지 않는 다른 동일한 세균과 비교하여 감소되도록 변형된 세균 게놈의 유전자에 돌연변이를 도입하는 것에 의해 감소될 수 있다. 감소된 유전자 발현을 초래하는 돌연변이에는 유전자에 의해 암호화된 폴리펩타이드에서 아미노산의 치환을 유발하는 하나의 뉴클레오타이드 또는 그 이상의 대체(과오돌연변이: missense mutation), 정지 코돈의 도입(넌센스 돌연변이: nonsense mutation), 프레임 시프트를 유발하는 뉴클레오타이드의 결실 또는 삽입, 약물-저항 유전자의 삽입 또는 유전자의 일부 또는 전체 유전자의 결실이 포함된다(Qiu and Goodman, 1997; Kwon et al., 2000). 또한 발현은 발현 조절 서열, 예를 들어, 프로모터, 샤인-달가노(SD) 서열 등의 변형에 의해 감소될 수 있다. 또한 유전자의 발현은 유전자 대체(Datsenko and Wanner, 2000), 예를 들어, "람다-레드 매개 유전자 대체"에 의해 감소될 수 있다. 람다-레드 매개 유전자 대체는 본 명세서에 기술된 바와 같은 하나 이상의 유전자를 비활성화하는데 특히 적합한 방법이다.
"비활성화하는", "비활성화" 및 "비활성화된"은, 유전자의 맥락에서 사용될 때, 문제의 유전자가 더이상 기능성 단백질을 발현하지 않는 것을 의미한다. 변형된 DNA 영역이 유전자의 일부 또는 전체 서열의 결실, 유전자의 해독 틀의 이동, 과오/넌센스 돌연변이(들)의 도입 또는, 유전자 발현을 제어하는 서열, 예를 들어, 프로모터, 인핸서, 감쇠조절인자(attenuator), 리보솜-결합 부위 등을 포함하는, 유전자의 인접 영역의 변형으로 인해 유전자를 자연적으로 발현하지 못할 가능성이 있다. 바람직하게는, 관심있는 유전자는, 예를 들어 유전자 대체에 의한, 유전자의 일부 또는 전체 서열의 결실에 의해 비활성화된다. 비활성화는 또한 관심있는 유전자를 DNA 절단하여, 바람직하게는 이중-가닥 절단하여 선택적으로 비활성화할 수 있는 희귀-절단 엔도뉴클레아제를 도입 또는 발현시키는 것에 의해 달성될 수 있다. 본 발명의 맥락에서 "희귀-절단 엔도뉴클레아제"에는 전사 활성화인자-유사 효과인자(TALE) 뉴클레아제, 메가뉴클레아제, 징크-핑거 뉴클레아제(ZFN) 및 RNA-가이드 엔도뉴클레아제가 포함된다.
세균의 게놈 내 유전자의 존재 또는 부재는 PCR, 서던 블로팅 등을 포함하는 잘 알려진 방법으로 검출할 수 있다. 또한, 유전자 발현의 수준은 노던 블로팅, 정량적 RT-PCR 등을 포함하는 다양한 잘 알려진 방법을 사용하여 유전자로부터 전사된 mRNA의 양을 측정하여 추산할 수 있다. 유전자에 의해 암호화된 단백질의 양은 SDS-PAGE 후 면역블로팅 분석(웨스턴 블로팅 분석) 등을 포함하는 잘 알려진 방법으로 측정할 수 있다.
유전자의 "증가된 발현 수준"은 변형된 세균에 의해 생산되는 상기 유전자에 의해 암호화되는 전사 산물의 양, 각각의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 특히, 유전자의 "증가된 발현 수준"은 변형된 세균에 의해 생산되는 상기 유전자에 의해 암호화되는 전사 산물의 양, 각각의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 유전자의 발현 수준은 PCR, 서던 블로팅 등을 포함하는 잘 알려진 방법으로 결정할 수 있다. 또한, 유전자 발현의 수준은 노던 블로팅, 정량적 RT-PCR 등을 포함하는 다양한 잘 알려진 방법을 사용하여 유전자로부터 전사된 mRNA의 양을 측정하여 추산할 수 있다. 유전자에 의해 암호화된 폴리펩타이드의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅 등을 포함하는 잘 알려진 방법으로 측정할 수 있다.
폴리펩타이드의 "증가된 발현 수준"은 변형된 세균에 의해 생산되는 문제의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 특히, 폴리펩타이드의 "증가된 발현 수준"은 변형된 세균에 의해 생산되는 문제의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포에서 생산되는 폴리펩타이드의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.
폴리펩타이드 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 폴리펩타이드 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 폴리펩타이드를 암호화하는 유전자 또는 유전자들을 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 폴리펩타이드를 암호화하는 유전자 또는 유전자들의 카피수를 증가시켜 달성할 수 있다. 또한 폴리펩타이드 발현의 증가는 폴리펩타이드를 암호화하는 유전자 또는 유전자들의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다. 또한 폴리펩타이드 발현의 증가는 폴리펩타이드를 암호화하는 유전자 또는 유전자들에 작동 가능하게 연결된 프로모터(들)의 강도를 증가시켜 달성할 수 있다. 또한 폴리펩타이드 발현의 증가는 폴리펩타이드를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.
본 명세서에 사용된, 폴리펩타이드(예를 들어, 퓨린 뉴클레오타이드 분해 경로에 관련된 효소)의 "감소된" 또는 "감소하는" 발현 또는 발현"의 감소"는 변형된 세균에서 상기 폴리펩타이드의 발현이 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 발현(대조군)과 비교하여 감소됨을 의미한다. 변형된 세균에서 폴리펩타이드의 발현은 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 발현(대조군)과 비교하여, 적어도 약 10%, 및 바람직하게는 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 또는 100% 또는 10% 내지 100% 사이의 정수의 임의의 백분율(예를 들어, 6%, 7%, 8% 등)만큼 감소될 수 있다. 특히, 폴리펩타이드의 "감소된" 또는 "감소하는" 발현 또는 발현"의 감소"는 변형된 세균에서 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 양(대조군)과 비교하여, 적어도 약 10%, 바람직하게는 적어도 약 20%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 또는 100% 또는 10% 내지 100% 사이의 정수의 임의의 백분율(예를 들어, 6%, 7%, 8% 등)만큼 감소됨을 의미한다. 세균에서 폴리펩타이드의 발현 또는 양은 예를 들어 ELISA, 면역조직화학, 웨스턴 블로팅 또는 유세포분석 기술을 포함하는 이 분야에 알려진 임의의 적합한 수단으로 결정할 수 있다.
본 명세서에 사용된, 폴리펩타이드(예를 들어, 퓨린 뉴클레오타이드 분해 경로에 관련된 효소)의 "감소된" 또는 "감소하는" 활성 또는 활성"의 감소"는 변형된 세균에서 상기 폴리펩타이드의 촉매 활성이 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 촉매 활성(대조군)과 비교하여 감소됨을 의미한다. 변형된 세균에서 폴리펩타이드의 활성은 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 발현(대조군)과 비교하여, 적어도 약 10%, 및 바람직하게는 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 또는 100% 또는 10% 내지 100% 사이의 정수의 임의의 백분율(예를 들어, 6%, 7%, 8% 등)만큼 감소될 수 있다. 미생물에서 폴리펩타이드의 활성은 임의의 적합한 단백질 및 효소 활성 분석법으로 결정할 수 있다.
본 명세서에 사용된 "효소의 억제인자"는 효소의 촉매 활성을 억제하는 천연 또는 합성의 임의의 화학적 화합물을 의미한다. 효소의 억제인자는 반드시 100% 또는 완전한 억제를 달성할 필요는 없다. 이와 관련하여, 효소의 억제인자는 임의의 억제 수준을 유도할 수 있다.
"치환" 또는 "치환된"은 하나의 아미노산 잔기가 다른 것으로 대체되는 것에 의한 폴리펩타이드의 변형을 의미하며, 예를 들어 폴리펩타이드 서열에서 세린 잔기를 글리신 또는 알라닌 잔기로 대체하는 것이 아미노산 치환이다. 폴리뉴클레오타이드에 관련하여 사용될 때, "치환" 또는 "치환된"은 하나의 뉴클레오타이드가 다른 것으로 대체되는 것에 의한 폴리뉴클레오타이드의 변형을 의미하며, 예를 들어 폴리뉴클레오타이드 서열에서 시토신을 티민으로 대체하는 것이 뉴클레오타이드 치환이다.
"보존적 치환"은, 폴리펩타이드에 관련하여 사용될 때, 아미노산 잔기를 유사한 측쇄를 갖는 다른 잔기로 치환하는 것을 의미하며, 따라서 전형적으로 폴리펩타이드의 아미노산을 같거나 유사한 부류에 속하는 아미노산으로 치환하는 것을 포함한다. 제한하는 것이 아닌 예시로서, 지방족 측쇄를 갖는 아미노산은 다른 지방족 아미노산, 예를 들어 알라닌, 발린, 류신 및 아이소류신으로 치환될 수 있고, 수산기 측쇄를 갖는 아미노산은 수산기 측쇄를 갖는 다른 아미노산, 예를 들어 세린 및 트레오닌으로 치환될 수 있고, 방향족 측쇄를 갖는 아미노산은 방향족 측쇄를 갖는 다른 아미노산, 예를 들어 페닐알라닌, 티로신, 트립토판 및 히스티딘으로 치환될 수 있고, 염기성 측쇄를 갖는 아미노산은 염기성 측쇄를 갖는 다른 아미노산, 예를 들어 라이신 및 아르기닌으로 치환될 수 있고, 산성 측쇄를 갖는 아미노산은 산성 측쇄를 갖는 다른 아미노산, 예를 들어 아스파르트산 또는 글루탐산으로 치환될 수 있고, 소수성 또는 친수성 아미노산은 각각 다른 소수성 또는 친수성 아미노산으로 대체될 수 있다.
"비-보존적 치환"은, 폴리펩타이드에 관련하여 사용될 때, 폴리펩타이드의 아미노산을 유의적으로 다른 측쇄 특성을 갖는 아미노산으로 치환하는 것을 의미한다. 비-보존적 치환은 정의된 군 내에서 보다는 사이에서의 아미노산을 사용할 수 있고 (a) 치환(예를 들어, 글리신 대신 세린) 영역의 펩타이드 백본 구조, (b) 전하 또는 소수성 또는 (c) 측쇄의 규모에 영향을 미칠 수 있다. 제한하는 것이 아닌 예시로서, 예시적인 비-보존적 치환은 산성 아미노산이 염기성 또는 지방족 아미노산으로 치환되는 것; 방향족 아미노산이 작은 아미노산으로 치환되는 것; 및 친수성 아미노산이 소수성 아미노산으로 치환되는 것일 수 있다.
"발현"은 전사, 전사-후 변형, 번역, 번역-후 변형 및 분비를 포함하지만 이로 제한되지 않는 폴리펩타이드(예를 들어, 암호화된 효소)의 생산에 관련된 임의의 단계를 포함한다.
본 명세서에 사용된 유전자의 "조절 영역"은 암호화 서열의 발현에 영향을 미치는 핵산 서열을 의미한다. 조절 영역은 이 분야에 알려져 있으며 프로모터, 인핸서, 전사 종결인자, 폴리아데닐화 부위, 매트릭스 부착 영역 및/또는 암호화 서열의 발현을 조절하는 기타 요소를 포함하지만 이로 제한되지 않는다.
본 명세서에 사용된 "벡터"는 연결되어 있는 다른 핵산 분자를 수송할 수 있는 핵산 분자를 의미한다. 벡터의 한 유형은 "플라스미드"이며, 부가적인 핵산 절편이 결찰될 수 있는 원형의 이중 가닥 핵산 루프를 의미한다. 특정 벡터는 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터를 본 명세서에서 "발현 벡터"로 지칭한다. 특정 다른 벡터는 외인성 핵산 분자가 세균의 게놈에 삽입되는 것을 촉진할 수 있다. 이러한 벡터를 본 명세서에서 "형질전환 벡터"로 지칭한다. 일반적으로, 재조합 핵산 기술에 유용한 벡터는 종종 플라스미드의 형태이다. 플라스미드가 벡터의 가장 일반적으로 사용되는 형태이므로 본 명세서에서, "플라스미드" 및 "벡터"는 호환 가능하게 사용될 수 있다. 많은 적합한 벡터가 이 분야의 기술자에게 알려져 있으며 상업적으로 이용할 수 있다.
본 명세서에 사용된 "프로모터"는 일반적으로 구조 유전자의 암호화 영역 상류(5')의 DNA 서열로서 RNA 중합효소 및 전사의 개시에 필요할 수 있는 다른 요소에 대한 인식 및 결합 부위를 제공하여 암호화 영역의 발현을 조절하는 DNA 서열을 의미한다. 프로모터의 선택은 관심있는 핵산 서열에 따라 달라질 것이다. 적합한 "프로모터"는 일반적으로 본 발명의 세균에서 전사의 개시를 지원하여 mRNA 분자의 생산을 일으킬 수 있는 것이다. "강력한" 프로모터에는 예를 들어 단백질의 효율적인 발현 및 과생산을 가능하게 하는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. "강력한" 프로모터의 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7 및 코리네파지 BFK20에서 유래한 P F1 프로모터가 포함된다.
본 명세서에 사용된 "작동 가능하게 연결된"은 기술된 구성 요소가 의도된 방식으로 기능하도록 하는 관계에 있는 병치(juxtaposition)를 의미한다. 암호화 서열에 "작동 가능하게 연결된" 제어 서열은 암호화 서열의 발현이 제어 서열과 화합되는 조건 하에서 달성되는 방식으로 결찰된다. 프로모터 서열은 유전자의 전사를 조절하기 위해 유전자의 전사 시작 부위에 충분히 근접할 때 유전자에 "작동 가능하게 연결"된다.
"서열 동일성의 백분율", "% 서열 동일성" 및 "% 동일성"은 아미노산 서열과 참조 아미노산 서열 사이의 비교를 나타내기 위해 본 명세서에 사용된다. 본 명세서에 사용된 "% 서열 동일성"은 다음과 같이 두 개의 아미노산 서열로부터 계산된다: -12의 갭 오픈 페널티(갭의 첫 번째 널(null)에 대한 것) 및 -4의 갭 확장 페널티(갭에서 각각의 추가 널에 대한 것)를 갖는 기본 BLOSUM62 매트릭스를 사용하여, Genetic Computing Group's GAP(글로벌 정렬 프로그램)의 버젼 9를 사용하여 서열을 정렬한다. 정렬 후, 일치하는 수를 참조 아미노산 서열의 아미노산 수에 대한 백분율로 나타내어 % 동일성을 계산한다.
"참조 서열" 또는 "참조 아미노산 서열"은 다른 서열이 비교되는 정의된 서열을 의미한다. 본 발명의 맥락에서, 참조 아미노산 서열은 예를 들어 서열번호 1에 기재된 아미노산 서열일 수 있다.
본 명세서에 사용된 용어 "약"은 사용된 수의 수치값의 플러스 또는 마이너스 10%를 의미한다.
본 명세서에서 수적 한계 또는 범위가 명시된 경우, 끝점이 포함된다. 또한, 수적 한계 또는 범위 내의 모든 값 및 하위 범위가 명시적으로 작성된 것과 같이 구체적으로 포함된다.
본 명세서에 사용된, 단수적 표현은 문맥이 달리 명시하지 않는 한 "적어도 하나" 또는 "하나 이상"을 의미한다.
본 명세서에 사용된, 용어 "포함하는", "함유하는", "갖는" 및 이들의 문법적 변형 용어는 명시된 특징, 단계 또는 구성요소를 명시하는 것으로 간주되지만 하나 이상의 추가적인 특징, 단계, 구성요소 또는 이들의 군의 추가를 배제하지 않는다.
본 발명을 일반적으로 기술하였지만, 본 명세서에서 단지 예시적인 목적으로 제공되며 달리 명시되지 않는 한 제한하려는 의도가 아닌, 특정 구체적인 실시예를 참조하여 추가적인 이해를 얻을 수 있다.
실시예
실시예 1: 출발 균주의 선택
서로 다른 바실러스 균주들을 아이소프레노이드 사이토키닌 생산의 조작을 위한 출발 균주로 사용할 수 있다(표 2). 바실러스 속 균주들은 자연에서 분리하거나 균주 은행에서 얻을 수 있다. 그 중에서도, 퓨린 뉴클레오타이드 생합성 경로에 관련된 대사산물을 과생산하기 위한 고전적인 돌연변이 유발 및 선별 방법에 이미 적용되었던 바실러스 서브틸리스 균주들 사이에서 아이소프레노이드 사이토키닌 생산을 위한 출발 균주를 선택할 수 있다. 예를 들어, 리보플라빈, 이노신, 구아노신 또는 아데노신을 과생산하는 균주들을 선택할 수 있다. 퓨린 뉴클레오타이드 및 리보플라빈 경로로부터의 무작위 돌연변이 유발 및 독성 대사 억제인자에 적용된 균주가 바람직하며 표 3에 포함되어 있다.
바실러스 서브틸리스 VKPM B2116은 바실러스 서브틸리스 W23 균주로부터의 6.4kbp DNA 섬(island)을 갖는 바실러스 서브틸리스 168(대략 4Mbp의 게놈을 갖는 가장 일반적인 바실러스 서브틸리스 숙주 균주)의 잡종 균주이다. 이러한 구성은 대부분의 바실러스 서브틸리스 산업 균주에 일반적이며 바실러스 서브틸리스 168(트립토판 영양요구성 trpC)을 W23(자가영양성 TrpC+)의 DNA로 형질전환하여 수득된다. VKPM B21216의 게놈 내 6.4kbp W23 섬은 게놈이 공개적으로 이용가능한 바실러스 서브틸리스 레거시 균주들 중 하나인, 바실러스 서브틸리스 SMY에서와 같다(Zeigler et al. 2008). 바실러스 서브틸리스 VKPM B2116은 고전적인 돌연변이 유발 및 선별로 수득된 바실러스 서브틸리스 SMY의 직접 후손 균주이다. 이 균주의 다른 이름은 바실러스 서브틸리스 VNII Genetika 304이다. 균주의 구성에 대한 설명은 1980년에 출원된 소련 특허 SU908092에 있다. 돌연변이는 후속 돌연변이 유발 및 대사 억제제의 선별로 수득되었다. 균주 VKPM B2116은 플라빈 키나제를 암호화하는 ribC 유전자의 돌연변이로 인해 비타민 B2의 독성 유사체인 로세오플라빈에 내성이 있다. 이 균주는 독성 퓨린 유사체인 8-아자구아닌(8-azaguanine)에도 내성이 있다.
실시예 2: 바실러스 서브틸리스에 최적화된 아이소프레노이드 사이토키닌 생합성을 위한 합성 유전자 IPT 서열번호 1 및 LOG 서열번호 34의 합성
GENEius(Eurofins)를 사용하여 바실러스 서브틸리스에서의 유전자 발현을 위한 코돈-최적화 뉴클레오타이드 서열을 생성하기 위해 아그로박테리움 투메파시엔스(동의어: 아그로박테리움 파브룸(Agrobacterium fabrum))(균주 C58/ATCC 33970))로부터의 아데닐레이트 다이메틸알릴전이효소(IPT) Tzs(유전자 tzs, E.C.2.5.1.27, UniProt: P58758)(서열번호 1) 및 코리네박테리움 글루타미쿰(균주 ATCC 13032/DSM 20300/NCIMB 10025)으로부터의 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제(LOG)(유전자 Cgl2379, E.C. 3.2.2.n1, UniProt: Q8NN34)(서열번호 34)의 아미노산 서열을 사용하였다. RBS 서열 및 합성 아이소프레노이드 사이토키닌 오페론 발현 카세트의 추가 조립을 위한 합성 단편 양쪽 말단의 짧은 어댑터 서열을 추가하여 합성 DNA 단편 IPT-LOG(서열번호 71)를 설계하였다.
실시예 3: 바실러스 서브틸리스에 최적화된 아이소프레노이드 사이토키닌 생합성을 위한 합성 유전자 IPT 서열번호 2 및 LOG 서열번호 34의 합성
GENEius(Eurofins)를 사용하여 바실러스 서브틸리스에서의 유전자 발현을 위한 코돈-최적화 뉴클레오타이드 서열을 생성하기 위해 아그로박테리움 투메파시엔스(동의어: 아그로박테리움 파브룸(Agrobacterium fabrum))(균주 C58/ATCC 33970))로부터의 아데닐레이트 다이메틸알릴전이효소(IPT) Tmr(유전자 izt, E.C.2.5.1.27, Uniprot: P0A3L5)(서열번호 2) 및 코리네박테리움 글루타미쿰으로부터의 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제(LOG)(유전자 Cgl2379, E.C. 3.2.2.n1, UniProt: Q8NN34)(서열번호 34)의 아미노산 서열을 사용하였다. RBS 서열 및 합성 아이소프레노이드 사이토키닌 오페론 발현 카세트의 추가 조립을 위한 합성 단편 양쪽 말단의 짧은 어댑터 서열을 추가하여 합성 DNA 단편 IPT-LOG(서열번호 72)를 설계하였다.
실시예 4: IPT 및 LOG를 함유하는 합성 아이소프레노이드 사이토키닌 오페론의 조립 및 바실러스 서브틸리스로의 형질전환
아이소프레노이드 사이토키닌 생합성을 위한 합성 유전자 IPT-LOG(서열번호 71 및 서열번호 72)를 함유하는 합성 단편을 인공 아이소프레노이드 사이토키닌 오페론에 조립하였다. 바실러스 서브틸리스 게놈 내 amyE 자리로의 안정적 게놈 통합을 위해 유전자 통합 상동성, 프로모터 서열 및 에리트로마이신 선별 마커(서열번호 73)를 함유하는 초기 및 최종 단편을 설계 및 합성하였다.
인공 오페론 조립의 첫 번째 단계로 서열번호 76의 초기 단편을 위해 그리고 아이소프레노이드 사이토키닌 생합성을 위한 유전자들을 함유하는 서열번호 71 및 서열번호 72의 IPT-LOG 합성 단편을 위해 서열번호 74 및 서열번호 75의 프라이머 쌍을 사용하여 별개의 DNA 단편을 PCR 증폭하였다. 서열번호 79의 최종 단편의 증폭을 위해서는 서열번호 77 및 서열번호 78의 프라이머 세트를 사용하였다.
Eppendorf 사이클러 및 제조사에서 제공하는 완충액에서 Phusion 중합효소(Thermo Fisher)를 사용하고 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고 98℃ 30초; (98℃ 30초, 68.5℃ 25초 및 72℃ 23/25초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다.
각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위해 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI) 및 XbaI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI) 및 XbaI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 처음 두 개의 단편을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 80 및 서열번호 81의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. 최종 단편의 결찰을 위해 제한효소 처리, 세척 및 결찰 단계를 반복하였다. PCR 산물을 0.8% 아가로스 겔에서 전기영동하고, 단편을 겔에서 잘라내고, 이전과 같이 소화 및 세척하고, 이전과 같이 결찰하였다. 서열번호 76 및 서열번호 77의 프라이머 쌍을 사용하여 amyE 상동성, RBS 서열을 갖는 프로모터, IPT 및 LOG 유전자 및 에리트로마이신 저항 카세트를 함유하는 최종 오페론을 증폭하고, 앞서 기술된 바와 같이 세척 및 결찰하였다. 바실러스 서브틸리스 VKPM B2116의 형질전환을 위해 서열번호 82 및 서열번호 83의 IPT-LOG를 함유하는 구축된 합성 트랜스-제아틴 오페론을 사용하였다. 서열번호 83의 IPT-LOG 오페론으로 형질전환하여 형질전환 균주 TZAB1, TZAB2, TZAB3 및 TZAB4를 얻었다. 서열번호 82의 IPT-LOG 오페론으로 형질전환하여 형질전환 균주 TZAB14 및 TZAB15를 얻었다. 인공 오페론이 amyE 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.
실시예 5:
dxs
의 과발현으로 아이소프레노이드 전구체 공급이 증가함에 의해 증가된 아이소프레노이드 사이토키닌 생합성
아이소프레노이드 사이토키닌의 생합성을 위한 아이소프레노이드 측쇄는 바실러스 서브틸리스에서 MEP 경로에 의해 합성된다. 바실러스 서브틸리스에서의 유전자 발현을 위한 것으로서 GENEius(Eurofins)의 코돈-최적화 기능을 사용하여 dxs의 합성 뉴클레오타이드 서열을 생성하기 위해 바실러스 서브틸리스의 1-데옥시자일룰로스-5-인산 합성효소(Dxs, EC 2.2.1.7)의 단백질 서열을 사용하였다. 서열번호 84 및 서열번호 85의 dxs 합성 DNA 단편을 중첩 PCR에 의해 연결된 2개의 중첩 부분에 설계하였다. 서열번호 86의 연결된 전체 합성 유전자 dxs를 인공 오페론에 조립하였다. 바실러스 서브틸리스 게놈으로의 안정적 게놈 통합을 위해 lacA 상동성, 프로모터 서열 및 서열번호 87의 스펙티노마이신 선별 마커를 함유하는 초기 및 최종 단편을 설계 및 합성하였다. 단편은 실시예 4에 기술된 바와 같이 조립하였다.
인공 오페론 조립의 첫 번째 단계로 서열번호 88의 초기 단편, 서열번호 89의 최종 단편 및 서열번호 86의 연결된 합성 유전자 dxs를 위해 서열번호 74 및 서열번호 75의 프라이머 세트를 사용하여 별개의 DNA 단편을 PCR 증폭하였다.
Eppendorf 사이클러 및 제조사에서 제공하는 완충액에서 Phusion 중합효소(Thermo Fisher)를 사용하고 50㎕의 최종 부피에 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하여 30 사이클 동안 단편들을 증폭하였다. 98℃ 30초; (98℃ 30초, 71℃ 25초 및 72℃ 23/25초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하였다.
각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위해 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI) 및 XbaI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI) 및 XbaI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 처음 두 개의 단편을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 74 및 서열번호 75의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. 최종 단편의 결찰을 위해 제한효소 처리, 세척 및 결찰 단계를 반복하였다. 마지막 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR에서 서열번호 90의 완전한 합성 dxs 오페론을 위한 주형으로 사용하고, 서열번호 91 및 서열번호 92의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. PCR 산물을 0.8% 아가로스 겔에서 전기영동하고, 단편을 겔에서 잘라내고, 이전과 같이 세척하고, 이전과 같이 결찰하였다. 바실러스 서브틸리스 TZAB15를 IPT-LOG 오페론으로 amyE에 형질전환하기 위해 구축된 합성 dxs 오페론을 사용하였다(서열번호 80). 인공 DXS 오페론(서열번호 90)으로 형질전환하여 형질전환 균주 TZAB43을 얻었다. 인공 오페론이 lacA 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.
실시예 6: 아이소프레노이드 사이토키닌의 생산을 위한 바실러스 서브틸리스 균주의 배양
구축된 균주 및 대조 균주 모두는 이 절차에 따라 배양하였다. 20% 글리세롤에 담겨 -80℃에 보관된 VKPM B2116, TZAB1, TZAB2, TZAB3, TZAB4, TZAB14, TZAB15 및 TZAB43 균주들의 동결 스톡을 에리트로마이신과 린코마이신이 적절한 농도로 함유된 고체 종배양 배지에 도말하고 37℃에서 대략 1일 동안 인큐베이션하였다. 추가 시험을 위해, 영양-단계 배지에 접종하되, 25㎖의 영양 배지 및 적절한 양의 항생제가 함유된 주름진 250㎖ 에를렌마이어 플라스크당 1 내지 5개의 고체 종배양 플레이트 배양물 플러그를 접종하였다. 220RPM에서 18 내지 20시간 동안 37℃에서 인큐베이션하였다. 영양 배지의 배양물을 종배양물로 사용하여 생산 배지에 접종하였다. 10% 접종원을 사용하였다(250㎖ 에를렌마이어 플라스크에 담긴 25㎖의 생산 배지당 2.5㎖). 기술된 바와 같은 생산 배지를 사용하거나 황산 아데닌으로 수정하였다(최종 농도 3g/ℓ). 220RPM에서 최대 48시간 동안 30℃ 또는 37℃에서 인큐베이션하였다. 발효된 배양물 시료를 취하고 실시예 7에 기술된 바와 같이 분석하였다. 트랜스-제아틴, 트랜스-제아틴 리보사이드 및 아이소펜테닐 아데닌의 역가는 실시예 7에 기술된 바와 같이 LC/MS를 사용하여 측정하였다.
영양 배지의 성분들(표 7)을 혼합하고 pH를 7.2 내지 7.4로 설정하였다. 다음 KH2PO4 - K2HPO4 용액을 최종 농도 KH2PO4 1.5g/ℓ 및 K2HPO4 3.5g/ℓ로 첨가하였다. 배지를 에를렌마이어 플라스크에 분배하고(250㎖-주름진 에를렌마이어 플라스크당 25㎖) 121℃에서 30분 오토클레이브하였다. 오토클레이브 이후 멸균 포도당을 최종 농도 7.5g/ℓ로 첨가하였다. 접종 전에 항생제를 첨가하였다.
생산 배지의 성분들(표 8)을 혼합하고 pH를 7.2 내지 7.4로 설정하였다. 다음 KH2PO4 - K2HPO4 용액을 최종 농도 KH2PO4 1.5g/ℓ 및 K2HPO4 3.5g/ℓ로 첨가하였다. 배지를 30분 동안 121℃에서 오토클레이브하였다. 오토클레이브 이후 멸균 우레아 용액(20㎖의 스톡 용액, 최종 농도는 6g/ℓ), 멸균 포도당 용액(500㎖의 스톡 용액, 최종 농도는 100g/ℓ 포도당)을 첨가하여 1ℓ의 생산 배지를 얻었다. 접종 전에 적절한 항생제를 첨가하였다. 이후 배지를 멸균 에를렌마이어 플라스크에 분배하였다(250㎖-주름진 에를렌마이어 플라스크당 25㎖).
실시예 7: 아이소프레노이드 사이토키닌 분석
실시예 6에 기술된 절차에 따라 배양한 모든 균주들을 이 절차에 따라 분석하였다. 발효된 생산 배지 시료를 취하고 바로 -20℃에서 동결시켰다. 대사산물의 추출을 위해, 발효 생산 배지를 pH 4의 메탄올과 100mM 아세트산 암모늄의 1:1 혼합물로 구성된 추출 완충액으로 1:1로 희석하였다. 시료를 일정하게 교반하면서 상온에서 1시간 동안 추출하고, 15분 동안 4000 내지 4500RPM으로 원심분리하고, 여과(0.22㎛)하였다. 즉시 시료를 LC/MS로 분석하거나 분석할 때까지 -20℃에 보관하였다.
MS/MS 가능 질량 분석기인 Thermo TSQ Quantum Access MAX에 연결된 Thermo Accela 1250 HPLC 장비에서 시료를 분석하였다. 이 방법은 150×4.6㎜, 2.6㎛ 입자 크기의 Thermo Accucore C30 칼럼, 60℃ 유지, 이동상 A - 0.1% 포름산 함유 물 및 이동상 B - 메탄올의 구배 프로그램의 사용과 다음의 출발 조건의 사용을 기반으로 한다: 95% A, 10분에 B%에서 50%까지의 선형 구배 증가 및 초기 조건으로 5분 안정화, 1㎖/분 유속. 질량 분석기는 hESI 이온 공급원이 장착되어 있고, 양성(+) 모드에서 작동되며, 스프레이 전압이 4600V로 설정되어 있고, 기화기 온도는 350℃이며, 1.0torr의 충돌 압력 및 10V의 충돌 에너지로 설정되었다. 트랜스-제아틴은 모 이온 219.9m/z에서 딸 이온 185.2, 148.0 및 136.0으로의 전이로 MRM 모드에서 관찰되었다.
트랜스-제아틴 리보사이드(tZR)는 모 이온 352.5m/z에서 딸 이온 220.1, 202.1, 148.0 및 136.1로의 전이로 MRM 모드에서 관찰되었다. 아이소펜테닐 아데닌(iP)는 모 이온 204.4m/z에서 딸 이온 148.4, 136.3 및 119.2로의 전이로 MRM 모드에서 관찰되었다. 아이소펜테닐 아데닌 리보사이드(iPR)는 모 이온 336.5m/z에서 딸 이온 204.1, 148.0 및 113.1로의 전이로 MRM 모드에서 관찰되었다.
실시예 8: IPT 및 LOG를 이종 발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산
실시예 6에 기술된 바와 같이 배양을 수행하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였다. 검출된 아이소프레노이드 사이토키닌의 수율을 도 4에 나타내었다. 서열번호 82의 IPT-LOG 발현 균주는 최대 10㎎/ℓ의 양으로 아이소프레노이드 사이토키닌을 생산한다(도 4 참조).
실시예 9: 성장 배지에서 황산 아데닌과 함께 IPT 및 LOG를 이종 발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산
실시예 6에 기술된 바와 같이 배양을 수행하였다. 생산 배지는 실시예 6에 기술된 바와 같이 구성되거나, 최종 농도 3g/ℓ로 황산 아데닌으로 수정되었다. 발효 배양액을 추출하고 실시예 7에 기술된 바와 같이 분석하였다. 이의 결과는 도 5에 나타내었다. 서열번호 82의 IPT-LOG를 갖는 TZAB14 균주에서 아이소프레노이드 사이토키닌의 생산은 황산 아데닌이 없는 배지와 비교하여 황산 아데닌을 함유하는 배지에서 증가하였다.
실시예 10: 서열번호 82의 IPT-LOG를 이종 발현하고 DXS를 과발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산
실시예 6에 기술된 바와 같이 배양을 수행하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였다. 수율은 도 6에 나타내었다. 서열번호 82의 IPT-LOG 오페론 및 서열번호 90의 DXS 오페론을 갖는 균주에서 아이소프레노이드 사이토키닌의 생산이 증가되었다.
실시예 11: IPT-LOG(서열번호 83)를 갖는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌 생산의 분석
실시예 6에 기술된 바와 같이 배양을 수행하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였다. 서열번호 83의 IPT-LOG를 갖는 TZAB1, TZAB2, TZAB3 및 TZAB4 균주와 서열번호 82의 IPT-LOG를 갖는 TZAB14 및 TZAB15 균주는 아이소프레노이드 사이토키닌을 생산하였다. 이의 결과는 도 7에 나타내었다.
실시예 12: 바실러스 서브틸리스 균주에서 IPT-LOG 오페론, IPT 및 DXS의 이종 발현을 사용한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산
실시예 4에 기술된 바와 같이 아이소프레노이드 사이토키닌 생합성을 위한 IPT1-LOG1 유전자를 함유하는 합성 DNA 단편(서열번호 71)을 인공 아이소프레노이드 사이토키닌 오페론에 조립하였다.
서열번호 123 및 서열번호 183의 프라이머들을 사용하여 IPT1-LOG1(서열번호 82) 단편의 첫 번째 부분을 PCR 증폭하고 별도로 서열번호 123 및 서열번호 128의 프라이머들을 사용하여 IPT1-LOG1(서열번호 82)의 마지막 부분을 PCR 증폭하여 IPT1(서열번호 1)만을 함유하는 IPT1 발현 카세트를 조립하였으며, 이때 Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고 98℃ 30초; (98℃ 30초, 68.5℃ 25초 및 72℃ 25초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 수행하였다. PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰로 단편을 인공 IPT1 발현 카세트에 조립하였다. 성공적인 결찰을 위해 호환 가능한 제한 말단을 제공하기 위해 XbaI 제한 부위를 사용하였다. 결찰 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 XbaI(Thermo Fisher) 제한 효소 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 처음 두 개의 단편을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 123 및 서열번호 128의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. IPT 단편을 갖는 최종 발현 카세트(서열번호 184)를 생성하였다.
이후 IPT1-LOG1(서열번호 82) 또는 IPT 단편(서열번호 184)을 함유하는 트랜스-제아틴 오페론을 위해 구축된 최종 발현 카세트를 바실러스 서브틸리스 VKPM B2116, 바실러스 서브틸리스 168 및 바실러스 서브틸리스 RB50 균주의 형질전환에 사용하였고 표 9에 나타낸 새로운 형질전환 균주를 개발하였다. 인공 오페론이 amyE 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.
dxs 유전자를 함유하는 합성 단편(서열번호 86)을 실시예 5에 기술된 바와 같이 발현 카세트에 조립하였다. 구축된 DXS 발현 카세트(서열번호 90)를 바실러스 서브틸리스 VKPM B2116, 바실러스 서브틸리스 168 및 바실러스 서브틸리스 RB50 유래 균주의 형질전환에 사용하였고 표 9에 나타낸 새로운 형질전환 균주를 개발하였다. 인공 오페론이 lacA 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.
모든 구축된 균주 및 대조 균주는 실시예 6에 기술된 절차에 따라 배양하였다. 20% 글리세롤에 담겨 -80℃에 보관된 균주들의 동결 스톡을 에리트로마이신과 린코마이신이 적절한 농도로 함유된 고체 종배양 배지에 도말하고 37℃에서 대략 1일 동안 인큐베이션하였다. 추가 시험을 위해, 영양-단계 배지에 접종하되, 25㎖의 영양 배지 및 적절한 양의 항생제가 함유된 주름진 250㎖ 에를렌마이어 플라스크당 1 내지 5개의 고체 종배양 플레이트 배양물 플러그를 접종하였다. 220RPM에서 8 내지 20시간 동안 37℃에서 인큐베이션하였다. 영양 배지의 배양물을 종배양물로 사용하여 생산 배지에 접종하였다. 10% 접종원을 사용하였다(250㎖ 에를렌마이어 플라스크에 담긴 25㎖의 생산 배지당 2.5㎖). 생산 배지는 바실러스 서브틸리스 168 유래 균주의 평가를 위해 트립토판으로 수정하였다(최종 농도 50㎎/ℓ). 220RPM에서 최대 48시간 동안 30℃, 34℃ 또는 37℃에서 인큐베이션하였다. 발효된 배양물 시료를 취하고 실시예 7에 기술된 바와 같이 분석하였다. 트랜스-제아틴(tZ), 트랜스-제아틴 리보사이드(tZR) 및 아이소펜테닐 아데닌 리보사이드(iPR) 및 아이소펜테닐 아데닌(iP)의 역가는 실시예 7에 기술된 바와 같이 LC/MS를 사용하여 측정하였다.
추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였다. 검출된 아이소프레노이드 사이토키닌의 수율을 표 17, 도 8, 도 9 및 도 10에 나타내었다. 서열번호 82의 IPT-LOG 발현 균주는 최대 60㎎/ℓ의 총량으로 아이소프레노이드 사이토키닌을 생산하며(도 10 참조) 아이소프레노이드 사이토키닌의 생산은 IPT-LOG 오페론(서열번호 82)을 갖는 균주 및 DXS 오페론(서열번호 90)을 갖는 균주에서 추가로 전반적으로 증가하였다.
실시예 13: 대장균 BL21(DE3) 균주에서 IPT, IPT1-LOG1 오페론 및 DXS의 이종 발현을 사용한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산
가능한 아이소프레노이드 사이토키닌 생산 균주로서 대장균을 평가하기 위해, 2개의 발현 플라스미드 세트를 구축하였다.
첫 번째 세트는 합성 유전자 IPT(서열번호 179) 및 IPT-LOG 오페론(서열번호 82)의 이종 사이토키닌 유전자/오페론 발현을 위한 플라스미드이다. IPT 유전자 또는 IPT-LOG 오페론을 pBBR1 플라스미드 벡터에 조립하였다. pBBR1 벡터는 아이소프로필-β-D-1-티오갈락토파이란노사이드(IPTG)로 유도할 수 있는 프로모터: LacIQ/P lacUV5 -T7 기반의 이종 발현 시스템을 가지며 선별 마커로서 클로람페니콜 저항성 카세트를 함유한다.
두 번째 플라스미드는 DXS(서열번호 90)의 이종 발현으로 아이소프레노이드 전구체 공급을 증가시키기 위해 클로닝하였다. DXS 유전자를 p15A 플라스미드 벡터에 조립하였다. p15A 벡터는 XylS/Pm 기반의 발현 시스템을 갖는다: 여기서 XylS은 m-톨루엔산염 유도성 Pm 프로모터의 양성 조절인자이며 선별 마커로서 카나마이신 저항성 카세트를 함유한다.
발현 플라스미드 조립의 첫 번째 단계는 삽입 단편인 IPT-LOG 및 DXS와 벡터 백본인 pBBR1 및 p15A의 PCR 증폭이다. IPT DNA 단편은 서열번호 163 및 서열번호 182의 프라이머 세트로 증폭하였고, IPT-LOG DNA 단편은 IPT를 위한 서열번호 163 및 서열번호 164의 프라이머 세트 및 LOG 증폭을 위한 서열번호 165 및 서열번호 166의 프라이머 세트로 증폭하였다. 서열번호 167 및 서열번호 168의 프라이머 세트는 pBBR1 벡터 백본을 증폭하기 위해 사용하였다. DXS 단편은 서열번호 169 및 서열번호 170의 프라이머 세트로 증폭하였고 서열번호 171 및 서열번호 172의 프라이머 세트는 p15A 벡터 백본을 증폭하기 위해 사용하였다. Eppendorf 사이클러를 사용하고 Phusion 중합효소(Thermo Fisher)를 제조사에서 제공하는 완충액에 첨가하여 사용하여 단편들을 증폭하였고 30 사이클 동안 50㎕의 최종 부피에 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 각 단편의 양은 NanoDrop 기기를 사용하여 260㎚에서의 흡광도로 측정하였다. 10㎕ HIFI 조립 반응(NEBuilder HiFi DNA Assembly Master Mix)을 사용하여 단편들을 최종 발현 작제물로 조립하였다. 반응은 얼음 상에서 설정하였으며, 5㎕의 HIFI DNA Assembly Master Mix에 대해 단편들을 1:2의 벡터:삽입물 DNA 몰 비율로 첨가하였다(단편들의 총량은 최대 0.2pmol이었음). 반응액을 최종 부피 10㎕가 되도록 뉴클레아제 제외 물로 채웠다. 열순환기에서 시료를 60분 동안 50℃에서 인큐베이션하였다. 다음 단계에서, 1㎕의 냉각한 조립 산물을 수용성 대장균 BL21(DE3) 세포의 형질전환에 사용하였다. 수득한 균주에서 플라스미드 DNA를 분리하고 시퀀싱하여 올바르게 조립되었는지 확인하였다.
DXS 유전자의 발현을 위한 p15A 플라스미드의 형질전환으로 형질전환 균주 TZ3077을 얻었다. IPT 유전자의 발현을 위한 pBBR1 플라스미드의 형질전환으로 형질전환 균주 TZAB3079를 얻었다. IPT-LOG 오페론의 발현을 위한 pBBR1 플라스미드의 형질전환으로 형질전환 균주 TZ3082를 얻었다. 추가로, IPT 유전자 및 IPT-LOG 오페론 발현 플라스미드를 TZ3077(DXS 발현 플라스미드를 갖는 대장균 BL21(DE3) 균주)에 형질전환하였다. 하나는 DXS 유전자를 위한 것이고 다른 것은 IPT 유전자 발현을 위한 것인 두 개의 플라스미드를 갖는 수득된 균주는 TZAB3087로 저장하였다. 하나는 DXS 유전자를 위한 것이고 다른 것은 IPT-LOG 오페론 발현을 위한 것인 두 개의 플라스미드를 갖는 수득된 균주는 TZ3091로 저장하였다. 모든 형질전환체들은 cPCR로 확인하였고 아래 표 10에 나열하였다.
구축된 균주들(TZ3077 내지 TZ3091) 및 대조 균주인 대장균 BL21(DE3)을 20% 글리세롤에 담아 -80℃에 보관하였다. 균주들은 항상 적절한 농도의 선별 항생제(카나마이신/클로람페니콜)의 존재 내에서 배양하였다. 먼저, 이들을 고체 종배양 배지 - 2YT 한천 플레이트(표 11)에 도말하고 37℃에서 대략 17시간 동안 인큐베이션하였다. 추가 시험을 위해, 영양-단계 배지 - 2YT에 50㎖의 영양 배지 및 적절한 양의 항생제가 함유된 250㎖ 에를렌마이어 플라스크당 1개의 고체 종배양 플레이트 배양 단일 콜로니를 접종하였다. 220RPM에서 17시간 동안 37℃에서 인큐베이션하였다. 영양 배지(표 12)에서의 배양물을 종배양물로 사용하였고, 2.5% 접종물을 250㎖ 에를렌마이어 플라스크에 담긴 50㎖의 생산 배지의 접종을 위해 사용하였다. 생산 배지(표 13)로 포도당이 보충된 2YT를 사용하였다(멸균 포도당을 25g/ℓ의 최종 농도로 오토클레이브 후에 첨가함). 220RPM에서 10시간 동안 37℃에서 인큐베이션하였다. 2시간의 발효 후, 발현 플라스미드를 갖는 균주들을 유도시켰다. IPT/IPT-LOG 발현 플라스미드를 갖는 균주는 최종 농도 150μM의 IPTG로 유도시켰다. DXS 발현 플라스미드를 갖는 균주는 최종 농도 1mM의 m-톨루엔산염으로 유도시켰다. 두 가지 발현 시스템(DXS 및 IPT/IPT-LOG)을 모두 갖는 균주는 두 가지 유도인자들(150μM IPTG 및 1mM m-톨루엔산염)로 유도시켰다. 10시간의 발효 후, 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 분석을 위해 배양액 시료를 취하였다. 사용한 추출 프로토콜은 실시예 7에 기술된 바와 같다. 트랜스-제아틴, 트랜스-제아틴 리보사이드, 아이소펜테닐 아데닌 및 아이소펜테닐 아데닌 리보사이드의 역가는 실시예 7에 기술된 바와 같이 LC/MS를 사용하여 측정하였다.
검출된 아이소프레노이드 사이토키닌의 수율을 도 11에 나타내었다. 하나 또는 두 가지의 선별 항생제의 존재 내에서 균주 성장이 다르고 서로 다른 유도인자를 사용했기 때문에, 사이토키닌의 측정치를 600㎚에서의 각 배양액의 광학밀도(OD600)로 나누어 정규화하였다.
IPT를 발현하는 균주는 최대 2.8㎎/ℓ의 양으로 아이소프레노이드 사이토키닌을 생산하였다(도 11 및 표 17 참조). IPT-LOG를 발현하는 균주는 최대 3.4㎎/ℓ의 양으로 아이소프레노이드 사이토키닌을 생산하였다. 아이소프레노이드 사이토키닌의 생산은 IPT-LOG의 발현 및 아이소프레노이드 전구체 공급을 위한 추가적인 DXS의 발현이 있는 균주에서 3.4㎎/ℓ로 증가하였다.
실시예 14: 클로닝 벡터로의 IPT1-LOG1 오페론, IPT1 및 DXS 유전자의 조립 및 코리네박테리움 스테이셔니스로의 플라스미드의 형질전환
서열번호 178의 단편을 위한 서열번호 173 및 서열번호 174의 프라이머 세트를 사용하여 앞서 구축된 서열번호 82의 합성 트랜스-제아틴 오페론으로부터 아이소프레노이드 사이토키닌 생합성을 위한 IPT1-LOG1(서열번호 178) 유전자를 함유하는 합성 단편을 증폭하였고 IPT1 유전자(서열번호 180)의 발현을 위한 서열번호 180의 단편의 구축을 위해 서열번호 173 및 서열번호 177의 프라이머 세트를 사용하였다. Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 63.3℃ 25초 및 72℃ 45초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다.
합성 dxs 유전자(서열번호 181)는 서열번호 175 및 서열번호 176의 프라이머 세트를 사용하여 서열번호 90의 앞서 구축된 합성 dxs 오페론으로부터 증폭하였는데, 이때 Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 67.6℃ 25초 및 72℃ 60초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 시행하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다.
제조사에서 제공하는 프로토콜에 따른 NEBuilder HiFi DNA Assembly Master Mix를 사용한 HiFi 조립 반응으로 IPT1 유전자 및 IPT1-LOG1 아이소프레노이드 사이토키닌 오페론을 추가로 pVWEx6 플라스미드(Henke et al. 2021)에 클로닝하고 dxs 유전자 발현 카세트를 pECXT99APsyn 플라스미드에 클로닝하였다. 두 가지 플라스미드 모두 BamHI FD 제한 효소로 소화시켜 사전에 선형화하였다. HiFi 반응 혼합물을 추가로 전기수용성 DH10β 대장균 세포의 전기천공을 위해 사용하였다. 카나마이신 선별 마커는 pVWEx6 + IPT1-LOG1 및 pVWEx6 + IPT1 형질전환체의 선별을 가능하게 하며, pECXT99APsyn + dxs 형질전환체의 선별을 위해서는 테트라사이클린을 사용하였다. 형질전환체들은 콜로니 PCR로 확인하였다. 플라스미드 분리를 위해 콜로니를 적절한 항생제가 있는 2TY 배지에 접종하고 37℃에서 밤새 인큐베이션하였다. GeneJET Plasmid Miniprep Kit(Thermo Fisher) 플라스미드 추출 키트를 사용하여 제조사에서 제공하는 프로토콜에 따라 밤새 배양한 배양물로부터 플라스미드를 분리하였다. 분리한 플라스미드는 KpnI 및 XbaI FD 제한 효소로 소화시켜 추가로 분석하였다.
생성된 플라스미드를 코리네박테리움 스테이셔니스 DSM 20305에 형질전환하기 위해 문헌[Yili et al. 2015]에 따라 전기수용성 세포를 준비하였다. 분리된 플라스미드의 형질전환은 2㎜ 큐벳을 사용하여 BioRad의 전기천공기를 사용하여 수행하였다. 대략 250ng의 플라스미드를 50㎕의 앞서 준비한 전기수용성 세포 분취물에 도입하고, 2㎜ 큐벳으로 옮기고, 전기 펄스에 노출시켰다. 즉시 세포를 1㎖의 재생 배지 함유 2㎖ Eppendorf 튜브로 옮겼다. 30℃ 및 200rpm으로 설정한 교반기에서 3시간 동안 인큐베이션한 다음, 형질전환체를 적절한 농도의 선별 마커가 있는 회수 한천 플레이트 LBHIS에 도말하였다. 수득한 형질전환체(표 14에 나타냄)는 콜로니 PCR로 확인하였다.
pVWEx6+ipt1-log1 및 pECXT99APsyn+dxs, 그리고 pVWEx6+ipt1 및 pECXT99APsyn+dxs의 형질전환을 위해, 확인된 형질전환체를 2세대 균주를 위한 새로운 전기수용성 세포의 준비를 위해 사용하였다. 전기수용성 세포를 추가 플라스미드로 형질전환시키고 플레이트 상에서 카나마이신과 테트라사이클린으로 선별하였다. 두 플라스미드에 대해 형질전환체의 콜로니 PCR 검증을 수행하였다.
실시예 15: 코리네박테리움 스테이셔니스 이종 발현에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산
모든 구축된 균주들 및 대조 균주는 이 절차에 따라 배양하였다. 20% 글리세롤에 담겨 -80℃에 보관된 코리네박테리움 스테이셔니스 DSM 20305, TZ3136, TZ3138, TZ3139, TZ3142 및 TZ3146 균주들의 동결 스톡을 테트라사이클린 또는/및 카나마이신이 적절한 농도로 함유된 고체 종배양 배지에 도말하고 30℃에서 대략 1일 동안 인큐베이션하였다. 추가 시험을 위해, 영양-단계 배지에 접종하되, 25㎖의 영양 배지 및 적절한 양의 항생제가 함유된 주름진 250㎖ 에를렌마이어 플라스크당 5개의 고체 종배양 플레이트 배양물 플러그를 접종하였다. 200RPM에서 18시간 동안 30℃에서 인큐베이션하였다. 영양 배지의 배양물을 종배양물로 사용하여 생산 배지에 접종하였다. 10% 접종원을 사용하였다(주름진 250㎖ 에를렌마이어 플라스크에 담긴 25㎖의 생산 배지당 2.5㎖). 200RPM에서 최대 48시간 동안 30℃에서 인큐베이션하였다. 발효된 배양물 시료를 취하고 실시예 7에 기술된 바와 같이 분석하였다. 트랜스-제아틴, 트랜스-제아틴 리보사이드, 아이소펜테닐 아데닌 및 아이소펜테닐 아데닌 리보사이드의 역가는 실시예 7에 기술된 바와 같이 LC/MS를 사용하여 측정하였다.
실시예 16: 코리네박테리움 스테이셔니스 이종 발현에 의한 아이소프레노이드 사이토키닌의 분석
발효 과정에서 코리네박테리움 스테이셔니스 형질전환체의 아이소프레노이드 사이토키닌 생산을 시험하였다. 배양은 실시예 15에 기술된 바와 같이 수행하였다. 추출 및 분석은 실시예 7에 기술된 절차에 따라 수행하였다. 이의 결과는 도 12 및 표 17에 나타내었다.
실시예 17:
purA
유전자의 과발현에 의한 바실러스 서브틸리스의 퓨린 뉴클레오타이드 생합성 경로의 증강
퓨린 뉴클레오타이드 생합성 경로의 증강을 위해 사용한 purA 유전자 함유 합성 단편(서열번호 98)을 인공 유전자 발현 카세트에 조립하였다. 바실러스 서브틸리스 게놈의 yybN 자리로의 안정적 게놈 통합을 위해 유전자 통합 상동성, 프로모터 서열 및 제오신(zeocin) 선별 마커를 함유하는 초기(서열번호 96) 및 최종 단편(서열번호 97)을 설계 및 합성하였다.
인공 오페론 조립의 첫 번째 단계로 서열번호 96의 초기 단편을 위해 서열번호 99 및 서열번호 100의 프라이머 쌍 및 서열번호 97의 최종 단편을 위해 서열번호 101 및 서열번호 102의 프라이머 세트를 사용하여 별개의 DNA 단편을 PCR 증폭하였다. 서열번호 103 및 서열번호 104의 프라이머 세트는 서열번호 98의 purA 과발현을 위한 유전자 함유 단편의 증폭을 위해 사용하였다. Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 65℃ 25초 및 72℃ 23/25초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위한 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI) 및 XbaI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI) 및 XbaI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 처음 두 개의 단편을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 102 및 서열번호 105의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. 최종 단편의 결찰을 위해 제한효소 처리, 세척 및 결찰 단계를 반복하였다. PCR 산물을 0.8% 아가로스 겔에서 전기영동하고, 단편을 겔에서 잘라내고, 이전과 같이 소화 및 세척하고, 이전과 같이 결찰하였다. 서열번호 106 및 서열번호 107의 프라이머 쌍을 사용하여 yybN 상동성, RBS 서열을 갖는 프로모터, purA 유전자 및 제오신 저항성 카세트를 함유하는 최종 오페론을 증폭하고, 앞서 기술된 바와 같이 세척 및 결찰하였다. 바실러스 서브틸리스 VKPM B2116의 형질전환을 위해 구축된 합성 오페론을 사용하였다. 서열번호 108의 purA 오페론으로 형질전환하여 형질전환 균주 BS19를 얻었다. 인공 오페론이 yybN 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.
실시예 18: LOG8 유전자와의 조합으로 다양한 IPT 유전자의 상동체를 함유하는 합성 아이소프레노이드 사이토키닌 오페론의 조립 및 바실러스 서브틸리스로의 형질전환
아이소프레노이드 사이토키닌 생합성을 위한 합성 LOG 유전자(LOG8 - 서열번호 116) 및 다양한 IPT 유전자(서열번호 129, 154 내지 156)를 함유하는 합성 단편을 인공 아이소프레노이드 사이토키닌 오페론에 조립하였다. 바실러스 서브틸리스 게놈의 amyE 자리로의 안정적 게놈 통합을 위해 유전자 통합 상동성, 프로모터 서열 및 에리트로마이신 선별 마커(서열번호 73)를 함유하는 초기 및 최종 단편을 설계 및 합성하였다.
인공 오페론 조립의 첫 번째 단계로 서열번호 76의 초기 단편을 위해, 그리고 아이소프레노이드-사이토키닌 생합성을 위한 유전자들을 함유하는 합성 단편 LOG8(서열번호 116) 및 IPT1, IPT6, IPT7 및 IPT9 단편들(각각 서열번호 179, 151, 152 및 153)을 위해, 서열번호 74 및 서열번호 75의 프라이머 쌍을 사용하여 별개의 DNA 단편을 PCR 증폭하였다. 서열번호 77 및 서열번호 78의 프라이머 세트는 서열번호 79의 최종 단편의 증폭을 위해 사용하였다. Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 65℃ 25초 및 72℃ 30초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위한 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI), VspI, NdeI 및 SnaBI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI), VspI, NdeI 및 SnaBI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 초기 단편 및 다양한 IPT 단편들(서열번호 179, 151, 152 및 153)을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 120 및 서열번호 121의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. DNA 단편들을 앞서 기술된 바와 같이 아가로스 겔에서 추출하였다. AmyE + IPT1 오페론, AmyE + IPT6 오페론, AmyE + IPT7 오페론 및 AmyE + IPT9 오페론(각각 서열번호 129, 154, 155 및 156) 및 LOG8 유전자 함유 단편(서열번호 116)의 결찰을 위해 제한효소 처리(VspI 및 NdeI), 세척 및 결찰 단계를 반복하였다. 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 122 및 서열번호 123의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. DNA 단편들을 앞서 기술된 바와 같이 아가로스 겔에서 추출하였다. 이전에 SnaBI 제한 부위에 의해 결찰되었고 서열번호 126 및 서열번호 127의 프라이머 세트를 사용하여 PCR 증폭된, AmyE 0 + IPT1/6/7/9 + LOG8 오페론(각각 서열번호 136, 157, 158 및 159) 및 EryR + AmyE END 오페론(서열번호 140)을 결찰하기 위해 XbaI 효소 처리를 수행하였다.
서열번호 128 및 서열번호 123의 프라이머 쌍을 사용하여 amyE 상동성, RBS 서열을 갖는 프로모터, 다양한 IPT 유전자와 LOG8 유전자 및 에리트로마이신 저항 카세트를 함유하는 최종 오페론을 증폭하고, 앞서 기술된 바와 같이 세척 및 결찰하였다. 바실러스 서브틸리스 BS19(실시예 17에 기술되어 있음)의 형질전환을 위해 IPT1-LOG8, IPT6-LOG8, IPT7-LOG8 및 IPT9-LOG8(각각 서열번호 147, 160, 161 및 162)을 함유하는 구축된 합성 트랜스-제아틴 오페론을 사용하였다. 모든 형질전환체들은 cPCR로 확인하였고 아래 표 18에 나열하였다. 모든 구축된 균주들은 실시예 6에 기술된 바와 같이 배양하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였고 사이토키닌의 수율을 도 13에 나타내었다.
실시예 19: IPT1 및 다양한 LOG를 함유하는 합성 아이소프레노이드 사이토키닌 오페론의 조립 및 바실러스 서브틸리스로의 형질전환
아이소프레노이드 사이토키닌 생합성을 위한 합성 IPT1 유전자(서열번호 71) 및 다양한 LOG 유전자(서열번호 110 내지 119)를 함유하는 합성 단편을 인공 아이소프레노이드 사이토키닌 오페론에 조립하였다. 바실러스 서브틸리스 게놈의 amyE 자리로의 안정적 게놈 통합을 위해 유전자 통합 상동성, 프로모터 서열 및 에리트로마이신 선별 마커를 함유하는 초기 및 최종 단편을 설계 및 합성하였다.
인공 오페론 조립의 첫 번째 단계로 서열번호 76의 초기 단편을 위해, 아이소프레노이드-사이토키닌 생합성을 위한 유전자들을 함유하는 서열번호 71의 합성 단편 IPT1 및 LOG2 내지 LOG11 단편들(서열번호 110 내지 119)을 위한, 서열번호 74 및 서열번호 75의 프라이머 쌍을 사용하여 별개의 DNA 단편을 PCR 증폭하였다. 서열번호 126 및 서열번호 127의 프라이머 세트는 에리트로마이신 선별 마커를 함유하는 최종 단편(서열번호 140)의 증폭을 위해 사용하였다. Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 65℃ 25초 및 72℃ 30초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위한 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI), VspI, NdeI, XbaI 및 SnaBI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI), VspI, NdeI, XbaI 및 SnaBI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다.
처음 두 단편들을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 120 및 서열번호 121의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. DNA 단편들을 앞서 기술된 바와 같이 아가로스 겔에서 추출하였다. 다양한 LOG 유전자(서열번호 110 내지 119) 함유 단편의 결찰을 위해 제한효소 처리(VspI 및 NdeI), 세척 및 결찰 단계를 반복하였다. 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 122 및 서열번호 123의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. DNA 단편들을 앞서 기술된 바와 같이 아가로스 겔에서 추출하였다. 이전에 SnaBI 제한 부위에 의해 결찰되었고 서열번호 126 및 서열번호 127의 프라이머 세트를 사용하여 PCR 증폭된, AmyE 0 + IPT1 + LOG2 내지 11 오페론(각각 서열번호 130 내지 139) 및 EryR + AmyE END 오페론(서열번호 140)을 결찰하기 위해 XbaI 효소 처리를 수행하였다.
서열번호 128 및 서열번호 123의 프라이머 쌍을 사용하여 amyE 상동성, RBS 서열을 갖는 프로모터, IPT1 및 다양한 LOG 유전자 및 에리트로마이신 저항성 카세트를 함유하는 최종 오페론을 증폭하고, 앞서 기술된 바와 같이 세척 및 결찰하였다. 바실러스 서브틸리스 BS19(실시예 17에 기술되어 있음)의 형질전환을 위해 IPT1-LOG 2 내지 11(서열번호 141 내지 150)을 함유하는 구축된 합성 트랜스-제아틴 오페론을 사용하였다. 모든 형질전환체들은 cPCR로 확인하였고 아래 표 19에 나열하였다. 모든 구축된 균주들은 실시예 6에 기술된 바와 같이 배양하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였고 사이토키닌의 수율을 도 14에 나타내었다.
설명에 인용된 참고문헌 목록
SEQUENCE LISTING
<110> ACIES BIO D.O.O.
<120> Genetically engineered bacterium capable of producing cytokinins
with isoprenoid side chains
<130> WO2022112509
<140> PCT/EP2021/083188
<141> 2021-11-26
<150> EP20075015
<151> 2020-11-26
<160> 184
<170> PatentIn version 3.5
<210> 1
<211> 243
<212> PRT
<213> Agrobacterium tumefaciens
<400> 1
Met Leu Leu His Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp
1 5 10 15
Met Ala Ile Gln Ile Ala Gln Glu Thr Gly Trp Pro Val Val Ala Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro
35 40 45
Leu Glu Ser Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Ser Arg
50 55 60
Pro Leu Thr Glu Gly Ile Leu Asp Ala Glu Ser Ala His Arg Arg Leu
65 70 75 80
Ile Phe Glu Val Asp Trp Arg Lys Ser Glu Glu Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Asn Cys Met Ala Lys Ser Pro Phe Trp
100 105 110
Arg Ser Gly Phe Gln Trp His Val Lys Arg Leu Arg Leu Gly Asp Ser
115 120 125
Asp Ala Phe Leu Thr Arg Ala Lys Gln Arg Val Ala Glu Met Phe Ala
130 135 140
Ile Arg Glu Asp Arg Pro Ser Leu Leu Glu Glu Leu Ala Glu Leu Trp
145 150 155 160
Asn Tyr Pro Ala Ala Arg Pro Ile Leu Glu Asp Ile Asp Gly Tyr Arg
165 170 175
Cys Ala Ile Arg Phe Ala Arg Lys His Asp Leu Ala Ile Ser Gln Leu
180 185 190
Pro Asn Ile Asp Ala Gly Arg His Val Glu Leu Ile Glu Ala Ile Ala
195 200 205
Asn Glu Tyr Leu Glu His Ala Leu Ser Gln Glu Arg Asp Phe Pro Gln
210 215 220
Trp Pro Glu Asp Gly Ala Gly Gln Pro Val Cys Pro Val Thr Leu Thr
225 230 235 240
Arg Ile Arg
<210> 2
<211> 240
<212> PRT
<213> Agrobacterium tumefaciens
<400> 2
Met Asp Leu Arg Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Ser
1 5 10 15
Thr Ala Val Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro
35 40 45
Thr Val Glu Glu Leu Lys Gly Thr Ser Arg Leu Tyr Leu Asp Asp Arg
50 55 60
Pro Leu Val Lys Gly Ile Ile Ala Ala Lys Gln Ala His Glu Arg Leu
65 70 75 80
Met Gly Glu Val Tyr Asn Tyr Glu Ala His Gly Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Lys Cys Met Ala Gln Ser Ser Tyr Trp
100 105 110
Ser Ala Asp Phe Arg Trp His Ile Ile Arg His Glu Leu Ala Asp Glu
115 120 125
Glu Thr Phe Met Asn Val Ala Lys Ala Arg Val Lys Gln Met Leu Arg
130 135 140
Pro Ala Ala Gly Leu Ser Ile Ile Gln Glu Leu Val Asp Leu Trp Lys
145 150 155 160
Glu Pro Arg Leu Arg Pro Ile Leu Lys Glu Ile Asp Gly Tyr Arg Tyr
165 170 175
Ala Met Leu Phe Ala Ser Gln Asn Gln Ile Thr Ser Asp Met Leu Leu
180 185 190
Gln Leu Asp Ala Asp Met Glu Asp Lys Leu Ile His Gly Ile Ala Gln
195 200 205
Glu Tyr Leu Ile His Ala Arg Arg Gln Glu Gln Lys Phe Pro Arg Val
210 215 220
Asn Ala Ala Ala Tyr Asp Gly Phe Glu Gly His Pro Phe Gly Met Tyr
225 230 235 240
<210> 3
<211> 234
<212> PRT
<213> Pseudomonas savastanoi
<400> 3
Met Lys Ile Tyr Leu Ile Trp Gly Ala Thr Cys Thr Gly Lys Thr Glu
1 5 10 15
His Ser Ile Lys Leu Ser Lys Ser Thr Gly Trp Pro Val Ile Val Leu
20 25 30
Asp Arg Val Gln Cys Cys Phe Asp Ile Ala Thr Gly Ser Gly Arg Pro
35 40 45
His Pro Glu Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Asn Arg
50 55 60
Arg Ile Ser Glu Gly Val Ile Ser Ala Glu Glu Ala Asn Asp Arg Leu
65 70 75 80
Lys Leu Glu Val Asn Lys His Ile Asp Ser Gly Gly Val Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Lys Leu Ile Ser Lys Asp Pro Tyr Trp
100 105 110
Cys Asp Arg Phe Ile Trp Ser Gln His Arg Met Arg Leu Gln Asp Thr
115 120 125
Asp Val Phe Met Asp Lys Ala Lys Ala Arg Val Arg Arg Met Leu Val
130 135 140
Gly Ser Thr Glu Thr Thr Gly Leu Leu Asp Glu Leu Val Ala Ala Gln
145 150 155 160
Ser Asp Leu Asn Ala Lys Leu Ala Ile Gln Asp Ile Asp Gly Tyr Arg
165 170 175
Tyr Ile Met Asn Tyr Ala Gln Ala Arg Arg Leu Ser Ile Thr Gln Leu
180 185 190
Leu Asn Val Met Thr Gly Asp Met Lys Glu Glu Leu Ile Asn Gly Ile
195 200 205
Ala Leu Glu Tyr Tyr Glu His Ala Lys Trp Gln Glu Arg Asp Phe Pro
210 215 220
Ala Glu Trp Leu Ala Glu Arg Ser Thr Arg
225 230
<210> 4
<211> 236
<212> PRT
<213> Erwinia herbicola
<400> 4
Met Arg Gly Asn Val Tyr Leu Leu Trp Gly Ala Thr Thr Thr Gly Lys
1 5 10 15
Thr Ala Phe Ser Val Ser Val Ala Lys Glu Arg Gly Trp Ser Val Ile
20 25 30
Ala Leu Asp Arg Phe Gln Gly Tyr His Glu Ile Ser Thr Gly Ser Gly
35 40 45
Ala Pro Thr Asn Asn Glu Leu Glu Lys Thr Glu Arg Ile Tyr Ile Thr
50 55 60
Pro Gln Arg Gly Leu Ala Asp Gly Ile Ile Thr Ala Lys Asp Tyr Asn
65 70 75 80
Tyr Trp Leu Lys Ser Arg Val Leu Ser Leu Pro Glu Gly Lys Ser Asp
85 90 95
Phe Ile Ile Glu Gly Gly Ser Val Ser Leu Leu Lys Glu Met Val Ser
100 105 110
Asp Glu Phe Trp Ala Asp Phe Leu Trp Glu Ile Lys Ile Phe Arg Ala
115 120 125
Pro Ser Lys Asp Val Phe Ile Lys Arg Ala Lys Arg Arg Ile Thr Asp
130 135 140
Met Leu His Pro Glu Asp Gly Arg Pro Ser Ile Met Asp Glu Val Ser
145 150 155 160
Ser Phe Phe Met Asn His Lys Thr Ile His Pro Leu Glu Asp Ile Asp
165 170 175
Gly Tyr Arg Thr Ile Ile Asp Tyr Cys Arg Cys Lys Lys Ile Gly Phe
180 185 190
Asp Lys Leu Lys Ile Met Thr Thr Asp Gln Glu Lys Ile Ile Ile Ser
195 200 205
Gly Ile Ala Glu Glu Tyr Tyr Ala His Ala Leu Trp Gln Glu Gln Glu
210 215 220
Thr Pro Cys Phe Pro His Ser Trp Ser Arg Arg Trp
225 230 235
<210> 5
<211> 255
<212> PRT
<213> Rhodococcus fascians
<400> 5
Met Lys Glu Ser Thr Met Ala Gln Thr Gln Ala Arg Phe Asp Arg Val
1 5 10 15
Arg Trp Glu Pro Gly Val Tyr Ala Ile Val Gly Ala Thr Gly Ile Gly
20 25 30
Lys Ser Ala Glu Ala Ser Lys Leu Ala Leu Ser His Ser Ala Pro Ile
35 40 45
Val Val Ala Asp Arg Ile Gln Cys Tyr Ser Asp Leu Leu Val Thr Ser
50 55 60
Gly Arg Ala Phe Asp Ala Lys Val Glu Gly Leu Asn Arg Val Trp Leu
65 70 75 80
Asp Asn Arg Thr Ile His Gln Gly Asn Phe Asp Pro Asp Glu Ala Phe
85 90 95
Asp Arg Leu Ile Lys Val Leu Thr Ser Tyr Val Asp Arg Gly Glu Ala
100 105 110
Val Val Met Glu Gly Gly Ser Ile Ser Leu Ile Leu Arg Phe Ala Gln
115 120 125
Thr Ile Ser Asn Leu Pro Phe Pro Ala Val Val Asn Val Met Pro Ile
130 135 140
Pro Asp Arg Gln His Tyr Phe Ala Gln Gln Cys Ala Arg Ala Arg Gln
145 150 155 160
Met Leu Arg Gly Asp Ser Thr Gly Arg Asn Leu Leu Thr Glu Leu Ala
165 170 175
Glu Ala Trp Val Leu Gly Asp Gln His Asn Phe Ile Ala Ser Val Ala
180 185 190
Gly Leu Asp Cys Val Leu Asp Trp Cys Ala Thr His Ser Val Thr Pro
195 200 205
Glu Glu Leu Ala Asn Arg Asp Leu Thr Thr Glu Val Leu Asp Glu Leu
210 215 220
Ala Ala Ser Met Gly Gly Arg Tyr Val Glu His Gly Val Leu Gln Gln
225 230 235 240
Glu Ile Phe Leu Arg Thr Phe Gly Ala Pro Gly Val Thr Ala Arg
245 250 255
<210> 6
<211> 243
<212> PRT
<213> Agrobacterium tumefaciens
<400> 6
Met Ile Leu His Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp
1 5 10 15
Met Ala Ile Gln Ile Ala Gln Glu Thr Gly Trp Pro Val Val Ala Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro
35 40 45
Leu Glu Ser Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Ser Arg
50 55 60
Pro Leu Thr Glu Gly Ile Leu Asp Ala Glu Ser Ala His Arg Arg Leu
65 70 75 80
Ile Phe Glu Val Asp Trp Arg Lys Ser Glu Asp Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Asn Cys Met Ala Lys Ser Pro Phe Trp
100 105 110
Arg Ser Gly Phe Gln Trp His Val Lys Arg Leu Arg Leu Gly Asp Ser
115 120 125
Asp Ala Phe Leu Thr Arg Ala Lys Gln Arg Val Ala Glu Met Phe Ala
130 135 140
Ile Arg Glu Asp Arg Pro Ser Leu Leu Glu Glu Leu Ala Glu Leu Trp
145 150 155 160
Asn Tyr Pro Ala Ala Arg Pro Ile Leu Glu Asp Ile Asp Gly Tyr Arg
165 170 175
Cys Ala Ile Arg Phe Ala Arg Lys His Asp Leu Ala Ile Ser Gln Leu
180 185 190
Pro Asn Ile Asp Ala Gly Arg His Val Glu Leu Ile Glu Ala Ile Ala
195 200 205
Asn Glu Tyr Leu Glu His Ala Leu Ser Gln Glu Arg Asp Phe Pro Gln
210 215 220
Trp Pro Glu Asp Gly Ala Gly Gln Pro Val Cys Pro Val Thr Leu Thr
225 230 235 240
Arg Ile Arg
<210> 7
<211> 238
<212> PRT
<213> Ralstonia solanacearum
<400> 7
Met Pro Val Arg Leu Tyr Leu Ile Trp Gly Ala Thr Thr Thr Gly Lys
1 5 10 15
Thr Ala Gln Ser Val Ala Leu Ala Arg Ser Ala Gly Ala Pro Val Ile
20 25 30
Ser Leu Asp Arg Val Gln Cys Cys His Glu Leu Ala Val Gly Ser Gly
35 40 45
Arg Pro Ser Pro Ser Glu Leu Leu Gly Thr Arg Arg Glu Tyr Leu Cys
50 55 60
Glu Arg Glu Val Ser Arg Gly Val Val Ser Ala Ala Glu Ala Asn Gln
65 70 75 80
Leu Leu Leu Asp Lys Val Ala Arg Tyr Ala Thr Gln Glu Arg Ala Leu
85 90 95
Ile Leu Glu Gly Gly Ser Val Ser Leu Ile Asn Ala Met Ile Arg Asp
100 105 110
Ala Arg Trp Ser Glu Arg Gly Glu Trp Ile Leu Arg Arg Ile Pro Val
115 120 125
Pro Gly Arg Ala Ala Phe Met Ala Ala Ala Arg Lys Arg Val Arg Glu
130 135 140
Met Leu Asp Pro Pro Pro Gly Gln Ala Gly Ile Leu Asp Glu Leu Gln
145 150 155 160
Gly Leu Trp Gly Tyr Pro Arg Asn His Ala Val Leu Glu Asp Ile Asp
165 170 175
Gly Tyr Arg Gln Ile Ile Arg Tyr Ala Asn Ala Leu Gln Val Pro Ile
180 185 190
Cys Arg Ile Thr Ser Ile Asp Pro Asn Ala Lys Ala Leu Leu Ile Glu
195 200 205
Arg Ile Ala Gln Glu Tyr Trp Glu His Ala Leu Trp Gln Glu Gln Glu
210 215 220
Phe Leu Gly Ile Pro Ala Ser Trp Met Arg Ala Asp Asp Ala
225 230 235
<210> 8
<211> 249
<212> PRT
<213> Xanthomonas oryzae
<400> 8
Met Ser Cys Ile Leu His Leu Ile Trp Gly Pro Thr Cys Ser Gly Lys
1 5 10 15
Thr Glu Val Ala Val Ala Leu Ala Glu Gln Thr Gly Trp Pro Val Ile
20 25 30
Ala Leu Asp Arg Val Gln Cys Cys Pro Glu Met Ser Thr Cys Ser Gly
35 40 45
Arg Pro Leu Pro Ala Glu Leu Arg Ala Thr Arg Arg Ile Tyr Leu Ala
50 55 60
Ser Arg Ala Val Arg Glu Gly Ile Ile Ala Ala Asp Glu Ala His Ala
65 70 75 80
Leu Leu Val Asp Leu Val Asp Arg Arg Ser Ala Ala Gly Gly Val Ile
85 90 95
Leu Glu Gly Gly Ser Ile Ser Leu Ile Asn Arg Met Ile Leu Asp Pro
100 105 110
Tyr Trp Ala Asn Asp Trp Gln Trp Arg Ser His Arg Leu Leu Leu Gly
115 120 125
Glu Cys Ala Asp Phe Leu Asp Arg Ala Leu Arg Arg Val Glu Lys Met
130 135 140
Leu Arg Thr Gly Met Gly Arg Pro Ser Leu Leu Glu Glu Leu Val Ala
145 150 155 160
Leu Trp Pro Asp Pro Ala Leu Arg Pro Thr Ile Glu Asp Val Asp Gly
165 170 175
Tyr Arg Tyr Ser Ile Arg Phe Ala Arg Gln Trp Asn Val Pro Val Gly
180 185 190
Gln Leu Leu Ser Ile Gly Asp Glu Met Lys Gln Arg Leu Ile His Gly
195 200 205
Ile Ala Glu Glu Tyr Leu Gly His Ala Gln Trp Gln Glu Arg Asp Leu
210 215 220
Leu Thr Leu Pro Ala Asn Trp Gln Ala Gln Asp Val Ser Met Gly Gly
225 230 235 240
Ser Lys Ser Gly Leu His His Arg Leu
245
<210> 9
<211> 243
<212> PRT
<213> Neorhizobium sp. NCHU2750
<400> 9
Met Leu Leu His Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp
1 5 10 15
Met Ala Ile Gln Ile Ala Gln Glu Thr Gly Trp Pro Val Val Ala Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro
35 40 45
Leu Glu Ser Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Ser Arg
50 55 60
Pro Leu Thr Glu Gly Ile Leu Asp Ala Glu Ser Ala His Arg Arg Leu
65 70 75 80
Ile Phe Glu Val Asp Trp Arg Lys Ser Glu Glu Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Asn Cys Met Ala Lys Ser Pro Phe Trp
100 105 110
Arg Ser Gly Phe Gln Trp His Val Lys Arg Leu Arg Leu Gly Asp Ser
115 120 125
Asp Ala Phe Leu Thr Arg Ala Lys Gln Arg Val Ala Glu Met Phe Ala
130 135 140
Ile Arg Glu Asp Arg Pro Ser Leu Leu Glu Glu Leu Ala Glu Leu Trp
145 150 155 160
Asn Tyr Pro Ala Ala Arg Pro Ile Leu Glu Asp Ile Asp Gly Tyr Arg
165 170 175
Cys Ala Ile Arg Phe Ala Arg Lys His Asp Leu Ala Ile Ser Gln Leu
180 185 190
Pro Asn Ile Asp Ala Gly Arg His Val Glu Leu Ile Glu Ala Ile Ala
195 200 205
Asn Glu Tyr Leu Glu His Ala Leu Ser Gln Glu Arg Asp Phe Pro Gln
210 215 220
Trp Pro Glu Asp Gly Ala Gly Gln Pro Val Cys Pro Val Thr Leu Thr
225 230 235 240
Arg Ile Arg
<210> 10
<211> 237
<212> PRT
<213> Streptomyces hainanensis
<400> 10
Met His Ile Ile Ala Gly Pro Thr Gly Ile Gly Lys Ser Ala Ala Ala
1 5 10 15
Thr Glu Leu Ala Arg Ala Thr Gly Ala Pro Ile Val Val Ala Asp Arg
20 25 30
Ile Gln Cys Phe Pro Glu Leu Ala Thr Thr Ser Ala Arg Ala Gly Gly
35 40 45
Glu Ala Ala Asp Val Glu Arg Ile Trp Leu Ala Glu Arg Ala Val Ala
50 55 60
Asp Gly Asp Phe Ala Val Ala Asp Ala Leu Glu Ala Leu Ile Gly Thr
65 70 75 80
Leu Arg Gly Leu Arg Glu Arg His Pro Phe Val Ile Val Glu Gly Gly
85 90 95
Ser Ile Ser Leu Leu Trp Asp Phe Ala Glu Leu Leu Pro Glu Leu Gly
100 105 110
Phe Arg Ala Thr Val Arg Leu Met His Ile Ala Asp Arg Arg Glu Tyr
115 120 125
Val Ala Gly Leu Thr Arg Arg Ala Arg Gly Met Leu Val Pro Glu Gly
130 135 140
Ala Ala Thr Ser Ala Ile Glu Glu Leu Ala Ile Ala Trp Lys Ser Val
145 150 155 160
Glu Gln Arg Ser Phe Val Ala Ser Ile Asn Gly Phe Lys Gly Ile Leu
165 170 175
Glu Trp Cys Ala Thr His Ser Phe Ala Val Glu Ser Leu Ala Ser Ala
180 185 190
Ala Leu Thr Glu Glu Gln Val Gly Glu Leu Ser Arg Met Val Ala Leu
195 200 205
Arg His Ala Glu His Gly Val Leu Gln Asp Arg Ile Phe Ser Met Val
210 215 220
Phe Asp Gly Trp Cys Gly Glu Pro Asp Ala Val Thr Asp
225 230 235
<210> 11
<211> 256
<212> PRT
<213> Streptomyces ipomoeae
<400> 11
Met Ala Asp Thr Gly Thr His Val Glu Thr Ser Pro Leu Val His Leu
1 5 10 15
Ile Ala Gly Pro Thr Gly Val Gly Lys Ser Ala Ala Ala Thr Glu Leu
20 25 30
Ala Arg Glu Thr Gly Ala Pro Val Val Val Ala Asp Arg Leu Gln Cys
35 40 45
Phe Thr Asp Leu Ala Thr Ala Ser Ala Arg Ala Gly Ala Glu Val Pro
50 55 60
Asp Val Gln Arg Tyr Trp Leu Gly Asp Arg Thr Val Ala Asp Gly Asp
65 70 75 80
Leu Ser Ala Ser Ala Ala Thr Asp Ala Leu Val Ala Leu Val Glu Arg
85 90 95
Leu Ala Ile Arg His Pro Leu Val Ile Val Glu Gly Gly Ser Ile Ser
100 105 110
Leu Leu Arg Glu Leu Ser Glu Arg Arg Ala Ala Leu Ser Trp Arg Leu
115 120 125
Thr Val Arg Leu Met Pro Leu Pro Asp Arg Ser Asp Tyr Val Ala Ala
130 135 140
Leu Thr Arg Arg Ala Arg Thr Met Leu Ala Pro Pro Pro Pro Glu Arg
145 150 155 160
Gly Leu Leu Asp Glu Leu Ala Thr Leu Trp Arg Asp Pro His Arg Arg
165 170 175
Tyr Phe Ala Ala Ser Val Asn Gly Phe Glu Thr Val Leu Glu Cys Cys
180 185 190
Ala Lys Tyr Ser Leu Asp Val Lys Thr Leu His Lys Arg Asn Leu Pro
195 200 205
Glu His Ile Leu Ala Arg Met Ala Ala Leu Ile Ala Glu Arg His Ala
210 215 220
Glu His Gly Ile Leu Gln His Gln Val Phe Thr Glu Ile Phe Ala Asp
225 230 235 240
Arg Ile Ser Gly Ser Arg Cys Asp Leu Gly Ala Leu Glu Arg Val Ala
245 250 255
<210> 12
<211> 257
<212> PRT
<213> Streptomyces turgidiscabies
<400> 12
Met Glu Lys Val Leu Lys Met Thr Ala Arg Ile Arg Thr Ala Arg Gly
1 5 10 15
Arg Gly Thr Ile Gly Val Arg Ala Leu Val Gly Pro Thr Gly Val Gly
20 25 30
Lys Ser Ala Ala Ala Thr Ala Leu Ala Arg Asp Thr Gly Ala Pro Val
35 40 45
Leu Val Ala Asp Arg Ile Gln Cys Phe Thr Asp Leu Val Val Thr Ser
50 55 60
Gly Arg Ala Ala Asp Ala His Val Leu Glu Val Asp Arg Ile Trp Leu
65 70 75 80
Ser Asp Arg Thr Val Ser Asp Gly Asp Tyr Ala Leu Gly Glu Ala Ser
85 90 95
Glu Asp Leu Leu Ser Arg Leu Gly Ser Leu Val Thr Asp Arg Gly Leu
100 105 110
Val Val Leu Glu Gly Gly Ser Ile Ser Leu Leu Leu Arg Phe Ala Glu
115 120 125
Leu Met Glu Asn Leu Pro Tyr Ser Val Ser Val Asp Leu Leu Pro Ile
130 135 140
Phe Asp Lys Ser Tyr Tyr Ser Ala Arg Gln Ile Ala Arg Ala Arg Lys
145 150 155 160
Met Leu Leu Pro Asp Ser Ser Gly Arg Ser Leu Leu Thr Glu Phe Ala
165 170 175
Ala Ala Trp Arg Thr Pro Gly Gln Arg Arg Phe Ala Ala Ser Val Ser
180 185 190
Gly Leu Asp Ser Ile Cys Glu Trp Cys Ala Lys His Ser Val Glu Pro
195 200 205
Glu Glu Val Ala Asp Val Asp Leu Ser Glu Lys Met Leu Gly Glu Leu
210 215 220
Ser Thr Met Leu Gly Glu Arg Tyr Ala Ala His Gly Phe Thr Gln Glu
225 230 235 240
Arg Leu Phe Leu Lys Thr Phe Asp His His Val Arg Asn Ser Pro Asp
245 250 255
Ala
<210> 13
<211> 256
<212> PRT
<213> Streptomyces turgidiscabies
<400> 13
Met Gly Glu Ile Pro Ala Asp Cys Thr Val Arg Pro Tyr Val His Leu
1 5 10 15
Ile Ala Gly Pro Thr Gly Ala Gly Lys Ser Ala Val Ala Asn Asp Leu
20 25 30
Ala Arg Val Thr Gly Ala Pro Val Val Val Ala Asp Arg Leu Gln Cys
35 40 45
Phe Thr Asp Leu Ala Thr Thr Ser Ala Arg Ala Gly Ala Gln Ala Pro
50 55 60
Gly Val Arg Arg Tyr Trp Leu Ala Asp Arg Thr Val Ala Asp Gly Asp
65 70 75 80
Leu Asp Ala Ala Ala Ala Ala Asp Ser Leu Phe Gly Leu Val Glu Arg
85 90 95
Leu Gly Ser Arg His Pro Phe Val Ile Val Glu Gly Gly Ser Ile Ser
100 105 110
Leu Leu Lys Val Leu Ala Ala Arg Cys Ala Ala Leu Pro Trp Gln Leu
115 120 125
Ser Val Arg Val Leu Pro Leu Pro Ala Tyr Gly Asp Tyr Ile Glu Ala
130 135 140
Leu Thr Cys Arg Ala Arg Thr Met Leu Ala Pro Pro Thr Pro Glu Arg
145 150 155 160
Ser Leu Leu Glu Glu Leu Ala Val Leu Trp Ala Asp Pro Arg His Arg
165 170 175
Arg Phe Ala Ala Ser Val Asn Gly Phe Glu Ala Val Leu Glu Cys Cys
180 185 190
Ala Lys Tyr Ser Leu Asn Val Gly Thr Ile His Lys Gln Ala Pro Pro
195 200 205
Asp Pro Ile Arg Ser Gln Met Ala Ser Leu Ile Ala Leu Arg His Ala
210 215 220
Glu His Gly Ile Leu Gln Ser Arg Val Phe Thr Glu Thr Phe Gly Ser
225 230 235 240
Arg Leu Pro Glu Gln Ile Leu Asp Pro Ser Val Leu Gly Arg Ala Ala
245 250 255
<210> 14
<211> 243
<212> PRT
<213> Agrobacterium rhizogenes
<400> 14
Met Leu Leu Tyr Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp
1 5 10 15
Ile Ala Ile Gln Ile Ala Gln Lys Thr Gly Trp Pro Val Val Ala Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro
35 40 45
Leu Pro Ser Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Ser Arg
50 55 60
Arg Leu Thr Lys Gly Ile Ile Asp Ala Glu Gly Ala His Arg Arg Leu
65 70 75 80
Ile Leu Glu Val Asp Trp Gln Glu Ser Glu Glu Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Val Ser Leu Leu Asn Cys Met Ala Lys Ser Pro Tyr Trp
100 105 110
Lys Ser Gly Phe Gln Trp His Val Lys Arg Leu Arg Leu Gly Asp Ser
115 120 125
Asp Ala Phe Leu Ala Arg Ala Lys Gln Arg Val Thr Glu Met Phe Ala
130 135 140
Ile Arg Glu Asp Arg Pro Ser Leu Leu Glu Glu Leu Ala Glu Leu Trp
145 150 155 160
Asn Tyr Pro Ala Thr Arg Pro Ile Leu Glu Asp Ile Asp Gly Tyr Arg
165 170 175
Cys Ala Ile Arg Phe Ala Arg Lys His Asp Leu Ala Ile Asn Gln Leu
180 185 190
Pro Asp Ile Asp Ala Glu Arg Gln Gln Asp Leu Ile Glu Ala Ile Ala
195 200 205
Lys Glu Tyr Leu Glu His Ala Ile Met Gln Glu Arg Asp Phe Pro Gln
210 215 220
Trp Pro Glu Asp Gly Ala Arg Gln Pro Val Gly Pro Ala Thr Leu Met
225 230 235 240
Arg Ile Gln
<210> 15
<211> 240
<212> PRT
<213> Agrobacterium tumefaciens
<400> 15
Met Asp Leu His Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Thr
1 5 10 15
Thr Ala Ile Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro
35 40 45
Thr Val Glu Glu Leu Lys Gly Thr Thr Arg Leu Tyr Leu Asp Asp Arg
50 55 60
Pro Leu Val Glu Gly Ile Ile Ala Ala Lys Gln Ala His His Arg Leu
65 70 75 80
Ile Glu Glu Val Tyr Asn His Glu Ala Asn Gly Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Thr Ser Leu Leu Asn Cys Met Ala Arg Asn Ser Tyr Trp
100 105 110
Ser Ala Asp Phe Arg Trp His Ile Ile Arg His Lys Leu Pro Asp Gln
115 120 125
Glu Thr Phe Met Lys Ala Ala Lys Ala Arg Val Lys Gln Met Leu His
130 135 140
Pro Ala Ala Gly His Ser Ile Ile Gln Glu Leu Val Tyr Leu Trp Asn
145 150 155 160
Glu Pro Arg Leu Arg Pro Ile Leu Lys Glu Ile Asp Gly Tyr Arg Tyr
165 170 175
Ala Met Leu Phe Ala Ser Gln Asn Gln Ile Thr Ala Asp Met Leu Leu
180 185 190
Gln Leu Asp Ala Asn Met Glu Gly Lys Leu Ile Asn Gly Ile Ala Gln
195 200 205
Glu Tyr Phe Ile His Ala Arg Gln Gln Glu Gln Lys Phe Pro Gln Val
210 215 220
Asn Ala Ala Ala Phe Asp Gly Phe Glu Gly His Pro Phe Gly Met Tyr
225 230 235 240
<210> 16
<211> 240
<212> PRT
<213> Agrobacterium tumefaciens
<400> 16
Met Asp Leu Arg Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Ser
1 5 10 15
Thr Ala Val Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro
35 40 45
Thr Val Glu Glu Leu Lys Gly Thr Ser Arg Leu Tyr Leu Asp Asp Arg
50 55 60
Pro Leu Val Lys Gly Ile Ile Ala Ala Lys Gln Ala His Glu Arg Leu
65 70 75 80
Met Gly Glu Val Tyr Asn Tyr Glu Ala His Gly Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Lys Cys Met Ala Gln Ser Ser Tyr Trp
100 105 110
Ser Ala Asp Phe Arg Trp His Ile Ile Arg His Glu Leu Ala Asp Glu
115 120 125
Glu Thr Phe Met Asn Val Ala Lys Ala Arg Val Lys Gln Met Leu Arg
130 135 140
Pro Ala Ala Gly Leu Ser Ile Ile Gln Glu Leu Val Asp Leu Trp Lys
145 150 155 160
Glu Pro Arg Leu Arg Pro Ile Leu Lys Glu Ile Asp Gly Tyr Arg Tyr
165 170 175
Ala Met Leu Phe Ala Ser Gln Asn Gln Ile Thr Ser Asp Met Leu Leu
180 185 190
Gln Leu Asp Ala Asp Met Glu Asp Lys Leu Ile His Gly Ile Ala Gln
195 200 205
Glu Tyr Leu Ile His Ala Arg Arg Gln Glu Gln Lys Phe Pro Arg Val
210 215 220
Asn Ala Ala Ala Tyr Asp Gly Phe Glu Gly His Pro Phe Gly Met Tyr
225 230 235 240
<210> 17
<211> 240
<212> PRT
<213> Agrobacterium vitis
<400> 17
Met Asp Leu Arg Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Ser
1 5 10 15
Thr Ala Ile Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro
35 40 45
Thr Val Glu Glu Leu Lys Gly Thr Thr Arg Leu Tyr Leu Asp Asp Arg
50 55 60
Pro Leu Val Lys Gly Ile Ile Ala Ala Glu Gln Ala His Glu Arg Leu
65 70 75 80
Ile Ala Glu Val Tyr Asn Tyr Glu Ala His Gly Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Lys Cys Met Ala Gln Ser Gly Tyr Trp
100 105 110
Ser Ala Asp Phe Arg Trp His Ile Ile Arg His Lys Leu Ala Asp Glu
115 120 125
Glu Thr Phe Met Lys Ala Ala Lys Ala Arg Val Lys Gln Met Leu Cys
130 135 140
Pro Ala Ile Gly Pro Ser Leu Ile Gln Glu Leu Val Tyr Leu Trp Asn
145 150 155 160
Glu Pro Arg Leu Arg Pro Ile Leu Lys Glu Ile Asp Gly Tyr Arg Tyr
165 170 175
Ala Met Leu Phe Ala Ser Gln Asn Arg Ile Thr Pro Asp Met Leu Leu
180 185 190
Gln Leu Asp Ala Asp Met Glu Gly Lys Leu Ile His Gly Ile Ala Gln
195 200 205
Glu Tyr Leu Ile His Ala Arg Arg Gln Glu His Glu Phe Pro Pro Val
210 215 220
Ser Ala Ala Ala Phe Glu Gly Phe Glu Gly Pro Pro Phe Gly Ala Tyr
225 230 235 240
<210> 18
<211> 236
<212> PRT
<213> Agrobacterium vitis
<400> 18
Met Glu Ala His Leu Ile Phe Gly Pro Thr Ser Thr Gly Lys Thr Ser
1 5 10 15
Val Ala Ile Ala Leu Ala Lys Arg Thr Gly Phe Pro Val Ile Val Leu
20 25 30
Asp Arg Ile Gln Cys Tyr Ser Gln Leu Ser Val Gly Gly Gly Arg Pro
35 40 45
Ser Ala Ala Glu Phe Gln Gly Thr Arg Arg Ile Tyr Leu Ile Glu Gly
50 55 60
Ser Leu Asp Glu Gly Val Ile Ser Ala Glu Arg Ala His Glu Cys Leu
65 70 75 80
Val Ala Ala Val Glu Ala His Lys Pro Glu Gly Gly Val Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Phe Lys Arg Met Ala Gln Ser Ser Tyr Trp
100 105 110
Asn Cys Gly Phe Thr Trp His Val Thr Arg Leu His Leu Gly Gly Glu
115 120 125
Glu Ile Phe Leu Ala Ala Ala Lys Lys Arg Ile Asn Gln Met Met Gln
130 135 140
Pro Asp Glu Gln Gly Asn Ser Phe Leu Gly Glu Leu Val Ser Val Trp
145 150 155 160
Lys Thr Thr Ala Leu Arg Ala Thr Leu Glu Gly Ile Cys Gly Tyr Arg
165 170 175
Tyr Ala Ile Glu Phe Ala Gly Lys Gln Gly Leu Glu Met Asp Ala Leu
180 185 190
Thr Ser Leu Asn Arg Arg Gln Leu Glu Gln Leu Val His Gly Met Ala
195 200 205
His Glu Tyr Leu Cys Tyr Ala Arg Gln Gln Glu Gln Glu Leu Pro Leu
210 215 220
Pro Ser Leu Ala Gly Gly Glu Gly Pro Pro Phe Gln
225 230 235
<210> 19
<211> 240
<212> PRT
<213> Halomonas anticariensis
<400> 19
Met Arg Arg His Tyr Ile Leu Gly Thr Thr Ala Ser Gly Lys Thr Ser
1 5 10 15
Ala Ser Ile Ser Leu Ala Glu Met Val Asn Ala Pro Val Val Val Leu
20 25 30
Asp Arg Ile Gln Cys Phe Gln Glu Leu Trp Thr Val Ser Ser Arg Pro
35 40 45
Gln Asp Ser Glu Leu Gly Ala Thr Lys Arg Phe Tyr Leu Asp Asp Arg
50 55 60
Glu Ile Ser His Gly Asn Leu Gly Val Glu Asp Ala Tyr Thr Lys Leu
65 70 75 80
Val Asn Ile Val Asp Lys Leu Ser Asn Tyr His Ser Phe Val Ile Leu
85 90 95
Glu Gly Gly Ser Val Ser Leu Cys Arg Leu Ile Val Glu Arg Ala Glu
100 105 110
Leu Cys Arg Gly Ser Thr Val Glu Ile Arg Trp Asn Asn Pro Asp Asp
115 120 125
Pro Ala Tyr Val Gln Lys Ile Arg Glu Arg Val Val Gln Met Met Glu
130 135 140
Pro Arg Val Asp Arg Arg Ser Ile Val Asp Glu Leu Lys Tyr Ala Trp
145 150 155 160
Asp Tyr Lys Glu Gln Arg Asp Phe Ile Thr Ser Ile Cys Gly Phe Asp
165 170 175
Gly Ile Leu Ser Trp Cys Asp Asp Asn Asn Phe His Ile Glu Asp Val
180 185 190
Asp Phe Glu Cys Leu Pro Leu Ser Ala Ile Gly Glu Ile Thr Asp Arg
195 200 205
Val Ala Glu Ser His Arg Lys Tyr Ala Arg Thr Gln Phe Glu Met Leu
210 215 220
Asn Ile Met Glu Gln Ala Met Ile Ala Thr Gly Val Lys Val Val Arg
225 230 235 240
<210> 20
<211> 233
<212> PRT
<213> Lonsdalea quercina
<400> 20
Met Asp Thr Thr Leu His Leu Ile Trp Gly Pro Thr Ser Thr Gly Lys
1 5 10 15
Thr Ala Arg Ser Val Ala Ile Ala Glu Lys Thr Gly Ala Pro Val Leu
20 25 30
Val Leu Asp Arg Ile Gln Cys Cys Pro Glu Val Thr Met Gly Ser Gly
35 40 45
Arg Pro Thr Glu Gln Glu Leu Arg Gly Thr Glu Arg Val Tyr Leu Ser
50 55 60
Ser Arg Pro Ile Glu Gln Ser Ile Ile Ser Ala Pro Gln Ala Val Glu
65 70 75 80
Arg Leu His Gln Leu Val Asp His Phe Ala Lys Ile His Pro Leu Ile
85 90 95
Ile Leu Glu Gly Gly Ser Val Ser Ile Leu Gln Glu Met Val Lys His
100 105 110
Gln Thr Trp Gly Gln Gln Tyr Ala Trp Thr Phe Glu Pro Ile Pro Met
115 120 125
Pro Ser Ala Glu His Phe Leu Asn Arg Ala Arg Lys Arg Ile Trp Glu
130 135 140
Met Phe Tyr Pro Gly Gly Gly Leu Lys Ser Leu Leu Asp Glu Met Val
145 150 155 160
Gln Ile Trp Ala His Pro Glu Tyr Arg Asp Thr Leu Ala Asp Ile Asp
165 170 175
Gly Tyr Arg Cys Ile Ile Ser Tyr Leu Arg Gln Arg Gly Arg Arg Val
180 185 190
Asp Glu Ile Pro Arg Met Ser Leu His Glu His Lys Gln Met Ala Glu
195 200 205
Asp Ile Ala Gln Glu Tyr Trp Gln His Ala Val Trp Gln Thr Asp Asn
210 215 220
Phe Pro Glu Ile Pro Pro Cys Trp Arg
225 230
<210> 21
<211> 238
<212> PRT
<213> Ralstonia solanacearum
<400> 21
Met Pro Ile Arg Leu Tyr Leu Ile Trp Gly Ala Thr Thr Thr Gly Lys
1 5 10 15
Thr Ala Gln Ser Val Ala Leu Ala Arg Ala Thr Gly Ala Pro Val Ile
20 25 30
Ser Leu Asp Arg Val Gln Cys Cys His Glu Leu Ala Val Gly Ser Gly
35 40 45
Arg Pro Leu Pro Ser Glu Leu Leu Gly Thr Arg Arg Glu Tyr Leu Cys
50 55 60
Asp Arg Ser Val Ser Ser Gly Val Ile Pro Ala Ala Asp Ala Asn Gln
65 70 75 80
Leu Leu Phe Asp Lys Val Val Arg Tyr Ser Ala His Glu Arg Ala Leu
85 90 95
Ile Leu Glu Gly Gly Ser Val Ser Leu Ile Asn Ala Met Ile Arg Asp
100 105 110
Ala Arg Trp Ser Ala Leu Gly Glu Trp Ala Leu Arg Arg Ile Val Leu
115 120 125
Pro Gly Arg Ala Val Phe Ile Ala Gln Ala Ile Lys Arg Val Arg Asp
130 135 140
Met Leu Glu Pro Pro Pro Gly His Ala Ser Ile Leu Asp Glu Leu Glu
145 150 155 160
Gly Leu Trp Ala His Pro Gly Asn His Ala Val Leu Glu Asp Val Asp
165 170 175
Gly Tyr Arg Gln Ile Ile Arg Tyr Ala Arg Ala Ser Gln Val Pro Ile
180 185 190
Asp Arg Ile Thr Ser Ile Asp Arg Ser Thr Met Ala Thr Leu Val Glu
195 200 205
Arg Ile Ala Gln Glu Tyr Trp Glu His Ala Leu Trp Gln Glu Gln Glu
210 215 220
Phe Leu Gly Ile Pro Ala Thr Trp Arg Arg Ala Asp Asp Ala
225 230 235
<210> 22
<211> 239
<212> PRT
<213> Rhizobium radiobacter
<400> 22
Met Asp Leu Arg Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Ser
1 5 10 15
Thr Ala Ile Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro
35 40 45
Thr Val Glu Glu Leu Lys Gly Thr Thr Arg Leu Tyr Leu Asp Asp Arg
50 55 60
Pro Leu Val Lys Gly Ile Ile Thr Ala Lys Gln Ala His Glu Arg Leu
65 70 75 80
Ile Ala Glu Val His Asn His Glu Ala Lys Gly Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Arg Cys Met Ala Gln Ser Arg Tyr Trp
100 105 110
Asn Ala Asp Phe Arg Trp His Ile Ile Arg Asn Glu Leu Ala Asp Glu
115 120 125
Glu Ser Phe Met Ser Val Ala Lys Thr Arg Val Lys Gln Met Leu Arg
130 135 140
Pro Ser Ala Gly Leu Ser Ile Ile Gln Glu Leu Val Gln Leu Trp Arg
145 150 155 160
Glu Pro Arg Leu Arg Pro Ile Leu Glu Gly Ile Asp Gly Tyr Arg Tyr
165 170 175
Ala Leu Leu Phe Ala Thr Gln Asn Gln Ile Thr Pro Asp Met Leu Leu
180 185 190
Gln Leu Asp Ala Asp Met Glu Asn Lys Leu Ile His Gly Ile Ala Gln
195 200 205
Glu Phe Leu Ile His Ala Arg Arg Gln Glu Gln Lys Phe Pro Leu Val
210 215 220
Gly Ala Thr Ala Val Glu Ala Phe Glu Gly Pro Pro Phe Arg Met
225 230 235
<210> 23
<211> 252
<212> PRT
<213> Rhizobium tumorigenes
<400> 23
Met Leu Ile Tyr Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp
1 5 10 15
Leu Ala Ile Gln Ile Ala Arg Glu Thr Gly Trp Pro Val Ile Ala Leu
20 25 30
Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro
35 40 45
Leu Glu Ser Glu Leu Gln Ser Thr Gln Arg Ile Tyr Leu Asp Ser Arg
50 55 60
Pro Leu Thr Glu Gly Val Met Glu Ala Glu Ala Ala His Leu Gln Leu
65 70 75 80
Ile Ser Ala Ile Glu Asp Arg Lys Ser Ser Pro Gly Leu Ile Leu Glu
85 90 95
Gly Gly Ser Ile Ser Leu Leu Asn Cys Met Ala Lys Asp Ser Tyr Trp
100 105 110
Asn Ala Gly Phe Arg Trp His Val Arg Arg Leu Arg Leu Pro Thr Pro
115 120 125
Asp Val Phe Leu Pro Arg Ala Arg Leu Arg Val Thr Glu Met Phe Ala
130 135 140
Ile Lys Asp Glu Arg Pro Ser Leu Leu Glu Glu Leu Ala Asp Leu Trp
145 150 155 160
Asn Gln Glu Val Leu Arg Pro Val Leu Glu Asp Ile Asp Gly Tyr Arg
165 170 175
Cys Ala Ile Gln Phe Ala Arg Glu Asn Asn Ile Glu Ile Gly Glu Leu
180 185 190
Leu His Leu Asp Pro Met Arg Arg Glu Ala Leu Ile Ala Ala Ile Ala
195 200 205
Glu Glu Tyr Leu Glu His Ala Arg Trp Gln Glu Arg Glu Phe Pro Asp
210 215 220
Trp Gln Glu Gly Gly Asn Val Gly Leu Thr Pro Leu Pro Ala Ser His
225 230 235 240
Asp Thr Gly Ser Pro Arg Asp Leu Arg Ser Leu Gly
245 250
<210> 24
<211> 236
<212> PRT
<213> Streptomyces bingchenggensis
<400> 24
Met His Val Ile Ala Gly Pro Thr Gly Val Gly Lys Ser Ala Ala Ala
1 5 10 15
Thr Ala Leu Ala Arg Ile Thr Gly Ala Pro Ile Val Val Ala Asp Arg
20 25 30
Ile Gln Cys Phe Thr Asp Leu Ala Thr Thr Ser Ala Arg Ala Gly Glu
35 40 45
Glu Thr Val Glu Val Glu Arg Ser Trp Leu Gly Asp Arg Thr Val Ala
50 55 60
Asp Gly Asp Tyr Pro Pro Glu Glu Ala Ala Asp Ala Leu Val Arg Arg
65 70 75 80
Leu Ala Glu Leu Gly Glu Arg His Arg Phe Val Ile Val Glu Gly Gly
85 90 95
Ser Ile Ser Leu Leu Arg Asp Phe Ala Glu Arg Leu Pro Asp Leu Pro
100 105 110
Tyr Arg Leu Thr Val Arg Leu Leu His Ile Pro Asp Arg Glu Gly Tyr
115 120 125
Val Val Arg Leu Ala Arg Arg Ala Arg Arg Met Leu Ala Pro Gly Gly
130 135 140
Ser Gln Thr Ser Met Leu Glu Glu Leu Ala Ala Leu Trp Glu Ser Pro
145 150 155 160
Asp His Arg Phe Phe Ala Ala Ser Val Asn Gly Leu Glu Ala Ile Leu
165 170 175
Glu Trp Cys Ala Thr Tyr Ser Val Arg Val Glu Ser Leu Ala Ser Tyr
180 185 190
Glu Leu Ser Glu Ala Gln Leu Glu Lys Met Ala Trp Met Val Ala Glu
195 200 205
Arg His Ala Glu His Gly Ile Leu Gln Glu Arg Ile Phe Ser Lys Val
210 215 220
Phe Asp Gly Ile Pro Ser Ala Val Tyr Gly Pro Ala
225 230 235
<210> 25
<211> 246
<212> PRT
<213> Streptomyces glauciniger
<400> 25
Met Ile Ser Leu His Leu Ile Leu Gly Pro Thr Gly Val Gly Lys Thr
1 5 10 15
Ser Arg Ser Val Ala Leu Ala Leu Arg His Glu Thr Pro Val Leu Val
20 25 30
Leu Asp Arg Val Gln Cys His Pro Gln Leu Ala Ile Gly Ser Gly Arg
35 40 45
Pro Thr Gln Val Glu Leu Gln Asp Thr Val Arg Tyr Tyr Leu Thr Glu
50 55 60
Arg Pro Leu His His Gly Val Ile Thr Ala Ala Asp Ala Val Asp Arg
65 70 75 80
Leu Ile His His Arg Lys Met Ile His Asp Ser Gly Val Asp Arg Leu
85 90 95
Ile Leu Glu Gly Gly Ser Ile Ser Ile Leu Ala Glu Leu Leu Thr Arg
100 105 110
Thr Asp Trp Tyr Glu Asp Ala Thr Met Ala Val Glu Cys Trp Leu Glu
115 120 125
Ala Ser Ala Ser Ala Tyr Glu Ala Arg Val Thr Glu Arg Val Glu His
130 135 140
Met Leu Gly Tyr Ser Asp His Ser Gly Arg Thr Met Leu Asp Glu Leu
145 150 155 160
Ala Glu Leu Trp Leu His Pro Glu Ala Arg Pro Arg Leu His Ser Ile
165 170 175
Ala Gly Tyr Arg Glu Val Ile Asp Leu Cys Ala Ala Glu Gly Leu Asp
180 185 190
Pro Met Tyr Leu Arg Gly Leu Ala Ala Arg Leu Arg Arg Thr Gln Cys
195 200 205
Ala Thr Ala Ile Thr Ser Ala His Leu Asp Tyr Ala Arg Arg Gln Arg
210 215 220
Leu Ala Leu Ala Thr Ala Leu Pro Glu Leu Val Gln Arg Gly Phe Glu
225 230 235 240
Val Thr Leu Cys Glu Ile
245
<210> 26
<211> 294
<212> PRT
<213> Streptomyces hainanensis
<400> 26
Met Ala Arg Ser Gly Arg Arg Ser Leu Ala Arg Ser Glu Arg Ser Arg
1 5 10 15
Thr Ser Leu Asn Val Ser Thr His Arg Pro Ile Gly Arg Pro Arg Ser
20 25 30
Arg Ala Pro Ile Ala Thr Arg Glu Glu Pro Thr Val Arg His Ile Ala
35 40 45
Ala Glu Val Pro Leu Thr Val Arg Leu Ile Val Gly Pro Thr Gly Val
50 55 60
Gly Lys Ser Ala Ala Ala Ser Asp Val Ala Arg Arg Thr Gly Ala Pro
65 70 75 80
Val Val Val Ala Asp Arg Ile Gln Cys Phe Thr Asp Leu Ala Thr Thr
85 90 95
Ser Ala Arg Ala Gly Ala Asp Glu Pro Asp Val Thr Arg Ala Trp Leu
100 105 110
Gly Asp Arg Thr Val Ala Asp Gly Asp Tyr Pro Ala Pro Glu Ala Ala
115 120 125
Ala Ala Leu Val Arg Ala Val Arg Arg Val Ala Arg Pro Gly Arg Pro
130 135 140
Val Val Val Glu Gly Gly Ser Ile Ser Leu Leu Ala Tyr Leu Val Asp
145 150 155 160
His His Leu Pro Val Leu Pro Trp Arg Phe Thr Val Thr Ser Leu Thr
165 170 175
Arg Pro Ala Pro Ser Arg Tyr Leu Ala Ala Leu Thr Ala Arg Ala His
180 185 190
Ala Met Leu Arg Pro Glu Pro Pro Leu Ala Gly Leu Leu Asp Glu Leu
195 200 205
Ala Ala Leu Trp Arg Val Pro Gly His Arg Trp Phe Ala Ala Ser Val
210 215 220
Asn Gly Phe Glu Ala Ala Leu Glu Trp Cys Ala Lys Tyr Gly Leu Asp
225 230 235 240
Pro Thr Glu Pro Thr Leu Val Gly Leu Pro Pro Arg Leu Val Asp Glu
245 250 255
Leu Ala Leu Leu Ile Ala Glu Arg His Ala Glu His Gly Ala Asp Gln
260 265 270
Glu Arg Ala Phe Ala Ala Leu Phe Ala Pro Ala Ala Arg Ala Gly Val
275 280 285
Arg Leu Gly Asp Ala Ala
290
<210> 27
<211> 256
<212> PRT
<213> Streptomyces sp. NRRL WC-3618
<400> 27
Met Ala Glu Ile Ser Asn Asp Arg Thr Ala Arg Pro Phe Val His Leu
1 5 10 15
Ile Ala Gly Pro Thr Gly Ala Gly Lys Ser Ala Ala Ala Asn Glu Leu
20 25 30
Ala Arg Val Thr Gly Ala Pro Val Val Val Ala Asp Arg Leu Gln Cys
35 40 45
Phe Thr Asp Leu Val Thr Thr Ser Ala Arg Ala Gly Ala Glu Ala Arg
50 55 60
Gly Val Arg Arg Tyr Trp Leu Ala Asp Arg Thr Val Ala Asp Gly Asp
65 70 75 80
Leu Gly Ala Val Ala Ala Ala Asp Ser Leu Val Gly Leu Val Glu Arg
85 90 95
Leu Gly Arg Gln His Arg Phe Val Ile Val Glu Gly Gly Ser Ile Ser
100 105 110
Leu Leu Lys Ala Leu Ala Glu Arg Arg Ala Thr Leu Pro Trp Gln Leu
115 120 125
Ser Val Arg Val Leu Pro Leu Pro Ala Tyr Gly Asp Tyr Val Glu Ala
130 135 140
Leu Thr Arg Arg Ala Gln Thr Met Ile Ala Pro Pro Thr Pro Asp Pro
145 150 155 160
Ser Leu Leu Glu Glu Leu Ala Thr Leu Trp Ala Asp Pro Arg Leu Arg
165 170 175
Arg Phe Ala Ala Ser Val Asn Gly Phe Glu Ala Val Leu Glu Ile Cys
180 185 190
Ala Lys Tyr Ser Leu Asp Val Glu Thr Ile His Lys Gln Val Pro Pro
195 200 205
Ala Pro Val Leu Ser Gln Met Ala Ser Leu Ile Ala Leu Arg His Ala
210 215 220
Glu His Gly Ile Leu Gln Ser Tyr Val Phe Thr Glu Ile Phe Glu Glu
225 230 235 240
Gln Ile Pro Val Gln Val Ser Asp Pro Gly Val Leu Val Arg Ala Ala
245 250 255
<210> 28
<211> 239
<212> PRT
<213> Trinickia caryophylli
<400> 28
Met Thr Ile Arg Leu Tyr Met Ile Trp Gly Pro Thr Thr Thr Gly Lys
1 5 10 15
Thr Ala Leu Ser Val Ala Leu Ala Arg Met Val Gly Val Pro Val Leu
20 25 30
Ser Leu Asp Arg Val Gln Cys Cys His Glu Ile Ala Val Gly Ser Gly
35 40 45
Arg Pro Ser Pro Glu Glu Leu Glu Gly Thr Ala Arg Glu Tyr Leu Cys
50 55 60
His Arg Arg Val Ala Asp Gly Val Val Ser Ala Ala Glu Ala Asn Arg
65 70 75 80
Leu Leu Lys Ala Lys Val Leu Asp Tyr Ser Arg His Leu Pro Ala Leu
85 90 95
Ile Leu Glu Gly Gly Ser Val Ser Leu Phe Asn Glu Met Thr Ala Asp
100 105 110
Asp Ser Trp Ala His Ile Ala Glu Trp Val Leu Gln Arg Val Pro Leu
115 120 125
Pro Ala Gln Asp Val Phe Met Lys Arg Ala Arg Gly Arg Ala Arg Ala
130 135 140
Met Leu Asp Ala Pro Ala Gly Glu Arg Ser Met Leu Asp Glu Leu Val
145 150 155 160
Asp Leu Trp Arg Asp Pro Arg Thr His Ala Val Leu Glu Asp Ile Asp
165 170 175
Gly Tyr Arg Gln Leu Ile Gly Tyr Ala Arg Ala Ala Gly Ile Pro Val
180 185 190
Val Glu Leu Ser Asn Ala Ala Pro Glu Ile Phe Asp Asp Trp Val Glu
195 200 205
Leu Ile Ala Arg Glu Tyr Trp Glu His Ala Cys Trp Gln Glu Gln Arg
210 215 220
Phe Ala Ser Pro Pro Thr Cys Trp Arg His Val Ala His Ala Trp
225 230 235
<210> 29
<211> 238
<212> PRT
<213> Xanthomonas albilineans
<400> 29
Met Asn Gly Ala Leu Tyr Leu Ile Trp Gly Pro Thr Cys Ser Gly Lys
1 5 10 15
Thr Ala Leu Ala Val Ala Leu Ala Glu Gln Ser Gly Trp Pro Val Ile
20 25 30
Ala Leu Asp Arg Ile Gln Cys Tyr Pro Glu Leu Ala Thr Gly Ser Gly
35 40 45
Arg Pro Leu Ser Ser Glu Leu Arg Gly Thr Arg Arg Ile Tyr Leu Ala
50 55 60
Ser Arg Ala Val Arg Glu Gly Ile Ile Ala Ala Asp Glu Ala His Ala
65 70 75 80
Leu Leu Lys Asp Met Val Gly Arg His Ser Ala Ala Gly Gly Val Ile
85 90 95
Leu Glu Gly Gly Ser Ile Ser Leu Ile Asn Arg Met Ile Ala Asp Pro
100 105 110
Tyr Trp Ala Ser Gly Trp Gln Trp His Ser Arg Arg Leu Arg Leu Gly
115 120 125
Asp Pro Ala Ala Phe Leu Asp Arg Ala Leu Arg Arg Val Glu Gln Met
130 135 140
Leu Arg Thr His Gln Glu His Pro Ser Leu Leu Glu Glu Leu Val Ala
145 150 155 160
Leu Trp Pro Asp Pro Ala Leu Arg Pro Ile Leu Glu Asp Val Asp Gly
165 170 175
Tyr Arg Tyr Ala Ile Arg Phe Ala Arg His Trp Ser Leu Pro Val Ala
180 185 190
Asp Leu Leu Ser Met Arg Asp Glu Met Lys Gln Arg Leu Ile Arg Gly
195 200 205
Ile Ala Glu Glu Tyr Leu Glu His Ala Gln Trp Gln Glu Arg Asp Leu
210 215 220
Leu Ala Leu Pro Ala Ser Trp Gln Ala Gln Glu Leu Ser Thr
225 230 235
<210> 30
<211> 238
<212> PRT
<213> Chondromyces crocatus
<400> 30
Met Lys Ala His Cys Ile Val Gly Ala Thr Gly Thr Gly Lys Thr Ala
1 5 10 15
Arg Ala Thr Ser Leu Ala Arg Gln Thr Gly Ala Pro Val Leu Val Leu
20 25 30
Asp Arg Phe Gln Val Phe Glu Asp Leu Ala Ser Gly Thr Gly Arg Pro
35 40 45
Leu Ser Arg Glu Val Ala Gly Thr Thr Arg Leu Tyr Leu Gly His Arg
50 55 60
Tyr Met Met Asp Gly Glu Leu Thr Arg Gln Asp Ala Leu Leu Asp Phe
65 70 75 80
Leu Arg Thr Val Gly Lys Leu Ala Val Asp His Asp Phe Ile Ile Leu
85 90 95
Glu Gly Gly Ser Ile Ser Leu Asn Glu Ala Leu Ile Glu Glu Ser Leu
100 105 110
Leu Gly Thr Thr Gly Val Thr Val Glu Arg Met Arg Met Thr Ser Val
115 120 125
Lys Ala Tyr Glu Gln Gly Leu Arg Arg Arg Ala Arg Met Met Leu Thr
130 135 140
Pro Ser Ala Glu Arg Pro Ser Met Ile Glu Glu Leu Ala Arg Gly Trp
145 150 155 160
Asp Asn Pro Arg Leu Arg Ala Phe Leu Ser Ser Ile Thr Gly Tyr Asp
165 170 175
Ala Ile Val Asp His Cys Glu Gln Ala Gly Ile Glu Pro Ala Glu Leu
180 185 190
Ala Ala Gly Pro Val Asp Pro Val Leu Ile Asp Glu Val Val Leu Ser
195 200 205
His Met Lys Tyr Ala Ala Lys Gln Thr Ala Ala Phe Asn Gln Leu Phe
210 215 220
Pro Glu Gln Ser Ser Phe Pro Gly Cys Gln Pro Cys Thr Ala
225 230 235
<210> 31
<211> 239
<212> PRT
<213> Dickeya dianthicola
<400> 31
Met Ser Thr Ile Leu Tyr Leu Leu Trp Gly Pro Thr Ser Thr Gly Lys
1 5 10 15
Thr Ser His Ser Val Ile Leu Ala Lys Lys Tyr Gly Phe Pro Val Ile
20 25 30
Ala Leu Asp Arg Phe Gln Gly Tyr Gln Glu Ile Lys Thr Gly Ser Gly
35 40 45
Ala Pro Asp Gln Ala Glu Leu Gln Gly Thr Glu Arg Ile Tyr Ile Thr
50 55 60
Pro Ser His His Leu Thr Glu Ser Val Val Ser Ser Glu Glu Ala His
65 70 75 80
Asn Ile Leu Lys Lys Lys Ile Ser Ile Leu Leu Asn Arg Asn Ser Ser
85 90 95
Val Ile Leu Glu Gly Gly Ser Val Ser Leu Leu Thr Lys Ile Val Met
100 105 110
Asp Asp Tyr Trp Ser Gln Phe Ser Trp Arg Ile Arg Arg Phe His Met
115 120 125
Ile Ser Lys Lys Asp Phe Ile Glu Lys Ala Gln Lys Arg Val Thr Ser
130 135 140
Met Ile Tyr Pro Gln Asn Gly Gly Ser Ser Ile Leu Lys Glu Thr Ser
145 150 155 160
Leu Phe Phe Arg Lys Asn Leu Thr Ile Glu Pro Leu Glu Asp Ile Asp
165 170 175
Gly Tyr Arg Lys Ile Ile Gln Tyr Cys Lys Glu Lys Asn Ile Asp Phe
180 185 190
Asp Ser Leu Asp Lys Leu Asn Ser Asn Glu Lys Asp Asn Leu Ile Asp
195 200 205
Ile Ile Ser Asn Glu Tyr Tyr Glu His Ala Leu Trp Gln Glu Lys Asn
210 215 220
Phe Pro Gly Phe Pro Ala Ser Trp Ser Trp Glu Thr Leu Lys Asn
225 230 235
<210> 32
<211> 244
<212> PRT
<213> Nostoc sp.
<400> 32
Met Arg Leu His Ile Ile Leu Gly Pro Thr Ser Val Gly Lys Thr Asp
1 5 10 15
Arg Ser Val Val Leu Ala Lys Gln Thr Lys Ala Pro Val Ile Val Leu
20 25 30
Asp Arg Ile Gln Ile Tyr Gln Glu Ile Ala Thr Gly Ser Gly Arg Pro
35 40 45
Leu Ile Asp Glu Leu Glu Gly Thr Thr Arg Ile Tyr Leu Glu Glu Arg
50 55 60
Gln Leu Ala Asp Gly Asn Leu Asn Thr Leu Glu Ser Leu Ser Leu Ala
65 70 75 80
Leu Gln His Ile Asp Arg Leu Ser Ser Gln His Lys Leu Leu Ile Leu
85 90 95
Glu Gly Gly Ser Ile Ser Leu Cys Thr Ala Leu Trp Lys Ser Arg Ile
100 105 110
Leu Glu Asn Tyr Gln Thr Thr Ile Glu Tyr Val Lys Val Glu Asn Glu
115 120 125
Glu Leu Tyr Gln Ser Arg Leu Trp Arg Arg Met Gln Asn Ala Leu Ile
130 135 140
Ser Asn Pro Arg Arg Pro Ser Leu Ile Glu Glu Leu Ser Arg Val Trp
145 150 155 160
Gln Asp Pro His Lys Leu Ala Leu Val Arg Thr Val Val Gly Tyr Asp
165 170 175
Val Leu Ile His Trp Cys Gln Lys Tyr Gly Leu Ser Pro Asp Gln Met
180 185 190
Trp Lys Ser Phe Gln Asp Asn Ser Phe Tyr Ile Asn Leu Met Gln Glu
195 200 205
Met Phe Leu Ala Tyr Met Gln Tyr Ser Gln Asn Gln Arg Gln Ala Phe
210 215 220
Asp Gln Leu Ala Val Glu Tyr Lys Gln Gln Gln Ala Leu Leu Ala Ser
225 230 235 240
Thr Val Thr Leu
<210> 33
<211> 283
<212> PRT
<213> Dictyostelium discoideum
<400> 33
Met Lys Ile Leu Leu Ile Ile Gly Ser Thr Gly Val Gly Lys Thr Asp
1 5 10 15
Leu Ser Ile Asn Tyr Ser Lys Lys Tyr Asn Ala Pro Val Val Val Leu
20 25 30
Asp Arg Ile Gln Cys Phe Pro Glu Leu Ser Ile Thr Ser Gly Arg Pro
35 40 45
Asp Glu Ser Glu Tyr Phe Gly Ser Lys Arg Ile Tyr Leu Thr Asp Leu
50 55 60
Leu Val Glu Pro Gly Asn Glu Asn Ile Lys Lys Thr Phe Tyr Val Asn
65 70 75 80
Lys Leu Ile Asn Ile Leu Asn Glu Ile Lys Asn Asn Tyr Asp Thr Gln
85 90 95
Asn Leu Pro Asn Glu Lys Gly Tyr Gly Cys Ile Phe Glu Gly Gly Ser
100 105 110
Ile Ser Leu Leu Lys Glu Leu Leu Thr Lys Ile Asn Lys Leu Pro Tyr
115 120 125
Lys Ile Thr Cys Val Ile Tyr Ile Arg Pro Ser Asp Ser Ile Asp Asn
130 135 140
His Lys Leu Tyr Lys Ala Lys Ile Phe Lys Arg Val Ser Gln Met Leu
145 150 155 160
Phe Pro Thr Glu Glu Gly Asn Asp Ser Gln Ile Leu Glu Val Lys Arg
165 170 175
Ile Leu Asn Lys Gly Lys Thr Val Asn Ala Gln Gly Glu Ile Asn Leu
180 185 190
Glu Tyr Tyr Glu Lys Ile Lys Gln Val Leu Ile Ser Leu Val Gly Leu
195 200 205
Val Gly Ile Glu Asp Val Ile His Phe Leu Asp Lys Gln Tyr Asp Gln
210 215 220
Lys Asn Ile Thr Ser Lys Leu Asp Pro Asn Tyr Leu Asn Glu Ile Gln
225 230 235 240
Ser Gln Leu Ile Glu Thr Ile Thr Leu Ala His Tyr Asn Tyr Ala Leu
245 250 255
Ser Gln Ile Glu Leu Ile Asp Ser Leu Ile Lys Gln Leu Pro Lys Ser
260 265 270
Ile Glu Tyr Cys Leu Lys Asn Ile Glu Ile Asn
275 280
<210> 34
<211> 195
<212> PRT
<213> Corynebacterium glutamicum
<400> 34
Met Thr Ser Leu Phe Asp Ala Pro Thr Leu Gln Arg Val Thr Val Phe
1 5 10 15
Thr Gly Ser Ala Leu Gly Ser Ser Ser Leu Tyr Thr Gln Ala Ala Gln
20 25 30
Thr Leu Ala Lys Thr Ala Val Asp Arg Gly Ile Asp Leu Val Tyr Gly
35 40 45
Gly Gly Lys Val Gly Leu Met Gly Ile Val Ala Asp Ala Phe Leu Glu
50 55 60
Ser Gly Gly Glu Ala Phe Gly Val Ile Thr Glu Ser Leu Met Lys Gly
65 70 75 80
Glu Leu Gly His Glu Lys Leu Thr Glu Leu Glu Ile Val Pro Asp Met
85 90 95
His Ile Arg Lys Arg Arg Met Ala Glu Leu Gly Asp Gly Phe Ile Ala
100 105 110
Met Pro Gly Gly Ala Gly Thr Leu Glu Glu Leu Phe Glu Val Trp Thr
115 120 125
Trp Gln Gln Leu Gly Ile His Gln Lys Pro Val Ala Leu Tyr Asp Val
130 135 140
Asp Gly Phe Trp Gln Pro Leu Leu Glu Met Leu Glu Gln Met Thr Gln
145 150 155 160
Arg Gly Phe Ile Lys Arg Asp Phe Phe Glu Cys Leu Ile Val Glu Ser
165 170 175
Asp Pro His Ala Leu Leu Lys Ala Met Gln Thr Trp Thr Pro Pro Ala
180 185 190
Pro Lys Trp
195
<210> 35
<211> 191
<212> PRT
<213> Bacillus subtilis
<400> 35
Met Lys Thr Ile Cys Val Phe Ala Gly Ser Asn Pro Gly Gly Asn Glu
1 5 10 15
Ala Tyr Lys Arg Lys Ala Ala Glu Leu Gly Val Tyr Met Ala Glu Gln
20 25 30
Gly Ile Gly Leu Val Tyr Gly Gly Ser Arg Val Gly Leu Met Gly Thr
35 40 45
Ile Ala Asp Ala Ile Met Glu Asn Gly Gly Thr Ala Ile Gly Val Met
50 55 60
Pro Ser Gly Leu Phe Ser Gly Glu Val Val His Gln Asn Leu Thr Glu
65 70 75 80
Leu Ile Glu Val Asn Gly Met His Glu Arg Lys Ala Lys Met Ser Glu
85 90 95
Leu Ala Asp Gly Phe Ile Ser Met Pro Gly Gly Phe Gly Thr Tyr Glu
100 105 110
Glu Leu Phe Glu Val Leu Cys Trp Ala Gln Ile Gly Ile His Gln Lys
115 120 125
Pro Ile Gly Leu Tyr Asn Val Asn Gly Tyr Phe Glu Pro Met Met Lys
130 135 140
Met Val Lys Tyr Ser Ile Gln Glu Gly Phe Ser Asn Glu Ser His Leu
145 150 155 160
Lys Leu Ile His Ser Ser Ser Arg Pro Asp Glu Leu Ile Glu Gln Met
165 170 175
Gln Asn Tyr Ser Tyr Pro Ile Leu Glu Lys Lys Trp Thr Glu Ile
180 185 190
<210> 36
<211> 256
<212> PRT
<213> Corynebacterium glutamicum
<400> 36
Met Ala Pro Lys Gln Thr Pro Ser Pro Glu Lys Asn Arg Asn Leu Val
1 5 10 15
Gly Pro Val Leu Gln Arg Arg Gln Thr Glu Gly Thr Phe Asp Gln Arg
20 25 30
Leu Leu Glu Met Arg Ala Asp His Asn Trp Lys His Ala Asp Pro Trp
35 40 45
Arg Val Leu Arg Ile Gln Ser Glu Phe Val Ala Gly Phe Asp Ala Leu
50 55 60
His Glu Met Pro Lys Ala Val Thr Val Phe Gly Ser Ala Arg Ile Lys
65 70 75 80
Glu Asp His Pro Tyr Tyr Lys Ala Gly Val Glu Leu Gly Glu Lys Leu
85 90 95
Val Ala Ala Asp Tyr Ala Val Val Thr Gly Gly Gly Pro Gly Leu Met
100 105 110
Glu Ala Pro Asn Lys Gly Ala Ser Glu Ala Asn Gly Leu Ser Val Gly
115 120 125
Leu Gly Ile Glu Leu Pro His Glu Gln His Leu Asn Pro Tyr Val Asp
130 135 140
Leu Gly Leu Asn Phe Arg Tyr Phe Phe Ala Arg Lys Thr Met Phe Leu
145 150 155 160
Lys Tyr Ser Gln Ala Phe Val Cys Leu Pro Gly Gly Phe Gly Thr Leu
165 170 175
Asp Glu Leu Phe Glu Val Leu Cys Met Val Gln Thr Gly Lys Val Thr
180 185 190
Asn Phe Pro Ile Val Leu Ile Gly Thr Glu Phe Trp Ala Gly Leu Val
195 200 205
Asp Trp Ile Arg His Arg Leu Val Glu Glu Gly Met Ile Asp Glu Lys
210 215 220
Asp Val Asp Arg Met Leu Val Thr Asp Asp Leu Asp Gln Ala Val Lys
225 230 235 240
Phe Ile Val Asp Ala His Ala Gly Leu Asp Val Ala Arg Arg His Asn
245 250 255
<210> 37
<211> 195
<212> PRT
<213> Pseudomonas aeruginosa
<400> 37
Met Thr Leu Arg Ser Val Cys Val Phe Cys Gly Ala Ser Pro Gly Ala
1 5 10 15
Ser Pro Val Tyr Gln Glu Ala Ala Val Ala Leu Gly Arg His Leu Ala
20 25 30
Glu Arg Gly Leu Thr Leu Val Tyr Gly Gly Gly Ala Val Gly Leu Met
35 40 45
Gly Thr Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ile Gly
50 55 60
Ile Ile Pro Gln Ser Leu Gln Glu Ala Glu Ile Gly His Lys Gly Leu
65 70 75 80
Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met
85 90 95
Ala Glu Leu Ala Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr
100 105 110
Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His
115 120 125
Ala Lys Pro Leu Gly Leu Leu Glu Val Asn Gly Phe Tyr Asp Pro Leu
130 135 140
Leu Thr Phe Leu Asp His Leu Val Asp Glu Arg Phe Val Arg Ala Glu
145 150 155 160
His Arg Gly Met Leu Gln Arg Gly Ala Ser Pro Glu Ala Leu Leu Asp
165 170 175
Ala Leu Ala Ala Trp Thr Pro Ser Val Ala Pro Lys Trp Val Asp Arg
180 185 190
Thr Pro Gln
195
<210> 38
<211> 256
<212> PRT
<213> Rhodococcus fascians
<400> 38
Met Asn Ser Val Asp Asp Pro Gly Ser Tyr Glu Gln Ile Gly Ser Glu
1 5 10 15
Lys Pro Ala Lys His Lys Gly Ser Val Val Leu Arg Arg Gly Arg Asn
20 25 30
Thr Glu Thr Ser Thr Ser Asp Gln Arg Leu Leu Asp Glu Arg Gly Ser
35 40 45
Gly Asn Trp Ile His Ser Asp Thr Trp Arg Val Leu Arg Ile Gln Ser
50 55 60
Glu Phe Val Glu Gly Phe Gly Ala Leu Ala Glu Val Pro Arg Ala Val
65 70 75 80
Thr Val Phe Gly Ser Ala Arg Thr Pro Val Asp His Pro Glu Tyr Glu
85 90 95
Arg Ala Arg Glu Leu Gly Ala Ala Leu Ala Arg Glu Gly Phe Ala Val
100 105 110
Ile Thr Gly Gly Gly Pro Gly Val Met Glu Gly Ala Asn Arg Gly Ala
115 120 125
Ser Glu Ala Asp Gly Tyr Ser Ile Gly Leu Gly Ile Glu Leu Pro Phe
130 135 140
Glu Gln Gly Leu Asn Asp Trp Val Asp Leu Gly Val Asn Phe Arg Tyr
145 150 155 160
Phe Phe Val Arg Lys Thr Met Phe Val Lys Tyr Ser Gln Ala Phe Val
165 170 175
Cys Leu Pro Gly Gly Phe Gly Thr Leu Asp Glu Leu Phe Glu Ala Leu
180 185 190
Thr Leu Val Gln Thr Ala Lys Val Thr Arg Phe Pro Ile Val Leu Leu
195 200 205
Gly Lys Asp Phe Trp Ser Gly Leu Leu Asp Trp Ile Lys Thr Thr Leu
210 215 220
Val Lys Glu Gly Lys Val Ser Glu Lys Asp Leu Asp Leu Ile His Cys
225 230 235 240
Thr Asp Ser Val Asp Glu Ala Val Arg Ile Val Arg Glu Ala Gln Gln
245 250 255
<210> 39
<211> 198
<212> PRT
<213> Rhodococcus fascians
<400> 39
Met Asn Leu Arg Pro Met Pro Ala Thr Thr Val Ser Ala Gln Ala Arg
1 5 10 15
Pro Thr Pro Lys Ser Val Thr Val Phe Cys Gly Ala Met Pro Gly Arg
20 25 30
Gly Thr Lys Tyr Gly Gln Leu Ala Glu Gly Met Gly Arg Ala Ile Ala
35 40 45
Arg Ser Lys Leu Arg Leu Val Tyr Gly Gly Ala Arg Val Gly Leu Met
50 55 60
Gly Thr Leu Ala Asn Ala Ala Leu Asp Ser Gly Gly Thr Val Val Gly
65 70 75 80
Val Ile Pro Glu Ser Phe Thr Ala Ile Pro Glu Ala Ala His His Gly
85 90 95
Leu Thr Glu Leu His Val Val His Asp Met His Gln Arg Lys Ala Leu
100 105 110
Met Ala Glu Leu Gly Asp Ala Phe Ile Ala Leu Pro Gly Gly Val Gly
115 120 125
Thr Ala Glu Glu Phe Phe Glu Val Leu Thr Trp Ser His Leu Gly Leu
130 135 140
His Asn Lys Pro Cys Val Leu Leu Asn Asp Asn Glu Tyr Tyr Arg Pro
145 150 155 160
Leu Leu Ser Tyr Ile Glu His Ala Ala Val Glu Gly Phe Ile Thr Pro
165 170 175
Ala Thr Arg Ser Arg Val Ile Val Cys Lys Asp Ile Glu Gly Ala Ile
180 185 190
Ala Ala Ile Arg Ser Pro
195
<210> 40
<211> 187
<212> PRT
<213> Corynebacterium stationis
<400> 40
Met Lys Ser Val Ala Ile Tyr Cys Gly Ser Ser Met Gly Ser Ser Pro
1 5 10 15
Arg Tyr Ala Glu Val Ala Lys Glu Met Gly Glu Glu Leu Ala Arg Arg
20 25 30
Asn Leu Arg Val Val Tyr Gly Gly Gly Asn Val Gly Leu Met Gly Thr
35 40 45
Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Val Gly Val Ile
50 55 60
Pro Arg Gln Leu Ile Asn Arg Glu Met Ala His Ala Gly Leu Thr Asp
65 70 75 80
Leu Glu Val Val Asp Thr Met Ala Gln Arg Lys Thr Arg Met Glu Glu
85 90 95
Leu Ala Asp Ala Phe Val Cys Leu Pro Gly Gly Val Gly Thr Leu Glu
100 105 110
Glu Val Val Glu Val Leu Thr Met Gln Gln Leu Gly His Val Gln Gly
115 120 125
Pro Val Gly Leu Val Asn Val Asp Gly Phe Trp Glu Pro Phe Val Arg
130 135 140
Thr Leu Glu Ser Met Val Ala Cys Gly Phe Val Gln Ser Arg Tyr Ile
145 150 155 160
Asp Ala Ile Ala Leu Ser Ser Asp Pro Ala Glu Ile Leu Asp Glu Phe
165 170 175
Ala Gly Trp Ser Pro Ile Gly Ala Lys Trp Ser
180 185
<210> 41
<211> 275
<212> PRT
<213> Corynebacterium stationis
<400> 41
Met Ala Pro Leu Arg Ser Asn Lys Asp Gly Lys Pro Arg Val Pro Arg
1 5 10 15
Thr Thr Glu Ser Ala Glu Thr Asn Arg Met Leu Arg Gly Pro Met Leu
20 25 30
Leu Arg Thr Asp Gly Asn Gln Thr Ser Thr Tyr Asp Gln Arg Leu Leu
35 40 45
Glu Ser Gly Ala Asp His Ala Trp Lys His Ala Asp Pro Trp Arg Val
50 55 60
Leu Arg Ile Gln Gly Glu Phe Val Ala Gly Phe Asp Ala Leu Ser Asp
65 70 75 80
Leu Pro Lys Ala Val Thr Val Tyr Gly Ser Ala Arg Thr Lys Glu Asp
85 90 95
Thr Pro Glu Tyr Ala Gln Gly Ile Asp Leu Gly Ala Lys Leu Val Glu
100 105 110
His Asp Tyr Ala Val Val Thr Gly Gly Gly Pro Gly Ile Met Glu Ala
115 120 125
Ala Asn Arg Gly Ala Tyr Glu Ala Gly Gly Leu Ser Val Gly Leu Gly
130 135 140
Ile Glu Leu Pro Phe Glu Gln Gly Leu Asn Lys Tyr Val Asp Leu Gly
145 150 155 160
Ile Asn Phe Arg Tyr Phe Phe Ala Arg Lys Thr Met Phe Leu Lys Tyr
165 170 175
Ser Gln Ala Phe Val Cys Leu Pro Gly Gly Met Gly Thr Met Asp Glu
180 185 190
Leu Phe Glu Met Leu Cys Met Val Gln Thr Gly Lys Val Thr Asn Tyr
195 200 205
Pro Ile Val Leu Ile Gly Thr Glu Tyr Trp Ser Gly Leu Val Glu Trp
210 215 220
Met Ala Asn Thr Leu Val Ala Glu Gly Tyr Ile Asn Pro Gln Asp Met
225 230 235 240
Asp Leu Phe Leu Leu Thr Asp Ser Val Asp Glu Ala Val Glu His Ile
245 250 255
Val Ala Ala His Lys Glu Met Thr Asp Glu Arg Val Ser Arg Leu Asn
260 265 270
His Asp Ala
275
<210> 42
<211> 252
<212> PRT
<213> Streptomyces coelicolor
<400> 42
Met Ala Thr Gly Asn Pro Glu Gly Lys Lys Arg Pro Pro Glu Glu Gln
1 5 10 15
Arg Leu Gly Pro Val Leu Arg Arg Arg Gly Gln Val Gln Glu Ser Thr
20 25 30
Thr Asp Gln Arg Leu Leu Asp Glu Arg Ala Pro Thr Asp Trp Val His
35 40 45
Thr Asp Pro Trp Arg Val Leu Arg Ile Gln Ser Glu Phe Ile Glu Gly
50 55 60
Phe Gly Thr Leu Ala Glu Leu Pro Pro Ala Ile Ser Val Phe Gly Ser
65 70 75 80
Ala Arg Thr Pro Ala Asp Ser Pro Glu Tyr Asp Ala Gly Val Arg Leu
85 90 95
Gly Arg Gly Leu Val Glu Ala Gly Phe Ala Val Ile Thr Gly Gly Gly
100 105 110
Pro Gly Ala Met Glu Ala Ala Asn Lys Gly Ala Leu Glu Ala Lys Gly
115 120 125
Thr Ser Val Gly Leu Gly Ile Glu Leu Pro Phe Glu Gln Gly Leu Asn
130 135 140
Pro Tyr Val Asp Ile Gly Leu Asn Phe Arg Tyr Phe Phe Val Arg Lys
145 150 155 160
Met Met Phe Val Lys Tyr Ala Gln Gly Phe Val Val Leu Pro Gly Gly
165 170 175
Leu Gly Thr Leu Asp Glu Leu Phe Glu Ala Leu Thr Leu Val Gln Thr
180 185 190
Gln Lys Val Thr Arg Phe Pro Ile Val Leu Phe Gly Ser Glu Tyr Trp
195 200 205
Gly Gly Leu Val Asp Trp Leu Arg Gly Thr Leu Val Ala Gln Gly Lys
210 215 220
Ala Ala Glu Lys Asp Leu Met Leu Phe His Val Thr Asp Asp Val Asp
225 230 235 240
Glu Ala Val Ala Leu Val Ser Lys Glu Ala Gly Arg
245 250
<210> 43
<211> 215
<212> PRT
<213> Arabidopsis thaliana
<400> 43
Met Glu Ile Lys Gly Glu Ser Met Gln Lys Ser Lys Phe Arg Arg Ile
1 5 10 15
Cys Val Phe Cys Gly Ser Ser Gln Gly Lys Lys Ser Ser Tyr Gln Asp
20 25 30
Ala Ala Val Asp Leu Gly Asn Glu Leu Val Ser Arg Asn Ile Asp Leu
35 40 45
Val Tyr Gly Gly Gly Ser Ile Gly Leu Met Gly Leu Val Ser Gln Ala
50 55 60
Val His Asp Gly Gly Arg His Val Ile Gly Ile Ile Pro Lys Thr Leu
65 70 75 80
Met Pro Arg Glu Leu Thr Gly Glu Thr Val Gly Glu Val Arg Ala Val
85 90 95
Ala Asp Met His Gln Arg Lys Ala Glu Met Ala Lys His Ser Asp Ala
100 105 110
Phe Ile Ala Leu Pro Gly Gly Tyr Gly Thr Leu Glu Glu Leu Leu Glu
115 120 125
Val Ile Thr Trp Ala Gln Leu Gly Ile His Asp Lys Pro Val Gly Leu
130 135 140
Leu Asn Val Asp Gly Tyr Tyr Asn Ser Leu Leu Ser Phe Ile Asp Lys
145 150 155 160
Ala Val Glu Glu Gly Phe Ile Ser Pro Thr Ala Arg Glu Ile Ile Val
165 170 175
Ser Ala Pro Thr Ala Lys Glu Leu Val Lys Lys Leu Glu Glu Tyr Ala
180 185 190
Pro Cys His Glu Arg Val Ala Thr Lys Leu Cys Trp Glu Met Glu Arg
195 200 205
Ile Gly Tyr Ser Ser Glu Glu
210 215
<210> 44
<211> 306
<212> PRT
<213> Arabidopsis thaliana
<400> 44
Met Gly Val Ser Met Leu Asp Ser Ser Trp Ser Phe Arg Leu Ser Ser
1 5 10 15
Lys Met Ser Pro Ser Pro Thr Gln Lys Leu Ala Ser Ser Leu Thr Glu
20 25 30
Arg Asp Pro Ile Ser Leu Asn Leu Arg Phe Asp His Ser Ile Arg Ala
35 40 45
Tyr Ser Ala Arg Ala Leu Lys Cys Arg Ser Val Lys Ser Glu Asp Phe
50 55 60
Val Glu Arg Ser Ser Pro Phe Glu Val Lys Lys Glu Leu Glu Ile Cys
65 70 75 80
Phe Asp Leu Val His Arg Leu Gly Arg Gly Ile Val Tyr Leu Gly Ser
85 90 95
Ala Arg Ile Pro Pro Asn His Ser His Tyr Leu Gln Ala Gln Glu Leu
100 105 110
Ser Arg Glu Ala Ala Thr Leu Leu Asp Cys Thr Thr Trp Ser Gly Ala
115 120 125
Gly Pro Gly Leu Met Asp Ala Val Thr Glu Gly Ala Leu Glu Ala Glu
130 135 140
Lys Pro Val Gly Gly Ile Lys Ile Glu Lys Glu Ala Gly Glu Trp Thr
145 150 155 160
Ala Ser Lys Phe His Pro Tyr Leu Pro Pro Gln Asn Tyr His Thr Cys
165 170 175
Arg Phe Phe Ser Ala Arg Lys His Gly Leu Val Asp Ala Val Ile Arg
180 185 190
Asn Asn Val Ser Glu Lys Thr Ala Ile Ile Ala Leu Pro Gly Gly Ile
195 200 205
Gly Thr Leu Asp Glu Met Phe Glu Ile Leu Ala Leu Ile Gln Leu Glu
210 215 220
Arg Ile Gly Ser Ala Leu Pro Val Pro Phe Ile Val Met Asn Tyr Asp
225 230 235 240
Ala Phe Tyr Ser Lys Leu Leu Glu Phe Ile Glu Thr Cys Glu Asn Leu
245 250 255
Gly Thr Val Ser Lys Gly Glu Val Ser Ala Leu Trp Lys Val Cys Asn
260 265 270
Asn Asn Phe Glu Ala Leu Thr Tyr Leu Ala Glu Phe Tyr Asp Leu Pro
275 280 285
Asp Gly Ser Ala Lys Leu Glu Thr Glu Leu Arg Lys Thr Thr Pro Thr
290 295 300
Arg Gly
305
<210> 45
<211> 194
<212> PRT
<213> Burkholderia sp. TNe-862
<400> 45
Met Lys Ala Val Cys Val Tyr Cys Gly Ser Ala Glu Gly Ala Asn Pro
1 5 10 15
Ile Tyr Ala Glu Ala Ala Gln Ala Phe Gly Arg Ala Leu Val Ala Ala
20 25 30
Asn Leu Ala Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Val
35 40 45
Ile Ala Asp Thr Val Met Ala Ala Gly Gly Arg Ala Ile Gly Val Ile
50 55 60
Pro Glu Leu Leu Val Asp Lys Glu Val Gly His Thr Gly Leu Thr Glu
65 70 75 80
Leu His Val Val Pro Asp Met His His Arg Lys Lys Met Met Ala Asp
85 90 95
Phe Ser Asp Ala Phe Val Ala Met Pro Gly Gly Ala Gly Thr Leu Glu
100 105 110
Glu Leu Phe Glu Val Tyr Thr Trp Ala Gln Leu Gly Tyr His Arg Lys
115 120 125
Pro Val Gly Val Leu Asn Ile Gly Gly Phe Tyr Asp Pro Leu Val Ala
130 135 140
Leu Leu Asp His Thr Val Arg Glu Gly Phe Met Arg Gln Thr Tyr Arg
145 150 155 160
Glu Met Leu Gln Ile Asp Gly Asp Pro Ala Ala Leu Ile Ala Arg Leu
165 170 175
Lys Arg Tyr His Ala Pro Ala Lys Asp Lys Trp Ala Asp Leu Arg Glu
180 185 190
Asn Val
<210> 46
<211> 194
<212> PRT
<213> Paraburkholderia sp. SOS3
<400> 46
Met Lys Ala Val Cys Val Tyr Cys Gly Ser Ala Lys Gly Ala Asn Pro
1 5 10 15
Ile Tyr Ala Glu Ala Ala His Ala Phe Gly Arg Ala Leu Val Asp Ala
20 25 30
Asn Leu Ala Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Met
35 40 45
Ile Ala Asp Ser Val Met Ala Ala Gly Gly Arg Ala Ile Gly Val Ile
50 55 60
Pro Glu Leu Leu Val Asp Lys Glu Ile Gly His His Gly Leu Thr Glu
65 70 75 80
Leu His Val Val Ser Asp Met His Glu Arg Lys Lys Leu Met Ala Asp
85 90 95
Leu Ser Asp Ala Phe Val Ala Leu Pro Gly Gly Ala Gly Thr Leu Glu
100 105 110
Glu Leu Phe Glu Val Tyr Thr Trp Ala Gln Leu Gly Tyr His Arg Lys
115 120 125
Pro Val Gly Ile Leu Asn Ile Ala Gly Phe Tyr Asp Pro Leu Ile Ala
130 135 140
Met Leu Glu His Thr Val Arg Glu Gly Phe Met Gln Gln Thr Tyr Phe
145 150 155 160
Glu Thr Leu Gln Ile Asp Asn Glu Ala Ala Ala Leu Leu Gly Lys Leu
165 170 175
Gln His Tyr Arg Pro Leu Ala Gln Asp Lys Trp Ser Gln His Arg Asp
180 185 190
Lys Val
<210> 47
<211> 195
<212> PRT
<213> Pseudomonas sp. HAR-UPW-AIA-41
<400> 47
Met Pro Leu Gln Ser Ile Cys Val Phe Cys Gly Ala Ser Val Gly His
1 5 10 15
Asp Pro Ala Tyr Gln Gln Ala Ala Glu Ala Leu Gly Arg Thr Leu Ala
20 25 30
Glu Arg Gly Leu Arg Leu Ile Tyr Gly Gly Gly Glu Val Gly Leu Met
35 40 45
Gly Lys Leu Ala Asp Ala Val Leu Ala Ala Gly Gly Glu Val Thr Gly
50 55 60
Ile Ile Pro Gln Ser Leu Gln Arg Ser Glu Ile Gly His Lys Gly Leu
65 70 75 80
Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met
85 90 95
Ala Glu Leu Ser Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr
100 105 110
Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Ala Gln Leu Gly Tyr His
115 120 125
Thr Lys Pro Ile Gly Leu Leu Asp Val Ala Gly Phe Tyr Arg Gly Leu
130 135 140
Ser Ala Phe Leu Asp Gln Thr Val Ser Ala Gly Phe Ile Arg Pro Pro
145 150 155 160
His Arg Gly Leu Leu His Gln Ala Glu Asp Pro Ala Gln Leu Leu Asp
165 170 175
Leu Leu Gln Gln Gln Gln Gly Ser Val Thr Pro Lys Trp Asp Ala Arg
180 185 190
Gln Pro Ile
195
<210> 48
<211> 195
<212> PRT
<213> Pseudomonas putida
<400> 48
Met Pro Val Arg Ser Val Cys Val Phe Cys Gly Ala Ser Met Gly Ala
1 5 10 15
Asn Pro Ala Tyr Arg Glu Ala Ala Val Ala Leu Gly Gln Ala Ile Ala
20 25 30
Arg Arg Gly Leu Thr Leu Val Tyr Gly Gly Gly Ala Val Gly Leu Met
35 40 45
Gly Val Val Ala Asp Ala Ala Met Ala Ala Gly Gly Glu Val Val Gly
50 55 60
Ile Ile Pro Gln Ser Leu Leu Asp Ala Glu Val Gly His Lys Gly Leu
65 70 75 80
Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met
85 90 95
Ala Glu Leu Ser Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr
100 105 110
Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His
115 120 125
Ala Lys Pro Leu Gly Leu Leu Asp Val Asn Gly Phe Tyr Asp Lys Leu
130 135 140
Gly Gly Phe Leu Asp His Ile Val Glu Glu Gly Phe Val Arg Pro Gln
145 150 155 160
His Arg Ala Met Leu Leu Leu Gly Gln Gln Pro Asp Glu Leu Leu Glu
165 170 175
Gly Met Asp Ser Phe Val Ala Pro Val Ala Pro Lys Trp Val Asp Lys
180 185 190
Gln Pro Asp
195
<210> 49
<211> 203
<212> PRT
<213> Bradyrhizobium sp. Leo170
<400> 49
Met Gln Asn Gln Asn Ala Lys Ala Leu Lys Ser Val Cys Ile Phe Cys
1 5 10 15
Gly Ser Ser Pro Gly Arg Asp Pro Ile Tyr Leu Gln Thr Ala Val Ala
20 25 30
Thr Gly Gln Ala Leu Ala Lys Ala Gly Val Thr Ile Val Tyr Gly Gly
35 40 45
Gly Lys Val Gly Leu Met Gly Ala Val Ala Asp Ala Ala Leu Ala Ala
50 55 60
Gly Gly Arg Val Val Gly Val Ile Pro Arg Ala Leu Val Glu Arg Glu
65 70 75 80
Ile Gly His Thr Gly Leu Ser Gln Leu His Ile Val Glu Thr Met His
85 90 95
Glu Arg Lys Thr Met Met Ala Gln Leu Ser Asp Gly Phe Ile Ala Leu
100 105 110
Pro Gly Gly Ala Gly Thr Leu Glu Glu Leu Phe Glu Glu Trp Thr Trp
115 120 125
Ala Gln Leu Gly Ile His Gln Lys Pro Cys Gly Leu Leu Asn Val Lys
130 135 140
Asp Tyr Phe Ala Pro Leu Ile Ala Met Val Glu Arg Met Val Ala Glu
145 150 155 160
Gly Phe Thr Ile Ala Ala Tyr Ala Glu Met Leu Ile Ile Glu Thr Lys
165 170 175
Val Asp Ala Leu Leu Ser Arg Phe Gly Thr Tyr Gln Pro Pro Pro Arg
180 185 190
Lys Trp Leu Arg Thr Glu Ala Ala Ala Lys Pro
195 200
<210> 50
<211> 200
<212> PRT
<213> Rhodococcus hoagii
<400> 50
Met Arg Ile Thr Val Phe Met Gly Ser Ala Thr Gly His Asp Pro Ala
1 5 10 15
His Leu Gln Thr Ala Thr Gln Phe Gly Arg Asp Leu Ala Ala Ala Gly
20 25 30
Ile Gly Leu Val Tyr Gly Gly Gly Arg Val Gly Leu Met Gly Ala Val
35 40 45
Ala Asp Ala Val Val Ala Gly Gly Gly Glu Thr Val Gly Val Ile Pro
50 55 60
Arg His Leu Ala Asp Lys Glu Ile Ala His Pro Gly Leu Ser Thr Leu
65 70 75 80
Glu Val Val Glu Ser Met His Ala Arg Lys Gln Arg Met Ala Glu Leu
85 90 95
Ala Asp Ala Phe Val Val Leu Pro Gly Gly Ala Gly Thr Leu Asp Glu
100 105 110
Phe Phe Glu Ile Trp Thr Trp Gln Gln Leu Gly Leu His Asp Lys Pro
115 120 125
Val Phe Leu Phe Asp Ala Asp Gly Phe Trp Gln Pro Leu Val Gly Leu
130 135 140
Leu Asp His Leu Val Asp Ala Gly Phe Val Ala Ala Tyr Gln Arg Glu
145 150 155 160
Ala Leu Leu Val Ala Ala Asp Leu Asp Asp Val Arg Thr Ala Met Thr
165 170 175
Thr Trp Ala Pro Pro Ala Pro Lys Trp Ser Gly Thr Ala Glu Pro Ala
180 185 190
Asn Asp Thr Asp Leu Glu Arg Ala
195 200
<210> 51
<211> 185
<212> PRT
<213> Streptomyces gilvigriseus
<400> 51
Met Arg Val Ala Val Phe Thr Gly Ser Ser Phe Gly Ser Ser Pro Ala
1 5 10 15
Phe Ala Arg Ala Ala Glu Glu Leu Gly Arg Gly Leu Ala Glu Ala Gly
20 25 30
Met Gly Ile Val Tyr Gly Gly Gly His Val Gly Leu Met Gly Ala Val
35 40 45
Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ser Gly Val Ile Pro
50 55 60
Arg Ala Leu Ala Glu Arg Glu Leu Gln His Glu Gly Leu Thr Arg Leu
65 70 75 80
Arg Ile Val Glu Thr Met His Glu Arg Lys Ala Ala Met Ala Ala Glu
85 90 95
Ala Asp Ala Phe Val Ala Leu Pro Gly Gly Ala Gly Thr Leu Glu Glu
100 105 110
Leu Phe Glu Ala Trp Thr Trp Gln His Leu Gly Tyr His Ala Lys Pro
115 120 125
Val Val Leu Tyr Asp Val Asp Gly Phe Trp Gln Pro Leu Arg Ala Met
130 135 140
Val Ser Gly Met Val Glu Ser Gly Phe Ile Arg Ala Glu Phe Arg Asp
145 150 155 160
Thr Leu Pro Thr Ala Gly Ser Val Ala Glu Leu Leu Gly Leu Leu Lys
165 170 175
Asp Trp Arg Ala Pro Gly Gly Lys Trp
180 185
<210> 52
<211> 195
<212> PRT
<213> Pseudomonas fluorescens
<400> 52
Met Ser Ile Ala Ser Val Cys Val Phe Cys Gly Ala Ser Thr Gly Thr
1 5 10 15
Asp Pro Ala Tyr Arg Glu Ala Ala Gln Ala Leu Gly Arg Ala Leu Ala
20 25 30
Glu Arg Lys Leu Thr Leu Val Tyr Gly Gly Gly Ala Val Gly Leu Met
35 40 45
Gly Ile Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ile Gly
50 55 60
Ile Ile Pro Gln Ser Leu Lys Asp Lys Glu Ile Gly His Ser Gly Leu
65 70 75 80
Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met
85 90 95
Ala Glu Leu Ser Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr
100 105 110
Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His
115 120 125
Gly Lys Pro Leu Gly Leu Leu Glu Val Asn Gly Phe Tyr Ser Lys Leu
130 135 140
Thr Ala Phe Leu Asp His Ile Val Gly Glu Gly Phe Val Arg Ala Pro
145 150 155 160
His Arg Asp Met Leu Gln Val Ser Glu Ser Ala Gln Asp Leu Leu Asp
165 170 175
Ala Leu Asp Glu Trp Gln Pro Ser Val Gln Pro Lys Trp Ala Glu Gln
180 185 190
Lys Pro Ser
195
<210> 53
<211> 195
<212> PRT
<213> Pseudomonas oryzihabitans
<400> 53
Met Ser Leu Lys Ala Val Cys Val Phe Cys Gly Ala Lys Ser Gly Ala
1 5 10 15
Ser Pro Val Phe Glu Gln Ala Ala Ala Gln Leu Gly Arg Ala Leu Ala
20 25 30
Glu Arg Gly Leu Thr Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met
35 40 45
Gly Val Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ile Gly
50 55 60
Ile Ile Pro Gln Ser Leu Lys Thr Ala Glu Leu Gly His Thr Gly Cys
65 70 75 80
Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met
85 90 95
Ala Glu Leu Ala Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr
100 105 110
Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His
115 120 125
Ala Lys Pro Met Gly Leu Leu Glu Val Asp Gly Phe Tyr Ala Gln Leu
130 135 140
Glu Gly Phe Leu Asp His Leu Val Ala Gln Gly Phe Val Ala Ala Pro
145 150 155 160
His Arg Ala Met Leu Gln Val Glu Asp Ser Pro Ile Ala Leu Leu Asp
165 170 175
Ala Leu Ala Ala Trp Gln Pro Thr Ala Pro Pro Arg Trp Ala Glu Pro
180 185 190
Ala Pro Arg
195
<210> 54
<211> 189
<212> PRT
<213> Amycolatopsis rhizosphaerae
<400> 54
Met Arg Arg Ile Cys Val Phe Cys Gly Ser Ser Ser Gly Asn Asp Ala
1 5 10 15
Val Tyr Ala Glu Gln Ala Ala Ala Leu Gly Lys Leu Leu Ala Glu Arg
20 25 30
Gly Ile Gly Leu Val Tyr Gly Gly Ala Ser Val Gly Ile Met Gly Val
35 40 45
Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ile Gly Val Ile
50 55 60
Pro Lys His Leu Met Arg Val Glu Ile Gly His Ala Asp Leu Thr Glu
65 70 75 80
Leu His Val Thr Ala Gly Met His Glu Arg Lys Ala Lys Met Ala Glu
85 90 95
Leu Ser Asp Gly Phe Leu Ala Leu Pro Gly Gly Ala Gly Thr Leu Glu
100 105 110
Glu Leu Ala Glu Val Trp Thr Trp Ala Gln Leu Gly Leu His His Lys
115 120 125
Pro Ile Gly Leu Val Asp Val Ala Gly Tyr Tyr Arg Pro Leu Arg Glu
130 135 140
Phe Ala Asp His Met Val Ala Glu Gly Phe Leu Arg Pro Gln His Arg
145 150 155 160
Asp Leu Ile Phe Ile Asp Pro Asp Pro Val Val Leu Leu Asp Ala Phe
165 170 175
Glu Ser Tyr Glu Pro Pro Thr Val Ala Lys Trp Ile Gly
180 185
<210> 55
<211> 193
<212> PRT
<213> Corynebacterium provencense
<400> 55
Met Thr Ala Ala Ala Pro Val Arg Lys Val Ala Leu Tyr Leu Gly Ser
1 5 10 15
Ala Thr Gly Asp Ser Pro Ala Tyr Arg Glu Thr Thr Val Arg Thr Val
20 25 30
Glu Val Leu Ala Asp Ala Gly Cys Glu Leu Val Tyr Gly Gly Gly Ser
35 40 45
Val Gly Leu Met Gly Val Ala Ala Asp Thr Ala Leu Ala Ala Gly Met
50 55 60
Pro Val His Gly Val Ile Thr Arg His Leu Met Asp Gly Glu Thr Gly
65 70 75 80
His Pro Gly Leu Thr Asp Leu Glu Val Val Asp Thr Met Thr Arg Arg
85 90 95
Lys Glu Arg Met Ala Glu Ile Ala Asp Ala Phe Ile Val Leu Pro Gly
100 105 110
Gly Ile Gly Thr Leu Glu Glu Phe Phe Glu Val Trp Val Ala Gln Val
115 120 125
Leu Gly Ile His Thr Arg Pro Val Ala Leu Val Asp Val Asp Asn Tyr
130 135 140
Trp Gln Pro Leu Thr Asp Met Ile Asp His Met Val Ser Arg Gly Phe
145 150 155 160
Leu Ser Ala Val His Arg Asp His Leu Ile Arg Val Asn Asp Pro Glu
165 170 175
Met Ile Pro Thr Ala Leu Asp Val Trp Thr Pro Ala Ala Ala Lys Trp
180 185 190
Ser
<210> 56
<211> 195
<212> PRT
<213> Erwinia typographi
<400> 56
Met Asn Thr Val Gly Ile Phe Cys Gly Ser Ser Glu Gly His Ser Thr
1 5 10 15
Ala Tyr Ile Asp Ala Ala Arg His Val Gly Lys Tyr Leu Ala Glu Gln
20 25 30
Gly Ile Ser Ile Val Tyr Gly Gly Gly Arg Val Gly Leu Met Gly Ala
35 40 45
Val Ala Asp Ala Ala Leu Ala Tyr Gly Gly His Val Thr Gly Val Ile
50 55 60
Pro Lys Ser Leu Leu Glu Arg Glu Ile Ala His Thr Gly Leu Ser Glu
65 70 75 80
Leu Leu Val Val Asp Asn Met His Gln Arg Lys Asn Met Met Ala Glu
85 90 95
Leu Ser Ser Gly Phe Ile Ala Leu Pro Gly Gly Ala Gly Thr Ala Glu
100 105 110
Glu Ile Phe Glu Gln Trp Thr Trp Ala Gln Leu Gly Ile His Asp Lys
115 120 125
Pro Leu Ala Phe Leu Asn Val Asn His Phe Tyr Asp Pro Leu Thr Val
130 135 140
Met Val Gln Arg Met Val Ser Asp Gly Phe Met Lys Gln Asp Tyr Ala
145 150 155 160
Asn Met Leu Arg Phe Ser Glu Asn Leu His Asp Ile Ile Asp Tyr Phe
165 170 175
Lys Thr Tyr Thr Pro Pro Val Ser Lys Trp Thr Thr Arg Asn Glu Asn
180 185 190
His His Val
195
<210> 57
<211> 194
<212> PRT
<213> Paraburkholderia sp. BL10I2N1
<400> 57
Met Lys Ser Val Cys Val Tyr Cys Gly Ser Ser Asp Gly Val Lys Pro
1 5 10 15
Leu Tyr Ala Glu Ala Ala Arg Ala Phe Gly Arg Ala Ile Val Glu Ala
20 25 30
Arg Leu Ala Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Val
35 40 45
Ile Ala Asp Glu Val Met Ala Ala Gly Gly Arg Ala Ile Gly Val Ile
50 55 60
Pro Glu Leu Leu Val Asn Lys Glu Val Gly His Glu Gly Leu Thr Glu
65 70 75 80
Leu His Val Val Pro Asp Met His Gln Arg Lys Lys Met Met Ala Asp
85 90 95
Leu Ser Asp Ala Phe Ile Ala Met Pro Gly Gly Ala Gly Thr Leu Glu
100 105 110
Glu Leu Phe Glu Val Tyr Thr Trp Ala Gln Leu Gly Tyr His Gln Lys
115 120 125
Pro Val Ala Val Leu Asn Ile Asp Gly Tyr Tyr Asp Pro Leu Ile Ser
130 135 140
Met Leu Gln His Thr Val Gln Glu Gly Phe Met Arg Gln Thr Tyr Leu
145 150 155 160
Asp Ile Leu Gln Ile Asp Ser Asp Pro Val Ser Leu Ile Ser Lys Leu
165 170 175
Gln Arg Tyr Leu Pro Pro Ala Arg Asp Lys Trp Ala Asp Asn Arg Glu
180 185 190
Ala Val
<210> 58
<211> 195
<212> PRT
<213> Pseudomonas putida
<400> 58
Met Ser Leu Arg Ser Val Cys Val Phe Cys Gly Ala Ser Thr Gly Ala
1 5 10 15
Ser Pro Val Tyr Arg Glu Ala Ala Ile Ala Leu Gly Gln Ala Ile Ala
20 25 30
Gly Arg Gly Leu Thr Leu Val Tyr Gly Gly Gly Ala Val Gly Leu Met
35 40 45
Gly Ile Val Ala Asp Ala Ala Met Ala Ala Gly Gly Glu Val Ile Gly
50 55 60
Ile Ile Pro Val Ser Leu Gln Arg Ala Glu Ile Ala His Pro Gly Leu
65 70 75 80
Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met
85 90 95
Ala Glu Leu Ser Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr
100 105 110
Phe Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His
115 120 125
Gly Lys Pro Leu Gly Leu Leu Glu Val Asn Gly Phe Tyr Glu Lys Leu
130 135 140
Ser Gly Phe Leu Asp His Val Val Glu Gln Gly Phe Val Arg Pro Gln
145 150 155 160
His Arg Ser Met Leu Gln Met Asn Glu Ala Pro Asp Ala Leu Leu Asp
165 170 175
Ala Leu Asp Ala Trp Glu Pro Val Val Gln Pro Lys Trp Val Asp Gln
180 185 190
Pro Pro Ser
195
<210> 59
<211> 199
<212> PRT
<213> Acinetobacter baylyi
<400> 59
Met Val Lys Lys Phe Met Asn Ser Val Cys Ile Phe Cys Gly Ser Ala
1 5 10 15
Val Gly Thr Asp Pro Val Phe Ile Gln Ala Ala Gln Ser Thr Gly Lys
20 25 30
Arg Ile Ala Glu Gln Gly Lys Thr Leu Val Tyr Gly Gly Gly Arg Ser
35 40 45
Gly Leu Met Gly Val Val Ala Asp Ser Ala Leu Gln Ala Gly Gly His
50 55 60
Val Ile Gly Val Ile Pro Thr Ala Leu Val Asp Arg Glu Leu Ala His
65 70 75 80
Pro His Leu Thr Glu Leu His Val Val Lys Asn Met His Glu Arg Lys
85 90 95
Thr Lys Met Ala Glu Leu Ser Asp Gly Phe Ile Ala Leu Pro Gly Gly
100 105 110
Ala Gly Thr Leu Glu Glu Ile Phe Glu Gln Trp Thr Trp Ala Gln Leu
115 120 125
Gly Ile His Gln Lys Pro Cys Gly Phe Leu Asn Ile Lys Gly Phe Tyr
130 135 140
Asp Asp Leu Leu Lys Met Ile Gln Gly Thr Val Asp Tyr Gly Phe Thr
145 150 155 160
Gln Ser Arg Phe Ala Glu Lys Leu Ile Ala Ser Asp Asp Ile Glu Ile
165 170 175
Ile Leu Asn Gln Phe Glu His Tyr Leu Ala Pro Thr Pro Lys Trp Gly
180 185 190
Asp His Ala Lys Val His Pro
195
<210> 60
<211> 185
<212> PRT
<213> Arcobacter mytili
<400> 60
Met Lys Ile Ala Val Phe Cys Gly Ser Ser Met Gly Asn Asn Ile Lys
1 5 10 15
Tyr Leu Asn Ala Thr Lys Ala Leu Gly Lys Phe Phe Ala Gln Asn Asn
20 25 30
Ile Asp Val Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Ala Ile
35 40 45
Ala Asp Ser Val Met Glu Asn Gly Gly Lys Val Tyr Gly Val Ile Pro
50 55 60
Glu Lys Leu Lys Ser Lys Glu Leu Ala His Thr Gly Ile Thr Glu Leu
65 70 75 80
His Val Val Ser Thr Met His Glu Arg Lys Ala Met Met Ala Glu Leu
85 90 95
Ala Asp Ala Phe Val Thr Leu Pro Gly Gly Ala Gly Thr Leu Glu Glu
100 105 110
Ile Phe Glu Ala Trp Thr Trp Ala Gln Leu Gly Tyr His Asn Lys Pro
115 120 125
Cys Ala Phe Tyr Asn Val Asp Gly Phe Tyr Asp Lys Leu Phe Glu Leu
130 135 140
Ile Asn Asn Met Cys Glu Cys Glu Phe Leu Lys Pro Glu Tyr Ser Asn
145 150 155 160
Met Leu Ile Lys Thr Asp Asn Lys Glu Glu Leu Leu Glu Ala Ile Lys
165 170 175
Asn Tyr Lys Ala Pro Leu Asn Lys Trp
180 185
<210> 61
<211> 189
<212> PRT
<213> Blastococcus endophyticus
<400> 61
Met Arg Ile Ala Val Phe Thr Gly Ser Gln Ser Gly Pro Glu Ser His
1 5 10 15
Arg Thr Ala Ala Ala Ala Leu Ala Gly Asp Leu Ala Arg Ala Gly Val
20 25 30
Gly Ile Val Tyr Gly Gly Gly His Val Gly Leu Met Gly Val Val Ala
35 40 45
Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Val Gly Val Ile Pro Gln
50 55 60
His Leu Val Asp Asp Glu Leu Ala His Pro Arg Leu Pro Arg Leu Glu
65 70 75 80
Ile Val Ser Ser Met His Glu Arg Lys Ala Arg Met Ala Glu Leu Ser
85 90 95
Asp Ala Phe Val Ala Leu Pro Gly Ala Ala Gly Thr Leu Glu Glu Leu
100 105 110
Phe Glu Ala Trp Thr Trp Gly Met Leu Gly Leu His Ala Lys Pro Thr
115 120 125
Val Leu Val Asp Val Asp Gly Phe Trp Gln Pro Leu Leu Ala Gln Leu
130 135 140
Arg Arg Met Ala Asp Asp Gly Tyr Leu Asp Arg Arg Arg Leu Asp Ala
145 150 155 160
Leu Gly Val Val Thr Asp Ala Ala Gly Leu Leu Ala Phe Val Glu Gly
165 170 175
Tyr Glu His Pro Pro Arg Lys Trp Thr Pro Thr Pro Ala
180 185
<210> 62
<211> 194
<212> PRT
<213> Burkholderia sp. OLGA172
<400> 62
Met Lys Ser Val Cys Val Tyr Cys Gly Ser Ser Asp Gly Val Arg Pro
1 5 10 15
Leu Tyr Ala Glu Ala Ala Arg Ala Phe Gly Arg Ala Leu Val Gln Ala
20 25 30
Asp Leu Ala Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Val
35 40 45
Ile Ala Asp Thr Val Met Ala Glu Gly Gly Arg Ala Val Gly Val Ile
50 55 60
Pro Glu Leu Leu Val Asn Lys Glu Val Gly His Asn Gly Leu Thr Glu
65 70 75 80
Leu His Val Val Pro Asp Met His His Arg Lys Lys Met Met Ala Asp
85 90 95
Leu Ser Asp Ala Phe Val Ala Met Pro Gly Gly Ala Gly Thr Leu Glu
100 105 110
Glu Leu Phe Glu Val Tyr Thr Trp Ala Gln Leu Gly Tyr His Gln Lys
115 120 125
Pro Val Ala Leu Leu Asn Ile Asp Gly Phe Tyr Asp Pro Leu Ile Ala
130 135 140
Leu Leu Lys His Thr Val Asp Glu Gly Phe Met Arg Gln Thr Tyr Phe
145 150 155 160
Asp Ile Leu Gln Arg Asp Ala Asp Pro Val Ala Leu Ile Asp Lys Leu
165 170 175
Gln Arg Tyr Lys Pro Pro Ala Ser Asp Lys Trp Ala Ile Lys Arg Asp
180 185 190
Ala Val
<210> 63
<211> 633
<212> PRT
<213> Bacillus subtilis
<400> 63
Met Asp Leu Leu Ser Ile Gln Asp Pro Ser Phe Leu Lys Asn Met Ser
1 5 10 15
Ile Asp Glu Leu Glu Lys Leu Ser Asp Glu Ile Arg Gln Phe Leu Ile
20 25 30
Thr Ser Leu Ser Ala Ser Gly Gly His Ile Gly Pro Asn Leu Gly Val
35 40 45
Val Glu Leu Thr Val Ala Leu His Lys Glu Phe Asn Ser Pro Lys Asp
50 55 60
Lys Phe Leu Trp Asp Val Gly His Gln Ser Tyr Val His Lys Leu Leu
65 70 75 80
Thr Gly Arg Gly Lys Glu Phe Ala Thr Leu Arg Gln Tyr Lys Gly Leu
85 90 95
Cys Gly Phe Pro Lys Arg Ser Glu Ser Glu His Asp Val Trp Glu Thr
100 105 110
Gly His Ser Ser Thr Ser Leu Ser Gly Ala Met Gly Met Ala Ala Ala
115 120 125
Arg Asp Ile Lys Gly Thr Asp Glu Tyr Ile Ile Pro Ile Ile Gly Asp
130 135 140
Gly Ala Leu Thr Gly Gly Met Ala Leu Glu Ala Leu Asn His Ile Gly
145 150 155 160
Asp Glu Lys Lys Asp Met Ile Val Ile Leu Asn Asp Asn Glu Met Ser
165 170 175
Ile Ala Pro Asn Val Gly Ala Ile His Ser Met Leu Gly Arg Leu Arg
180 185 190
Thr Ala Gly Lys Tyr Gln Trp Val Lys Asp Glu Leu Glu Tyr Leu Phe
195 200 205
Lys Lys Ile Pro Ala Val Gly Gly Lys Leu Ala Ala Thr Ala Glu Arg
210 215 220
Val Lys Asp Ser Leu Lys Tyr Met Leu Val Ser Gly Met Phe Phe Glu
225 230 235 240
Glu Leu Gly Phe Thr Tyr Leu Gly Pro Val Asp Gly His Ser Tyr His
245 250 255
Glu Leu Ile Glu Asn Leu Gln Tyr Ala Lys Lys Thr Lys Gly Pro Val
260 265 270
Leu Leu His Val Ile Thr Lys Lys Gly Lys Gly Tyr Lys Pro Ala Glu
275 280 285
Thr Asp Thr Ile Gly Thr Trp His Gly Thr Gly Pro Tyr Lys Ile Asn
290 295 300
Thr Gly Asp Phe Val Lys Pro Lys Ala Ala Ala Pro Ser Trp Ser Gly
305 310 315 320
Leu Val Ser Gly Thr Val Gln Arg Met Ala Arg Glu Asp Gly Arg Ile
325 330 335
Val Ala Ile Thr Pro Ala Met Pro Val Gly Ser Lys Leu Glu Gly Phe
340 345 350
Ala Lys Glu Phe Pro Asp Arg Met Phe Asp Val Gly Ile Ala Glu Gln
355 360 365
His Ala Ala Thr Met Ala Ala Ala Met Ala Met Gln Gly Met Lys Pro
370 375 380
Phe Leu Ala Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val
385 390 395 400
Val His Asp Ile Cys Arg Gln Asn Ala Asn Val Phe Ile Gly Ile Asp
405 410 415
Arg Ala Gly Leu Val Gly Ala Asp Gly Glu Thr His Gln Gly Val Phe
420 425 430
Asp Ile Ala Phe Met Arg His Ile Pro Asn Met Val Leu Met Met Pro
435 440 445
Lys Asp Glu Asn Glu Gly Gln His Met Val His Thr Ala Leu Ser Tyr
450 455 460
Asp Glu Gly Pro Ile Ala Met Arg Phe Pro Arg Gly Asn Gly Leu Gly
465 470 475 480
Val Lys Met Asp Glu Gln Leu Lys Thr Ile Pro Ile Gly Thr Trp Glu
485 490 495
Val Leu Arg Pro Gly Asn Asp Ala Val Ile Leu Thr Phe Gly Thr Thr
500 505 510
Ile Glu Met Ala Ile Glu Ala Ala Glu Glu Leu Gln Lys Glu Gly Leu
515 520 525
Ser Val Arg Val Val Asn Ala Arg Phe Ile Lys Pro Ile Asp Glu Lys
530 535 540
Met Met Lys Ser Ile Leu Lys Glu Gly Leu Pro Ile Leu Thr Ile Glu
545 550 555 560
Glu Ala Val Leu Glu Gly Gly Phe Gly Ser Ser Ile Leu Glu Phe Ala
565 570 575
His Asp Gln Gly Glu Tyr His Thr Pro Ile Asp Arg Met Gly Ile Pro
580 585 590
Asp Arg Phe Ile Glu His Gly Ser Val Thr Ala Leu Leu Glu Glu Ile
595 600 605
Gly Leu Thr Lys Gln Gln Val Ala Asn Arg Ile Arg Leu Leu Met Pro
610 615 620
Pro Lys Thr His Lys Gly Ile Gly Ser
625 630
<210> 64
<211> 620
<212> PRT
<213> Escherichia coli
<400> 64
Met Ser Phe Asp Ile Ala Lys Tyr Pro Thr Leu Ala Leu Val Asp Ser
1 5 10 15
Thr Gln Glu Leu Arg Leu Leu Pro Lys Glu Ser Leu Pro Lys Leu Cys
20 25 30
Asp Glu Leu Arg Arg Tyr Leu Leu Asp Ser Val Ser Arg Ser Ser Gly
35 40 45
His Phe Ala Ser Gly Leu Gly Thr Val Glu Leu Thr Val Ala Leu His
50 55 60
Tyr Val Tyr Asn Thr Pro Phe Asp Gln Leu Ile Trp Asp Val Gly His
65 70 75 80
Gln Ala Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Ile Gly
85 90 95
Thr Ile Arg Gln Lys Gly Gly Leu His Pro Phe Pro Trp Arg Gly Glu
100 105 110
Ser Glu Tyr Asp Val Leu Ser Val Gly His Ser Ser Thr Ser Ile Ser
115 120 125
Ala Gly Ile Gly Ile Ala Val Ala Ala Glu Lys Glu Gly Lys Asn Arg
130 135 140
Arg Thr Val Cys Val Ile Gly Asp Gly Ala Ile Thr Ala Gly Met Ala
145 150 155 160
Phe Glu Ala Met Asn His Ala Gly Asp Ile Arg Pro Asp Met Leu Val
165 170 175
Ile Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val Gly Ala Leu
180 185 190
Asn Asn His Leu Ala Gln Leu Leu Ser Gly Lys Leu Tyr Ser Ser Leu
195 200 205
Arg Glu Gly Gly Lys Lys Val Phe Ser Gly Val Pro Pro Ile Lys Glu
210 215 220
Leu Leu Lys Arg Thr Glu Glu His Ile Lys Gly Met Val Val Pro Gly
225 230 235 240
Thr Leu Phe Glu Glu Leu Gly Phe Asn Tyr Ile Gly Pro Val Asp Gly
245 250 255
His Asp Val Leu Gly Leu Ile Thr Thr Leu Lys Asn Met Arg Asp Leu
260 265 270
Lys Gly Pro Gln Phe Leu His Ile Met Thr Lys Lys Gly Arg Gly Tyr
275 280 285
Glu Pro Ala Glu Lys Asp Pro Ile Thr Phe His Ala Val Pro Lys Phe
290 295 300
Asp Pro Ser Ser Gly Cys Leu Pro Lys Ser Ser Gly Gly Leu Pro Ser
305 310 315 320
Tyr Ser Lys Ile Phe Gly Asp Trp Leu Cys Glu Thr Ala Ala Lys Asp
325 330 335
Asn Lys Leu Met Ala Ile Thr Pro Ala Met Arg Glu Gly Ser Gly Met
340 345 350
Val Glu Phe Ser Arg Lys Phe Pro Asp Arg Tyr Phe Asp Val Ala Ile
355 360 365
Ala Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Ile Gly Gly
370 375 380
Tyr Lys Pro Ile Val Ala Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr
385 390 395 400
Asp Gln Val Leu His Asp Val Ala Ile Gln Lys Leu Pro Val Leu Phe
405 410 415
Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly Gln Thr His Gln
420 425 430
Gly Ala Phe Asp Leu Ser Tyr Leu Arg Cys Ile Pro Glu Met Val Ile
435 440 445
Met Thr Pro Ser Asp Glu Asn Glu Cys Arg Gln Met Leu Tyr Thr Gly
450 455 460
Tyr His Tyr Asn Asp Gly Pro Ser Ala Val Arg Tyr Pro Arg Gly Asn
465 470 475 480
Ala Val Gly Val Glu Leu Thr Pro Leu Glu Lys Leu Pro Ile Gly Lys
485 490 495
Gly Ile Val Lys Arg Arg Gly Glu Lys Leu Ala Ile Leu Asn Phe Gly
500 505 510
Thr Leu Met Pro Glu Ala Ala Lys Val Ala Glu Ser Leu Asn Ala Thr
515 520 525
Leu Val Asp Met Arg Phe Val Lys Pro Leu Asp Glu Ala Leu Ile Leu
530 535 540
Glu Met Ala Ala Ser His Glu Ala Leu Val Thr Val Glu Glu Asn Ala
545 550 555 560
Ile Met Gly Gly Ala Gly Ser Gly Val Asn Glu Val Leu Met Ala His
565 570 575
Arg Lys Pro Val Pro Val Leu Asn Ile Gly Leu Pro Asp Phe Phe Ile
580 585 590
Pro Gln Gly Thr Gln Glu Glu Met Arg Ala Glu Leu Gly Leu Asp Ala
595 600 605
Ala Gly Met Glu Ala Lys Ile Lys Ala Trp Leu Ala
610 615 620
<210> 65
<211> 633
<212> PRT
<213> Corynebacterium stationis
<400> 65
Met Gly Ile Leu Asn Lys Val Lys Ser Pro Gln Asp Leu Lys Lys Leu
1 5 10 15
Ser Asp Asp Lys Val Glu Glu Leu Ala Ala Glu Ile Arg Gln Phe Leu
20 25 30
Ile Asp Lys Val Ser Val Thr Gly Gly His Leu Gly Pro Asn Leu Gly
35 40 45
Val Val Glu Leu Thr Ile Ala Leu His Arg Val Phe Asp Ser Pro Arg
50 55 60
Asp Pro Ile Val Phe Asp Thr Ser His Gln Ser Tyr Val His Lys Ile
65 70 75 80
Leu Thr Gly Arg Ala Asp Gln Phe Asp Thr Leu Arg Gln Lys Asp Gly
85 90 95
Leu Ser Gly Tyr Thr Asp Arg Gly Glu Ser Glu His Asp Trp Thr Glu
100 105 110
Ser Ser His Ala Ser Ala Ala Ile Ser Val Ile Asp Gly Leu Ser Lys
115 120 125
Ala Phe Cys Ile Lys Gly Glu Ser Arg Arg Asn Ala Val Ala Val Val
130 135 140
Gly Asp Gly Ala Leu Thr Gly Gly Met Cys Trp Glu Ala Leu Asn Asn
145 150 155 160
Ile Ser Ala Asn Lys Glu Arg Asn Ala Val Ile Val Val Asn Asp Asn
165 170 175
Gly Arg Ser Tyr Ser Pro Thr Ile Gly Gly Leu Ser Glu Asn Leu Ser
180 185 190
Arg Ile Arg Thr Gln His Gly Tyr Asp Glu Leu Met Glu His Gly Lys
195 200 205
Lys Thr Leu Lys Ser Leu Gly Trp Val Gly Asn Arg Thr Phe Asp Ala
210 215 220
Leu Arg Ala Val Lys Glu Gly Val Lys Ser Ser Ile Leu Pro Thr Glu
225 230 235 240
Met Phe Pro Glu Leu Gly Met Lys Tyr Ile Gly Pro Ile Asn Gly His
245 250 255
Asp Leu Asp Ala Leu Asp His Ala Leu Ser Tyr Ala Arg Asp Tyr Glu
260 265 270
Gly Pro Ile Ile Val His Val Val Thr Glu Lys Gly His Gly Phe Ala
275 280 285
Pro Ala Val Asn Glu Pro Gln Asp Gln Met His Ser Thr Gly Ala Ile
290 295 300
Asp Pro Val Thr Gly Val Pro Lys Gly Lys Ser Gln Pro Gly Trp Thr
305 310 315 320
Ala Val Phe Ser Glu Glu Leu Ile Glu Ala Ala Lys Lys Arg Asp Asp
325 330 335
Ile Val Ala Ile Thr Ala Ala Met Ala Gly Pro Thr Gly Leu Ile Pro
340 345 350
Phe Ala Glu Gln Phe Pro Asn Arg Phe Phe Asp Val Gly Ile Ala Glu
355 360 365
Gln His Ala Met Ala Ser Ala Ser Gly Leu Ala Leu Gly Gly Leu His
370 375 380
Pro Val Val Ala Ile Tyr Ser Thr Phe Leu Asn Arg Ala Phe Asp Gln
385 390 395 400
Leu Leu Met Asp Ile Ala Leu Leu Lys Gln Pro Val Thr Ile Val Leu
405 410 415
Asp Arg Ala Gly Val Thr Gly Ser Asp Gly Ala Ser His Asn Gly Val
420 425 430
Trp Asp Met Ala Leu Thr Thr Ile Ile Pro Gly Ile His Val Ala Ala
435 440 445
Pro Arg Asp Gly Gln Arg Leu Arg Glu Leu Phe Gln Glu Ser Leu Glu
450 455 460
Ile Lys Ser Gly Pro Ser Val Val Arg Phe Pro Lys Gly Asn Leu Leu
465 470 475 480
Glu Asp Met Asp Ala Val Ala Thr Thr Glu Asp Gly Val Asp Ile Ile
485 490 495
Phe Glu Ser Glu Gln Glu Arg Phe Ala Asp Ala Glu Ala Lys Lys Val
500 505 510
Leu Val Ile Ser Ile Gly Ala Met Ala Ala Arg Ser Leu Gly Ala Ala
515 520 525
Gln Ile Leu Glu Asp Lys Gly Met Ala Val Thr Val Val Asp Pro Arg
530 535 540
Trp Leu Cys Pro Val Ala Pro Ser Leu Ile Glu Met Ala Asp Glu His
545 550 555 560
Asp Ile Val Val Val Ala Glu Asp Gly Met Met Arg Ala Gly Val Gly
565 570 575
Ser Leu Phe Asp Glu Ala Phe Ser Ala Ala Glu Val Asp Thr Pro Leu
580 585 590
Arg Arg Val Ala Phe Pro Ser Ile Phe Pro Lys His Gly Ser Arg Gly
595 600 605
Glu Val Leu Glu Glu Val Gly Met Asp Ala Asp Gly Ile Ala Ala Ala
610 615 620
Val Thr Glu Trp Val Asp Asp Leu His
625 630
<210> 66
<211> 642
<212> PRT
<213> Streptomyces avermitilis
<400> 66
Met Pro Leu Leu Thr Arg Ile Arg Gly Pro Arg Asp Leu Asp Arg Leu
1 5 10 15
Ser Leu Glu Gln Leu Asp Gln Leu Ala Glu Glu Ile Arg Thr Phe Leu
20 25 30
Val Asp Ala Val Ser Lys Thr Gly Gly His Leu Gly Pro Asn Leu Gly
35 40 45
Val Val Glu Leu Thr Ile Ala Leu His Arg Val Phe Asp Ser Pro Lys
50 55 60
Asp Arg Val Leu Phe Asp Thr Gly His Gln Ser Tyr Val His Lys Leu
65 70 75 80
Leu Thr Gly Arg Gln Asp Phe Ser Lys Leu Lys Met Lys Gly Gly Leu
85 90 95
Ser Gly Tyr Pro Ser Gln Ala Glu Ser Glu His Asp Val Ile Glu Asn
100 105 110
Ser His Ala Ser Thr Val Leu Gly Trp Ala Asp Gly Leu Ala Lys Ala
115 120 125
Asn Gln Val Leu Glu Arg Asp Asp His Val Val Ala Val Ile Gly Asp
130 135 140
Gly Ala Leu Thr Gly Gly Met Ala Trp Glu Ala Leu Asn Asn Ile Ala
145 150 155 160
Ala Ala Lys Asp Arg Pro Leu Val Ile Val Val Asn Asp Asn Glu Arg
165 170 175
Ser Tyr Ala Pro Thr Ile Gly Gly Leu Ala Asn His Leu Ala Thr Leu
180 185 190
Arg Thr Thr Asp Gly Tyr Glu Arg Phe Leu Ala Arg Gly Lys Asp Leu
195 200 205
Leu Glu Arg Thr Pro Val Val Gly Arg Pro Leu Tyr Glu Thr Leu His
210 215 220
Gly Ala Lys Lys Gly Leu Lys Asp Phe Ile Ala Pro Gln Gly Met Phe
225 230 235 240
Glu Asp Leu Gly Leu Lys Tyr Val Gly Pro Ile Asp Gly His Asp Ile
245 250 255
Glu Ala Leu Glu Ser Ala Leu Ala Arg Ala Lys Arg Phe Gly Gly Pro
260 265 270
Val Ile Val His Cys Leu Thr Glu Lys Gly Arg Gly Tyr Gln Pro Ala
275 280 285
Leu Gln Asp Glu Ala Asp Arg Phe His Ala Val Gly Lys Ile His Pro
290 295 300
Asp Thr Gly Leu Pro Ile Ala Ser Ser Gly Ala Asp Trp Thr Ser Val
305 310 315 320
Phe Gly Glu Glu Met Val Lys Leu Gly Gln Glu Arg Lys Asp Ile Val
325 330 335
Ala Ile Thr Ala Ala Met Leu Gln Pro Val Gly Leu Asp Lys Phe Ala
340 345 350
Lys Val Phe Pro Lys Arg Val Tyr Asp Val Gly Ile Ala Glu Gln His
355 360 365
Ala Ala Val Ser Ala Ala Gly Leu Ala Thr Gly Gly Leu His Pro Val
370 375 380
Phe Ala Val Tyr Ala Thr Phe Leu Asn Arg Ala Phe Asp Gln Val Leu
385 390 395 400
Met Asp Val Ala Leu His Lys Cys Gly Val Thr Phe Val Leu Asp Arg
405 410 415
Ala Gly Val Thr Gly Thr Asp Gly Ala Ser His Asn Gly Met Trp Asp
420 425 430
Met Ser Ile Leu Gln Val Val Pro Gly Leu Arg Leu Ala Ala Pro Arg
435 440 445
Asp Ala Asp Gln Val Arg Ala Gln Leu Arg Glu Ala Val Asp Val Asp
450 455 460
Asp Ala Pro Thr Val Val Arg Phe Ser Lys Gly Ala Val Gly Pro Ala
465 470 475 480
Val Pro Ala Val Gly Arg Ile Gly Gly Met Asp Val Leu Arg Glu Pro
485 490 495
Gly Thr Asp Ala Pro Asp Val Leu Leu Val Ser Val Gly Ala Leu Ala
500 505 510
Pro Met Cys Leu Glu Ile Ala Gly Leu Leu Asp Lys Gln Gly Ile Ser
515 520 525
Ala Thr Val Val Asp Pro Arg Trp Val Lys Pro Val Asp Glu Ala Met
530 535 540
Ala Pro Leu Ala Glu Arg His Arg Val Val Val Thr Val Glu Asp Asn
545 550 555 560
Ser Arg Val Gly Gly Val Gly Ser Ala Ile Ala Gln Ala Leu Arg Asp
565 570 575
Ala Gly Val Asp Val Pro Leu Arg Asp Phe Gly Ile Pro Pro Arg Phe
580 585 590
Leu Asp His Ala Ser Arg Gly Glu Val Met Ala Glu Ile Gly Leu Thr
595 600 605
Ala Pro Asp Ile Ala Arg Gln Val Thr Gly Leu Val Ser Lys Leu Asp
610 615 620
Gly Arg Phe Glu Arg Pro Thr Ala Glu Ile Asp Ser Val Glu Pro Ala
625 630 635 640
Arg Asp
<210> 67
<211> 656
<212> PRT
<213> Streptomyces coelicolor
<400> 67
Met Thr Ile Leu Glu Asn Ile Arg Gly Pro Arg Asp Leu Lys Ala Leu
1 5 10 15
Ser Glu Ala Glu Leu Gly Glu Leu Ser Asp Glu Ile Arg Asp Phe Leu
20 25 30
Val His Ala Val Ala Arg Thr Gly Gly His Leu Gly Pro Asn Leu Gly
35 40 45
Val Val Glu Leu Thr Val Ala Leu His Arg Val Phe Glu Ser Pro Asp
50 55 60
Asp Arg Ile Leu Trp Asp Thr Gly His Gln Ser Tyr Val His Lys Leu
65 70 75 80
Leu Thr Gly Arg Gln Asp Phe Ser Lys Leu Arg Ser Lys Gly Gly Leu
85 90 95
Ser Gly Tyr Pro Ser Arg Glu Glu Ser Ala His Asp Val Ile Glu Asn
100 105 110
Ser His Ala Ser Thr Val Leu Gly Trp Ala Asp Gly Leu Ala Lys Ala
115 120 125
Arg Gln Val Gln Gly Glu Arg Ser His Val Val Ala Val Ile Gly Asp
130 135 140
Gly Ala Leu Thr Gly Gly Met Ala Trp Glu Ala Leu Asn Asn Ile Ala
145 150 155 160
Ala Ala Arg Asp Arg Pro Leu Ile Ile Val Val Asn Asp Asn Glu Arg
165 170 175
Ser Tyr Ala Pro Thr Ile Gly Gly Leu Ala Asn His Leu Ala Thr Leu
180 185 190
Arg Thr Thr Asp Gly Tyr Glu Arg Ala Leu Ala Trp Gly Lys Asp Val
195 200 205
Leu Gln Arg Thr Pro Val Val Gly His Thr Val Tyr Glu Ala Leu His
210 215 220
Gly Ala Lys Lys Gly Phe Lys Asp Ala Phe Ala Pro Gln Gly Leu Phe
225 230 235 240
Glu Asp Leu Gly Leu Lys Tyr Leu Gly Pro Ile Asp Gly His Asp Ile
245 250 255
Gly Ala Val Glu Ser Ala Leu Arg Arg Ala Lys Arg Phe His Gly Pro
260 265 270
Val Leu Val His Cys Leu Thr Glu Lys Gly Arg Gly Tyr Glu Pro Ala
275 280 285
Leu Arg Asp Glu Glu Asp His Phe His Thr Val Gly Val Met Asp Pro
290 295 300
Leu Thr Cys Glu Pro Leu Gly Pro Ala Gly Gly Pro Ser Trp Thr Ser
305 310 315 320
Val Phe Gly Glu Glu Ile Val Arg Ile Gly Glu Glu Arg Ala Asp Val
325 330 335
Val Ala Ile Thr Ala Ala Met Leu His Pro Val Gly Leu Ala Pro Phe
340 345 350
Ala Glu Arg Phe Pro Asp Arg Val Trp Asp Val Gly Ile Ala Glu Gln
355 360 365
His Ala Ala Val Ser Ala Ala Gly Leu Ala Thr Gly Gly Leu His Pro
370 375 380
Val Val Ala Val Tyr Ala Thr Phe Leu Asn Arg Ala Phe Asp Gln Leu
385 390 395 400
Leu Met Asp Val Ala Leu His Arg Cys Gly Val Thr Phe Val Leu Asp
405 410 415
Arg Ala Gly Val Thr Gly Val Asp Gly Ala Ser His Asn Gly Met Trp
420 425 430
Asp Met Ser Val Leu Gln Val Val Pro Gly Leu Arg Ile Ala Ala Pro
435 440 445
Arg Asp Ala Asp Gln Leu Arg Thr Gln Leu Arg Glu Ala Val Ala Val
450 455 460
Asp Asp Ala Pro Thr Leu Leu Arg Phe Pro Lys Glu Ser Val Gly Pro
465 470 475 480
Ala Val Pro Ala Val Asp Arg Ile Gly Gly Leu Asp Val Leu His Thr
485 490 495
Ala Asp Arg Ser Glu Val Leu Leu Val Ala Val Gly Val Met Ala Pro
500 505 510
Val Cys Leu Gly Ala Ala Glu Leu Leu Glu Ala Arg Gly Ile Gly Cys
515 520 525
Thr Val Val Asp Pro Arg Trp Val Lys Pro Val Asp Pro Ala Leu Ala
530 535 540
Pro Leu Ala Ala Arg His Arg Leu Val Ala Val Val Glu Asp Asn Ser
545 550 555 560
Arg Ala Ala Gly Val Gly Ser Ala Val Ala Leu Ala Leu Gly Asp Ala
565 570 575
Glu Val Asp Val Pro Val Arg Arg Phe Gly Ile Pro Glu Gln Phe Leu
580 585 590
Ala His Ala Lys Arg Ala Glu Val Leu Ala Asp Ile Gly Leu Thr Pro
595 600 605
Val Asp Val Ala Gly Arg Ile Ala Ala Ser Leu Ala Leu Ala Glu Pro
610 615 620
Ala Gly Asp Arg Ala Gly Gly Pro Ala Val Glu Gln Pro Gly Asp Gly
625 630 635 640
Arg Met Ser Gly Asp Gly Arg Ile Val Met Pro Ala Gln Gly Glu Asn
645 650 655
<210> 68
<211> 629
<212> PRT
<213> Deinococcus radiodurans
<400> 68
Met Asn Glu Leu Pro Gly Thr Ser Asp Thr Pro Leu Leu Asp Gln Ile
1 5 10 15
His Gly Pro Lys Asp Leu Lys Arg Leu Ser Arg Glu Gln Leu Pro Ala
20 25 30
Leu Thr Glu Glu Leu Arg Gly Glu Ile Val Arg Val Cys Ser Arg Gly
35 40 45
Gly Leu His Leu Ala Ser Ser Leu Gly Ala Val Asp Ile Ile Thr Ala
50 55 60
Leu His Tyr Val Leu Asp Ser Pro Arg Asp Arg Ile Leu Phe Asp Val
65 70 75 80
Gly His Gln Ala Tyr Ala His Lys Ile Leu Thr Gly Arg Arg Asp Gln
85 90 95
Met Ala Asp Ile Lys Lys Glu Gly Gly Ile Ser Gly Phe Thr Lys Val
100 105 110
Ser Glu Ser Glu His Asp Ala Ile Thr Val Gly His Ala Ser Thr Ser
115 120 125
Leu Ala Asn Ala Leu Gly Met Ala Leu Ala Arg Asp Ala Gln Gly Lys
130 135 140
Asp Phe His Val Ala Ala Val Ile Gly Asp Gly Ser Leu Thr Gly Gly
145 150 155 160
Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Met Gly Arg Lys Met
165 170 175
Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val Gly
180 185 190
Ala Met Asn Lys Phe Met Arg Gly Leu Gln Val Gln Lys Trp Phe Gln
195 200 205
Glu Gly Glu Gly Ala Gly Lys Lys Ala Val Glu Ala Val Ser Lys Pro
210 215 220
Leu Ala Asp Phe Met Ser Arg Ala Lys Asn Ser Thr Arg His Phe Phe
225 230 235 240
Asp Pro Ala Ser Val Asn Pro Phe Ala Ala Met Gly Val Arg Tyr Val
245 250 255
Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val Trp Leu Leu Glu
260 265 270
Arg Leu Val Asp Leu Asp Gly Pro Thr Ile Leu His Ile Val Thr Thr
275 280 285
Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro Ile Tyr Trp His
290 295 300
Gly Pro Ala Lys Phe Asp Pro Ala Thr Gly Glu Tyr Val Pro Ser Ser
305 310 315 320
Ala Tyr Ser Trp Ser Ala Ala Phe Gly Glu Ala Val Thr Glu Trp Ala
325 330 335
Lys Thr Asp Pro Arg Thr Phe Val Val Thr Pro Ala Met Arg Glu Gly
340 345 350
Ser Gly Leu Val Glu Phe Ser Arg Val His Pro His Arg Tyr Leu Asp
355 360 365
Val Gly Ile Ala Glu Glu Val Ala Val Thr Thr Ala Ala Gly Met Ala
370 375 380
Leu Gln Gly Met Arg Pro Val Val Ala Ile Tyr Ser Thr Phe Leu Gln
385 390 395 400
Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile Glu His Leu Asn
405 410 415
Val Thr Phe Cys Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly Ala
420 425 430
Thr His Asn Gly Val Phe Asp Leu Ser Phe Leu Arg Ser Ile Pro Gly
435 440 445
Val Arg Ile Gly Leu Pro Lys Asp Ala Ala Glu Leu Arg Gly Met Leu
450 455 460
Lys Tyr Ala Gln Thr His Asp Gly Pro Phe Ala Ile Arg Tyr Pro Arg
465 470 475 480
Gly Asn Thr Ala Gln Val Pro Ala Gly Thr Trp Pro Asp Leu Lys Trp
485 490 495
Gly Glu Trp Glu Arg Leu Lys Gly Gly Asp Asp Val Val Ile Leu Ala
500 505 510
Gly Gly Lys Ala Leu Asp Tyr Ala Leu Lys Ala Ala Glu Asp Leu Pro
515 520 525
Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro Leu Asp Glu Glu
530 535 540
Met Leu Arg Glu Val Gly Gly Arg Ala Arg Ala Leu Ile Thr Val Glu
545 550 555 560
Asp Asn Thr Val Val Gly Gly Phe Gly Gly Ala Val Leu Glu Ala Leu
565 570 575
Asn Ser Met Asn Leu His Pro Thr Val Arg Val Leu Gly Ile Pro Asp
580 585 590
Glu Phe Gln Glu His Ala Thr Ala Glu Ser Val His Ala Arg Ala Gly
595 600 605
Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu Leu Gly Val Asp
610 615 620
Val Pro Ile Glu Val
625
<210> 69
<211> 620
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant Escherichia coli enzyme DXS (Y392F)
<400> 69
Met Ser Phe Asp Ile Ala Lys Tyr Pro Thr Leu Ala Leu Val Asp Ser
1 5 10 15
Thr Gln Glu Leu Arg Leu Leu Pro Lys Glu Ser Leu Pro Lys Leu Cys
20 25 30
Asp Glu Leu Arg Arg Tyr Leu Leu Asp Ser Val Ser Arg Ser Ser Gly
35 40 45
His Phe Ala Ser Gly Leu Gly Thr Val Glu Leu Thr Val Ala Leu His
50 55 60
Tyr Val Tyr Asn Thr Pro Phe Asp Gln Leu Ile Trp Asp Val Gly His
65 70 75 80
Gln Ala Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Ile Gly
85 90 95
Thr Ile Arg Gln Lys Gly Gly Leu His Pro Phe Pro Trp Arg Gly Glu
100 105 110
Ser Glu Tyr Asp Val Leu Ser Val Gly His Ser Ser Thr Ser Ile Ser
115 120 125
Ala Gly Ile Gly Ile Ala Val Ala Ala Glu Lys Glu Gly Lys Asn Arg
130 135 140
Arg Thr Val Cys Val Ile Gly Asp Gly Ala Ile Thr Ala Gly Met Ala
145 150 155 160
Phe Glu Ala Met Asn His Ala Gly Asp Ile Arg Pro Asp Met Leu Val
165 170 175
Ile Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val Gly Ala Leu
180 185 190
Asn Asn His Leu Ala Gln Leu Leu Ser Gly Lys Leu Tyr Ser Ser Leu
195 200 205
Arg Glu Gly Gly Lys Lys Val Phe Ser Gly Val Pro Pro Ile Lys Glu
210 215 220
Leu Leu Lys Arg Thr Glu Glu His Ile Lys Gly Met Val Val Pro Gly
225 230 235 240
Thr Leu Phe Glu Glu Leu Gly Phe Asn Tyr Ile Gly Pro Val Asp Gly
245 250 255
His Asp Val Leu Gly Leu Ile Thr Thr Leu Lys Asn Met Arg Asp Leu
260 265 270
Lys Gly Pro Gln Phe Leu His Ile Met Thr Lys Lys Gly Arg Gly Tyr
275 280 285
Glu Pro Ala Glu Lys Asp Pro Ile Thr Phe His Ala Val Pro Lys Phe
290 295 300
Asp Pro Ser Ser Gly Cys Leu Pro Lys Ser Ser Gly Gly Leu Pro Ser
305 310 315 320
Tyr Ser Lys Ile Phe Gly Asp Trp Leu Cys Glu Thr Ala Ala Lys Asp
325 330 335
Asn Lys Leu Met Ala Ile Thr Pro Ala Met Arg Glu Gly Ser Gly Met
340 345 350
Val Glu Phe Ser Arg Lys Phe Pro Asp Arg Tyr Phe Asp Val Ala Ile
355 360 365
Ala Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Ile Gly Gly
370 375 380
Tyr Lys Pro Ile Val Ala Ile Phe Ser Thr Phe Leu Gln Arg Ala Tyr
385 390 395 400
Asp Gln Val Leu His Asp Val Ala Ile Gln Lys Leu Pro Val Leu Phe
405 410 415
Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly Gln Thr His Gln
420 425 430
Gly Ala Phe Asp Leu Ser Tyr Leu Arg Cys Ile Pro Glu Met Val Ile
435 440 445
Met Thr Pro Ser Asp Glu Asn Glu Cys Arg Gln Met Leu Tyr Thr Gly
450 455 460
Tyr His Tyr Asn Asp Gly Pro Ser Ala Val Arg Tyr Pro Arg Gly Asn
465 470 475 480
Ala Val Gly Val Glu Leu Thr Pro Leu Glu Lys Leu Pro Ile Gly Lys
485 490 495
Gly Ile Val Lys Arg Arg Gly Glu Lys Leu Ala Ile Leu Asn Phe Gly
500 505 510
Thr Leu Met Pro Glu Ala Ala Lys Val Ala Glu Ser Leu Asn Ala Thr
515 520 525
Leu Val Asp Met Arg Phe Val Lys Pro Leu Asp Glu Ala Leu Ile Leu
530 535 540
Glu Met Ala Ala Ser His Glu Ala Leu Val Thr Val Glu Glu Asn Ala
545 550 555 560
Ile Met Gly Gly Ala Gly Ser Gly Val Asn Glu Val Leu Met Ala His
565 570 575
Arg Lys Pro Val Pro Val Leu Asn Ile Gly Leu Pro Asp Phe Phe Ile
580 585 590
Pro Gln Gly Thr Gln Glu Glu Met Arg Ala Glu Leu Gly Leu Asp Ala
595 600 605
Ala Gly Met Glu Ala Lys Ile Lys Ala Trp Leu Ala
610 615 620
<210> 70
<211> 633
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutant Bacillus subtilis enzyme DXS (Y389F)
<400> 70
Met Asp Leu Leu Ser Ile Gln Asp Pro Ser Phe Leu Lys Asn Met Ser
1 5 10 15
Ile Asp Glu Leu Glu Lys Leu Ser Asp Glu Ile Arg Gln Phe Leu Ile
20 25 30
Thr Ser Leu Ser Ala Ser Gly Gly His Ile Gly Pro Asn Leu Gly Val
35 40 45
Val Glu Leu Thr Val Ala Leu His Lys Glu Phe Asn Ser Pro Lys Asp
50 55 60
Lys Phe Leu Trp Asp Val Gly His Gln Ser Tyr Val His Lys Leu Leu
65 70 75 80
Thr Gly Arg Gly Lys Glu Phe Ala Thr Leu Arg Gln Tyr Lys Gly Leu
85 90 95
Cys Gly Phe Pro Lys Arg Ser Glu Ser Glu His Asp Val Trp Glu Thr
100 105 110
Gly His Ser Ser Thr Ser Leu Ser Gly Ala Met Gly Met Ala Ala Ala
115 120 125
Arg Asp Ile Lys Gly Thr Asp Glu Tyr Ile Ile Pro Ile Ile Gly Asp
130 135 140
Gly Ala Leu Thr Gly Gly Met Ala Leu Glu Ala Leu Asn His Ile Gly
145 150 155 160
Asp Glu Lys Lys Asp Met Ile Val Ile Leu Asn Asp Asn Glu Met Ser
165 170 175
Ile Ala Pro Asn Val Gly Ala Ile His Ser Met Leu Gly Arg Leu Arg
180 185 190
Thr Ala Gly Lys Tyr Gln Trp Val Lys Asp Glu Leu Glu Tyr Leu Phe
195 200 205
Lys Lys Ile Pro Ala Val Gly Gly Lys Leu Ala Ala Thr Ala Glu Arg
210 215 220
Val Lys Asp Ser Leu Lys Tyr Met Leu Val Ser Gly Met Phe Phe Glu
225 230 235 240
Glu Leu Gly Phe Thr Tyr Leu Gly Pro Val Asp Gly His Ser Tyr His
245 250 255
Glu Leu Ile Glu Asn Leu Gln Tyr Ala Lys Lys Thr Lys Gly Pro Val
260 265 270
Leu Leu His Val Ile Thr Lys Lys Gly Lys Gly Tyr Lys Pro Ala Glu
275 280 285
Thr Asp Thr Ile Gly Thr Trp His Gly Thr Gly Pro Tyr Lys Ile Asn
290 295 300
Thr Gly Asp Phe Val Lys Pro Lys Ala Ala Ala Pro Ser Trp Ser Gly
305 310 315 320
Leu Val Ser Gly Thr Val Gln Arg Met Ala Arg Glu Asp Gly Arg Ile
325 330 335
Val Ala Ile Thr Pro Ala Met Pro Val Gly Ser Lys Leu Glu Gly Phe
340 345 350
Ala Lys Glu Phe Pro Asp Arg Met Phe Asp Val Gly Ile Ala Glu Gln
355 360 365
His Ala Ala Thr Met Ala Ala Ala Met Ala Met Gln Gly Met Lys Pro
370 375 380
Phe Leu Ala Ile Phe Ser Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val
385 390 395 400
Val His Asp Ile Cys Arg Gln Asn Ala Asn Val Phe Ile Gly Ile Asp
405 410 415
Arg Ala Gly Leu Val Gly Ala Asp Gly Glu Thr His Gln Gly Val Phe
420 425 430
Asp Ile Ala Phe Met Arg His Ile Pro Asn Met Val Leu Met Met Pro
435 440 445
Lys Asp Glu Asn Glu Gly Gln His Met Val His Thr Ala Leu Ser Tyr
450 455 460
Asp Glu Gly Pro Ile Ala Met Arg Phe Pro Arg Gly Asn Gly Leu Gly
465 470 475 480
Val Lys Met Asp Glu Gln Leu Lys Thr Ile Pro Ile Gly Thr Trp Glu
485 490 495
Val Leu Arg Pro Gly Asn Asp Ala Val Ile Leu Thr Phe Gly Thr Thr
500 505 510
Ile Glu Met Ala Ile Glu Ala Ala Glu Glu Leu Gln Lys Glu Gly Leu
515 520 525
Ser Val Arg Val Val Asn Ala Arg Phe Ile Lys Pro Ile Asp Glu Lys
530 535 540
Met Met Lys Ser Ile Leu Lys Glu Gly Leu Pro Ile Leu Thr Ile Glu
545 550 555 560
Glu Ala Val Leu Glu Gly Gly Phe Gly Ser Ser Ile Leu Glu Phe Ala
565 570 575
His Asp Gln Gly Glu Tyr His Thr Pro Ile Asp Arg Met Gly Ile Pro
580 585 590
Asp Arg Phe Ile Glu His Gly Ser Val Thr Ala Leu Leu Glu Glu Ile
595 600 605
Gly Leu Thr Lys Gln Gln Val Ala Asn Arg Ile Arg Leu Leu Met Pro
610 615 620
Pro Lys Thr His Lys Gly Ile Gly Ser
625 630
<210> 71
<211> 1451
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic DNA fragment tzs-LOG (IPT-LOG)
<400> 71
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60
tattacacct gatctacggt cctacatgta gtggtaaaac tgatatggct atacaaatcg 120
cgcaagaaac aggttggccc gtcgttgctc ttgatcgtgt gcagtgctgt ccacagattg 180
cgacaggatc cggcagacct ctggaaagcg agttacaatc tacccggcgg atttatttag 240
actcacgccc tttgacagaa ggcattcttg acgcggaatc cgctcatcgc cgtcttatat 300
tcgaggtaga ttggaggaaa tcggaagaag gcttaatcct cgaaggaggg tccatctcgc 360
ttctaaattg tatggctaag tctccatttt ggagatctgg attccagtgg cacgtcaagc 420
gcctgagact tggggattca gatgcgtttc tgacgcgagc aaaacagcgt gtggctgaga 480
tgtttgctat tagagaagat cggccaagtt tattggagga gctcgccgag ctgtggaatt 540
acccggcagc tcgcccgatt ttggaagaca ttgacggcta tcgatgtgcc attagatttg 600
caaggaaaca cgatctcgcc atatcacagc tgccgaacat cgatgccggc cggcatgttg 660
aactgatcga agccattgca aacgaatatc ttgaacatgc gctaagccaa gaacgcgact 720
ttcctcaatg gccggaggac ggcgcaggac aaccagtatg cccggttacc ttaacgagaa 780
tccgttaaaa aagaggggag ggaaacatta tgatgacatc gctttttgac gcgcctacgc 840
ttcaacgcgt aacggttttc actgggagcg ccttgggctc ctctagtctt tatactcagg 900
ctgctcaaac cctggctaaa accgcggtag accgagggat tgatctggtt tatggcggtg 960
gaaaagtcgg cctcatgggt attgttgctg atgcattcct tgaaagcggg ggtgaggcat 1020
tcggcgtgat aacagagtca ctgatgaaag gagaattagg ccatgagaaa ctgacggagt 1080
tggaaatcgt gcccgacatg catattcgta aaaggcggat ggcggaactt ggggatggat 1140
tcattgcgat gcctggagga gccggcaccc tggaagaact gtttgaagtc tggacatggc 1200
agcagttagg aattcatcaa aagccggttg cactctatga cgtcgatggc ttctggcaac 1260
cgttattgga aatgttggaa caaatgacac agagaggatt tatcaagaga gatttttttg 1320
aatgcctcat cgtcgaatca gatccgcacg cattattaaa ggccatgcag acatggacac 1380
ctccagcccc aaaatggtaa attaattcta gagtcgatcc ccgggttcgc cagcaatgac 1440
taccggcagc c 1451
<210> 72
<211> 1442
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic DNA fragment tmr-LOG (IPT-LOG)
<400> 72
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgg 60
atttaagact gattttcggt ccaacctgta cgggaaagac ttccaccgca gttgcgttag 120
ctcaacagac aggcctcccg gttttatcat tggatcgggt tcagtgttgc ccgcaactgt 180
ccacgggctc tggccgaccc acagtggagg aactaaaagg aacatcgcgg ttatatttgg 240
atgaccgacc attggtgaaa ggtataatag ctgcgaaaca ggcacacgag agattgatgg 300
gcgaagtgta caactatgaa gcgcatgggg ggctgatttt ggagggagga agtatctcac 360
tgttaaaatg catggctcaa tcaagctatt ggagcgctga tttccgctgg catattataa 420
gacacgaatt ggcagatgaa gaaacattta tgaatgtcgc gaaagcacgg gtaaagcaga 480
tgttacgtcc tgccgcaggc cttagcatca ttcaagagtt agtggatctt tggaaggagc 540
cgcgccttag acctatcctg aaagaaatag atggctatcg ttacgctatg ctctttgcat 600
ctcagaatca gattacttct gatatgctgc tgcaacttga cgcggacatg gaagacaaac 660
tcattcatgg tattgcccaa gaatacctta ttcatgcgag gcgccaagaa caaaagtttc 720
ccagagtaaa cgccgccgcc tatgacgggt ttgaaggcca tccgtttgga atgtattaaa 780
aaagagggga gggaaacatt atgatgacat cgctttttga cgcgcctacg cttcaacgcg 840
taacggtttt cactgggagc gccttgggct cctctagtct ttatactcag gctgctcaaa 900
ccctggctaa aaccgcggta gaccgaggga ttgatctggt ttatggcggt ggaaaagtcg 960
gcctcatggg tattgttgct gatgcattcc ttgaaagcgg gggtgaggca ttcggcgtga 1020
taacagagtc actgatgaaa ggagaattag gccatgagaa actgacggag ttggaaatcg 1080
tgcccgacat gcatattcgt aaaaggcgga tggcggaact tggggatgga ttcattgcga 1140
tgcctggagg agccggcacc ctggaagaac tgtttgaagt ctggacatgg cagcagttag 1200
gaattcatca aaagccggtt gcactctatg acgtcgatgg cttctggcaa ccgttattgg 1260
aaatgttgga acaaatgaca cagagaggat ttatcaagag agattttttt gaatgcctca 1320
tcgtcgaatc agatccgcac gcattattaa aggccatgca gacatggaca cctccagccc 1380
caaaatggta aattaattct agagtcgatc cccgggttcg ccagcaatga ctaccggcag 1440
cc 1442
<210> 73
<211> 958
<212> DNA
<213> Artificial Sequence
<220>
<223> Erythromycin selectable marker
<400> 73
gagggattcg tcatgttggt attccaaatg cgttatgtag ataaaacatc tactgttttg 60
aaacagacta aaaacagtga ttacgcagat aaataaatac gttagattaa ttcctaccag 120
tgactaatct tatgactttt taaacagata actaaaatta caaacaaatc gtttaacttc 180
tgtatttgtt tatagatgta atcacttcag gagtgattac atgaacaaaa atataaaata 240
ttctcaaaac tttttaacga gtgaaaaagt actcaaccaa ataataaaac aattgaattt 300
aaaagaaacc gataccgttt acgaaattgg aacaggtaaa gggcatttaa cgacgaaact 360
ggctaaaata agtaaacagg taacgtctat tgaattagac agtcatctat tcaacttatc 420
gtcagaaaaa ttaaaactga acattcgtgt cactttaatt caccaagata ttctacagtt 480
tcaattccct aacaaacaga ggtataaaat tgttgggaat attccttacc atttaagcac 540
acaaattatt aaaaaagtgg tttttgaaag ccatgcgtct gacatctatc tgattgttga 600
agaaggattc tacaagcgta ccttggatat tcaccgaaca ctagggttgc tcttgcacac 660
tcaagtctcg attcagcaat tgcttaagct gccagcggaa tgctttcatc ctaaaccaaa 720
agtaaacagt gtcttaataa aacttacccg ccataccaca gatgttccag ataaatattg 780
gaagctatat acgtactttg tttcaaaatg ggtcaatcga gaatatcgtc aactgtttac 840
taaaaatcag tttcatcaag caatgaaaca cgccaaagta aacaatttaa gtaccgttac 900
ttatgagcaa gtattgtcta tttttaatag ttatctatta tttaacggga ggaaataa 958
<210> 74
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer TwistBio For
<400> 74
gaagtgccat tccgcctgac ct 22
<210> 75
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer TwistBio Rev
<400> 75
cactgagcct ccacctagcc t 21
<210> 76
<211> 1680
<212> DNA
<213> Artificial Sequence
<220>
<223> Initial fragment amyE
<400> 76
gaagtgccat tccgcctgac cttcgccttt gcggtagtgg tgcttacgat gtacgacagg 60
gggattcccc atacattctt cgcttggctg aaaatgattc ttctttttat cgtctgcggc 120
ggcgttctgt ttctgcttcg gtatgtgatt gtgaagctgg cttacagaag agcggtaaaa 180
gaagaaataa aaaagaaatc atcttttttg tttggaaagc gagggaagcg ttcacagttt 240
cgggcagctt tttttatagg aacattgatt tgtattcact ctgccaagtt gttttgatag 300
agtgattgtg ataattttaa atgtaagcgt taacaaaatt ctccagtctt cacatcggtt 360
tgaaaggagg aagcggaaga atgaagtaag agggattttt gactccgaag taagtcttca 420
aaaaatcaaa taaggagtgt caagaatgtt tgcaaaacga ttcaaaacct ctttactgcc 480
gttattcgct ggatttttat tgctgtttca tttggttctg gcaggaccgg cggctgcgag 540
tgctgaaacg gcgaacaaat cgaatgagct tacagcaccg tcgatcaaaa gcggaaccat 600
tcttcatgca tggaattggt cgttcaatac gttaaaacac aatatgaagg atattcatga 660
tgcaggatat acagccattc agacatctcc gattaaccaa gtaaaggaag ggaatcaagg 720
agataaaagc atgtcgaact ggtactggct gtatcagccg acatcgtatc aaattggcaa 780
ccgttactta ggtactgaac aagaatttaa agaaatgtgt gcagccgctg aagaatatgg 840
cataaaggtc attgttgacg cggtcatcaa tcataccacc agtgattatg ccgcgatttc 900
caatgaggtt aagagtattc caaactggac acatggaaac acacaaatta aaaactggtc 960
tgatcgatgg gatgtcacgc agaattcatt gctcgggctg tatgactgga atacacaaaa 1020
tacacaagta cagtcctatc tgaaacggtt cttagacagg gcattgaatg acggggcaga 1080
cggttttcga tttgatgccg ccaaacatat agagcttcca gatgatggca gttacggcag 1140
tcaattttgg ccgaatatca caaatacatc tgcagagttc caatacggag aaatcctgca 1200
ggatagtgcc tccagagatg ctgcttatgc gaattatatg gatgtgacag cgtctaacta 1260
tgggcattcc ataaggtccg ctttaaagaa tcgtaatctg ggcgtgtcga atatctccca 1320
ctatgcatct gatgtgtctg cggacaagct agtgacatgg gtagagtcgc atgatacacg 1380
ggtgcgcatg atcgtatggt tcactgtcca ccaaccaaaa ctgtgctcag taccgccaat 1440
atttctccct tggggggtac aaagaggtgt ccctagaaga gatccacgct gtgtaaaaat 1500
tttacaaaaa ggtattgact ttccctacag ggtgtgtaat aatttaatta caggcggggg 1560
caaccccgct cagtacctag agcgtaaaag aggggaggga aacactagtt ggcttcgttg 1620
ggattctccg gtgatgctga tttcgctgcg tatgctgcga ggctaggtgg aggctcagtg 1680
<210> 77
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer For for end fragment with erythromycin selectable marker
<400> 77
aaatctagaa attaagaagg agggattcgt ca 32
<210> 78
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Rev for end fragment with erythromycin selectable marker
<400> 78
cactgagcct ccacctagcc taatactcat ggcttgtgac cgct 44
<210> 79
<211> 1911
<212> DNA
<213> Artificial Sequence
<220>
<223> End fragment containing erythromycin selectable marker
<400> 79
gaagtgccat tccgcctgac ctcacggtag tcattgctgg cgaacgcgtc tagaaattaa 60
gaaggaggga ttcgtcatgt tggtattcca aatgcgttat gtagataaaa catctactgt 120
tttgaaacag actaaaaaca gtgattacgc agataaataa atacgttaga ttaattccta 180
ccagtgacta atcttatgac tttttaaaca gataactaaa attacaaaca aatcgtttaa 240
cttctgtatt tgtttataga tgtaatcact tcaggagtga ttacatgaac aaaaatataa 300
aatattctca aaacttttta acgagtgaaa aagtactcaa ccaaataata aaacaattga 360
atttaaaaga aaccgatacc gtttacgaaa ttggaacagg taaagggcat ttaacgacga 420
aactggctaa aataagtaaa caggtaacgt ctattgaatt agacagtcat ctattcaact 480
tatcgtcaga aaaattaaaa ctgaacattc gtgtcacttt aattcaccaa gatattctac 540
agtttcaatt ccctaacaaa cagaggtata aaattgttgg gaatattcct taccatttaa 600
gcacacaaat tattaaaaaa gtggtttttg aaagccatgc gtctgacatc tatctgattg 660
ttgaagaagg attctacaag cgtaccttgg atattcaccg aacactaggg ttgctcttgc 720
acactcaagt ctcgattcag caattgctta agctgccagc ggaatgcttt catcctaaac 780
caaaagtaaa cagtgtctta ataaaactta cccgccatac cacagatgtt ccagataaat 840
attggaagct atatacgtac tttgtttcaa aatgggtcaa tcgagaatat cgtcaactgt 900
ttactaaaaa tcagtttcat caagcaatga aacacgccaa agtaaacaat ttaagtaccg 960
ttacttatga gcaagtattg tctattttta atagttatct attatttaac gggaggaaat 1020
aattctatga gtcgcttttg taaatttgga aagttacacg ttactaaagg gaatgtagat 1080
ggatcctttt aatggagtgt acgccaagcg cggtcaattg gcataacgtc aacaaggcaa 1140
agcgcccggg catgaatctg ctgtcatcca tgcaaatgat tgcccacggc tcggacagcg 1200
ttctctattt ccaataccgc aaatcacggg ggtcatcaga aaaattacac ggagcggttg 1260
tggatcatga caatagcccg aagaaccgcg tctttcaaga agtggccaag gtaggcgaga 1320
cattggaacg gctgtccgaa gttgtcggaa cgaagaggcc ggctcaaacc gcgattttat 1380
atgactggga aaatcattgg gcgctcgagg atgctcaggg gtttgcgaag gcgacaaaac 1440
gttatccgca aacgcttcag cagcattacc gcacattctg ggaacacgat atccctgtcg 1500
acgtcatcac gaaagaacaa gacttttcac catataaact gctgatcgtc ccgatgctgt 1560
atttaatcag cgaggacacc gtttcccgtt taaaagcgtt tacggctgac ggcggcacct 1620
tagtcatgac gtatatcagc ggggttgtga atgagcatga cttaacatac acaggcggat 1680
ggcatccgga tcttcaagct atatttggag ttgagcctct tgaaacggac accctgtatc 1740
cgaaggatcg aaacgctgtc agctaccgca gccaaatata tgaaatgaag gattatgcaa 1800
ccgtgattga tgtaaagaca gcttcagtgg aagcggtgta tcaagaagat ttttatgcgc 1860
gcacgccagc ggtcacaagc catgagtatt aggctaggtg gaggctcagt g 1911
<210> 80
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer For for IPT-LOG operon
<400> 80
gcggtagtgg tgcttacgat 20
<210> 81
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Rev for IPT-LOG operon
<400> 81
aggatccatc tacattccct ttagt 25
<210> 82
<211> 3968
<212> DNA
<213> Artificial Sequence
<220>
<223> Complete synthetic trans-zeatin operon containing IPT-LOG (with
TZS)
<400> 82
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgac 2340
atcgcttttt gacgcgccta cgcttcaacg cgtaacggtt ttcactggga gcgccttggg 2400
ctcctctagt ctttatactc aggctgctca aaccctggct aaaaccgcgg tagaccgagg 2460
gattgatctg gtttatggcg gtggaaaagt cggcctcatg ggtattgttg ctgatgcatt 2520
ccttgaaagc gggggtgagg cattcggcgt gataacagag tcactgatga aaggagaatt 2580
aggccatgag aaactgacgg agttggaaat cgtgcccgac atgcatattc gtaaaaggcg 2640
gatggcggaa cttggggatg gattcattgc gatgcctgga ggagccggca ccctggaaga 2700
actgtttgaa gtctggacat ggcagcagtt aggaattcat caaaagccgg ttgcactcta 2760
tgacgtcgat ggcttctggc aaccgttatt ggaaatgttg gaacaaatga cacagagagg 2820
atttatcaag agagattttt ttgaatgcct catcgtcgaa tcagatccgc acgcattatt 2880
aaaggccatg cagacatgga cacctccagc cccaaaatgg taaattaatt ctagaaatta 2940
agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3000
ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3060
accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3120
acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3180
aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3240
aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3300
aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3360
ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3420
cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3480
agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3540
gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3600
cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3660
ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3720
tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 3780
tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 3840
gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 3900
taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 3960
tggatcct 3968
<210> 83
<211> 3968
<212> DNA
<213> Artificial Sequence
<220>
<223> Complete synthetic trans-zeatin operon containing IPT-LOG (with
TMR)
<400> 83
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgac 2340
atcgcttttt gacgcgccta cgcttcaacg cgtaacggtt ttcactggga gcgccttggg 2400
ctcctctagt ctttatactc aggctgctca aaccctggct aaaaccgcgg tagaccgagg 2460
gattgatctg gtttatggcg gtggaaaagt cggcctcatg ggtattgttg ctgatgcatt 2520
ccttgaaagc gggggtgagg cattcggcgt gataacagag tcactgatga aaggagaatt 2580
aggccatgag aaactgacgg agttggaaat cgtgcccgac atgcatattc gtaaaaggcg 2640
gatggcggaa cttggggatg gattcattgc gatgcctgga ggagccggca ccctggaaga 2700
actgtttgaa gtctggacat ggcagcagtt aggaattcat caaaagccgg ttgcactcta 2760
tgacgtcgat ggcttctggc aaccgttatt ggaaatgttg gaacaaatga cacagagagg 2820
atttatcaag agagattttt ttgaatgcct catcgtcgaa tcagatccgc acgcattatt 2880
aaaggccatg cagacatgga cacctccagc cccaaaatgg taaattaatt ctagaaatta 2940
agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3000
ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3060
accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3120
acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3180
aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3240
aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3300
aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3360
ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3420
cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3480
agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3540
gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3600
cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3660
ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3720
tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 3780
tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 3840
gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 3900
taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 3960
tggatcct 3968
<210> 84
<211> 1080
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA fragment of dxs part1
<400> 84
gaagtgccat tccgcctgac ctcgcagcat acgcagcgaa atcagcatca ccggagaatc 60
ccaacgaagc caactagtat ggacttgttg tccattcaag acccgtcttt cctaaagaat 120
atgagcattg acgagcttga aaaattgtcc gatgagatcc gccaatttct catcacatct 180
ctatcggcct cgggcggaca cattggaccg aatctggggg tcgtggaact gacagtagcc 240
ctccacaagg agttcaactc acccaaagac aaatttctct gggacgtggg gcaccaaagc 300
tacgttcata aattgcttac tggtcgtggc aaagagttcg ccacattgcg ccagtacaaa 360
ggactctgcg gattccctaa acgctcggaa tccgagcacg atgtgtggga aacaggtcat 420
tcttctactt ctctcagcgg cgccatggga atggccgctg cacgagatat taaagggact 480
gatgagtaca taatcccaat aataggtgac ggcgctttaa caggaggaat ggccctagag 540
gccttgaacc acatagggga tgagaagaaa gatatgatag tcattttgaa tgataatgag 600
atgtctattg ctcccaacgt tggagcaata catagcatgt tagggcggtt acgtactgca 660
ggaaagtacc agtgggtaaa agatgaactt gaatacctct tcaagaagat acccgctgta 720
ggaggcaagc ttgcagccac ggccgagaga gtgaaggatt ctcttaaata tatgttggtt 780
tcagggatgt tctttgaaga attgggattc acgtaccttg gtccggttga cggccattct 840
taccacgagt taattgaaaa tttacaatac gcgaaaaaaa cgaaggggcc tgttctgctg 900
cacgttatta ccaaaaaagg aaaaggttat aaacctgcgg aaaccgatac aattggcacg 960
tggcacggca ccgggcctta taaaatcaac acgggggact ttgtcaagcc gaaagctgcc 1020
gcgcctagtt ggtccggcct ggttagtggg acggtacagc gaatggcagg ctaggtggag 1080
<210> 85
<211> 1094
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic DNA fragment of dxs part2
<400> 85
gaagtgccat tccgcctgac ctaatcaaca cgggggactt tgtcaagccg aaagctgccg 60
cgcctagttg gtccggcctg gttagtggga cggtacagcg aatggcccgg gaagatggga 120
ggattgtcgc tatcacaccg gcaatgccag taggtagcaa gttagaaggt tttgcgaaag 180
aatttccgga taggatgttt gacgtaggta ttgctgagca gcatgcggcg acgatggctg 240
cggcaatggc aatgcagggc atgaagcctt ttttagctat ttattcaaca tttctgcaaa 300
gagcgtatga ccaagtggta catgacattt gtcggcaaaa tgctaatgtc tttattggga 360
ttgatcgcgc agggttagtg ggtgcagacg gggaaacgca tcaaggagtg tttgacatcg 420
cgtttatgcg acatatccca aatatggtcc ttatgatgcc aaaagacgaa aacgagggtc 480
aacacatggt gcatacagct cttagttatg acgaaggacc tatcgcgatg agatttccga 540
gagggaatgg attaggcgtc aaaatggatg agcagcttaa aacaattccg attggaacat 600
gggaagtctt acgtccagga aatgacgcgg ttatccttac atttggcact accattgaga 660
tggcgattga ggcagcagaa gaactccaga aggagggcct gtcagtccgt gttgttaatg 720
cgagatttat taaaccgatt gacgaaaaga tgatgaaaag tatcctgaaa gaaggcctgc 780
cgatacttac catcgaggaa gctgttctgg aaggaggatt tggctcatca atccttgaat 840
ttgcacatga tcagggcgaa tatcacacac cgatcgatcg aatgggcatc ccggatcgat 900
ttatcgagca tggctccgtt acagcactgc ttgaagagat cggcttaacg aaacagcagg 960
tggcaaacag aatcaggtta cttatgccgc cgaagacaca taagggcatc ggctcataaa 1020
aaagagggga gggaaacatt aatgacgacc tggctaacga gtctcgccga tctaggctag 1080
gtggaggctc agtg 1094
<210> 86
<211> 2040
<212> DNA
<213> Artificial Sequence
<220>
<223> Joined synthetic gene dxs complete sequence
<400> 86
gaagtgccat tccgcctgac ctcgcagcat acgcagcgaa atcagcatca ccggagaatc 60
ccaacgaagc caactagtat ggacttgttg tccattcaag acccgtcttt cctaaagaat 120
atgagcattg acgagcttga aaaattgtcc gatgagatcc gccaatttct catcacatct 180
ctatcggcct cgggcggaca cattggaccg aatctggggg tcgtggaact gacagtagcc 240
ctccacaagg agttcaactc acccaaagac aaatttctct gggacgtggg gcaccaaagc 300
tacgttcata aattgcttac tggtcgtggc aaagagttcg ccacattgcg ccagtacaaa 360
ggactctgcg gattccctaa acgctcggaa tccgagcacg atgtgtggga aacaggtcat 420
tcttctactt ctctcagcgg cgccatggga atggccgctg cacgagatat taaagggact 480
gatgagtaca taatcccaat aataggtgac ggcgctttaa caggaggaat ggccctagag 540
gccttgaacc acatagggga tgagaagaaa gatatgatag tcattttgaa tgataatgag 600
atgtctattg ctcccaacgt tggagcaata catagcatgt tagggcggtt acgtactgca 660
ggaaagtacc agtgggtaaa agatgaactt gaatacctct tcaagaagat acccgctgta 720
ggaggcaagc ttgcagccac ggccgagaga gtgaaggatt ctcttaaata tatgttggtt 780
tcagggatgt tctttgaaga attgggattc acgtaccttg gtccggttga cggccattct 840
taccacgagt taattgaaaa tttacaatac gcgaaaaaaa cgaaggggcc tgttctgctg 900
cacgttatta ccaaaaaagg aaaaggttat aaacctgcgg aaaccgatac aattggcacg 960
tggcacggca ccgggcctta taaaatcaac acgggggact ttgtcaagcc gaaagctgcc 1020
gcgcctagtt ggtccggcct ggttagtggg acggtacagc gaatggcccg ggaagatggg 1080
aggattgtcg ctatcacacc ggcaatgcca gtaggtagca agttagaagg ttttgcgaaa 1140
gaatttccgg ataggatgtt tgacgtaggt attgctgagc agcatgcggc gacgatggct 1200
gcggcaatgg caatgcaggg catgaagcct tttttagcta tttattcaac atttctgcaa 1260
agagcgtatg accaagtggt acatgacatt tgtcggcaaa atgctaatgt ctttattggg 1320
attgatcgcg cagggttagt gggtgcagac ggggaaacgc atcaaggagt gtttgacatc 1380
gcgtttatgc gacatatccc aaatatggtc cttatgatgc caaaagacga aaacgagggt 1440
caacacatgg tgcatacagc tcttagttat gacgaaggac ctatcgcgat gagatttccg 1500
agagggaatg gattaggcgt caaaatggat gagcagctta aaacaattcc gattggaaca 1560
tgggaagtct tacgtccagg aaatgacgcg gttatcctta catttggcac taccattgag 1620
atggcgattg aggcagcaga agaactccag aaggagggcc tgtcagtccg tgttgttaat 1680
gcgagattta ttaaaccgat tgacgaaaag atgatgaaaa gtatcctgaa agaaggcctg 1740
ccgatactta ccatcgagga agctgttctg gaaggaggat ttggctcatc aatccttgaa 1800
tttgcacatg atcagggcga atatcacaca ccgatcgatc gaatgggcat cccggatcga 1860
tttatcgagc atggctccgt tacagcactg cttgaagaga tcggcttaac gaaacagcag 1920
gtggcaaaca gaatcaggtt acttatgccg ccgaagacac ataagggcat cggctcataa 1980
aaaagagggg agggaaacat taatgacgac ctggctaacg agtctcgccg atctaggcta 2040
<210> 87
<211> 768
<212> DNA
<213> Artificial Sequence
<220>
<223> Spectinomycin selectable marker
<400> 87
gtgaggcgaa tatatttgaa tacatacgaa caaatcaata aagtgaaaaa aatacttcgg 60
aaacatttaa aaaataacct tattggtact tacatgtttg gatcaggagt tgagagtgga 120
ctcaaaccaa atagtgatct tgacttttta gtcgtcgtat ctgaaccatt gacagatcaa 180
agtaaagaaa tacttataca aaaaattaga cctatttcaa aaaaaatagg agataaaagc 240
aacttacgat atattgaatt aacaattatt attcagcaag aaatggtacc gtggaatcat 300
cctcccaaac aagaatttat ttatggagaa tggttacaag agctttatga acaaggatac 360
attcctcaga aggaattaaa ttcagattta accataatgc tttaccaagc aaaacgaaaa 420
aataaaagaa tatacggaaa ttatgactta gaggaattac tacctgatat tccattttct 480
gatgtgagaa gagccattat ggattcgtca gaggaactta tagataatta tcaggatgat 540
gaaaccaact ctatattaac tttatgccgc atgattttaa ctatggacac gggtaaaatc 600
ataccaaaag atattgcggg aaatgcagtg gctgaatctt ctccattaga acatagggag 660
agaattttgt tagcagttcg tagttatctt ggagagaata ttgaatggac taatgaaaat 720
gtaaatctta cgataaacta tcttaataac cgccttaaga aactttaa 768
<210> 88
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> Initial fragment lacA
<400> 88
gaagtgccat tccgcctgac ctgcctttta atcccggcaa cagcttaatc agtacatcca 60
tcattccgaa gcatccgaca ttcgatcatt acaaggaatt atttgcgggc aaggaaagcc 120
ttcaatatgt gcagtggtat gtcaactcta tgaagatcag cctgtttaca atggcagggt 180
ctttgctctg tgtgacgttt acggcctatg cgttttcgcg ctttcggttt aaagggagga 240
aatacgcttt aacgctcttt ttattgctgc agatgattcc tcagttttca gctttaattg 300
ccttgtttgt gctggcgcaa atcttgggaa tgatcaatag ccactggctg ctaatcttgc 360
tttatatcgg cggcctgatc ccgatgaata cgtatttgat gaaagggtac atggattcca 420
ttccgatgga tttagacgaa agcgccaaga ttgacggagc cagcagcacc agaatcttct 480
tccagatcat tctgccatta tcaaaaccga tggcggcagt cgtggccatg aacggcttta 540
ccggtccgct cggagatttt gtgctgtcct caaccatatt gagaacgcct gaatcatata 600
cattgcccgt cggtctattc aatttagtga atgatgtcat gggggccagc tatacgacat 660
ttgcggccgg agccctgctt atcagcatac cggttgccgt catctttatt atgctgcaaa 720
agaattttgt gtccggatta accgcaggcg gaacgaaggg ctaagagaac aaggaggaga 780
atgtgatgtc aaagcttgaa aaaacgcacg taacaaaagc aaaatttatg ctccatgggg 840
gagactacaa ccccgatcag tggctggatc ggcccgatat tttagctgac gatatcaaac 900
tgatgaagct ttctcatacg aatacgtttt ctgtcggcat ttttgcatgg agcgcacttg 960
agccggagga gggcgtatat caatttgaat ggctggatga tatttttgag cggattcaca 1020
gtataggcgg ccgggtcata ttagcaacgc cgagcggagc ccgtccggcc tggctgtcgc 1080
aaacctatcc ggaagttttg cgcgtcaatg cctcccgcgt caaacagctg cacggcggaa 1140
ggcacaacca ctgcctcaca tctaaagtct accgagaaaa aacacggcac atcaaccgct 1200
acgggtgcgc atgatcgtat ggttcactgt ccaccaacca aaactgtgct cagtaccgcc 1260
aatatttctc ccttgggggg tacaaagagg tgtccctaga agagatccac gctgtgtaaa 1320
aattttacaa aaaggtattg actttcccta cagggtgtgt aataatttaa ttacaggcgg 1380
gggcaacccc gctcagtacc tagagcgtaa aagaggggag ggaaacacta gttggcttcg 1440
ttgggattct ccggtgatgc tgatttcgct gcgtatgctg cgaggctagg tggaggctca 1500
gtg 1503
<210> 89
<211> 2172
<212> DNA
<213> Artificial Sequence
<220>
<223> End fragment with spectinomycin selectable marker
<400> 89
gaagtgccat tccgcctgac ctcacggtag tcattgctgg cgaacgcgtc tagagctccg 60
gcataaaatt aactaaaata attattatgt agataaaaaa tttagaagcc aatgaaatct 120
ataaataaac taaattaagt ttatttaatt aacaactatg gatataaaat aggtactaat 180
caaaatagtg aggcgaatat atttgaatac atacgaacaa atcaataaag tgaaaaaaat 240
acttcggaaa catttaaaaa ataaccttat tggtacttac atgtttggat caggagttga 300
gagtggactc aaaccaaata gtgatcttga ctttttagtc gtcgtatctg aaccattgac 360
agatcaaagt aaagaaatac ttatacaaaa aattagacct atttcaaaaa aaataggaga 420
taaaagcaac ttacgatata ttgaattaac aattattatt cagcaagaaa tggtaccgtg 480
gaatcatcct cccaaacaag aatttattta tggagaatgg ttacaagagc tttatgaaca 540
aggatacatt cctcagaagg aattaaattc agatttaacc ataatgcttt accaagcaaa 600
acgaaaaaat aaaagaatat acggaaatta tgacttagag gaattactac ctgatattcc 660
attttctgat gtgagaagag ccattatgga ttcgtcagag gaacttatag ataattatca 720
ggatgatgaa accaactcta tattaacttt atgccgcatg attttaacta tggacacggg 780
taaaatcata ccaaaagata ttgcgggaaa tgcagtggct gaatcttctc cattagaaca 840
tagggagaga attttgttag cagttcgtag ttatcttgga gagaatattg aatggactaa 900
tgaaaatgta aatcttacga taaactatct taataaccgc cttaagaaac tttaacccgg 960
gcgcgttgct ttcgatgaag ttttaccgcc atcaccagac cctcaatcgt atgtgtttac 1020
tgccaatact ggagacagca cggtttcggt tattgatgca gatttaaaca ctgttgtaaa 1080
aacaatccct ttttctgacg tgccaactaa tctaggcgtt actttcgata aagcattcac 1140
gtatgtcctc catggaaata ccaaccttgt ctcagtgatt gataataaaa cattaaccat 1200
cataaatacc attactgttg gaggagggcc gagaaaaatc gaatttgatc caacagatga 1260
gttcgcatac gtgatggccg ccggatctat atatgtgatt aacacggcct ctcaatcggt 1320
cattgatgtc attccgatac ccggcgcttt agactttgct cttgatccga atggacagta 1380
tgtctatacc gctaatggaa gcagttggtc ggttgataaa tatgatgtaa atactgggca 1440
gttggtagaa agtatcatag atacatttga atttcccagt ttaattacaa ctccttacgc 1500
tggaaatttt gcgtacgtat tgaatggtga gctgtggccg aaaggtgtaa cggagattag 1560
tttgtcacca ttaagcaggg gaggggactt cagccgttta tttgaaacgc tgaggacgat 1620
tgtattttct ctcgatagta ctagagctta ttttcaagag ccatatagtg aaccgtttct 1680
catcaataac ttatacgtag ttaatacggc cagacagagg atcattgcaa acgtgtctct 1740
ccccggcgcc tttgacctcg ccgtaacgcc ggacaaacag tatatttatg cggcacagcc 1800
caacgacaat gctgtgaccg tgtaccgcac aagtgattat acagccgtga cggtgattcc 1860
ggttggcgcg ggtccgtctg cgattgcgat gtagctattt tatagatcaa gagaagcggt 1920
gctgtgataa gagaatcgtt tataaataaa tgatccgatt tgctgaatgg cagccaggat 1980
aatcagaaac agcagttcac ttatagagaa actgagcatc caccaaatcc cggctgctgc 2040
cagtgctccc gcaaacactt ttctgaacag gctgccgtgc cggaaaagct gccgcaaata 2100
cgttcgcatg caaaacaata aatacaggat cagtagcatc gcaagtccca taggctaggt 2160
ggaggctcag tg 2172
<210> 90
<211> 4245
<212> DNA
<213> Artificial Sequence
<220>
<223> Complete synthetic dxs operon
<400> 90
taatcccggc aacagcttaa tcagtacatc catcattccg aagcatccga cattcgatca 60
ttacaaggaa ttatttgcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc 120
tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta 180
tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct 240
gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg 300
aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa 360
tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa 420
gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc 480
gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc 540
ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt 600
gaatgatgtc atgggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat 660
accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg 720
cggaacgaag ggctaagaga acaaggagga gaatgtgatg tcaaagcttg aaaaaacgca 780
cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga 840
tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt 900
ttctgtcggc atttttgcat ggagcgcact tgagccggag gagggcgtat atcaatttga 960
atggctggat gatatttttg agcggattca cagtataggc ggccgggtca tattagcaac 1020
gccgagcgga gcccgtccgg cctggctgtc gcaaacctat ccggaagttt tgcgcgtcaa 1080
tgcctcccgc gtcaaacagc tgcacggcgg aaggcacaac cactgcctca catctaaagt 1140
ctaccgagaa aaaacacggc acatcaaccg ctacgggtgc gcatgatcgt atggttcact 1200
gtccaccaac caaaactgtg ctcagtaccg ccaatatttc tcccttgggg ggtacaaaga 1260
ggtgtcccta gaagagatcc acgctgtgta aaaattttac aaaaaggtat tgactttccc 1320
tacagggtgt gtaataattt aattacaggc gggggcaacc ccgctcagta cctagagcgt 1380
aaaagagggg agggaaacac tagtatggac ttgttgtcca ttcaagaccc gtctttccta 1440
aagaatatga gcattgacga gcttgaaaaa ttgtccgatg agatccgcca atttctcatc 1500
acatctctat cggcctcggg cggacacatt ggaccgaatc tgggggtcgt ggaactgaca 1560
gtagccctcc acaaggagtt caactcaccc aaagacaaat ttctctggga cgtggggcac 1620
caaagctacg ttcataaatt gcttactggt cgtggcaaag agttcgccac attgcgccag 1680
tacaaaggac tctgcggatt ccctaaacgc tcggaatccg agcacgatgt gtgggaaaca 1740
ggtcattctt ctacttctct cagcggcgcc atgggaatgg ccgctgcacg agatattaaa 1800
gggactgatg agtacataat cccaataata ggtgacggcg ctttaacagg aggaatggcc 1860
ctagaggcct tgaaccacat aggggatgag aagaaagata tgatagtcat tttgaatgat 1920
aatgagatgt ctattgctcc caacgttgga gcaatacata gcatgttagg gcggttacgt 1980
actgcaggaa agtaccagtg ggtaaaagat gaacttgaat acctcttcaa gaagataccc 2040
gctgtaggag gcaagcttgc agccacggcc gagagagtga aggattctct taaatatatg 2100
ttggtttcag ggatgttctt tgaagaattg ggattcacgt accttggtcc ggttgacggc 2160
cattcttacc acgagttaat tgaaaattta caatacgcga aaaaaacgaa ggggcctgtt 2220
ctgctgcacg ttattaccaa aaaaggaaaa ggttataaac ctgcggaaac cgatacaatt 2280
ggcacgtggc acggcaccgg gccttataaa atcaacacgg gggactttgt caagccgaaa 2340
gctgccgcgc ctagttggtc cggcctggtt agtgggacgg tacagcgaat ggcccgggaa 2400
gatgggagga ttgtcgctat cacaccggca atgccagtag gtagcaagtt agaaggtttt 2460
gcgaaagaat ttccggatag gatgtttgac gtaggtattg ctgagcagca tgcggcgacg 2520
atggctgcgg caatggcaat gcagggcatg aagccttttt tagctattta ttcaacattt 2580
ctgcaaagag cgtatgacca agtggtacat gacatttgtc ggcaaaatgc taatgtcttt 2640
attgggattg atcgcgcagg gttagtgggt gcagacgggg aaacgcatca aggagtgttt 2700
gacatcgcgt ttatgcgaca tatcccaaat atggtcctta tgatgccaaa agacgaaaac 2760
gagggtcaac acatggtgca tacagctctt agttatgacg aaggacctat cgcgatgaga 2820
tttccgagag ggaatggatt aggcgtcaaa atggatgagc agcttaaaac aattccgatt 2880
ggaacatggg aagtcttacg tccaggaaat gacgcggtta tccttacatt tggcactacc 2940
attgagatgg cgattgaggc agcagaagaa ctccagaagg agggcctgtc agtccgtgtt 3000
gttaatgcga gatttattaa accgattgac gaaaagatga tgaaaagtat cctgaaagaa 3060
ggcctgccga tacttaccat cgaggaagct gttctggaag gaggatttgg ctcatcaatc 3120
cttgaatttg cacatgatca gggcgaatat cacacaccga tcgatcgaat gggcatcccg 3180
gatcgattta tcgagcatgg ctccgttaca gcactgcttg aagagatcgg cttaacgaaa 3240
cagcaggtgg caaacagaat caggttactt atgccgccga agacacataa gggcatcggc 3300
tcataaatta attctagagc tccggcataa aattaactaa aataattatt atgtagataa 3360
aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac 3420
tatggatata aaataggtac taatcaaaat agtgaggcga atatatttga atacatacga 3480
acaaatcaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac 3540
ttacatgttt ggatcaggag ttgagagtgg actcaaacca aatagtgatc ttgacttttt 3600
agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag 3660
acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat 3720
tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga 3780
atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt 3840
aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt 3900
agaggaatta ctacctgata ttccattttc tgatgtgaga agagccatta tggattcgtc 3960
agaggaactt atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg 4020
catgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt 4080
ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct 4140
tggagagaat attgaatgga ctaatgaaaa tgtaaatctt acgataaact atcttaataa 4200
ccgccttaag aaactttaac ccgggcgcgt tgctttcgat gaagt 4245
<210> 91
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer For for dxs operon
<400> 91
taatcccggc aacagcttaa tcagtac 27
<210> 92
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Rev for dxs operon
<400> 92
acttcatcga aagcaacgcg 20
<210> 93
<211> 399
<212> PRT
<213> Rhodococcus fascians
<400> 93
Met Ala Gly Thr Ala Asp Leu Pro Leu Glu Met Arg Arg Asn Gly Leu
1 5 10 15
Asn Pro Thr Glu Glu Leu Ala Gln Val Arg Asp Arg Asp Gly Val Ile
20 25 30
Pro Val Gly Glu Leu Tyr Gly Ala Pro Ala Phe Leu Val Cys Arg Tyr
35 40 45
Glu Asp Val Arg Arg Ile Phe Ala Asp Ser Asn Arg Phe Ser Asn Ala
50 55 60
His Thr Pro Met Phe Ala Ile Pro Ser Gly Gly Asp Val Ile Glu Asp
65 70 75 80
Glu Leu Ala Ala Met Arg Ala Gly Asn Leu Ile Gly Leu Asp Pro Pro
85 90 95
Asp His Thr Arg Leu Arg His Ile Leu Ala Ala Glu Phe Ser Val His
100 105 110
Arg Leu Ser Arg Leu Gln Pro Arg Ile Ala Glu Ile Val Asp Ser Ala
115 120 125
Leu Asp Gly Leu Glu Gln Ala Gly Gln Pro Ala Asp Leu Met Asp Arg
130 135 140
Tyr Ala Leu Pro Val Ser Leu Leu Val Leu Cys Glu Leu Leu Gly Val
145 150 155 160
Pro Tyr Ala Asp Arg Asp Glu Leu Arg Asp Arg Thr Ala Arg Leu Leu
165 170 175
Asp Leu Ser Ala Ser Ala Glu Gln Arg Ala Val Ala Gln Arg Glu Asp
180 185 190
Arg Arg Tyr Met Ala Thr Leu Val Thr Arg Ala Gln Glu Gln Pro Gly
195 200 205
Asp Asp Leu Leu Gly Ile Leu Ala Arg Lys Ile Gly Asp Asn Leu Ser
210 215 220
Thr Asp Glu Leu Ile Ser Ile Ile Ser Leu Ile Met Leu Gly Gly His
225 230 235 240
Glu Thr Thr Ala Ser Met Ile Gly Leu Ser Val Leu Ala Leu Leu His
245 250 255
His Pro Glu Gln Ala Ala Met Met Ile Glu Asp Pro Asn Cys Val Asn
260 265 270
Ser Gly Ile Glu Glu Leu Leu Arg Trp Leu Ser Val Ala His Ser Gln
275 280 285
Pro Pro Arg Met Ala Val Thr Glu Val Gln Ile Ala Gly Val Thr Ile
290 295 300
Pro Ala Gly Ser Phe Val Ile Pro Ser Leu Leu Ala Ala Asn Arg Asp
305 310 315 320
Ser Asn Leu Thr Asp Arg Pro Asp Asp Leu Asp Ile Thr Arg Gly Val
325 330 335
Ala Gly His Leu Ala Phe Gly His Gly Val His Phe Cys Leu Gly His
340 345 350
Ser Leu Ala Arg Met Thr Leu Arg Thr Ala Val Pro Ala Val Leu Arg
355 360 365
Arg Phe Pro Asp Leu Ala Leu Ser Pro Ser His Asp Val Arg Leu Arg
370 375 380
Ser Ala Ser Ile Val Leu Gly Leu Glu Glu Leu Gln Leu Thr Trp
385 390 395
<210> 94
<211> 512
<212> PRT
<213> Arabidopsis thaliana
<400> 94
Met Met Val Thr Leu Val Leu Lys Tyr Val Leu Val Ile Val Met Thr
1 5 10 15
Leu Ile Leu Arg Val Leu Tyr Asp Ser Ile Cys Cys Tyr Phe Leu Thr
20 25 30
Pro Arg Arg Ile Lys Lys Phe Met Glu Arg Gln Gly Ile Thr Gly Pro
35 40 45
Lys Pro Arg Leu Leu Thr Gly Asn Ile Ile Asp Ile Ser Lys Met Leu
50 55 60
Ser His Ser Ala Ser Asn Asp Cys Ser Ser Ile His His Asn Ile Val
65 70 75 80
Pro Arg Leu Leu Pro His Tyr Val Ser Trp Ser Lys Gln Tyr Gly Lys
85 90 95
Arg Phe Ile Met Trp Asn Gly Thr Glu Pro Arg Leu Cys Leu Thr Glu
100 105 110
Thr Glu Met Ile Lys Glu Leu Leu Thr Lys His Asn Pro Val Thr Gly
115 120 125
Lys Ser Trp Leu Gln Gln Gln Gly Thr Lys Gly Phe Ile Gly Arg Gly
130 135 140
Leu Leu Met Ala Asn Gly Glu Ala Trp His His Gln Arg His Met Ala
145 150 155 160
Ala Pro Ala Phe Thr Arg Asp Arg Leu Lys Gly Tyr Ala Lys His Met
165 170 175
Val Glu Cys Thr Lys Met Met Ala Glu Arg Leu Arg Lys Glu Val Gly
180 185 190
Glu Glu Val Glu Ile Gly Glu Glu Met Arg Arg Leu Thr Ala Asp Ile
195 200 205
Ile Ser Arg Thr Glu Phe Gly Ser Ser Cys Asp Lys Gly Lys Glu Leu
210 215 220
Phe Ser Leu Leu Thr Val Leu Gln Arg Leu Cys Ala Gln Ala Thr Arg
225 230 235 240
His Leu Cys Phe Pro Gly Ser Arg Phe Leu Pro Ser Lys Tyr Asn Arg
245 250 255
Glu Ile Lys Ser Leu Lys Thr Glu Val Glu Arg Leu Leu Met Glu Ile
260 265 270
Ile Asp Ser Arg Lys Asp Ser Val Glu Ile Gly Arg Ser Ser Ser Tyr
275 280 285
Gly Asp Asp Leu Leu Gly Leu Leu Leu Asn Gln Met Asp Ser Asn Lys
290 295 300
Asn Asn Leu Asn Val Gln Met Ile Met Asp Glu Cys Lys Thr Phe Phe
305 310 315 320
Phe Thr Gly His Glu Thr Thr Ser Leu Leu Leu Thr Trp Thr Leu Met
325 330 335
Leu Leu Ala His Asn Pro Thr Trp Gln Asp Asn Val Arg Asp Glu Val
340 345 350
Arg Gln Val Cys Gly Gln Asp Gly Val Pro Ser Val Glu Gln Leu Ser
355 360 365
Ser Leu Thr Ser Leu Asn Lys Val Ile Asn Glu Ser Leu Arg Leu Tyr
370 375 380
Pro Pro Ala Thr Leu Leu Pro Arg Met Ala Phe Glu Asp Ile Lys Leu
385 390 395 400
Gly Asp Leu Ile Ile Pro Lys Gly Leu Ser Ile Trp Ile Pro Val Leu
405 410 415
Ala Ile His His Ser Asn Glu Leu Trp Gly Glu Asp Ala Asn Glu Phe
420 425 430
Asn Pro Glu Arg Phe Thr Thr Arg Ser Phe Ala Ser Ser Arg His Phe
435 440 445
Met Pro Phe Ala Ala Gly Pro Arg Asn Cys Ile Gly Gln Thr Phe Ala
450 455 460
Met Met Glu Ala Lys Ile Ile Leu Ala Met Leu Val Ser Lys Phe Ser
465 470 475 480
Phe Ala Ile Ser Glu Asn Tyr Arg His Ala Pro Ile Val Val Leu Thr
485 490 495
Ile Lys Pro Lys Tyr Gly Val Gln Leu Val Leu Lys Pro Leu Asp Leu
500 505 510
<210> 95
<211> 518
<212> PRT
<213> Arabidopsis thaliana
<400> 95
Met Leu Leu Thr Ile Leu Lys Ser Leu Leu Val Ile Phe Val Thr Thr
1 5 10 15
Ile Leu Arg Val Leu Tyr Asp Thr Ile Ser Cys Tyr Trp Leu Thr Pro
20 25 30
Arg Arg Ile Lys Lys Ile Met Glu Gln Gln Gly Val Thr Gly Pro Lys
35 40 45
Pro Arg Pro Leu Thr Gly Asn Ile Leu Glu Ile Ser Ala Met Val Ser
50 55 60
Gln Ser Ala Ser Lys Asp Cys Asp Ser Ile His His Asp Ile Val Gly
65 70 75 80
Arg Leu Leu Pro His Tyr Val Ala Trp Ser Lys Gln Tyr Gly Lys Arg
85 90 95
Phe Ile Val Trp Asn Gly Thr Asp Pro Arg Leu Cys Leu Thr Glu Thr
100 105 110
Glu Leu Ile Lys Glu Leu Leu Met Lys His Asn Gly Val Ser Gly Arg
115 120 125
Ser Trp Leu Gln Gln Gln Gly Thr Lys Asn Phe Ile Gly Arg Gly Leu
130 135 140
Leu Met Ala Asn Gly Gln Asp Trp His His Gln Arg His Leu Ala Ala
145 150 155 160
Pro Ala Phe Thr Gly Glu Arg Leu Lys Gly Tyr Ala Arg His Met Val
165 170 175
Glu Cys Thr Ser Lys Leu Val Glu Arg Leu Arg Lys Glu Val Gly Glu
180 185 190
Gly Ala Asn Glu Val Glu Ile Gly Glu Glu Met His Lys Leu Thr Ala
195 200 205
Asp Ile Ile Ser Arg Thr Lys Phe Gly Ser Ser Phe Glu Lys Gly Lys
210 215 220
Glu Leu Phe Asn His Leu Thr Val Leu Gln Arg Arg Cys Ala Gln Ala
225 230 235 240
Thr Arg His Leu Cys Phe Pro Gly Ser Arg Phe Leu Pro Ser Lys Tyr
245 250 255
Asn Arg Glu Ile Lys Ser Leu Lys Lys Glu Val Glu Arg Leu Leu Ile
260 265 270
Glu Ile Ile Gln Ser Arg Arg Asp Cys Ala Glu Met Gly Arg Ser Ser
275 280 285
Thr His Gly Asp Asp Leu Leu Gly Leu Leu Leu Asn Glu Met Asp Ile
290 295 300
Asp Lys Asn Asn Asn Asn Asn Asn Asn Asn Leu Gln Leu Ile Met Asp
305 310 315 320
Glu Cys Lys Thr Phe Phe Phe Ala Gly His Glu Thr Thr Ala Leu Leu
325 330 335
Leu Thr Trp Thr Thr Met Leu Leu Ala Asp Asn Pro Thr Trp Gln Glu
340 345 350
Lys Val Arg Glu Glu Val Arg Glu Val Phe Gly Arg Asn Gly Leu Pro
355 360 365
Ser Val Asp Gln Leu Ser Lys Leu Thr Ser Leu Ser Lys Val Ile Asn
370 375 380
Glu Ser Leu Arg Leu Tyr Pro Pro Ala Thr Leu Leu Pro Arg Met Ala
385 390 395 400
Phe Glu Asp Leu Lys Leu Gly Asp Leu Thr Ile Pro Lys Gly Leu Ser
405 410 415
Ile Trp Ile Pro Val Leu Ala Ile His His Ser Glu Glu Leu Trp Gly
420 425 430
Lys Asp Ala Asn Gln Phe Asn Pro Glu Arg Phe Gly Gly Arg Pro Phe
435 440 445
Ala Ser Gly Arg His Phe Ile Pro Phe Ala Ala Gly Pro Arg Asn Cys
450 455 460
Ile Gly Gln Gln Phe Ala Leu Met Glu Ala Lys Ile Ile Leu Ala Thr
465 470 475 480
Leu Ile Ser Lys Phe Asn Phe Thr Ile Ser Lys Asn Tyr Arg His Ala
485 490 495
Pro Ile Val Val Leu Thr Ile Lys Pro Lys Tyr Gly Val Gln Val Ile
500 505 510
Leu Lys Pro Leu Val Ser
515
<210> 96
<211> 1377
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 0-yybN-P15
<400> 96
gaaaatgagc tcccacatac cggctaggta tgtggcgttc ttcttcatgt tctggcatgc 60
agctgtgagg aggatttgtt tgctcacccc ctgaacctgc gatagctaag cccgtgcagt 120
tgttttgaac ctacaaagct tcgttctatt ttttcttttc tttttttaga gatttcctga 180
aatagaaaag caatcttttc taaccttttc tttatggttt tgccatacat accgagtaac 240
gactttctgg cgtttcgttg attttgtgta atattctcaa acatatttca ggatttgatt 300
tatatgaccg atagtctttg cgatcaattg ttgagtacgt aagtgtatgc tgattcaaca 360
aatgtatctg tattgttcac tttataatga aatttccatt ttggaagcaa acccctgact 420
gggtgataac gtctatgtgc gatggcacca aaaacttgga ggtcaaatag tcctttagag 480
atgagagttg ttaagtagcc ggaatgtaga gcgacggctt ctacttgaaa atcaaatcat 540
gcaatttagt gatccaatcg gtcaaggtag ggcttggaac agaatcatgg acttttctgg 600
agttgcaaac tatgaatcgt cctcattaaa tttataataa aaatattctc aattgagcaa 660
atcgcccacc ctttttcctt tataacataa aatccaatac tatcaataaa attctttaca 720
ggttattaca gttaagatat aatatagtta atcttttacg taaaaggagg tttttattac 780
ttgtgttgaa gttttaaata ggagtaactc catctcccca ttacggtctt catttaattt 840
catcctgagt tttatttagt tagatataaa aacgaaaatt tcacattatt tttaactaac 900
cgatagtata aaatatatat tgaaaggatt gtaaaattat gaataaattc ctgaagagca 960
atttccgttt ccttcttgcg gctgctttag gcatatcatt acttgctagt agtaatttta 1020
taaaagccag caatgataac tataaattcc atttacttgt accttatggc tatggtaatg 1080
cctattcaaa tgatgacggg tgcgcatgat cgtatggttc actgtccacc aaccaaaact 1140
gtgctcagta ccgccaatat ttctcccttg gggggtacaa agaggtgtcc ctagaagaga 1200
tccacgctgt gtaaaaattt tacaaaaagg tattgacttt ccctacaggg tgtgtaataa 1260
tttaattaca ggcgggggca accccgctca gtacctagag cgtaaaagag gggagggaaa 1320
cactagttgg cttcgttggg attctccggt gatgctgatt tcgctgcgta tgctgcg 1377
<210> 97
<211> 1489
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment END-ZeoR-yybN-HOM-R
<400> 97
cggtagtcat tgctggcgaa cgcgatctag acgaagttat cttgatatgg ctttttatat 60
gtgttactct acatacagaa aggaggaact aaatatggct aagttgacca gtgcagttcc 120
tgttttaaca gctagagacg ttgctggagc ggttgaattc tggacggacc gtcttggttt 180
ctcaagagac ttcgtggaag acgatttcgc aggtgttgtc agagacgatg ttacattatt 240
catttcagca gttcaggatc aagttgtacc tgacaacaca cttgcttggg tttgggtgcg 300
cggcctggac gaactgtacg cagaatggtc tgaggtcgtg tcaacgaact tcagagacgc 360
atctggtcca gcaatgacag aaattggaga gcaaccttgg ggtagagaat ttgcacttag 420
agatcctgca ggaaattgtg ttcatttcgt agctgaagag caagattgaa gcttgaattc 480
ggatccgtcg actacgtatg ccaatgatga tgaagagtcg acatggatga gcgatgatga 540
tatcgcattt agacagacca ctcatacaga taatccttgg aaagtaaatt tacagaaatc 600
ggcagaaggt aaaggtacaa tcatgacatt ttggttgatt aacacaggga atagtaaaat 660
tccaaaagct tctaaaatac ataacgtaaa acaaggaagc ggagctcatt attatcatgc 720
aaatagccag ggaagccata catatgtagc cttagcagtt gaaaacaaca attacagtgc 780
aagttcttat ggtatagatg gtgtatggga tgaagaaact tggtaaacaa gaaccttcta 840
aaaacgttgg caccttttag ccacgcgaaa aaatttagaa tgataatctt tttataagat 900
tatcattttt atttattcta ttaagaattg agtgagaaca tggaaagtca tatttatcgc 960
attatcaaaa ataaattaac tataataata tttactataa tcatattgat tccttgtgtt 1020
gatatatcac tattgttaat gactaacaca gaataccatc ctgcatatgc gtttttcctt 1080
tctggcactt ccgtagggca tgcttcacaa atgatcctat tatggtttct tccgctttat 1140
tttttgttac tatgtgctga cgattctata caagattata aaacaggata tcattacatt 1200
cttataagca aagttggcag aaaaaaatat tgtttggaaa aaatatttac ctcttttatc 1260
atttcatttt tgacaatgtt tttgtcacta atattaaact ttttattggt tcaggttttc 1320
ttttttaaag gtacatttaa aaatgactta gaccaaatta aattccctga taacagcctt 1380
tatactttta gtatggccca tccttatata gcaattgtgt tattttctat tatttgttgt 1440
attatgtctg gatttgttgg agcacttggt tcaagcctca gtttacttt 1489
<210> 98
<211> 1404
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment 25-solo-BS-purA
<400> 98
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60
caagcgtagt agttgttggc acacagtggg gcgacgaggg caagggcaag attacagatt 120
tcctgtctga aaacgcggag gtgatcgcac gctatcaggg aggaaacaac gccggccata 180
caatcaaatt cgacggcatt acatataaac ttcaccttat cccgtctggt atcttttaca 240
aagacaagac atgtgtcatc ggaaatggaa tggtcgtcga ccctaaagcg ctggtcacag 300
aactggccta tcttcacgaa cgcaatgtta gcacagacaa tttacgcatt agcaatagag 360
cgcatgtaat tctgccttat catctgaagt tagatgaagt tgaggaggaa cgcaagggtg 420
ctaataaaat tggtacaaca aagaagggca tcggcccggc ttatatggac aaagcggccc 480
gcatcggtat ccgcatcgca gatctgcttg acagagatgc gtttgctgag aaactggaaa 540
gaaacttaga ggagaagaac agactgttag aaaaaatgta tgaaacggaa ggatttaaat 600
tagaggatat tctggacgag tactacgaat acggccagca aatcaaaaaa tatgtatgcg 660
atacatctgt agtactgaac gatgcgctgg atgagggaag aagagtatta tttgaaggtg 720
cccaaggagt tatgctggat atcgatcaag gtacatatcc atttgttaca agcagcaatc 780
ctgttgctgg cggcgtcaca attggatctg gcgtaggccc tacgaaaatt aaacacgtcg 840
ttggcgtgtc aaaagcatat acgacaagag ttggtgatgg accgttcccg acagaactga 900
aagatgagat tggcgatcaa attagagagg tcggaagaga atatggcaca acaacaggta 960
gaccgagaag agttggttgg ttcgattcag tcgtggtgag acatgcaaga agagtgtctg 1020
gcattacgga tttatcactt aattcaattg atgttctggc tggaatcgaa acgttaaaaa 1080
tctgtgtggc atatagatat aaaggagaaa ttattgaaga atttccagcc tcacttaaag 1140
cactggccga atgcgaacct gtgtacgaag aaatgccagg ctggacagaa gatattacag 1200
gagctaaatc actttcagaa ctgccggaaa atgcgagaca ttacctggaa agagtgtcac 1260
aactgacagg cattccgctg tcaatttttt cagtgggccc ggatagatca caaacaaacg 1320
tgctgagatc agtgtacaga gcaaattaaa ttaattctag agtcgatccc cgggttcgcc 1380
agcaatgact accggcagcc cgcc 1404
<210> 99
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for Fragment 0-yybN-P15 amplification
<400> 99
ggagaatccc aacgaagcca 20
<210> 100
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for Fragment 0-yybN-P15 amplification
<400> 100
ggctaggtat gtggcgttct 20
<210> 101
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for END-ZeoR-yybN-HOM-R amplification
<400> 101
cggtagtcat tgctggcgaa 20
<210> 102
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for END-ZeoR-yybN-HOM-R amplification
<400> 102
actgaggctt gaaccaagtg 20
<210> 103
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for Fragment 25-solo-BS-purA amplification
<400> 103
gcagcgaaat cagcatcacc 20
<210> 104
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for Fragment 25-solo-BS-purA amplification
<400> 104
cactgagcct ccacctagcc t 21
<210> 105
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for amplification of purA fragment and end fragment
assembly
<400> 105
tttaactagt atgtcttcag tagttgtagt aggtac 36
<210> 106
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for final purA operon amplification
<400> 106
aagcccgtgc agttgttttg 20
<210> 107
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for final purA operon amplification
<400> 107
cacaattgct atataaggat gggc 24
<210> 108
<211> 4089
<212> DNA
<213> Artificial Sequence
<220>
<223> complete purA operon
<400> 108
gaaaatgagc tcccacatac cggctaggta tgtggcgttc ttcttcatgt tctggcatgc 60
agctgtgagg aggatttgtt tgctcacccc ctgaacctgc gatagctaag cccgtgcagt 120
tgttttgaac ctacaaagct tcgttctatt ttttcttttc tttttttaga gatttcctga 180
aatagaaaag caatcttttc taaccttttc tttatggttt tgccatacat accgagtaac 240
gactttctgg cgtttcgttg attttgtgta atattctcaa acatatttca ggatttgatt 300
tatatgaccg atagtctttg cgatcaattg ttgagtacgt aagtgtatgc tgattcaaca 360
aatgtatctg tattgttcac tttataatga aatttccatt ttggaagcaa acccctgact 420
gggtgataac gtctatgtgc gatggcacca aaaacttgga ggtcaaatag tcctttagag 480
atgagagttg ttaagtagcc ggaatgtaga gcgacggctt ctacttgaaa atcaaatcat 540
gcaatttagt gatccaatcg gtcaaggtag ggcttggaac agaatcatgg acttttctgg 600
agttgcaaac tatgaatcgt cctcattaaa tttataataa aaatattctc aattgagcaa 660
atcgcccacc ctttttcctt tataacataa aatccaatac tatcaataaa attctttaca 720
ggttattaca gttaagatat aatatagtta atcttttacg taaaaggagg tttttattac 780
ttgtgttgaa gttttaaata ggagtaactc catctcccca ttacggtctt catttaattt 840
catcctgagt tttatttagt tagatataaa aacgaaaatt tcacattatt tttaactaac 900
cgatagtata aaatatatat tgaaaggatt gtaaaattat gaataaattc ctgaagagca 960
atttccgttt ccttcttgcg gctgctttag gcatatcatt acttgctagt agtaatttta 1020
taaaagccag caatgataac tataaattcc atttacttgt accttatggc tatggtaatg 1080
cctattcaaa tgatgacggg tgcgcatgat cgtatggttc actgtccacc aaccaaaact 1140
gtgctcagta ccgccaatat ttctcccttg gggggtacaa agaggtgtcc ctagaagaga 1200
tccacgctgt gtaaaaattt tacaaaaagg tattgacttt ccctacaggg tgtgtaataa 1260
tttaattaca ggcgggggca accccgctca gtacctagag cgtaaaagag gggagggaaa 1320
cactagtatg tcaagcgtag tagttgttgg cacacagtgg ggcgacgagg gcaagggcaa 1380
gattacagat ttcctgtctg aaaacgcgga ggtgatcgca cgctatcagg gaggaaacaa 1440
cgccggccat acaatcaaat tcgacggcat tacatataaa cttcacctta tcccgtctgg 1500
tatcttttac aaagacaaga catgtgtcat cggaaatgga atggtcgtcg accctaaagc 1560
gctggtcaca gaactggcct atcttcacga acgcaatgtt agcacagaca atttacgcat 1620
tagcaataga gcgcatgtaa ttctgcctta tcatctgaag ttagatgaag ttgaggagga 1680
acgcaagggt gctaataaaa ttggtacaac aaagaagggc atcggcccgg cttatatgga 1740
caaagcggcc cgcatcggta tccgcatcgc agatctgctt gacagagatg cgtttgctga 1800
gaaactggaa agaaacttag aggagaagaa cagactgtta gaaaaaatgt atgaaacgga 1860
aggatttaaa ttagaggata ttctggacga gtactacgaa tacggccagc aaatcaaaaa 1920
atatgtatgc gatacatctg tagtactgaa cgatgcgctg gatgagggaa gaagagtatt 1980
atttgaaggt gcccaaggag ttatgctgga tatcgatcaa ggtacatatc catttgttac 2040
aagcagcaat cctgttgctg gcggcgtcac aattggatct ggcgtaggcc ctacgaaaat 2100
taaacacgtc gttggcgtgt caaaagcata tacgacaaga gttggtgatg gaccgttccc 2160
gacagaactg aaagatgaga ttggcgatca aattagagag gtcggaagag aatatggcac 2220
aacaacaggt agaccgagaa gagttggttg gttcgattca gtcgtggtga gacatgcaag 2280
aagagtgtct ggcattacgg atttatcact taattcaatt gatgttctgg ctggaatcga 2340
aacgttaaaa atctgtgtgg catatagata taaaggagaa attattgaag aatttccagc 2400
ctcacttaaa gcactggccg aatgcgaacc tgtgtacgaa gaaatgccag gctggacaga 2460
agatattaca ggagctaaat cactttcaga actgccggaa aatgcgagac attacctgga 2520
aagagtgtca caactgacag gcattccgct gtcaattttt tcagtgggcc cggatagatc 2580
acaaacaaac gtgctgagat cagtgtacag agcaaattaa attaattcta gacgaagtta 2640
tcttgatatg gctttttata tgtgttactc tacatacaga aaggaggaac taaatatggc 2700
taagttgacc agtgcagttc ctgttttaac agctagagac gttgctggag cggttgaatt 2760
ctggacggac cgtcttggtt tctcaagaga cttcgtggaa gacgatttcg caggtgttgt 2820
cagagacgat gttacattat tcatttcagc agttcaggat caagttgtac ctgacaacac 2880
acttgcttgg gtttgggtgc gcggcctgga cgaactgtac gcagaatggt ctgaggtcgt 2940
gtcaacgaac ttcagagacg catctggtcc agcaatgaca gaaattggag agcaaccttg 3000
gggtagagaa tttgcactta gagatcctgc aggaaattgt gttcatttcg tagctgaaga 3060
gcaagattga agcttgaatt cggatccgtc gactacgtat gccaatgatg atgaagagtc 3120
gacatggatg agcgatgatg atatccattt agacagacca ctcatacaga taatccttgg 3180
aaagtaaatt tacagaaatc ggcagaaggt aaaggtacaa tcatgacatt ttggttgatt 3240
aacacaggga atagtaaaat tccaaaagct tctaaaatac ataacgtaaa acaaggaagc 3300
ggagctcatt attatcatgc aaatagccag ggaagccata catatgtagc cttagcagtt 3360
gaaaacaaca attacagtgc aagttcttat ggtatagatg gtgtatggga tgaagaaact 3420
tggtaaacaa gaaccttcta aaaacgttgg caccttttag ccacgcgaaa aaatttagaa 3480
tgataatctt tttataagat tatcattttt atttattcta ttaagaattg agtgagaaca 3540
tggaaagtca tatttatcgc attatcaaaa ataaattaac tataataata tttactataa 3600
tcatattgat tccttgtgtt gatatatcac tattgttaat gactaacaca gaataccatc 3660
ctgcatatgc gtttttcctt tctggcactt ccgtagggca tgcttcacaa atgatcctat 3720
tatggtttct tccgctttat tttttgttac tatgtgctga cgattctata caagattata 3780
aaacaggata tcattacatt cttataagca aagttggcag aaaaaaatat tgtttggaaa 3840
aaatatttac ctcttttatc atttcatttt tgacaatgtt tttgtcacta atattaaact 3900
ttttattggt tcaggttttc ttttttaaag gtacatttaa aaatgactta gaccaaatta 3960
aattccctga taacagcctt tatactttta gtatggccca tccttatata gcaattgtgt 4020
tattttctat tatttgttgt attatgtctg gatttgttgg agcacttggt tcaagcctca 4080
gtttacttt 4089
<210> 109
<211> 2818
<212> DNA
<213> Artificial Sequence
<220>
<223> operon 25-solo-BS-purA fragment + END-ZeoR-yybN-HOM-R fragment
<400> 109
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60
caagcgtagt agttgttggc acacagtggg gcgacgaggg caagggcaag attacagatt 120
tcctgtctga aaacgcggag gtgatcgcac gctatcaggg aggaaacaac gccggccata 180
caatcaaatt cgacggcatt acatataaac ttcaccttat cccgtctggt atcttttaca 240
aagacaagac atgtgtcatc ggaaatggaa tggtcgtcga ccctaaagcg ctggtcacag 300
aactggccta tcttcacgaa cgcaatgtta gcacagacaa tttacgcatt agcaatagag 360
cgcatgtaat tctgccttat catctgaagt tagatgaagt tgaggaggaa cgcaagggtg 420
ctaataaaat tggtacaaca aagaagggca tcggcccggc ttatatggac aaagcggccc 480
gcatcggtat ccgcatcgca gatctgcttg acagagatgc gtttgctgag aaactggaaa 540
gaaacttaga ggagaagaac agactgttag aaaaaatgta tgaaacggaa ggatttaaat 600
tagaggatat tctggacgag tactacgaat acggccagca aatcaaaaaa tatgtatgcg 660
atacatctgt agtactgaac gatgcgctgg atgagggaag aagagtatta tttgaaggtg 720
cccaaggagt tatgctggat atcgatcaag gtacatatcc atttgttaca agcagcaatc 780
ctgttgctgg cggcgtcaca attggatctg gcgtaggccc tacgaaaatt aaacacgtcg 840
ttggcgtgtc aaaagcatat acgacaagag ttggtgatgg accgttcccg acagaactga 900
aagatgagat tggcgatcaa attagagagg tcggaagaga atatggcaca acaacaggta 960
gaccgagaag agttggttgg ttcgattcag tcgtggtgag acatgcaaga agagtgtctg 1020
gcattacgga tttatcactt aattcaattg atgttctggc tggaatcgaa acgttaaaaa 1080
tctgtgtggc atatagatat aaaggagaaa ttattgaaga atttccagcc tcacttaaag 1140
cactggccga atgcgaacct gtgtacgaag aaatgccagg ctggacagaa gatattacag 1200
gagctaaatc actttcagaa ctgccggaaa atgcgagaca ttacctggaa agagtgtcac 1260
aactgacagg cattccgctg tcaatttttt cagtgggccc ggatagatca caaacaaacg 1320
tgctgagatc agtgtacaga gcaaattaaa ttaattctag acgaagttat cttgatatgg 1380
ctttttatat gtgttactct acatacagaa aggaggaact aaatatggct aagttgacca 1440
gtgcagttcc tgttttaaca gctagagacg ttgctggagc ggttgaattc tggacggacc 1500
gtcttggttt ctcaagagac ttcgtggaag acgatttcgc aggtgttgtc agagacgatg 1560
ttacattatt catttcagca gttcaggatc aagttgtacc tgacaacaca cttgcttggg 1620
tttgggtgcg cggcctggac gaactgtacg cagaatggtc tgaggtcgtg tcaacgaact 1680
tcagagacgc atctggtcca gcaatgacag aaattggaga gcaaccttgg ggtagagaat 1740
ttgcacttag agatcctgca ggaaattgtg ttcatttcgt agctgaagag caagattgaa 1800
gcttgaattc ggatccgtcg actacgtatg ccaatgatga tgaagagtcg acatggatga 1860
gcgatgatga tatccattta gacagaccac tcatacagat aatccttgga aagtaaattt 1920
acagaaatcg gcagaaggta aaggtacaat catgacattt tggttgatta acacagggaa 1980
tagtaaaatt ccaaaagctt ctaaaataca taacgtaaaa caaggaagcg gagctcatta 2040
ttatcatgca aatagccagg gaagccatac atatgtagcc ttagcagttg aaaacaacaa 2100
ttacagtgca agttcttatg gtatagatgg tgtatgggat gaagaaactt ggtaaacaag 2160
aaccttctaa aaacgttggc accttttagc cacgcgaaaa aatttagaat gataatcttt 2220
ttataagatt atcattttta tttattctat taagaattga gtgagaacat ggaaagtcat 2280
atttatcgca ttatcaaaaa taaattaact ataataatat ttactataat catattgatt 2340
ccttgtgttg atatatcact attgttaatg actaacacag aataccatcc tgcatatgcg 2400
tttttccttt ctggcacttc cgtagggcat gcttcacaaa tgatcctatt atggtttctt 2460
ccgctttatt ttttgttact atgtgctgac gattctatac aagattataa aacaggatat 2520
cattacattc ttataagcaa agttggcaga aaaaaatatt gtttggaaaa aatatttacc 2580
tcttttatca tttcattttt gacaatgttt ttgtcactaa tattaaactt tttattggtt 2640
caggttttct tttttaaagg tacatttaaa aatgacttag accaaattaa attccctgat 2700
aacagccttt atacttttag tatggcccat ccttatatag caattgtgtt attttctatt 2760
atttgttgta ttatgtctgg atttgttgga gcacttggtt caagcctcag tttacttt 2818
<210> 110
<211> 667
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG2_Bsu
<400> 110
ttctttttgc gccaggtagc catagctggt catatgatga aaacaatctg tgtattcgct 60
ggcagcaacc ctggcggtaa tgaagcttac aagagaaagg ccgctgaact gggtgtgtat 120
atggcggaac agggaatcgg attagtatac ggtggctctc gcgtcggact gatgggcacg 180
attgcagacg caatcatgga gaacggcggc acggcaattg gagttatgcc atctggatta 240
ttttctggag aagttgtcca tcagaatctg acagagctga ttgaggtcaa tggcatgcac 300
gagagaaaag ccaaaatgtc agagctggcg gatggtttca tcagcatgcc tggaggattt 360
ggaacatacg aggagctttt tgaagttctt tgctgggcgc aaattggcat tcatcaaaaa 420
ccgattggcc tgtataatgt gaacggctat tttgaaccga tgatgaagat ggtgaaatat 480
tcaattcaag aaggctttag caatgaatca catcttaaac tgatccactc atcatcaaga 540
ccggatgaac tgatcgaaca aatgcagaat tattcatatc cgattttaga aaaaaaatgg 600
acagaaattt aaattaattc tagagtcgat ccccgggttc gccagcaatg actaccggca 660
gcccgcc 667
<210> 111
<211> 862
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG3_Cgl
<400> 111
ttctttttgc gccaggtagc catagctggt catatgatgg caccgaaaca gacaccttct 60
ccagaaaaaa atagaaacct tgtgggtcca gtgctgcaac gccgccaaac agagggcacg 120
tttgaccagc gcctgcttga aatgagagca gaccacaatt ggaagcacgc agacccgtgg 180
agagtgttaa gaattcagtc agagtttgtt gcaggatttg atgctctgca tgagatgccg 240
aaggcggtca cagtgtttgg aagcgcgaga attaaagagg atcatcctta ttataaagca 300
ggtgttgagc ttggagaaaa acttgttgcc gctgattacg cggttgtaac gggcggaggc 360
cctggcctta tggaagcacc gaataaagga gcgtcagaag ccaatggctt atcagtcggt 420
ttaggtattg aacttcctca cgagcagcat ttaaacccgt atgtggatct gggattaaat 480
tttagatact tttttgctag aaagacgatg tttctgaaat attcacaagc ttttgtctgt 540
ctgccgggcg gcttcggaac actggacgaa ctgttcgaag tgctgtgcat ggtccaaaca 600
ggcaaagtta caaacttccc gattgtactg atcggcacag aattctgggc tggcctggtt 660
gactggatca gacatagact ggtcgaagaa ggcatgattg atgaaaaaga tgtagacaga 720
atgctggtaa cagatgatct ggatcaagcc gttaagttca tcgtcgatgc ccatgccggc 780
ctggatgtag cgagaagaca taactaaatt aattctagag tcgatccccg ggttcgccag 840
caatgactac cggcagcccg cc 862
<210> 112
<211> 679
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG4_Pae
<400> 112
ttctttttgc gccaggtagc catagctggt catatgatga cgcttagatc agtctgtgtg 60
ttctgcggcg cgagcccggg agcttctccg gtttatcaag aagctgctgt ggcccttggt 120
agacatttag cggaacgcgg actgacgtta gtatatggcg gaggtgccgt aggactgatg 180
ggtacagtgg ccgacgccgc tctggcggcg ggcggagaag ttattggtat tatccctcaa 240
tcacttcagg aggccgaaat tggccataaa ggcttaacaa gattagaagt tgtagatggc 300
atgcatgcac gcaaggctag aatggctgag ttagctgatg cctttatcgc gcttccgggc 360
ggacttggaa cacttgagga actgtttgag gtctggacat ggggccagtt aggctaccac 420
gcaaaaccac tgggcctgct ggaagttaat ggcttctatg atcctctgct gacatttctg 480
gaccacctgg tcgatgaaag atttgtgaga gcggaacata gaggcatgct gcagagagga 540
gcgtcacctg aagcactgct ggacgcactg gcagcatgga caccgtcagt cgcaccgaaa 600
tgggttgata gaacaccaca ataaattaat tctagagtcg atccccgggt tcgccagcaa 660
tgactaccgg cagcccgcc 679
<210> 113
<211> 862
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG5_Rfa
<400> 113
ttctttttgc gccaggtagc catagctggt catatgatga acagcgttga cgaccctggt 60
tcatacgaac agattggcag cgagaagccg gcaaagcata aaggctctgt tgtactgcgc 120
agaggcagaa atacggaaac atctacgtca gaccaacgct tattagatga aagaggttca 180
ggtaattgga tccattctga tacgtggcgc gtcttacgca ttcagagcga atttgtggaa 240
ggctttggtg cgctggccga agttcctaga gctgtcacag tattcggcag cgccagaacg 300
ccagtcgatc acccggaata cgagagagct agagagttag gagccgcgct tgctagagaa 360
ggatttgcgg taattacagg cggtggacca ggcgtcatgg agggagctaa cagaggagcg 420
tcagaggcgg atggctattc aattggcctt ggcatcgagc tgccgttcga acaaggctta 480
aacgactggg tagatcttgg agtgaatttc agatattttt ttgtaagaaa aacaatgttc 540
gtgaaatatt cacaggcctt tgtgtgcctt ccgggcggct ttggaacact ggacgaactg 600
tttgaagcac tgacacttgt tcaaacagca aaagtcacaa gatttccgat tgttctgctg 660
ggaaaggact tctggtcagg actgctggat tggattaaaa caacactggt taaagagggc 720
aaagtctcag aaaaagatct ggatctgatc cattgtacag attcagtgga tgaagcagtg 780
agaatcgtta gagaagcaca acagtaaatt aattctagag tcgatccccg ggttcgccag 840
caatgactac cggcagcccg cc 862
<210> 114
<211> 688
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG6_Rfa
<400> 114
ttctttttgc gccaggtagc catagctggt catatgatga atttacgccc gatgcctgcc 60
acgacggtta gcgcccaagc aagaccaacg ccaaagtcag ttacggtgtt ctgcggagct 120
atgccgggta gaggaacaaa atacggtcaa cttgctgagg gcatgggtag agctattgct 180
agaagcaaat taagacttgt atatggagga gcgagagtcg gccttatggg aacactggca 240
aacgcagcct tagactctgg cggtacagtc gttggagtca ttcctgaatc atttacagct 300
atccctgaag ccgcccacca cggactgaca gaactgcatg tagtgcacga tatgcatcaa 360
agaaaagcct taatggctga gctgggcgat gcattcattg cacttcctgg cggcgtcggc 420
acagcggagg agttttttga ggtgctgaca tggagccatc tgggcctgca taacaaaccg 480
tgcgttctgc tgaatgataa tgaatactat agaccgctgc tgtcatatat tgaacatgca 540
gcggtcgaag gctttatcac acctgcgaca agatcaagag taatcgtgtg taaagacatt 600
gaaggcgcga ttgcggcgat tagatcaccg taaattaatt ctagagtcga tccccgggtt 660
cgccagcaat gactaccggc agcccgcc 688
<210> 115
<211> 655
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG7_Cst
<400> 115
ttctttttgc gccaggtagc catagctggt catatgatga aatcagtagc gatttattgc 60
ggatcatcaa tgggatctag ccctagatat gcagaagtag ctaaagagat gggagaggaa 120
cttgcaagac gcaatctgag agtagtgtat ggaggaggaa acgtcggact gatgggtaca 180
gtggccgacg cagcgttagc ggccggtggc gaggtggtag gcgtaattcc aagacagtta 240
attaaccgcg agatggcaca tgccggtctg acagatttag aagtggtgga cacaatggcg 300
cagagaaaaa cgagaatgga ggaacttgcc gatgcttttg tgtgtctgcc tggcggtgtt 360
ggcacgctgg aagaagtcgt tgaagttctt acaatgcaac aacttggcca cgtccaaggc 420
ccggtcggcc tggttaatgt tgacggcttt tgggaaccgt ttgtcagaac actggaatca 480
atggtcgctt gcggcttcgt tcagtcaaga tacatcgatg ctatcgcact gtcttcagat 540
ccggctgaaa ttctggatga attcgcaggc tggagcccga tcggcgcgaa gtggagctaa 600
attaattcta gagtcgatcc ccgggttcgc cagcaatgac taccggcagc ccgcc 655
<210> 116
<211> 919
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG8_Cst
<400> 116
ttctttttgc gccaggtagc catagctggt catatgatgg cccctcttcg ctcaaacaaa 60
gatggcaaac ctagagttcc tagaacgacg gaaagcgccg aaacgaatag aatgttaaga 120
ggtccgatgt tactgagaac agacggaaat cagacgtcaa catacgatca aagactttta 180
gagtcaggcg cagatcacgc ttggaagcat gcagatccgt ggcgcgttct gagaatccag 240
ggagagttcg tggcaggatt tgatgctctg agcgatctgc ctaaggcggt tacggtatac 300
ggctcagcca gaacaaaaga ggacacaccg gaatatgcac agggcatcga tttaggtgca 360
aaattagttg agcatgacta cgctgttgtg acaggcggtg gcccaggcat catggaggcg 420
gcgaatagag gcgcctatga agctggaggt ctttctgtgg gcctgggcat tgaacttccg 480
tttgaacaag gtttaaacaa atatgtagat cttggaatta actttagata ctttttcgcg 540
agaaagacaa tgttcctgaa atattcacag gcgtttgtgt gcctgccggg cggtatggga 600
acaatggatg agctgtttga aatgctgtgt atggtgcaaa caggaaaagt gacaaactat 660
ccgattgtac tgatcggcac agaatattgg agcggcctgg tagaatggat ggctaataca 720
ctggtcgccg aaggctacat caatccacaa gatatggatc tgttcctgct gacagacagc 780
gtcgacgaag ccgtcgaaca tattgtcgcg gctcataaag aaatgacaga cgaaagagtc 840
tcaagactga atcacgacgc ataaattaat tctagagtcg atccccgggt tcgccagcaa 900
tgactaccgg cagcccgcc 919
<210> 117
<211> 850
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG9_SC
<400> 117
ttctttttgc gccaggtagc catagctggt catatgatgg ccacaggcaa cccggaggga 60
aaaaaacgcc ctcctgagga acaacgcctt ggccctgttc ttagaagacg cggacaagtt 120
caggagtcta caacagacca aagactgctt gatgagagag ccccgacaga ttgggtgcat 180
acagatccat ggagagtttt aagaattcag tcagagttta ttgagggatt tggtacactg 240
gcggaactgc cgccggccat ttctgttttt ggatcagcga gaacgccggc cgactcaccg 300
gaatatgacg ctggcgtcag actgggaaga ggtctggtgg aagcgggatt cgccgtgatc 360
acgggcggcg gtccgggcgc aatggaagct gctaacaagg gtgcgttaga agcgaaaggt 420
acaagcgtcg gtttaggaat tgaacttcca ttcgaacaag gattaaatcc ttacgttgat 480
atcggactta atttcagata tttcttcgta agaaagatga tgtttgtaaa gtacgcacaa 540
ggatttgtag tgttaccagg cggcttaggc acacttgatg aactgtttga agcactgaca 600
ctggtacaga cgcagaaagt cacgagattt ccgatcgtcc tgtttggcag cgaatattgg 660
ggcggcctgg tcgattggct gagaggcaca ctggttgctc agggcaaagc ggctgaaaaa 720
gatctgatgc tgtttcacgt cacagacgac gtagatgaag cagtggcact ggtgtcaaaa 780
gaagcaggca gataaattaa ttctagagtc gatccccggg ttcgccagca atgactaccg 840
gcagcccgcc 850
<210> 118
<211> 739
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG10_ATh
<400> 118
ttctttttgc gccaggtagc catagctggt catatgatgg agattaaggg agagagcatg 60
caaaagtcaa agttcagacg catttgtgtg ttttgcggtt catcacaggg caaaaagtct 120
tcatatcaag atgctgcagt tgatctgggt aacgaattag taagcagaaa catcgatctt 180
gtctacggcg gtggctctat tggacttatg ggcttagtgt ctcaagcagt ccatgacggc 240
ggtagacatg tcatcggcat tattcctaaa acgttaatgc cgcgcgagct gacaggcgaa 300
acagtaggag aggtaagagc ggtggccgac atgcatcaaa gaaaagcgga aatggccaaa 360
cacagcgacg catttattgc tttaccgggc ggctacggaa cactggaaga acttcttgag 420
gtcatcacgt gggcccagct gggcattcat gataaaccag tgggactgct gaatgtggat 480
ggctattata atagcctgct gtcatttatt gataaagcgg ttgaagaagg attcatttca 540
ccgacggcaa gagaaatcat tgtttcagcg cctacagcta aagaactggt taaaaaactg 600
gaagagtatg cgccgtgcca tgaaagagtt gctacaaaac tgtgttggga aatggagaga 660
atcggatatt catcagaaga ataaattaat tctagagtcg atccccgggt tcgccagcaa 720
tgactaccgg cagcccgcc 739
<210> 119
<211> 1012
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment-LOG11_ATh
<400> 119
ttctttttgc gccaggtagc catagctggt catatgatgg gtgtctcaat gctggattct 60
tcttggtcat ttcgcctttc aagcaagatg tctccaagcc cgacgcaaaa attagccagc 120
tctctgacag aacgcgatcc aatcagctta aatctgcgct tcgaccattc aattagagca 180
tatagcgcaa gagctcttaa gtgcagatct gtcaaatctg aagatttcgt tgaaagatca 240
tcaccatttg aagttaagaa ggagctggaa atttgctttg atcttgtcca tagattaggt 300
agaggcattg tttaccttgg cagcgctaga attccgccga accacagcca ttacctgcag 360
gcacaggaat tatcaagaga agcggcaacg ttacttgact gcacaacgtg gtcaggcgct 420
ggacctggcc ttatggatgc ggtgacggaa ggtgcccttg aggcggaaaa gccggtaggt 480
ggcatcaaaa ttgaaaaaga agcgggcgag tggacggcgt caaaattcca cccgtattta 540
cctccgcaaa attatcatac atgtagattt ttctcagcga gaaaacatgg ccttgtcgat 600
gccgtaatta gaaataatgt ttcagaaaaa acagctatca ttgcactgcc gggcggcatt 660
ggaacattag atgagatgtt cgaaatcctg gctctgattc aactggagag aattggctca 720
gctctgccgg tgccttttat cgtaatgaac tacgacgcct tttattcaaa actgctggaa 780
tttatcgaga catgtgaaaa tctgggaaca gtttcaaaag gagaagtgtc agcactgtgg 840
aaagtgtgta ataacaactt tgaggccctg acatatctgg cggaatttta tgacctgcct 900
gatggatcag caaaactgga gacagaactg agaaaaacaa cacctacaag aggataaatt 960
aattctagag tcgatccccg ggttcgccag caatgactac cggcagcccg cc 1012
<210> 120
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for AmyE 0 + IPT1 amplification
<400> 120
gcggtagtgg tgcttacgat 20
<210> 121
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for AmyE 0 + IPT1 amplification
<400> 121
gactcgttag ccaggtcgtc 20
<210> 122
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for Amy 0 + IPT1 + LOG2-11 amplification
<400> 122
cggtagtcat tgctggcgaa 20
<210> 123
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for Amy 0 + IPT1 + LOG2-11 amplification
<400> 123
tacgatgtac gacaggggga 20
<210> 124
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for erythromycin resistance cassette amplification
<400> 124
aggatccatc tacattccct ttagt 25
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for erythromycin resistance cassette amplification
<400> 125
cgcgtaacgg ttttcactgg 20
<210> 126
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for EryR + AmyE END operon amplification
<400> 126
aaatctagaa attaagaagg agggattcgt ca 32
<210> 127
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for EryR + AmyE END operon amplification
<400> 127
caatggggaa gagaaccgct 20
<210> 128
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for final operon amplification
<400> 128
atctacattc cctttagtaa cgtgt 25
<210> 129
<211> 2355
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1
<400> 129
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgttg aaaaagaggg gagggaaaca ttaatgacga 2340
cctggctaac gagtc 2355
<210> 130
<211> 2966
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG2
<400> 130
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340
aacaatctgt gtattcgctg gcagcaaccc tggcggtaat gaagcttaca agagaaaggc 2400
cgctgaactg ggtgtgtata tggcggaaca gggaatcgga ttagtatacg gtggctctcg 2460
cgtcggactg atgggcacga ttgcagacgc aatcatggag aacggcggca cggcaattgg 2520
agttatgcca tctggattat tttctggaga agttgtccat cagaatctga cagagctgat 2580
tgaggtcaat ggcatgcacg agagaaaagc caaaatgtca gagctggcgg atggtttcat 2640
cagcatgcct ggaggatttg gaacatacga ggagcttttt gaagttcttt gctgggcgca 2700
aattggcatt catcaaaaac cgattggcct gtataatgtg aacggctatt ttgaaccgat 2760
gatgaagatg gtgaaatatt caattcaaga aggctttagc aatgaatcac atcttaaact 2820
gatccactca tcatcaagac cggatgaact gatcgaacaa atgcagaatt attcatatcc 2880
gattttagaa aaaaaatgga cagaaattta aattaattct agagtcgatc cccgggttcg 2940
ccagcaatga ctaccggcag cccgcc 2966
<210> 131
<211> 3161
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG3
<400> 131
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggc 2340
accgaaacag acaccttctc cagaaaaaaa tagaaacctt gtgggtccag tgctgcaacg 2400
ccgccaaaca gagggcacgt ttgaccagcg cctgcttgaa atgagagcag accacaattg 2460
gaagcacgca gacccgtgga gagtgttaag aattcagtca gagtttgttg caggatttga 2520
tgctctgcat gagatgccga aggcggtcac agtgtttgga agcgcgagaa ttaaagagga 2580
tcatccttat tataaagcag gtgttgagct tggagaaaaa cttgttgccg ctgattacgc 2640
ggttgtaacg ggcggaggcc ctggccttat ggaagcaccg aataaaggag cgtcagaagc 2700
caatggctta tcagtcggtt taggtattga acttcctcac gagcagcatt taaacccgta 2760
tgtggatctg ggattaaatt ttagatactt ttttgctaga aagacgatgt ttctgaaata 2820
ttcacaagct tttgtctgtc tgccgggcgg cttcggaaca ctggacgaac tgttcgaagt 2880
gctgtgcatg gtccaaacag gcaaagttac aaacttcccg attgtactga tcggcacaga 2940
attctgggct ggcctggttg actggatcag acatagactg gtcgaagaag gcatgattga 3000
tgaaaaagat gtagacagaa tgctggtaac agatgatctg gatcaagccg ttaagttcat 3060
cgtcgatgcc catgccggcc tggatgtagc gagaagacat aactaaatta attctagagt 3120
cgatccccgg gttcgccagc aatgactacc ggcagcccgc c 3161
<210> 132
<211> 2978
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG4
<400> 132
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgac 2340
gcttagatca gtctgtgtgt tctgcggcgc gagcccggga gcttctccgg tttatcaaga 2400
agctgctgtg gcccttggta gacatttagc ggaacgcgga ctgacgttag tatatggcgg 2460
aggtgccgta ggactgatgg gtacagtggc cgacgccgct ctggcggcgg gcggagaagt 2520
tattggtatt atccctcaat cacttcagga ggccgaaatt ggccataaag gcttaacaag 2580
attagaagtt gtagatggca tgcatgcacg caaggctaga atggctgagt tagctgatgc 2640
ctttatcgcg cttccgggcg gacttggaac acttgaggaa ctgtttgagg tctggacatg 2700
gggccagtta ggctaccacg caaaaccact gggcctgctg gaagttaatg gcttctatga 2760
tcctctgctg acatttctgg accacctggt cgatgaaaga tttgtgagag cggaacatag 2820
aggcatgctg cagagaggag cgtcacctga agcactgctg gacgcactgg cagcatggac 2880
accgtcagtc gcaccgaaat gggttgatag aacaccacaa taaattaatt ctagagtcga 2940
tccccgggtt cgccagcaat gactaccggc agcccgcc 2978
<210> 133
<211> 3161
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG5
<400> 133
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340
cagcgttgac gaccctggtt catacgaaca gattggcagc gagaagccgg caaagcataa 2400
aggctctgtt gtactgcgca gaggcagaaa tacggaaaca tctacgtcag accaacgctt 2460
attagatgaa agaggttcag gtaattggat ccattctgat acgtggcgcg tcttacgcat 2520
tcagagcgaa tttgtggaag gctttggtgc gctggccgaa gttcctagag ctgtcacagt 2580
attcggcagc gccagaacgc cagtcgatca cccggaatac gagagagcta gagagttagg 2640
agccgcgctt gctagagaag gatttgcggt aattacaggc ggtggaccag gcgtcatgga 2700
gggagctaac agaggagcgt cagaggcgga tggctattca attggccttg gcatcgagct 2760
gccgttcgaa caaggcttaa acgactgggt agatcttgga gtgaatttca gatatttttt 2820
tgtaagaaaa acaatgttcg tgaaatattc acaggccttt gtgtgccttc cgggcggctt 2880
tggaacactg gacgaactgt ttgaagcact gacacttgtt caaacagcaa aagtcacaag 2940
atttccgatt gttctgctgg gaaaggactt ctggtcagga ctgctggatt ggattaaaac 3000
aacactggtt aaagagggca aagtctcaga aaaagatctg gatctgatcc attgtacaga 3060
ttcagtggat gaagcagtga gaatcgttag agaagcacaa cagtaaatta attctagagt 3120
cgatccccgg gttcgccagc aatgactacc ggcagcccgc c 3161
<210> 134
<211> 2987
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG6
<400> 134
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340
tttacgcccg atgcctgcca cgacggttag cgcccaagca agaccaacgc caaagtcagt 2400
tacggtgttc tgcggagcta tgccgggtag aggaacaaaa tacggtcaac ttgctgaggg 2460
catgggtaga gctattgcta gaagcaaatt aagacttgta tatggaggag cgagagtcgg 2520
ccttatggga acactggcaa acgcagcctt agactctggc ggtacagtcg ttggagtcat 2580
tcctgaatca tttacagcta tccctgaagc cgcccaccac ggactgacag aactgcatgt 2640
agtgcacgat atgcatcaaa gaaaagcctt aatggctgag ctgggcgatg cattcattgc 2700
acttcctggc ggcgtcggca cagcggagga gttttttgag gtgctgacat ggagccatct 2760
gggcctgcat aacaaaccgt gcgttctgct gaatgataat gaatactata gaccgctgct 2820
gtcatatatt gaacatgcag cggtcgaagg ctttatcaca cctgcgacaa gatcaagagt 2880
aatcgtgtgt aaagacattg aaggcgcgat tgcggcgatt agatcaccgt aaattaattc 2940
tagagtcgat ccccgggttc gccagcaatg actaccggca gcccgcc 2987
<210> 135
<211> 2954
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG7
<400> 135
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340
atcagtagcg atttattgcg gatcatcaat gggatctagc cctagatatg cagaagtagc 2400
taaagagatg ggagaggaac ttgcaagacg caatctgaga gtagtgtatg gaggaggaaa 2460
cgtcggactg atgggtacag tggccgacgc agcgttagcg gccggtggcg aggtggtagg 2520
cgtaattcca agacagttaa ttaaccgcga gatggcacat gccggtctga cagatttaga 2580
agtggtggac acaatggcgc agagaaaaac gagaatggag gaacttgccg atgcttttgt 2640
gtgtctgcct ggcggtgttg gcacgctgga agaagtcgtt gaagttctta caatgcaaca 2700
acttggccac gtccaaggcc cggtcggcct ggttaatgtt gacggctttt gggaaccgtt 2760
tgtcagaaca ctggaatcaa tggtcgcttg cggcttcgtt cagtcaagat acatcgatgc 2820
tatcgcactg tcttcagatc cggctgaaat tctggatgaa ttcgcaggct ggagcccgat 2880
cggcgcgaag tggagctaaa ttaattctag agtcgatccc cgggttcgcc agcaatgact 2940
accggcagcc cgcc 2954
<210> 136
<211> 3218
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG8
<400> 136
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggc 2340
ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400
aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460
atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520
gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580
taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640
gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700
cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760
cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820
ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880
cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940
aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000
agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060
gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120
aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagagtcga 3180
tccccgggtt cgccagcaat gactaccggc agcccgcc 3218
<210> 137
<211> 3122
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG9
<400> 137
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgtt 2340
attacatctt atttacggac ctacatgttc aggaaaaaca gacatggcca ttcaaattgc 2400
tcaagaaacg ggatggccgg ttgtggcgtt agacagagta cagtgctgcc cacagattgc 2460
aacgggctca ggtagaccgt tagaatctga gttacaatca acaagaagaa tctatctgga 2520
ttcacgccca ctgacagagg gcatcctgga cgcagagagc gcgcaccgcc gccttatctt 2580
tgaagtcgat tggcgcaaat ctgaggaggg ccttatcctt gaaggaggaa gcattagcct 2640
gcttaattgt atggcaaaat caccgttttg gagatctggc ttccagtggc acgtaaagag 2700
actgagactt ggcgattcag acgcatttct gacaagagca aaacagagag tcgcagaaat 2760
gttcgcgatt agagaagaca gaccaagcct gctggaggaa ttagctgaac tgtggaacta 2820
tccggctgcg cgccctattc tggaggatat tgatggttat cgctgtgcga ttagatttgc 2880
tagaaagcat gatctggcta tttcacaact gcctaatatc gatgcgggaa gacatgttga 2940
actgattgaa gccatcgcca acgaatacct ggaacatgcc ctgtcacagg aaagagattt 3000
tcctcaatgg ccggaagatg gtgccggcca accggtttgc ccggtgacac tgacaagaat 3060
tagataaatt aattctagag tcgatccccg ggttcgccag caatgactac cggcagcccg 3120
cc 3122
<210> 138
<211> 3038
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG10
<400> 138
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgga 2340
gattaaggga gagagcatgc aaaagtcaaa gttcagacgc atttgtgtgt tttgcggttc 2400
atcacagggc aaaaagtctt catatcaaga tgctgcagtt gatctgggta acgaattagt 2460
aagcagaaac atcgatcttg tctacggcgg tggctctatt ggacttatgg gcttagtgtc 2520
tcaagcagtc catgacggcg gtagacatgt catcggcatt attcctaaaa cgttaatgcc 2580
gcgcgagctg acaggcgaaa cagtaggaga ggtaagagcg gtggccgaca tgcatcaaag 2640
aaaagcggaa atggccaaac acagcgacgc atttattgct ttaccgggcg gctacggaac 2700
actggaagaa cttcttgagg tcatcacgtg ggcccagctg ggcattcatg ataaaccagt 2760
gggactgctg aatgtggatg gctattataa tagcctgctg tcatttattg ataaagcggt 2820
tgaagaagga ttcatttcac cgacggcaag agaaatcatt gtttcagcgc ctacagctaa 2880
agaactggtt aaaaaactgg aagagtatgc gccgtgccat gaaagagttg ctacaaaact 2940
gtgttgggaa atggagagaa tcggatattc atcagaagaa taaattaatt ctagagtcga 3000
tccccgggtt cgccagcaat gactaccggc agcccgcc 3038
<210> 139
<211> 3311
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT1 + LOG11
<400> 139
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggg 2340
tgtctcaatg ctggattctt cttggtcatt tcgcctttca agcaagatgt ctccaagccc 2400
gacgcaaaaa ttagccagct ctctgacaga acgcgatcca atcagcttaa atctgcgctt 2460
cgaccattca attagagcat atagcgcaag agctcttaag tgcagatctg tcaaatctga 2520
agatttcgtt gaaagatcat caccatttga agttaagaag gagctggaaa tttgctttga 2580
tcttgtccat agattaggta gaggcattgt ttaccttggc agcgctagaa ttccgccgaa 2640
ccacagccat tacctgcagg cacaggaatt atcaagagaa gcggcaacgt tacttgactg 2700
cacaacgtgg tcaggcgctg gacctggcct tatggatgcg gtgacggaag gtgcccttga 2760
ggcggaaaag ccggtaggtg gcatcaaaat tgaaaaagaa gcgggcgagt ggacggcgtc 2820
aaaattccac ccgtatttac ctccgcaaaa ttatcataca tgtagatttt tctcagcgag 2880
aaaacatggc cttgtcgatg ccgtaattag aaataatgtt tcagaaaaaa cagctatcat 2940
tgcactgccg ggcggcattg gaacattaga tgagatgttc gaaatcctgg ctctgattca 3000
actggagaga attggctcag ctctgccggt gccttttatc gtaatgaact acgacgcctt 3060
ttattcaaaa ctgctggaat ttatcgagac atgtgaaaat ctgggaacag tttcaaaagg 3120
agaagtgtca gcactgtgga aagtgtgtaa taacaacttt gaggccctga catatctggc 3180
ggaattttat gacctgcctg atggatcagc aaaactggag acagaactga gaaaaacaac 3240
acctacaaga ggataaatta attctagagt cgatccccgg gttcgccagc aatgactacc 3300
ggcagcccgc c 3311
<210> 140
<211> 2093
<212> DNA
<213> Artificial Sequence
<220>
<223> operon EryR + AmyE END
<400> 140
attaattcta gaaattaaga aggagggatt cgtcatgttg gtattccaaa tgcgttatgt 60
agataaaaca tctactgttt tgaaacagac taaaaacagt gattacgcag ataaataaat 120
acgttagatt aattcctacc agtgactaat cttatgactt tttaaacaga taactaaaat 180
tacaaacaaa tcgtttaact tctgtatttg tttatagatg taatcacttc aggagtgatt 240
acatgaacaa aaatataaaa tattctcaaa actttttaac gagtgaaaaa gtactcaacc 300
aaataataaa acaattgaat ttaaaagaaa ccgataccgt ttacgaaatt ggaacaggta 360
aagggcattt aacgacgaaa ctggctaaaa taagtaaaca ggtaacgtct attgaattag 420
acagtcatct attcaactta tcgtcagaaa aattaaaact gaacattcgt gtcactttaa 480
ttcaccaaga tattctacag tttcaattcc ctaacaaaca gaggtataaa attgttggga 540
atattcctta ccatttaagc acacaaatta ttaaaaaagt ggtttttgaa agccatgcgt 600
ctgacatcta tctgattgtt gaagaaggat tctacaagcg taccttggat attcaccgaa 660
cactagggtt gctcttgcac actcaagtct cgattcagca attgcttaag ctgccagcgg 720
aatgctttca tcctaaacca aaagtaaaca gtgtcttaat aaaacttacc cgccatacca 780
cagatgttcc agataaatat tggaagctat atacgtactt tgtttcaaaa tgggtcaatc 840
gagaatatcg tcaactgttt actaaaaatc agtttcatca agcaatgaaa cacgccaaag 900
taaacaattt aagtaccgtt acttatgagc aagtattgtc tatttttaat agttatctat 960
tatttaacgg gaggaaataa ttctatgagt cgcttttgta aatttggaaa gttacacgtt 1020
actaaaggga atgtagatgg atcctgtatg ccaatgatga tgaagagtcg acatggatga 1080
gcgatgatga tatccgttta ggctgggcgg tgatagcttc tcgttcaggc agtacgcctc 1140
ttttcttttc cagacctgag ggaggcggaa atggtgtgag gttcccgggg aaaagccaaa 1200
taggcgatcg cgggagtgct ttatttgaag atcaggctat cactgcggtc aatagatttc 1260
acaatgtgat ggctggacag cctgaggaac tctcgaaccc gaatggaaac aaccagatat 1320
ttatgaatca gcgcggctca catggcgttg tgctggcaaa tgcaggttca tcctctgtct 1380
ctatcaatac ggcaacaaaa ttgcctgatg gcaggtatga caataaagct ggagcgggtt 1440
catttcaagt gaacgatggt aaactgacag gcacgatcaa tgccaggtct gtagctgtgc 1500
tttatcctga tgatattgca aaagcgcctc atgttttcct tgagaattac aaaacaggtg 1560
taacacattc tttcaatgat caactgacga ttaccttgcg tgcagatgcg aatacaacaa 1620
aagccgttta tcaaatcaat aatggaccag agacggcgtt taaggatgga gatcaattca 1680
caatcggaaa aggagatcca tttggcaaaa catacaccat catgttaaaa ggaacgaaca 1740
gtgatggtgt aacgaggacc gagaaataca gttttgttaa aagagatcca gcgtcggcca 1800
aaaccatcgg ctatcaaaat ccgaatcatt ggagccaggt aaatgcttat atctataaac 1860
atgatgggag ccgagtaatt gaattgaccg gatcttggcc tggaaaacca atgactaaaa 1920
atgcagacgg aatttacacg ctgacgctgc ctgcggacac ggatacaacc aacgcaaaag 1980
tgatttttaa taatggcagc gcccaagtgc ccggtcagaa tcagcctggc tttgattacg 2040
tgctaaatgg tttatataat gactcgggct taagcggttc tcttccccat tga 2093
<210> 141
<211> 5003
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG2 EryR AmyE END operon
<400> 141
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340
aacaatctgt gtattcgctg gcagcaaccc tggcggtaat gaagcttaca agagaaaggc 2400
cgctgaactg ggtgtgtata tggcggaaca gggaatcgga ttagtatacg gtggctctcg 2460
cgtcggactg atgggcacga ttgcagacgc aatcatggag aacggcggca cggcaattgg 2520
agttatgcca tctggattat tttctggaga agttgtccat cagaatctga cagagctgat 2580
tgaggtcaat ggcatgcacg agagaaaagc caaaatgtca gagctggcgg atggtttcat 2640
cagcatgcct ggaggatttg gaacatacga ggagcttttt gaagttcttt gctgggcgca 2700
aattggcatt catcaaaaac cgattggcct gtataatgtg aacggctatt ttgaaccgat 2760
gatgaagatg gtgaaatatt caattcaaga aggctttagc aatgaatcac atcttaaact 2820
gatccactca tcatcaagac cggatgaact gatcgaacaa atgcagaatt attcatatcc 2880
gattttagaa aaaaaatgga cagaaattta aattaattct agaaattaag aaggagggat 2940
tcgtcatgtt ggtattccaa atgcgttatg tagataaaac atctactgtt ttgaaacaga 3000
ctaaaaacag tgattacgca gataaataaa tacgttagat taattcctac cagtgactaa 3060
tcttatgact ttttaaacag ataactaaaa ttacaaacaa atcgtttaac ttctgtattt 3120
gtttatagat gtaatcactt caggagtgat tacatgaaca aaaatataaa atattctcaa 3180
aactttttaa cgagtgaaaa agtactcaac caaataataa aacaattgaa tttaaaagaa 3240
accgataccg tttacgaaat tggaacaggt aaagggcatt taacgacgaa actggctaaa 3300
ataagtaaac aggtaacgtc tattgaatta gacagtcatc tattcaactt atcgtcagaa 3360
aaattaaaac tgaacattcg tgtcacttta attcaccaag atattctaca gtttcaattc 3420
cctaacaaac agaggtataa aattgttggg aatattcctt accatttaag cacacaaatt 3480
attaaaaaag tggtttttga aagccatgcg tctgacatct atctgattgt tgaagaagga 3540
ttctacaagc gtaccttgga tattcaccga acactagggt tgctcttgca cactcaagtc 3600
tcgattcagc aattgcttaa gctgccagcg gaatgctttc atcctaaacc aaaagtaaac 3660
agtgtcttaa taaaacttac ccgccatacc acagatgttc cagataaata ttggaagcta 3720
tatacgtact ttgtttcaaa atgggtcaat cgagaatatc gtcaactgtt tactaaaaat 3780
cagtttcatc aagcaatgaa acacgccaaa gtaaacaatt taagtaccgt tacttatgag 3840
caagtattgt ctatttttaa tagttatcta ttatttaacg ggaggaaata attctatgag 3900
tcgcttttgt aaatttggaa agttacacgt tactaaaggg aatgtagatg gatcctgtat 3960
gccaatgatg atgaagagtc gacatggatg agcgatgatg atatccgttt aggctgggcg 4020
gtgatagctt ctcgttcagg cagtacgcct cttttctttt ccagacctga gggaggcgga 4080
aatggtgtga ggttcccggg gaaaagccaa ataggcgatc gcgggagtgc tttatttgaa 4140
gatcaggcta tcactgcggt caatagattt cacaatgtga tggctggaca gcctgaggaa 4200
ctctcgaacc cgaatggaaa caaccagata tttatgaatc agcgcggctc acatggcgtt 4260
gtgctggcaa atgcaggttc atcctctgtc tctatcaata cggcaacaaa attgcctgat 4320
ggcaggtatg acaataaagc tggagcgggt tcatttcaag tgaacgatgg taaactgaca 4380
ggcacgatca atgccaggtc tgtagctgtg ctttatcctg atgatattgc aaaagcgcct 4440
catgttttcc ttgagaatta caaaacaggt gtaacacatt ctttcaatga tcaactgacg 4500
attaccttgc gtgcagatgc gaatacaaca aaagccgttt atcaaatcaa taatggacca 4560
gagacggcgt ttaaggatgg agatcaattc acaatcggaa aaggagatcc atttggcaaa 4620
acatacacca tcatgttaaa aggaacgaac agtgatggtg taacgaggac cgagaaatac 4680
agttttgtta aaagagatcc agcgtcggcc aaaaccatcg gctatcaaaa tccgaatcat 4740
tggagccagg taaatgctta tatctataaa catgatggga gccgagtaat tgaattgacc 4800
ggatcttggc ctggaaaacc aatgactaaa aatgcagacg gaatttacac gctgacgctg 4860
cctgcggaca cggatacaac caacgcaaaa gtgattttta ataatggcag cgcccaagtg 4920
cccggtcaga atcagcctgg ctttgattac gtgctaaatg gtttatataa tgactcgggc 4980
ttaagcggtt ctcttcccca ttg 5003
<210> 142
<211> 5198
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG3 EryR AmyE END operon
<400> 142
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggc 2340
accgaaacag acaccttctc cagaaaaaaa tagaaacctt gtgggtccag tgctgcaacg 2400
ccgccaaaca gagggcacgt ttgaccagcg cctgcttgaa atgagagcag accacaattg 2460
gaagcacgca gacccgtgga gagtgttaag aattcagtca gagtttgttg caggatttga 2520
tgctctgcat gagatgccga aggcggtcac agtgtttgga agcgcgagaa ttaaagagga 2580
tcatccttat tataaagcag gtgttgagct tggagaaaaa cttgttgccg ctgattacgc 2640
ggttgtaacg ggcggaggcc ctggccttat ggaagcaccg aataaaggag cgtcagaagc 2700
caatggctta tcagtcggtt taggtattga acttcctcac gagcagcatt taaacccgta 2760
tgtggatctg ggattaaatt ttagatactt ttttgctaga aagacgatgt ttctgaaata 2820
ttcacaagct tttgtctgtc tgccgggcgg cttcggaaca ctggacgaac tgttcgaagt 2880
gctgtgcatg gtccaaacag gcaaagttac aaacttcccg attgtactga tcggcacaga 2940
attctgggct ggcctggttg actggatcag acatagactg gtcgaagaag gcatgattga 3000
tgaaaaagat gtagacagaa tgctggtaac agatgatctg gatcaagccg ttaagttcat 3060
cgtcgatgcc catgccggcc tggatgtagc gagaagacat aactaaatta attctagaaa 3120
ttaagaagga gggattcgtc atgttggtat tccaaatgcg ttatgtagat aaaacatcta 3180
ctgttttgaa acagactaaa aacagtgatt acgcagataa ataaatacgt tagattaatt 3240
cctaccagtg actaatctta tgacttttta aacagataac taaaattaca aacaaatcgt 3300
ttaacttctg tatttgttta tagatgtaat cacttcagga gtgattacat gaacaaaaat 3360
ataaaatatt ctcaaaactt tttaacgagt gaaaaagtac tcaaccaaat aataaaacaa 3420
ttgaatttaa aagaaaccga taccgtttac gaaattggaa caggtaaagg gcatttaacg 3480
acgaaactgg ctaaaataag taaacaggta acgtctattg aattagacag tcatctattc 3540
aacttatcgt cagaaaaatt aaaactgaac attcgtgtca ctttaattca ccaagatatt 3600
ctacagtttc aattccctaa caaacagagg tataaaattg ttgggaatat tccttaccat 3660
ttaagcacac aaattattaa aaaagtggtt tttgaaagcc atgcgtctga catctatctg 3720
attgttgaag aaggattcta caagcgtacc ttggatattc accgaacact agggttgctc 3780
ttgcacactc aagtctcgat tcagcaattg cttaagctgc cagcggaatg ctttcatcct 3840
aaaccaaaag taaacagtgt cttaataaaa cttacccgcc ataccacaga tgttccagat 3900
aaatattgga agctatatac gtactttgtt tcaaaatggg tcaatcgaga atatcgtcaa 3960
ctgtttacta aaaatcagtt tcatcaagca atgaaacacg ccaaagtaaa caatttaagt 4020
accgttactt atgagcaagt attgtctatt tttaatagtt atctattatt taacgggagg 4080
aaataattct atgagtcgct tttgtaaatt tggaaagtta cacgttacta aagggaatgt 4140
agatggatcc tgtatgccaa tgatgatgaa gagtcgacat ggatgagcga tgatgatatc 4200
cgtttaggct gggcggtgat agcttctcgt tcaggcagta cgcctctttt cttttccaga 4260
cctgagggag gcggaaatgg tgtgaggttc ccggggaaaa gccaaatagg cgatcgcggg 4320
agtgctttat ttgaagatca ggctatcact gcggtcaata gatttcacaa tgtgatggct 4380
ggacagcctg aggaactctc gaacccgaat ggaaacaacc agatatttat gaatcagcgc 4440
ggctcacatg gcgttgtgct ggcaaatgca ggttcatcct ctgtctctat caatacggca 4500
acaaaattgc ctgatggcag gtatgacaat aaagctggag cgggttcatt tcaagtgaac 4560
gatggtaaac tgacaggcac gatcaatgcc aggtctgtag ctgtgcttta tcctgatgat 4620
attgcaaaag cgcctcatgt tttccttgag aattacaaaa caggtgtaac acattctttc 4680
aatgatcaac tgacgattac cttgcgtgca gatgcgaata caacaaaagc cgtttatcaa 4740
atcaataatg gaccagagac ggcgtttaag gatggagatc aattcacaat cggaaaagga 4800
gatccatttg gcaaaacata caccatcatg ttaaaaggaa cgaacagtga tggtgtaacg 4860
aggaccgaga aatacagttt tgttaaaaga gatccagcgt cggccaaaac catcggctat 4920
caaaatccga atcattggag ccaggtaaat gcttatatct ataaacatga tgggagccga 4980
gtaattgaat tgaccggatc ttggcctgga aaaccaatga ctaaaaatgc agacggaatt 5040
tacacgctga cgctgcctgc ggacacggat acaaccaacg caaaagtgat ttttaataat 5100
ggcagcgccc aagtgcccgg tcagaatcag cctggctttg attacgtgct aaatggttta 5160
tataatgact cgggcttaag cggttctctt ccccattg 5198
<210> 143
<211> 5015
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG4 EryR AmyE END operon
<400> 143
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgac 2340
gcttagatca gtctgtgtgt tctgcggcgc gagcccggga gcttctccgg tttatcaaga 2400
agctgctgtg gcccttggta gacatttagc ggaacgcgga ctgacgttag tatatggcgg 2460
aggtgccgta ggactgatgg gtacagtggc cgacgccgct ctggcggcgg gcggagaagt 2520
tattggtatt atccctcaat cacttcagga ggccgaaatt ggccataaag gcttaacaag 2580
attagaagtt gtagatggca tgcatgcacg caaggctaga atggctgagt tagctgatgc 2640
ctttatcgcg cttccgggcg gacttggaac acttgaggaa ctgtttgagg tctggacatg 2700
gggccagtta ggctaccacg caaaaccact gggcctgctg gaagttaatg gcttctatga 2760
tcctctgctg acatttctgg accacctggt cgatgaaaga tttgtgagag cggaacatag 2820
aggcatgctg cagagaggag cgtcacctga agcactgctg gacgcactgg cagcatggac 2880
accgtcagtc gcaccgaaat gggttgatag aacaccacaa taaattaatt ctagaaatta 2940
agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3000
ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3060
accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3120
acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3180
aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3240
aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3300
aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3360
ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3420
cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3480
agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3540
gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3600
cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3660
ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3720
tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 3780
tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 3840
gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 3900
taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 3960
tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4020
ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4080
gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4140
gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4200
cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4260
tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4320
aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4380
ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4440
gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4500
gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4560
aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4620
ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4680
accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4740
aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 4800
attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 4860
acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 4920
agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 4980
aatgactcgg gcttaagcgg ttctcttccc cattg 5015
<210> 144
<211> 5198
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG5 EryR AmyE END operon
<400> 144
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340
cagcgttgac gaccctggtt catacgaaca gattggcagc gagaagccgg caaagcataa 2400
aggctctgtt gtactgcgca gaggcagaaa tacggaaaca tctacgtcag accaacgctt 2460
attagatgaa agaggttcag gtaattggat ccattctgat acgtggcgcg tcttacgcat 2520
tcagagcgaa tttgtggaag gctttggtgc gctggccgaa gttcctagag ctgtcacagt 2580
attcggcagc gccagaacgc cagtcgatca cccggaatac gagagagcta gagagttagg 2640
agccgcgctt gctagagaag gatttgcggt aattacaggc ggtggaccag gcgtcatgga 2700
gggagctaac agaggagcgt cagaggcgga tggctattca attggccttg gcatcgagct 2760
gccgttcgaa caaggcttaa acgactgggt agatcttgga gtgaatttca gatatttttt 2820
tgtaagaaaa acaatgttcg tgaaatattc acaggccttt gtgtgccttc cgggcggctt 2880
tggaacactg gacgaactgt ttgaagcact gacacttgtt caaacagcaa aagtcacaag 2940
atttccgatt gttctgctgg gaaaggactt ctggtcagga ctgctggatt ggattaaaac 3000
aacactggtt aaagagggca aagtctcaga aaaagatctg gatctgatcc attgtacaga 3060
ttcagtggat gaagcagtga gaatcgttag agaagcacaa cagtaaatta attctagaaa 3120
ttaagaagga gggattcgtc atgttggtat tccaaatgcg ttatgtagat aaaacatcta 3180
ctgttttgaa acagactaaa aacagtgatt acgcagataa ataaatacgt tagattaatt 3240
cctaccagtg actaatctta tgacttttta aacagataac taaaattaca aacaaatcgt 3300
ttaacttctg tatttgttta tagatgtaat cacttcagga gtgattacat gaacaaaaat 3360
ataaaatatt ctcaaaactt tttaacgagt gaaaaagtac tcaaccaaat aataaaacaa 3420
ttgaatttaa aagaaaccga taccgtttac gaaattggaa caggtaaagg gcatttaacg 3480
acgaaactgg ctaaaataag taaacaggta acgtctattg aattagacag tcatctattc 3540
aacttatcgt cagaaaaatt aaaactgaac attcgtgtca ctttaattca ccaagatatt 3600
ctacagtttc aattccctaa caaacagagg tataaaattg ttgggaatat tccttaccat 3660
ttaagcacac aaattattaa aaaagtggtt tttgaaagcc atgcgtctga catctatctg 3720
attgttgaag aaggattcta caagcgtacc ttggatattc accgaacact agggttgctc 3780
ttgcacactc aagtctcgat tcagcaattg cttaagctgc cagcggaatg ctttcatcct 3840
aaaccaaaag taaacagtgt cttaataaaa cttacccgcc ataccacaga tgttccagat 3900
aaatattgga agctatatac gtactttgtt tcaaaatggg tcaatcgaga atatcgtcaa 3960
ctgtttacta aaaatcagtt tcatcaagca atgaaacacg ccaaagtaaa caatttaagt 4020
accgttactt atgagcaagt attgtctatt tttaatagtt atctattatt taacgggagg 4080
aaataattct atgagtcgct tttgtaaatt tggaaagtta cacgttacta aagggaatgt 4140
agatggatcc tgtatgccaa tgatgatgaa gagtcgacat ggatgagcga tgatgatatc 4200
cgtttaggct gggcggtgat agcttctcgt tcaggcagta cgcctctttt cttttccaga 4260
cctgagggag gcggaaatgg tgtgaggttc ccggggaaaa gccaaatagg cgatcgcggg 4320
agtgctttat ttgaagatca ggctatcact gcggtcaata gatttcacaa tgtgatggct 4380
ggacagcctg aggaactctc gaacccgaat ggaaacaacc agatatttat gaatcagcgc 4440
ggctcacatg gcgttgtgct ggcaaatgca ggttcatcct ctgtctctat caatacggca 4500
acaaaattgc ctgatggcag gtatgacaat aaagctggag cgggttcatt tcaagtgaac 4560
gatggtaaac tgacaggcac gatcaatgcc aggtctgtag ctgtgcttta tcctgatgat 4620
attgcaaaag cgcctcatgt tttccttgag aattacaaaa caggtgtaac acattctttc 4680
aatgatcaac tgacgattac cttgcgtgca gatgcgaata caacaaaagc cgtttatcaa 4740
atcaataatg gaccagagac ggcgtttaag gatggagatc aattcacaat cggaaaagga 4800
gatccatttg gcaaaacata caccatcatg ttaaaaggaa cgaacagtga tggtgtaacg 4860
aggaccgaga aatacagttt tgttaaaaga gatccagcgt cggccaaaac catcggctat 4920
caaaatccga atcattggag ccaggtaaat gcttatatct ataaacatga tgggagccga 4980
gtaattgaat tgaccggatc ttggcctgga aaaccaatga ctaaaaatgc agacggaatt 5040
tacacgctga cgctgcctgc ggacacggat acaaccaacg caaaagtgat ttttaataat 5100
ggcagcgccc aagtgcccgg tcagaatcag cctggctttg attacgtgct aaatggttta 5160
tataatgact cgggcttaag cggttctctt ccccattg 5198
<210> 145
<211> 5024
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG6 EryR AmyE END operon
<400> 145
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340
tttacgcccg atgcctgcca cgacggttag cgcccaagca agaccaacgc caaagtcagt 2400
tacggtgttc tgcggagcta tgccgggtag aggaacaaaa tacggtcaac ttgctgaggg 2460
catgggtaga gctattgcta gaagcaaatt aagacttgta tatggaggag cgagagtcgg 2520
ccttatggga acactggcaa acgcagcctt agactctggc ggtacagtcg ttggagtcat 2580
tcctgaatca tttacagcta tccctgaagc cgcccaccac ggactgacag aactgcatgt 2640
agtgcacgat atgcatcaaa gaaaagcctt aatggctgag ctgggcgatg cattcattgc 2700
acttcctggc ggcgtcggca cagcggagga gttttttgag gtgctgacat ggagccatct 2760
gggcctgcat aacaaaccgt gcgttctgct gaatgataat gaatactata gaccgctgct 2820
gtcatatatt gaacatgcag cggtcgaagg ctttatcaca cctgcgacaa gatcaagagt 2880
aatcgtgtgt aaagacattg aaggcgcgat tgcggcgatt agatcaccgt aaattaattc 2940
tagaaattaa gaaggaggga ttcgtcatgt tggtattcca aatgcgttat gtagataaaa 3000
catctactgt tttgaaacag actaaaaaca gtgattacgc agataaataa atacgttaga 3060
ttaattccta ccagtgacta atcttatgac tttttaaaca gataactaaa attacaaaca 3120
aatcgtttaa cttctgtatt tgtttataga tgtaatcact tcaggagtga ttacatgaac 3180
aaaaatataa aatattctca aaacttttta acgagtgaaa aagtactcaa ccaaataata 3240
aaacaattga atttaaaaga aaccgatacc gtttacgaaa ttggaacagg taaagggcat 3300
ttaacgacga aactggctaa aataagtaaa caggtaacgt ctattgaatt agacagtcat 3360
ctattcaact tatcgtcaga aaaattaaaa ctgaacattc gtgtcacttt aattcaccaa 3420
gatattctac agtttcaatt ccctaacaaa cagaggtata aaattgttgg gaatattcct 3480
taccatttaa gcacacaaat tattaaaaaa gtggtttttg aaagccatgc gtctgacatc 3540
tatctgattg ttgaagaagg attctacaag cgtaccttgg atattcaccg aacactaggg 3600
ttgctcttgc acactcaagt ctcgattcag caattgctta agctgccagc ggaatgcttt 3660
catcctaaac caaaagtaaa cagtgtctta ataaaactta cccgccatac cacagatgtt 3720
ccagataaat attggaagct atatacgtac tttgtttcaa aatgggtcaa tcgagaatat 3780
cgtcaactgt ttactaaaaa tcagtttcat caagcaatga aacacgccaa agtaaacaat 3840
ttaagtaccg ttacttatga gcaagtattg tctattttta atagttatct attatttaac 3900
gggaggaaat aattctatga gtcgcttttg taaatttgga aagttacacg ttactaaagg 3960
gaatgtagat ggatcctgta tgccaatgat gatgaagagt cgacatggat gagcgatgat 4020
gatatccgtt taggctgggc ggtgatagct tctcgttcag gcagtacgcc tcttttcttt 4080
tccagacctg agggaggcgg aaatggtgtg aggttcccgg ggaaaagcca aataggcgat 4140
cgcgggagtg ctttatttga agatcaggct atcactgcgg tcaatagatt tcacaatgtg 4200
atggctggac agcctgagga actctcgaac ccgaatggaa acaaccagat atttatgaat 4260
cagcgcggct cacatggcgt tgtgctggca aatgcaggtt catcctctgt ctctatcaat 4320
acggcaacaa aattgcctga tggcaggtat gacaataaag ctggagcggg ttcatttcaa 4380
gtgaacgatg gtaaactgac aggcacgatc aatgccaggt ctgtagctgt gctttatcct 4440
gatgatattg caaaagcgcc tcatgttttc cttgagaatt acaaaacagg tgtaacacat 4500
tctttcaatg atcaactgac gattaccttg cgtgcagatg cgaatacaac aaaagccgtt 4560
tatcaaatca ataatggacc agagacggcg tttaaggatg gagatcaatt cacaatcgga 4620
aaaggagatc catttggcaa aacatacacc atcatgttaa aaggaacgaa cagtgatggt 4680
gtaacgagga ccgagaaata cagttttgtt aaaagagatc cagcgtcggc caaaaccatc 4740
ggctatcaaa atccgaatca ttggagccag gtaaatgctt atatctataa acatgatggg 4800
agccgagtaa ttgaattgac cggatcttgg cctggaaaac caatgactaa aaatgcagac 4860
ggaatttaca cgctgacgct gcctgcggac acggatacaa ccaacgcaaa agtgattttt 4920
aataatggca gcgcccaagt gcccggtcag aatcagcctg gctttgatta cgtgctaaat 4980
ggtttatata atgactcggg cttaagcggt tctcttcccc attg 5024
<210> 146
<211> 4991
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG7 EryR AmyE END operon
<400> 146
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340
atcagtagcg atttattgcg gatcatcaat gggatctagc cctagatatg cagaagtagc 2400
taaagagatg ggagaggaac ttgcaagacg caatctgaga gtagtgtatg gaggaggaaa 2460
cgtcggactg atgggtacag tggccgacgc agcgttagcg gccggtggcg aggtggtagg 2520
cgtaattcca agacagttaa ttaaccgcga gatggcacat gccggtctga cagatttaga 2580
agtggtggac acaatggcgc agagaaaaac gagaatggag gaacttgccg atgcttttgt 2640
gtgtctgcct ggcggtgttg gcacgctgga agaagtcgtt gaagttctta caatgcaaca 2700
acttggccac gtccaaggcc cggtcggcct ggttaatgtt gacggctttt gggaaccgtt 2760
tgtcagaaca ctggaatcaa tggtcgcttg cggcttcgtt cagtcaagat acatcgatgc 2820
tatcgcactg tcttcagatc cggctgaaat tctggatgaa ttcgcaggct ggagcccgat 2880
cggcgcgaag tggagctaaa ttaattctag aaattaagaa ggagggattc gtcatgttgg 2940
tattccaaat gcgttatgta gataaaacat ctactgtttt gaaacagact aaaaacagtg 3000
attacgcaga taaataaata cgttagatta attcctacca gtgactaatc ttatgacttt 3060
ttaaacagat aactaaaatt acaaacaaat cgtttaactt ctgtatttgt ttatagatgt 3120
aatcacttca ggagtgatta catgaacaaa aatataaaat attctcaaaa ctttttaacg 3180
agtgaaaaag tactcaacca aataataaaa caattgaatt taaaagaaac cgataccgtt 3240
tacgaaattg gaacaggtaa agggcattta acgacgaaac tggctaaaat aagtaaacag 3300
gtaacgtcta ttgaattaga cagtcatcta ttcaacttat cgtcagaaaa attaaaactg 3360
aacattcgtg tcactttaat tcaccaagat attctacagt ttcaattccc taacaaacag 3420
aggtataaaa ttgttgggaa tattccttac catttaagca cacaaattat taaaaaagtg 3480
gtttttgaaa gccatgcgtc tgacatctat ctgattgttg aagaaggatt ctacaagcgt 3540
accttggata ttcaccgaac actagggttg ctcttgcaca ctcaagtctc gattcagcaa 3600
ttgcttaagc tgccagcgga atgctttcat cctaaaccaa aagtaaacag tgtcttaata 3660
aaacttaccc gccataccac agatgttcca gataaatatt ggaagctata tacgtacttt 3720
gtttcaaaat gggtcaatcg agaatatcgt caactgttta ctaaaaatca gtttcatcaa 3780
gcaatgaaac acgccaaagt aaacaattta agtaccgtta cttatgagca agtattgtct 3840
atttttaata gttatctatt atttaacggg aggaaataat tctatgagtc gcttttgtaa 3900
atttggaaag ttacacgtta ctaaagggaa tgtagatgga tcctgtatgc caatgatgat 3960
gaagagtcga catggatgag cgatgatgat atccgtttag gctgggcggt gatagcttct 4020
cgttcaggca gtacgcctct tttcttttcc agacctgagg gaggcggaaa tggtgtgagg 4080
ttcccgggga aaagccaaat aggcgatcgc gggagtgctt tatttgaaga tcaggctatc 4140
actgcggtca atagatttca caatgtgatg gctggacagc ctgaggaact ctcgaacccg 4200
aatggaaaca accagatatt tatgaatcag cgcggctcac atggcgttgt gctggcaaat 4260
gcaggttcat cctctgtctc tatcaatacg gcaacaaaat tgcctgatgg caggtatgac 4320
aataaagctg gagcgggttc atttcaagtg aacgatggta aactgacagg cacgatcaat 4380
gccaggtctg tagctgtgct ttatcctgat gatattgcaa aagcgcctca tgttttcctt 4440
gagaattaca aaacaggtgt aacacattct ttcaatgatc aactgacgat taccttgcgt 4500
gcagatgcga atacaacaaa agccgtttat caaatcaata atggaccaga gacggcgttt 4560
aaggatggag atcaattcac aatcggaaaa ggagatccat ttggcaaaac atacaccatc 4620
atgttaaaag gaacgaacag tgatggtgta acgaggaccg agaaatacag ttttgttaaa 4680
agagatccag cgtcggccaa aaccatcggc tatcaaaatc cgaatcattg gagccaggta 4740
aatgcttata tctataaaca tgatgggagc cgagtaattg aattgaccgg atcttggcct 4800
ggaaaaccaa tgactaaaaa tgcagacgga atttacacgc tgacgctgcc tgcggacacg 4860
gatacaacca acgcaaaagt gatttttaat aatggcagcg cccaagtgcc cggtcagaat 4920
cagcctggct ttgattacgt gctaaatggt ttatataatg actcgggctt aagcggttct 4980
cttccccatt g 4991
<210> 147
<211> 5255
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG8 EryR AmyE END operon
<400> 147
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggc 2340
ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400
aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460
atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520
gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580
taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640
gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700
cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760
cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820
ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880
cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940
aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000
agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060
gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120
aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagaaatta 3180
agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3240
ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3300
accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3360
acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3420
aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3480
aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3540
aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3600
ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3660
cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3720
agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3780
gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3840
cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3900
ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3960
tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 4020
tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 4080
gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 4140
taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 4200
tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4260
ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4320
gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4380
gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4440
cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4500
tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4560
aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4620
ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4680
gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4740
gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4800
aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4860
ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4920
accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4980
aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 5040
attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 5100
acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 5160
agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 5220
aatgactcgg gcttaagcgg ttctcttccc cattg 5255
<210> 148
<211> 5159
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG9 EryR AmyE END operon
<400> 148
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgtt 2340
attacatctt atttacggac ctacatgttc aggaaaaaca gacatggcca ttcaaattgc 2400
tcaagaaacg ggatggccgg ttgtggcgtt agacagagta cagtgctgcc cacagattgc 2460
aacgggctca ggtagaccgt tagaatctga gttacaatca acaagaagaa tctatctgga 2520
ttcacgccca ctgacagagg gcatcctgga cgcagagagc gcgcaccgcc gccttatctt 2580
tgaagtcgat tggcgcaaat ctgaggaggg ccttatcctt gaaggaggaa gcattagcct 2640
gcttaattgt atggcaaaat caccgttttg gagatctggc ttccagtggc acgtaaagag 2700
actgagactt ggcgattcag acgcatttct gacaagagca aaacagagag tcgcagaaat 2760
gttcgcgatt agagaagaca gaccaagcct gctggaggaa ttagctgaac tgtggaacta 2820
tccggctgcg cgccctattc tggaggatat tgatggttat cgctgtgcga ttagatttgc 2880
tagaaagcat gatctggcta tttcacaact gcctaatatc gatgcgggaa gacatgttga 2940
actgattgaa gccatcgcca acgaatacct ggaacatgcc ctgtcacagg aaagagattt 3000
tcctcaatgg ccggaagatg gtgccggcca accggtttgc ccggtgacac tgacaagaat 3060
tagataaatt aattctagaa attaagaagg agggattcgt catgttggta ttccaaatgc 3120
gttatgtaga taaaacatct actgttttga aacagactaa aaacagtgat tacgcagata 3180
aataaatacg ttagattaat tcctaccagt gactaatctt atgacttttt aaacagataa 3240
ctaaaattac aaacaaatcg tttaacttct gtatttgttt atagatgtaa tcacttcagg 3300
agtgattaca tgaacaaaaa tataaaatat tctcaaaact ttttaacgag tgaaaaagta 3360
ctcaaccaaa taataaaaca attgaattta aaagaaaccg ataccgttta cgaaattgga 3420
acaggtaaag ggcatttaac gacgaaactg gctaaaataa gtaaacaggt aacgtctatt 3480
gaattagaca gtcatctatt caacttatcg tcagaaaaat taaaactgaa cattcgtgtc 3540
actttaattc accaagatat tctacagttt caattcccta acaaacagag gtataaaatt 3600
gttgggaata ttccttacca tttaagcaca caaattatta aaaaagtggt ttttgaaagc 3660
catgcgtctg acatctatct gattgttgaa gaaggattct acaagcgtac cttggatatt 3720
caccgaacac tagggttgct cttgcacact caagtctcga ttcagcaatt gcttaagctg 3780
ccagcggaat gctttcatcc taaaccaaaa gtaaacagtg tcttaataaa acttacccgc 3840
cataccacag atgttccaga taaatattgg aagctatata cgtactttgt ttcaaaatgg 3900
gtcaatcgag aatatcgtca actgtttact aaaaatcagt ttcatcaagc aatgaaacac 3960
gccaaagtaa acaatttaag taccgttact tatgagcaag tattgtctat ttttaatagt 4020
tatctattat ttaacgggag gaaataattc tatgagtcgc ttttgtaaat ttggaaagtt 4080
acacgttact aaagggaatg tagatggatc ctgtatgcca atgatgatga agagtcgaca 4140
tggatgagcg atgatgatat ccgtttaggc tgggcggtga tagcttctcg ttcaggcagt 4200
acgcctcttt tcttttccag acctgaggga ggcggaaatg gtgtgaggtt cccggggaaa 4260
agccaaatag gcgatcgcgg gagtgcttta tttgaagatc aggctatcac tgcggtcaat 4320
agatttcaca atgtgatggc tggacagcct gaggaactct cgaacccgaa tggaaacaac 4380
cagatattta tgaatcagcg cggctcacat ggcgttgtgc tggcaaatgc aggttcatcc 4440
tctgtctcta tcaatacggc aacaaaattg cctgatggca ggtatgacaa taaagctgga 4500
gcgggttcat ttcaagtgaa cgatggtaaa ctgacaggca cgatcaatgc caggtctgta 4560
gctgtgcttt atcctgatga tattgcaaaa gcgcctcatg ttttccttga gaattacaaa 4620
acaggtgtaa cacattcttt caatgatcaa ctgacgatta ccttgcgtgc agatgcgaat 4680
acaacaaaag ccgtttatca aatcaataat ggaccagaga cggcgtttaa ggatggagat 4740
caattcacaa tcggaaaagg agatccattt ggcaaaacat acaccatcat gttaaaagga 4800
acgaacagtg atggtgtaac gaggaccgag aaatacagtt ttgttaaaag agatccagcg 4860
tcggccaaaa ccatcggcta tcaaaatccg aatcattgga gccaggtaaa tgcttatatc 4920
tataaacatg atgggagccg agtaattgaa ttgaccggat cttggcctgg aaaaccaatg 4980
actaaaaatg cagacggaat ttacacgctg acgctgcctg cggacacgga tacaaccaac 5040
gcaaaagtga tttttaataa tggcagcgcc caagtgcccg gtcagaatca gcctggcttt 5100
gattacgtgc taaatggttt atataatgac tcgggcttaa gcggttctct tccccattg 5159
<210> 149
<211> 5075
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG10 EryR AmyE END operon
<400> 149
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgga 2340
gattaaggga gagagcatgc aaaagtcaaa gttcagacgc atttgtgtgt tttgcggttc 2400
atcacagggc aaaaagtctt catatcaaga tgctgcagtt gatctgggta acgaattagt 2460
aagcagaaac atcgatcttg tctacggcgg tggctctatt ggacttatgg gcttagtgtc 2520
tcaagcagtc catgacggcg gtagacatgt catcggcatt attcctaaaa cgttaatgcc 2580
gcgcgagctg acaggcgaaa cagtaggaga ggtaagagcg gtggccgaca tgcatcaaag 2640
aaaagcggaa atggccaaac acagcgacgc atttattgct ttaccgggcg gctacggaac 2700
actggaagaa cttcttgagg tcatcacgtg ggcccagctg ggcattcatg ataaaccagt 2760
gggactgctg aatgtggatg gctattataa tagcctgctg tcatttattg ataaagcggt 2820
tgaagaagga ttcatttcac cgacggcaag agaaatcatt gtttcagcgc ctacagctaa 2880
agaactggtt aaaaaactgg aagagtatgc gccgtgccat gaaagagttg ctacaaaact 2940
gtgttgggaa atggagagaa tcggatattc atcagaagaa taaattaatt ctagaaatta 3000
agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3060
ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3120
accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3180
acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3240
aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3300
aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3360
aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3420
ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3480
cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3540
agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3600
gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3660
cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3720
ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3780
tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 3840
tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 3900
gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 3960
taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 4020
tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4080
ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4140
gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4200
gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4260
cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4320
tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4380
aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4440
ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4500
gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4560
gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4620
aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4680
ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4740
accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4800
aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 4860
attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 4920
acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 4980
agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 5040
aatgactcgg gcttaagcgg ttctcttccc cattg 5075
<210> 150
<211> 5348
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT1 LOG11 EryR AmyE END operon
<400> 150
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggg 2340
tgtctcaatg ctggattctt cttggtcatt tcgcctttca agcaagatgt ctccaagccc 2400
gacgcaaaaa ttagccagct ctctgacaga acgcgatcca atcagcttaa atctgcgctt 2460
cgaccattca attagagcat atagcgcaag agctcttaag tgcagatctg tcaaatctga 2520
agatttcgtt gaaagatcat caccatttga agttaagaag gagctggaaa tttgctttga 2580
tcttgtccat agattaggta gaggcattgt ttaccttggc agcgctagaa ttccgccgaa 2640
ccacagccat tacctgcagg cacaggaatt atcaagagaa gcggcaacgt tacttgactg 2700
cacaacgtgg tcaggcgctg gacctggcct tatggatgcg gtgacggaag gtgcccttga 2760
ggcggaaaag ccggtaggtg gcatcaaaat tgaaaaagaa gcgggcgagt ggacggcgtc 2820
aaaattccac ccgtatttac ctccgcaaaa ttatcataca tgtagatttt tctcagcgag 2880
aaaacatggc cttgtcgatg ccgtaattag aaataatgtt tcagaaaaaa cagctatcat 2940
tgcactgccg ggcggcattg gaacattaga tgagatgttc gaaatcctgg ctctgattca 3000
actggagaga attggctcag ctctgccggt gccttttatc gtaatgaact acgacgcctt 3060
ttattcaaaa ctgctggaat ttatcgagac atgtgaaaat ctgggaacag tttcaaaagg 3120
agaagtgtca gcactgtgga aagtgtgtaa taacaacttt gaggccctga catatctggc 3180
ggaattttat gacctgcctg atggatcagc aaaactggag acagaactga gaaaaacaac 3240
acctacaaga ggataaatta attctagaaa ttaagaagga gggattcgtc atgttggtat 3300
tccaaatgcg ttatgtagat aaaacatcta ctgttttgaa acagactaaa aacagtgatt 3360
acgcagataa ataaatacgt tagattaatt cctaccagtg actaatctta tgacttttta 3420
aacagataac taaaattaca aacaaatcgt ttaacttctg tatttgttta tagatgtaat 3480
cacttcagga gtgattacat gaacaaaaat ataaaatatt ctcaaaactt tttaacgagt 3540
gaaaaagtac tcaaccaaat aataaaacaa ttgaatttaa aagaaaccga taccgtttac 3600
gaaattggaa caggtaaagg gcatttaacg acgaaactgg ctaaaataag taaacaggta 3660
acgtctattg aattagacag tcatctattc aacttatcgt cagaaaaatt aaaactgaac 3720
attcgtgtca ctttaattca ccaagatatt ctacagtttc aattccctaa caaacagagg 3780
tataaaattg ttgggaatat tccttaccat ttaagcacac aaattattaa aaaagtggtt 3840
tttgaaagcc atgcgtctga catctatctg attgttgaag aaggattcta caagcgtacc 3900
ttggatattc accgaacact agggttgctc ttgcacactc aagtctcgat tcagcaattg 3960
cttaagctgc cagcggaatg ctttcatcct aaaccaaaag taaacagtgt cttaataaaa 4020
cttacccgcc ataccacaga tgttccagat aaatattgga agctatatac gtactttgtt 4080
tcaaaatggg tcaatcgaga atatcgtcaa ctgtttacta aaaatcagtt tcatcaagca 4140
atgaaacacg ccaaagtaaa caatttaagt accgttactt atgagcaagt attgtctatt 4200
tttaatagtt atctattatt taacgggagg aaataattct atgagtcgct tttgtaaatt 4260
tggaaagtta cacgttacta aagggaatgt agatggatcc tgtatgccaa tgatgatgaa 4320
gagtcgacat ggatgagcga tgatgatatc cgtttaggct gggcggtgat agcttctcgt 4380
tcaggcagta cgcctctttt cttttccaga cctgagggag gcggaaatgg tgtgaggttc 4440
ccggggaaaa gccaaatagg cgatcgcggg agtgctttat ttgaagatca ggctatcact 4500
gcggtcaata gatttcacaa tgtgatggct ggacagcctg aggaactctc gaacccgaat 4560
ggaaacaacc agatatttat gaatcagcgc ggctcacatg gcgttgtgct ggcaaatgca 4620
ggttcatcct ctgtctctat caatacggca acaaaattgc ctgatggcag gtatgacaat 4680
aaagctggag cgggttcatt tcaagtgaac gatggtaaac tgacaggcac gatcaatgcc 4740
aggtctgtag ctgtgcttta tcctgatgat attgcaaaag cgcctcatgt tttccttgag 4800
aattacaaaa caggtgtaac acattctttc aatgatcaac tgacgattac cttgcgtgca 4860
gatgcgaata caacaaaagc cgtttatcaa atcaataatg gaccagagac ggcgtttaag 4920
gatggagatc aattcacaat cggaaaagga gatccatttg gcaaaacata caccatcatg 4980
ttaaaaggaa cgaacagtga tggtgtaacg aggaccgaga aatacagttt tgttaaaaga 5040
gatccagcgt cggccaaaac catcggctat caaaatccga atcattggag ccaggtaaat 5100
gcttatatct ataaacatga tgggagccga gtaattgaat tgaccggatc ttggcctgga 5160
aaaccaatga ctaaaaatgc agacggaatt tacacgctga cgctgcctgc ggacacggat 5220
acaaccaacg caaaagtgat ttttaataat ggcagcgccc aagtgcccgg tcagaatcag 5280
cctggctttg attacgtgct aaatggttta tataatgact cgggcttaag cggttctctt 5340
ccccattg 5348
<210> 151
<211> 842
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment IPT6_ Bsu
<400> 151
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatga 60
tcctgcatct tatttatggt ccgacgtgca gcggcaaaac ggacatggcc attcagattg 120
cgcaggagac aggatggcca gtagtagctc tggatagagt ccagtgttgt ccacaaattg 180
ctacaggctc tggccgcccg ctggagtctg agttacagag cacacgcaga atctatctgg 240
atagcagacc actgacagaa ggtattctgg atgcagaatc agcacataga cgcttaatct 300
tcgaagtcga ttggagaaag tctgaggacg gacttattct tgaaggaggc tcaatttctc 360
ttttaaactg tatggcaaaa tcacctttct ggagatcagg ctttcagtgg cacgttaaaa 420
gattaagact tggcgactca gatgcgtttc tgacaagagc aaagcaaaga gttgcagaaa 480
tgtttgcgat tcgcgaggat agaccgtcac ttttagaaga actggcagaa ctgtggaact 540
atcctgccgc gcgccctatc ttagaagaca ttgatggata cagatgcgcc atcagatttg 600
ctagaaaaca cgatctggcc atttcacaac tgcctaatat cgacgccgga agacatgttg 660
aactgattga agcgatcgcg aatgaatatc tggaacatgc tctgtctcaa gaaagagatt 720
ttccgcaatg gccggaagat ggcgctggtc aacctgtgtg cccggtgaca ctgacaagaa 780
ttagataaaa aagaggggag ggaaacatta atgacgacct ggctaacgag tctcgccgat 840
ct 842
<210> 152
<211> 827
<212> DNA
<213> Artificial Sequence
<220>
<223> Frgament IPT7_Bsu
<400> 152
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgc 60
cggtcagact gtatctgatt tggggcgcta caacaacggg caagacagca caatctgtgg 120
cactggctag atcagcaggt gctcctgtaa tttcactgga cagagttcaa tgttgccatg 180
aactggccgt tggttctggc cgcccatcac cgagcgagct gctgggaacg agaagagaat 240
atttatgtga gcgcgaagtg tcaagaggag tggttagcgc cgccgaagcg aatcagctgc 300
tgctggataa agtggcgcgc tatgccacac aggaacgcgc gctgattctt gaaggaggat 360
cagtctcact gatcaacgct atgatcagag atgcgagatg gagcgaaaga ggcgaatgga 420
tcttaagaag aatcccggtt ccgggcagag ccgcatttat ggccgccgcg agaaaaagag 480
ttcgcgaaat gcttgacccg cctccaggcc aggcaggaat tttagatgag cttcaaggtc 540
tttggggcta tccgagaaat cacgccgtct tagaggatat tgacggctac agacagatta 600
ttagatacgc caatgcatta caggtcccta tctgcagaat cacatctatt gaccctaacg 660
ccaaagctct gcttattgag cgcattgcac aggaatactg ggaacatgct ttatggcaag 720
agcaagagtt cctgggcatt ccggcaagct ggatgagagc tgatgatgcg taaaaaagag 780
gggagggaaa cattaatgac gacctggcta acgagtctcg ccgatct 827
<210> 153
<211> 842
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment IPT9_Bsu
<400> 153
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60
tattacatct tatttacgga cctacatgtt caggaaaaac agacatggcc attcaaattg 120
ctcaagaaac gggatggccg gttgtggcgt tagacagagt acagtgctgc ccacagattg 180
caacgggctc aggtagaccg ttagaatctg agttacaatc aacaagaaga atctatctgg 240
attcacgccc actgacagag ggcatcctgg acgcagagag cgcgcaccgc cgccttatct 300
ttgaagtcga ttggcgcaaa tctgaggagg gccttatcct tgaaggagga agcattagcc 360
tgcttaattg tatggcaaaa tcaccgtttt ggagatctgg cttccagtgg cacgtaaaga 420
gactgagact tggcgattca gacgcatttc tgacaagagc aaaacagaga gtcgcagaaa 480
tgttcgcgat tagagaagac agaccaagcc tgctggagga attagctgaa ctgtggaact 540
atccggctgc gcgccctatt ctggaggata ttgatggtta tcgctgtgcg attagatttg 600
ctagaaagca tgatctggct atttcacaac tgcctaatat cgatgcggga agacatgttg 660
aactgattga agccatcgcc aacgaatacc tggaacatgc cctgtcacag gaaagagatt 720
ttcctcaatg gccggaagat ggtgccggcc aaccggtttg cccggtgaca ctgacaagaa 780
ttagataaaa aagaggggag ggaaacatta atgacgacct ggctaacgag tctcgccgat 840
ct 842
<210> 154
<211> 2365
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT6
<400> 154
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgatcctgca tcttatttat ggtccgacgt gcagcggcaa 1620
aacggacatg gccattcaga ttgcgcagga gacaggatgg ccagtagtag ctctggatag 1680
agtccagtgt tgtccacaaa ttgctacagg ctctggccgc ccgctggagt ctgagttaca 1740
gagcacacgc agaatctatc tggatagcag accactgaca gaaggtattc tggatgcaga 1800
atcagcacat agacgcttaa tcttcgaagt cgattggaga aagtctgagg acggacttat 1860
tcttgaagga ggctcaattt ctcttttaaa ctgtatggca aaatcacctt tctggagatc 1920
aggctttcag tggcacgtta aaagattaag acttggcgac tcagatgcgt ttctgacaag 1980
agcaaagcaa agagttgcag aaatgtttgc gattcgcgag gatagaccgt cacttttaga 2040
agaactggca gaactgtgga actatcctgc cgcgcgccct atcttagaag acattgatgg 2100
atacagatgc gccatcagat ttgctagaaa acacgatctg gccatttcac aactgcctaa 2160
tatcgacgcc ggaagacatg ttgaactgat tgaagcgatc gcgaatgaat atctggaaca 2220
tgctctgtct caagaaagag attttccgca atggccggaa gatggcgctg gtcaacctgt 2280
gtgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttaatgacga 2340
cctggctaac gagtctcgcc gatct 2365
<210> 155
<211> 2350
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT7
<400> 155
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgccggtcag actgtatctg atttggggcg ctacaacaac 1620
gggcaagaca gcacaatctg tggcactggc tagatcagca ggtgctcctg taatttcact 1680
ggacagagtt caatgttgcc atgaactggc cgttggttct ggccgcccat caccgagcga 1740
gctgctggga acgagaagag aatatttatg tgagcgcgaa gtgtcaagag gagtggttag 1800
cgccgccgaa gcgaatcagc tgctgctgga taaagtggcg cgctatgcca cacaggaacg 1860
cgcgctgatt cttgaaggag gatcagtctc actgatcaac gctatgatca gagatgcgag 1920
atggagcgaa agaggcgaat ggatcttaag aagaatcccg gttccgggca gagccgcatt 1980
tatggccgcc gcgagaaaaa gagttcgcga aatgcttgac ccgcctccag gccaggcagg 2040
aattttagat gagcttcaag gtctttgggg ctatccgaga aatcacgccg tcttagagga 2100
tattgacggc tacagacaga ttattagata cgccaatgca ttacaggtcc ctatctgcag 2160
aatcacatct attgacccta acgccaaagc tctgcttatt gagcgcattg cacaggaata 2220
ctgggaacat gctttatggc aagagcaaga gttcctgggc attccggcaa gctggatgag 2280
agctgatgat gcgtaaaaaa gaggggaggg aaacattaat gacgacctgg ctaacgagtc 2340
tcgccgatct 2350
<210> 156
<211> 2365
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT9
<400> 156
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca tcttatttac ggacctacat gttcaggaaa 1620
aacagacatg gccattcaaa ttgctcaaga aacgggatgg ccggttgtgg cgttagacag 1680
agtacagtgc tgcccacaga ttgcaacggg ctcaggtaga ccgttagaat ctgagttaca 1740
atcaacaaga agaatctatc tggattcacg cccactgaca gagggcatcc tggacgcaga 1800
gagcgcgcac cgccgcctta tctttgaagt cgattggcgc aaatctgagg agggccttat 1860
ccttgaagga ggaagcatta gcctgcttaa ttgtatggca aaatcaccgt tttggagatc 1920
tggcttccag tggcacgtaa agagactgag acttggcgat tcagacgcat ttctgacaag 1980
agcaaaacag agagtcgcag aaatgttcgc gattagagaa gacagaccaa gcctgctgga 2040
ggaattagct gaactgtgga actatccggc tgcgcgccct attctggagg atattgatgg 2100
ttatcgctgt gcgattagat ttgctagaaa gcatgatctg gctatttcac aactgcctaa 2160
tatcgatgcg ggaagacatg ttgaactgat tgaagccatc gccaacgaat acctggaaca 2220
tgccctgtca caggaaagag attttcctca atggccggaa gatggtgccg gccaaccggt 2280
ttgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttaatgacga 2340
cctggctaac gagtctcgcc gatct 2365
<210> 157
<211> 3218
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT6 + LOG8
<400> 157
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgatcctgca tcttatttat ggtccgacgt gcagcggcaa 1620
aacggacatg gccattcaga ttgcgcagga gacaggatgg ccagtagtag ctctggatag 1680
agtccagtgt tgtccacaaa ttgctacagg ctctggccgc ccgctggagt ctgagttaca 1740
gagcacacgc agaatctatc tggatagcag accactgaca gaaggtattc tggatgcaga 1800
atcagcacat agacgcttaa tcttcgaagt cgattggaga aagtctgagg acggacttat 1860
tcttgaagga ggctcaattt ctcttttaaa ctgtatggca aaatcacctt tctggagatc 1920
aggctttcag tggcacgtta aaagattaag acttggcgac tcagatgcgt ttctgacaag 1980
agcaaagcaa agagttgcag aaatgtttgc gattcgcgag gatagaccgt cacttttaga 2040
agaactggca gaactgtgga actatcctgc cgcgcgccct atcttagaag acattgatgg 2100
atacagatgc gccatcagat ttgctagaaa acacgatctg gccatttcac aactgcctaa 2160
tatcgacgcc ggaagacatg ttgaactgat tgaagcgatc gcgaatgaat atctggaaca 2220
tgctctgtct caagaaagag attttccgca atggccggaa gatggcgctg gtcaacctgt 2280
gtgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttatgatggc 2340
ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400
aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460
atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520
gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580
taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640
gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700
cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760
cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820
ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880
cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940
aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000
agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060
gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120
aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagagtcga 3180
tccccgggtt cgccagcaat gactaccggc agcccgcc 3218
<210> 158
<211> 3203
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT7 + LOG8
<400> 158
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgccggtcag actgtatctg atttggggcg ctacaacaac 1620
gggcaagaca gcacaatctg tggcactggc tagatcagca ggtgctcctg taatttcact 1680
ggacagagtt caatgttgcc atgaactggc cgttggttct ggccgcccat caccgagcga 1740
gctgctggga acgagaagag aatatttatg tgagcgcgaa gtgtcaagag gagtggttag 1800
cgccgccgaa gcgaatcagc tgctgctgga taaagtggcg cgctatgcca cacaggaacg 1860
cgcgctgatt cttgaaggag gatcagtctc actgatcaac gctatgatca gagatgcgag 1920
atggagcgaa agaggcgaat ggatcttaag aagaatcccg gttccgggca gagccgcatt 1980
tatggccgcc gcgagaaaaa gagttcgcga aatgcttgac ccgcctccag gccaggcagg 2040
aattttagat gagcttcaag gtctttgggg ctatccgaga aatcacgccg tcttagagga 2100
tattgacggc tacagacaga ttattagata cgccaatgca ttacaggtcc ctatctgcag 2160
aatcacatct attgacccta acgccaaagc tctgcttatt gagcgcattg cacaggaata 2220
ctgggaacat gctttatggc aagagcaaga gttcctgggc attccggcaa gctggatgag 2280
agctgatgat gcgtaaaaaa gaggggaggg aaacattatg atggcccctc ttcgctcaaa 2340
caaagatggc aaacctagag ttcctagaac gacggaaagc gccgaaacga atagaatgtt 2400
aagaggtccg atgttactga gaacagacgg aaatcagacg tcaacatacg atcaaagact 2460
tttagagtca ggcgcagatc acgcttggaa gcatgcagat ccgtggcgcg ttctgagaat 2520
ccagggagag ttcgtggcag gatttgatgc tctgagcgat ctgcctaagg cggttacggt 2580
atacggctca gccagaacaa aagaggacac accggaatat gcacagggca tcgatttagg 2640
tgcaaaatta gttgagcatg actacgctgt tgtgacaggc ggtggcccag gcatcatgga 2700
ggcggcgaat agaggcgcct atgaagctgg aggtctttct gtgggcctgg gcattgaact 2760
tccgtttgaa caaggtttaa acaaatatgt agatcttgga attaacttta gatacttttt 2820
cgcgagaaag acaatgttcc tgaaatattc acaggcgttt gtgtgcctgc cgggcggtat 2880
gggaacaatg gatgagctgt ttgaaatgct gtgtatggtg caaacaggaa aagtgacaaa 2940
ctatccgatt gtactgatcg gcacagaata ttggagcggc ctggtagaat ggatggctaa 3000
tacactggtc gccgaaggct acatcaatcc acaagatatg gatctgttcc tgctgacaga 3060
cagcgtcgac gaagccgtcg aacatattgt cgcggctcat aaagaaatga cagacgaaag 3120
agtctcaaga ctgaatcacg acgcataaat taattctaga gtcgatcccc gggttcgcca 3180
gcaatgacta ccggcagccc gcc 3203
<210> 159
<211> 3218
<212> DNA
<213> Artificial Sequence
<220>
<223> operon AmyE 0 + IPT9 + LOG8
<400> 159
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca tcttatttac ggacctacat gttcaggaaa 1620
aacagacatg gccattcaaa ttgctcaaga aacgggatgg ccggttgtgg cgttagacag 1680
agtacagtgc tgcccacaga ttgcaacggg ctcaggtaga ccgttagaat ctgagttaca 1740
atcaacaaga agaatctatc tggattcacg cccactgaca gagggcatcc tggacgcaga 1800
gagcgcgcac cgccgcctta tctttgaagt cgattggcgc aaatctgagg agggccttat 1860
ccttgaagga ggaagcatta gcctgcttaa ttgtatggca aaatcaccgt tttggagatc 1920
tggcttccag tggcacgtaa agagactgag acttggcgat tcagacgcat ttctgacaag 1980
agcaaaacag agagtcgcag aaatgttcgc gattagagaa gacagaccaa gcctgctgga 2040
ggaattagct gaactgtgga actatccggc tgcgcgccct attctggagg atattgatgg 2100
ttatcgctgt gcgattagat ttgctagaaa gcatgatctg gctatttcac aactgcctaa 2160
tatcgatgcg ggaagacatg ttgaactgat tgaagccatc gccaacgaat acctggaaca 2220
tgccctgtca caggaaagag attttcctca atggccggaa gatggtgccg gccaaccggt 2280
ttgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttatgatggc 2340
ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400
aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460
atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520
gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580
taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640
gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700
cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760
cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820
ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880
cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940
aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000
agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060
gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120
aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagagtcga 3180
tccccgggtt cgccagcaat gactaccggc agcccgcc 3218
<210> 160
<211> 5255
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT6 LOG8 EryR AmyE END operon
<400> 160
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgatcctgca tcttatttat ggtccgacgt gcagcggcaa 1620
aacggacatg gccattcaga ttgcgcagga gacaggatgg ccagtagtag ctctggatag 1680
agtccagtgt tgtccacaaa ttgctacagg ctctggccgc ccgctggagt ctgagttaca 1740
gagcacacgc agaatctatc tggatagcag accactgaca gaaggtattc tggatgcaga 1800
atcagcacat agacgcttaa tcttcgaagt cgattggaga aagtctgagg acggacttat 1860
tcttgaagga ggctcaattt ctcttttaaa ctgtatggca aaatcacctt tctggagatc 1920
aggctttcag tggcacgtta aaagattaag acttggcgac tcagatgcgt ttctgacaag 1980
agcaaagcaa agagttgcag aaatgtttgc gattcgcgag gatagaccgt cacttttaga 2040
agaactggca gaactgtgga actatcctgc cgcgcgccct atcttagaag acattgatgg 2100
atacagatgc gccatcagat ttgctagaaa acacgatctg gccatttcac aactgcctaa 2160
tatcgacgcc ggaagacatg ttgaactgat tgaagcgatc gcgaatgaat atctggaaca 2220
tgctctgtct caagaaagag attttccgca atggccggaa gatggcgctg gtcaacctgt 2280
gtgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttatgatggc 2340
ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400
aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460
atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520
gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580
taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640
gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700
cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760
cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820
ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880
cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940
aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000
agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060
gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120
aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagaaatta 3180
agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3240
ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3300
accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3360
acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3420
aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3480
aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3540
aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3600
ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3660
cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3720
agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3780
gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3840
cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3900
ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3960
tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 4020
tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 4080
gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 4140
taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 4200
tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4260
ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4320
gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4380
gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4440
cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4500
tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4560
aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4620
ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4680
gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4740
gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4800
aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4860
ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4920
accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4980
aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 5040
attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 5100
acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 5160
agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 5220
aatgactcgg gcttaagcgg ttctcttccc cattg 5255
<210> 161
<211> 5240
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT7 LOG8 EryR AmyE END operon
<400> 161
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgccggtcag actgtatctg atttggggcg ctacaacaac 1620
gggcaagaca gcacaatctg tggcactggc tagatcagca ggtgctcctg taatttcact 1680
ggacagagtt caatgttgcc atgaactggc cgttggttct ggccgcccat caccgagcga 1740
gctgctggga acgagaagag aatatttatg tgagcgcgaa gtgtcaagag gagtggttag 1800
cgccgccgaa gcgaatcagc tgctgctgga taaagtggcg cgctatgcca cacaggaacg 1860
cgcgctgatt cttgaaggag gatcagtctc actgatcaac gctatgatca gagatgcgag 1920
atggagcgaa agaggcgaat ggatcttaag aagaatcccg gttccgggca gagccgcatt 1980
tatggccgcc gcgagaaaaa gagttcgcga aatgcttgac ccgcctccag gccaggcagg 2040
aattttagat gagcttcaag gtctttgggg ctatccgaga aatcacgccg tcttagagga 2100
tattgacggc tacagacaga ttattagata cgccaatgca ttacaggtcc ctatctgcag 2160
aatcacatct attgacccta acgccaaagc tctgcttatt gagcgcattg cacaggaata 2220
ctgggaacat gctttatggc aagagcaaga gttcctgggc attccggcaa gctggatgag 2280
agctgatgat gcgtaaaaaa gaggggaggg aaacattatg atggcccctc ttcgctcaaa 2340
caaagatggc aaacctagag ttcctagaac gacggaaagc gccgaaacga atagaatgtt 2400
aagaggtccg atgttactga gaacagacgg aaatcagacg tcaacatacg atcaaagact 2460
tttagagtca ggcgcagatc acgcttggaa gcatgcagat ccgtggcgcg ttctgagaat 2520
ccagggagag ttcgtggcag gatttgatgc tctgagcgat ctgcctaagg cggttacggt 2580
atacggctca gccagaacaa aagaggacac accggaatat gcacagggca tcgatttagg 2640
tgcaaaatta gttgagcatg actacgctgt tgtgacaggc ggtggcccag gcatcatgga 2700
ggcggcgaat agaggcgcct atgaagctgg aggtctttct gtgggcctgg gcattgaact 2760
tccgtttgaa caaggtttaa acaaatatgt agatcttgga attaacttta gatacttttt 2820
cgcgagaaag acaatgttcc tgaaatattc acaggcgttt gtgtgcctgc cgggcggtat 2880
gggaacaatg gatgagctgt ttgaaatgct gtgtatggtg caaacaggaa aagtgacaaa 2940
ctatccgatt gtactgatcg gcacagaata ttggagcggc ctggtagaat ggatggctaa 3000
tacactggtc gccgaaggct acatcaatcc acaagatatg gatctgttcc tgctgacaga 3060
cagcgtcgac gaagccgtcg aacatattgt cgcggctcat aaagaaatga cagacgaaag 3120
agtctcaaga ctgaatcacg acgcataaat taattctaga aattaagaag gagggattcg 3180
tcatgttggt attccaaatg cgttatgtag ataaaacatc tactgttttg aaacagacta 3240
aaaacagtga ttacgcagat aaataaatac gttagattaa ttcctaccag tgactaatct 3300
tatgactttt taaacagata actaaaatta caaacaaatc gtttaacttc tgtatttgtt 3360
tatagatgta atcacttcag gagtgattac atgaacaaaa atataaaata ttctcaaaac 3420
tttttaacga gtgaaaaagt actcaaccaa ataataaaac aattgaattt aaaagaaacc 3480
gataccgttt acgaaattgg aacaggtaaa gggcatttaa cgacgaaact ggctaaaata 3540
agtaaacagg taacgtctat tgaattagac agtcatctat tcaacttatc gtcagaaaaa 3600
ttaaaactga acattcgtgt cactttaatt caccaagata ttctacagtt tcaattccct 3660
aacaaacaga ggtataaaat tgttgggaat attccttacc atttaagcac acaaattatt 3720
aaaaaagtgg tttttgaaag ccatgcgtct gacatctatc tgattgttga agaaggattc 3780
tacaagcgta ccttggatat tcaccgaaca ctagggttgc tcttgcacac tcaagtctcg 3840
attcagcaat tgcttaagct gccagcggaa tgctttcatc ctaaaccaaa agtaaacagt 3900
gtcttaataa aacttacccg ccataccaca gatgttccag ataaatattg gaagctatat 3960
acgtactttg tttcaaaatg ggtcaatcga gaatatcgtc aactgtttac taaaaatcag 4020
tttcatcaag caatgaaaca cgccaaagta aacaatttaa gtaccgttac ttatgagcaa 4080
gtattgtcta tttttaatag ttatctatta tttaacggga ggaaataatt ctatgagtcg 4140
cttttgtaaa tttggaaagt tacacgttac taaagggaat gtagatggat cctgtatgcc 4200
aatgatgatg aagagtcgac atggatgagc gatgatgata tccgtttagg ctgggcggtg 4260
atagcttctc gttcaggcag tacgcctctt ttcttttcca gacctgaggg aggcggaaat 4320
ggtgtgaggt tcccggggaa aagccaaata ggcgatcgcg ggagtgcttt atttgaagat 4380
caggctatca ctgcggtcaa tagatttcac aatgtgatgg ctggacagcc tgaggaactc 4440
tcgaacccga atggaaacaa ccagatattt atgaatcagc gcggctcaca tggcgttgtg 4500
ctggcaaatg caggttcatc ctctgtctct atcaatacgg caacaaaatt gcctgatggc 4560
aggtatgaca ataaagctgg agcgggttca tttcaagtga acgatggtaa actgacaggc 4620
acgatcaatg ccaggtctgt agctgtgctt tatcctgatg atattgcaaa agcgcctcat 4680
gttttccttg agaattacaa aacaggtgta acacattctt tcaatgatca actgacgatt 4740
accttgcgtg cagatgcgaa tacaacaaaa gccgtttatc aaatcaataa tggaccagag 4800
acggcgttta aggatggaga tcaattcaca atcggaaaag gagatccatt tggcaaaaca 4860
tacaccatca tgttaaaagg aacgaacagt gatggtgtaa cgaggaccga gaaatacagt 4920
tttgttaaaa gagatccagc gtcggccaaa accatcggct atcaaaatcc gaatcattgg 4980
agccaggtaa atgcttatat ctataaacat gatgggagcc gagtaattga attgaccgga 5040
tcttggcctg gaaaaccaat gactaaaaat gcagacggaa tttacacgct gacgctgcct 5100
gcggacacgg atacaaccaa cgcaaaagtg atttttaata atggcagcgc ccaagtgccc 5160
ggtcagaatc agcctggctt tgattacgtg ctaaatggtt tatataatga ctcgggctta 5220
agcggttctc ttccccattg 5240
<210> 162
<211> 5255
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE 0 IPT9 LOG8 EryR AmyE END operon
<400> 162
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca tcttatttac ggacctacat gttcaggaaa 1620
aacagacatg gccattcaaa ttgctcaaga aacgggatgg ccggttgtgg cgttagacag 1680
agtacagtgc tgcccacaga ttgcaacggg ctcaggtaga ccgttagaat ctgagttaca 1740
atcaacaaga agaatctatc tggattcacg cccactgaca gagggcatcc tggacgcaga 1800
gagcgcgcac cgccgcctta tctttgaagt cgattggcgc aaatctgagg agggccttat 1860
ccttgaagga ggaagcatta gcctgcttaa ttgtatggca aaatcaccgt tttggagatc 1920
tggcttccag tggcacgtaa agagactgag acttggcgat tcagacgcat ttctgacaag 1980
agcaaaacag agagtcgcag aaatgttcgc gattagagaa gacagaccaa gcctgctgga 2040
ggaattagct gaactgtgga actatccggc tgcgcgccct attctggagg atattgatgg 2100
ttatcgctgt gcgattagat ttgctagaaa gcatgatctg gctatttcac aactgcctaa 2160
tatcgatgcg ggaagacatg ttgaactgat tgaagccatc gccaacgaat acctggaaca 2220
tgccctgtca caggaaagag attttcctca atggccggaa gatggtgccg gccaaccggt 2280
ttgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttatgatggc 2340
ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400
aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460
atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520
gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580
taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640
gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700
cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760
cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820
ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880
cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940
aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000
agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060
gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120
aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagaaatta 3180
agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3240
ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3300
accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3360
acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3420
aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3480
aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3540
aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3600
ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3660
cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3720
agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3780
gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3840
cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3900
ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3960
tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 4020
tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 4080
gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 4140
taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 4200
tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4260
ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4320
gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4380
gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4440
cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4500
tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4560
aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4620
ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4680
gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4740
gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4800
aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4860
ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4920
accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4980
aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 5040
attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 5100
acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 5160
agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 5220
aatgactcgg gcttaagcgg ttctcttccc cattg 5255
<210> 163
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer ipt1_RBS_F (pBBR1)
<400> 163
tttaagaagg agatatacat atgttattac acctgatcta cggtc 45
<210> 164
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> primer ipt1_RBS_R(pBBR1)
<400> 164
tcatatgtat atctccttct tttaacggat tctcgttaag gtaaccgg 48
<210> 165
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> primer log1_RBS_F(pBBR1)
<400> 165
taaaagaagg agatatacat atgacatcgc tttttgacgc gc 42
<210> 166
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer log1_RBS_R(pBBR1)
<400> 166
ccttactcga gtttggatcc ttaccatttt ggggctggag 40
<210> 167
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer BB_pBBR1_F
<400> 167
ggatccaaac tcgagtaagg 20
<210> 168
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer BB_pBBR1_R
<400> 168
atgtatatct ccttcttaaa gttaaac 27
<210> 169
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> primer dxs_F(p15A)
<400> 169
acaataataa tggagtcatg aacatatgga cttgttgtcc attcaagacc 50
<210> 170
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> primer dxs_R (p15A)
<400> 170
gaaggtgagc cagtgtgact ctagtttatg agccgatgcc cttatgtgtc 50
<210> 171
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer BB_15a_R
<400> 171
atgttcatga ctccattatt attgtac 27
<210> 172
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer BB_p15a_F
<400> 172
actagagtca cactggctca ccttc 25
<210> 173
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for IPT1 LOG1 amplification
<400> 173
atggaattcg agctcggtac ccggggaaag gaggcccttc agatgttatt acacctgatc 60
tacggtc 67
<210> 174
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for IPT1 LOG1 amplification
<400> 174
gcatgcctgc aggtcgactc tagaggatct taccattttg gggctggag 49
<210> 175
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> atggaattcgagctcggtacccggggaAAGGAGGCCCTTCAGATGGACTTGTTGTCCATTCAAGA
CC
<400> 175
atggaattcg agctcggtac ccggggaaag gaggcccttc agatggactt gttgtccatt 60
caagacc 67
<210> 176
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for dxs amplification
<400> 176
gcatgcctgc aggtcgactc tagaggatct tatgagccga tgcccttatg tgtc 54
<210> 177
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> primer for IPT1 amplification
<400> 177
gcatgcctgc aggtcgactc tagaggatct taacggattc tcgttaaggt aaccgg 56
<210> 178
<211> 1415
<212> DNA
<213> Artificial Sequence
<220>
<223> IPT1-LOG1 Coryneb.
<400> 178
atggaattcg agctcggtac ccggggaaag gaggcccttc agatgttatt acacctgatc 60
tacggtccta catgtagtgg taaaactgat atggctatac aaatcgcgca agaaacaggt 120
tggcccgtcg ttgctcttga tcgtgtgcag tgctgtccac agattgcgac aggatccggc 180
agacctctgg aaagcgagtt acaatctacc cggcggattt atttagactc acgccctttg 240
acagaaggca ttcttgacgc ggaatccgct catcgccgtc ttatattcga ggtagattgg 300
aggaaatcgg aagaaggctt aatcctcgaa ggagggtcca tctcgcttct aaattgtatg 360
gctaagtctc cattttggag atctggattc cagtggcacg tcaagcgcct gagacttggg 420
gattcagatg cgtttctgac gcgagcaaaa cagcgtgtgg ctgagatgtt tgctattaga 480
gaagatcggc caagtttatt ggaggagctc gccgagctgt ggaattaccc ggcagctcgc 540
ccgattttgg aagacattga cggctatcga tgtgccatta gatttgcaag gaaacacgat 600
ctcgccatat cacagctgcc gaacatcgat gccggccggc atgttgaact gatcgaagcc 660
attgcaaacg aatatcttga acatgcgcta agccaagaac gcgactttcc tcaatggccg 720
gaggacggcg caggacaacc agtatgcccg gttaccttaa cgagaatccg ttaaaaaaga 780
ggggagggaa acattatgat gacatcgctt tttgacgcgc ctacgcttca acgcgtaacg 840
gttttcactg ggagcgcctt gggctcctct agtctttata ctcaggctgc tcaaaccctg 900
gctaaaaccg cggtagaccg agggattgat ctggtttatg gcggtggaaa agtcggcctc 960
atgggtattg ttgctgatgc attccttgaa agcgggggtg aggcattcgg cgtgataaca 1020
gagtcactga tgaaaggaga attaggccat gagaaactga cggagttgga aatcgtgccc 1080
gacatgcata ttcgtaaaag gcggatggcg gaacttgggg atggattcat tgcgatgcct 1140
ggaggagccg gcaccctgga agaactgttt gaagtctgga catggcagca gttaggaatt 1200
catcaaaagc cggttgcact ctatgacgtc gatggcttct ggcaaccgtt attggaaatg 1260
ttggaacaaa tgacacagag aggatttatc aagagagatt tttttgaatg cctcatcgtc 1320
gaatcagatc cgcacgcatt attaaaggcc atgcagacat ggacacctcc agccccaaaa 1380
tggtaagatc ctctagagtc gacctgcagg catgc 1415
<210> 179
<211> 842
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment IPT1
<400> 179
cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60
tattacacct gatctacggt cctacatgta gtggtaaaac tgatatggct atacaaatcg 120
cgcaagaaac aggttggccc gtcgttgctc ttgatcgtgt gcagtgctgt ccacagattg 180
cgacaggatc cggcagacct ctggaaagcg agttacaatc tacccggcgg atttatttag 240
actcacgccc tttgacagaa ggcattcttg acgcggaatc cgctcatcgc cgtcttatat 300
tcgaggtaga ttggaggaaa tcggaagaag gcttaatcct cgaaggaggg tccatctcgc 360
ttctaaattg tatggctaag tctccatttt ggagatctgg attccagtgg cacgtcaagc 420
gcctgagact tggggattca gatgcgtttc tgacgcgagc aaaacagcgt gtggctgaga 480
tgtttgctat tagagaagat cggccaagtt tattggagga gctcgccgag ctgtggaatt 540
acccggcagc tcgcccgatt ttggaagaca ttgacggcta tcgatgtgcc attagatttg 600
caaggaaaca cgatctcgcc atatcacagc tgccgaacat cgatgccggc cggcatgttg 660
aactgatcga agccattgca aacgaatatc ttgaacatgc gctaagccaa gaacgcgact 720
ttcctcaatg gccggaggac ggcgcaggac aaccagtatg cccggttacc ttaacgagaa 780
tccgttgaaa aagaggggag ggaaacatta atgacgacct ggctaacgag tctcgccgat 840
ct 842
<210> 180
<211> 833
<212> DNA
<213> Artificial Sequence
<220>
<223> IPT1 Coryneb.
<400> 180
atggaattcg agctcggtac ccggggaaag gaggcccttc agatgttatt acacctgatc 60
tacggtccta catgtagtgg taaaactgat atggctatac aaatcgcgca agaaacaggt 120
tggcccgtcg ttgctcttga tcgtgtgcag tgctgtccac agattgcgac aggatccggc 180
agacctctgg aaagcgagtt acaatctacc cggcggattt atttagactc acgccctttg 240
acagaaggca ttcttgacgc ggaatccgct catcgccgtc ttatattcga ggtagattgg 300
aggaaatcgg aagaaggctt aatcctcgaa ggagggtcca tctcgcttct aaattgtatg 360
gctaagtctc cattttggag atctggattc cagtggcacg tcaagcgcct gagacttggg 420
gattcagatg cgtttctgac gcgagcaaaa cagcgtgtgg ctgagatgtt tgctattaga 480
gaagatcggc caagtttatt ggaggagctc gccgagctgt ggaattaccc ggcagctcgc 540
ccgattttgg aagacattga cggctatcga tgtgccatta gatttgcaag gaaacacgat 600
ctcgccatat cacagctgcc gaacatcgat gccggccggc atgttgaact gatcgaagcc 660
attgcaaacg aatatcttga acatgcgcta agccaagaac gcgactttcc tcaatggccg 720
gaggacggcg caggacaacc agtatgcccg gttaccttaa cgagaatccg ttaagatcct 780
ctagagtcga cctgcaggca tgccgagctc gaattcactg gccgtcgttt tac 833
<210> 181
<211> 1973
<212> DNA
<213> Artificial Sequence
<220>
<223> DXS Coryneb.
<400> 181
atggaattcg agctcggtac ccggggaaag gaggcccttc agatggactt gttgtccatt 60
caagacccgt ctttcctaaa gaatatgagc attgacgagc ttgaaaaatt gtccgatgag 120
atccgccaat ttctcatcac atctctatcg gcctcgggcg gacacattgg accgaatctg 180
ggggtcgtgg aactgacagt agccctccac aaggagttca actcacccaa agacaaattt 240
ctctgggacg tggggcacca aagctacgtt cataaattgc ttactggtcg tggcaaagag 300
ttcgccacat tgcgccagta caaaggactc tgcggattcc ctaaacgctc ggaatccgag 360
cacgatgtgt gggaaacagg tcattcttct acttctctca gcggcgccat gggaatggcc 420
gctgcacgag atattaaagg gactgatgag tacataatcc caataatagg tgacggcgct 480
ttaacaggag gaatggccct agaggccttg aaccacatag gggatgagaa gaaagatatg 540
atagtcattt tgaatgataa tgagatgtct attgctccca acgttggagc aatacatagc 600
atgttagggc ggttacgtac tgcaggaaag taccagtggg taaaagatga acttgaatac 660
ctcttcaaga agatacccgc tgtaggaggc aagcttgcag ccacggccga gagagtgaag 720
gattctctta aatatatgtt ggtttcaggg atgttctttg aagaattggg attcacgtac 780
cttggtccgg ttgacggcca ttcttaccac gagttaattg aaaatttaca atacgcgaaa 840
aaaacgaagg ggcctgttct gctgcacgtt attaccaaaa aaggaaaagg ttataaacct 900
gcggaaaccg atacaattgg cacgtggcac ggcaccgggc cttataaaat caacacgggg 960
gactttgtca agccgaaagc tgccgcgcct agttggtccg gcctggttag tgggacggta 1020
cagcgaatgg cccgggaaga tgggaggatt gtcgctatca caccggcaat gccagtaggt 1080
agcaagttag aaggttttgc gaaagaattt ccggatagga tgtttgacgt aggtattgct 1140
gagcagcatg cggcgacgat ggctgcggca atggcaatgc agggcatgaa gcctttttta 1200
gctatttatt caacatttct gcaaagagcg tatgaccaag tggtacatga catttgtcgg 1260
caaaatgcta atgtctttat tgggattgat cgcgcagggt tagtgggtgc agacggggaa 1320
acgcatcaag gagtgtttga catcgcgttt atgcgacata tcccaaatat ggtccttatg 1380
atgccaaaag acgaaaacga gggtcaacac atggtgcata cagctcttag ttatgacgaa 1440
ggacctatcg cgatgagatt tccgagaggg aatggattag gcgtcaaaat ggatgagcag 1500
cttaaaacaa ttccgattgg aacatgggaa gtcttacgtc caggaaatga cgcggttatc 1560
cttacatttg gcactaccat tgagatggcg attgaggcag cagaagaact ccagaaggag 1620
ggcctgtcag tccgtgttgt taatgcgaga tttattaaac cgattgacga aaagatgatg 1680
aaaagtatcc tgaaagaagg cctgccgata cttaccatcg aggaagctgt tctggaagga 1740
ggatttggct catcaatcct tgaatttgca catgatcagg gcgaatatca cacaccgatc 1800
gatcgaatgg gcatcccgga tcgatttatc gagcatggct ccgttacagc actgcttgaa 1860
gagatcggct taacgaaaca gcaggtggca aacagaatca ggttacttat gccgccgaag 1920
acacataagg gcatcggctc ataagatcct ctagagtcga cctgcaggca tgc 1973
<210> 182
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> primer ipt1_R(pBBR1)
<400> 182
ccttactcga gtttggatcc ttaacggatt ctcgttaagg taaccgg 47
<210> 183
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> primer ipt1_R_XbaI
<400> 183
atcattctag atcaacggat tctcgttaag gta 33
<210> 184
<211> 4397
<212> DNA
<213> Artificial Sequence
<220>
<223> complete AmyE IPT1 EryR construct
<400> 184
gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60
aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120
gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180
tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240
tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300
taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360
agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420
tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480
tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540
tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600
gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660
gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720
gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780
agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840
tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900
acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960
gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020
cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080
agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140
tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200
gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260
tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320
agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380
ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440
ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500
ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560
aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620
aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680
tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740
atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800
atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860
cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920
tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980
agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040
ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100
ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160
catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220
tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280
atgcccggtt accttaacga gaatccgtta atctagaaat taagaaggag ggattcgtca 2340
tgttggtatt ccaaatgcgt tatgtagata aaacatctac tgttttgaaa cagactaaaa 2400
acagtgatta cgcagataaa taaatacgtt agattaattc ctaccagtga ctaatcttat 2460
gactttttaa acagataact aaaattacaa acaaatcgtt taacttctgt atttgtttat 2520
agatgtaatc acttcaggag tgattacatg aacaaaaata taaaatattc tcaaaacttt 2580
ttaacgagtg aaaaagtact caaccaaata ataaaacaat tgaatttaaa agaaaccgat 2640
accgtttacg aaattggaac aggtaaaggg catttaacga cgaaactggc taaaataagt 2700
aaacaggtaa cgtctattga attagacagt catctattca acttatcgtc agaaaaatta 2760
aaactgaaca ttcgtgtcac tttaattcac caagatattc tacagtttca attccctaac 2820
aaacagaggt ataaaattgt tgggaatatt ccttaccatt taagcacaca aattattaaa 2880
aaagtggttt ttgaaagcca tgcgtctgac atctatctga ttgttgaaga aggattctac 2940
aagcgtacct tggatattca ccgaacacta gggttgctct tgcacactca agtctcgatt 3000
cagcaattgc ttaagctgcc agcggaatgc tttcatccta aaccaaaagt aaacagtgtc 3060
ttaataaaac ttacccgcca taccacagat gttccagata aatattggaa gctatatacg 3120
tactttgttt caaaatgggt caatcgagaa tatcgtcaac tgtttactaa aaatcagttt 3180
catcaagcaa tgaaacacgc caaagtaaac aatttaagta ccgttactta tgagcaagta 3240
ttgtctattt ttaatagtta tctattattt aacgggagga aataattcta tgagtcgctt 3300
ttgtaaattt ggaaagttac acgttactaa agggaatgta gatggatcct gtatgccaat 3360
gatgatgaag agtcgacatg gatgagcgat gatgatatcc gtttaggctg ggcggtgata 3420
gcttctcgtt caggcagtac gcctcttttc ttttccagac ctgagggagg cggaaatggt 3480
gtgaggttcc cggggaaaag ccaaataggc gatcgcggga gtgctttatt tgaagatcag 3540
gctatcactg cggtcaatag atttcacaat gtgatggctg gacagcctga ggaactctcg 3600
aacccgaatg gaaacaacca gatatttatg aatcagcgcg gctcacatgg cgttgtgctg 3660
gcaaatgcag gttcatcctc tgtctctatc aatacggcaa caaaattgcc tgatggcagg 3720
tatgacaata aagctggagc gggttcattt caagtgaacg atggtaaact gacaggcacg 3780
atcaatgcca ggtctgtagc tgtgctttat cctgatgata ttgcaaaagc gcctcatgtt 3840
ttccttgaga attacaaaac aggtgtaaca cattctttca atgatcaact gacgattacc 3900
ttgcgtgcag atgcgaatac aacaaaagcc gtttatcaaa tcaataatgg accagagacg 3960
gcgtttaagg atggagatca attcacaatc ggaaaaggag atccatttgg caaaacatac 4020
accatcatgt taaaaggaac gaacagtgat ggtgtaacga ggaccgagaa atacagtttt 4080
gttaaaagag atccagcgtc ggccaaaacc atcggctatc aaaatccgaa tcattggagc 4140
caggtaaatg cttatatcta taaacatgat gggagccgag taattgaatt gaccggatct 4200
tggcctggaa aaccaatgac taaaaatgca gacggaattt acacgctgac gctgcctgcg 4260
gacacggata caaccaacgc aaaagtgatt tttaataatg gcagcgccca agtgcccggt 4320
cagaatcagc ctggctttga ttacgtgcta aatggtttat ataatgactc gggcttaagc 4380
ggttctcttc cccattg 4397
Claims (33)
- 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 그람-양성 세균.
- 제1항에 있어서, 상기 세균은 바실러스과(Bacillaceae) 및 코리네박테리움과(Corynebacteriaceae)로 이루어진 군으로부터 선택된 과(family)의 세균인, 그람-양성 세균.
- 제1항 또는 제2항에 있어서, 상기 세균은 바실러스과의 세균인, 그람-양성 세균.
- 제1항 또는 제2항에 있어서, 상기 세균은 코리네박테리움과의 세균인, 그람-양성 세균.
- 제1항 또는 제2항에 있어서, 상기 세균은 바실러스(Bacillus) 또는 코리네박테리움(Corynebacterium) 속의 세균인, 그람-양성 세균.
- 제1항 또는 제2항에 있어서, 상기 세균은 바실러스 속의 세균인, 그람-양성 세균.
- 제1항 또는 제2항에 있어서, 상기 세균은 코리네박테리움 속의 세균인, 그람-양성 세균.
- 제1항 또는 제2항에 있어서, 상기 세균은 바실러스 서브틸리스(Bacillus subtilis)인, 그람-양성 세균.
- 제1항 또는 제2항에 있어서, 상기 세균은 코리네박테리움 스테이셔니스(Corynebacterium stationis)인, 그람-양성 세균.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 그람-양성 세균.
- 제13항에 있어서, 상기 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제13항에 있어서, 상기 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제13항에 있어서, 상기 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 세균은 변형되지 않은 다른 동일한 세균과 비교하여 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 추가 변형된, 그람-양성 세균.
- 제17항에 있어서, 상기 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제17항에 있어서, 상기 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63 내지 65 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 65 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제17항에 있어서, 상기 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제17항에 있어서, 상기 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 64의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 64의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 하나의 효소)의 발현 및/또는 활성이 증가되도록 추가 변형된, 그람-양성 세균.
- 제22항에 있어서, 상기 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실 전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀 전이효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소 및 아데노신 키나제 활성이 있는 효소로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 추가 변형된, 그람-양성 세균.
- 제24항에 있어서, 상기 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소 및 아데노신-포스포리보실 전이효소 활성이 있는 효소로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제1항 내지 제25항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 추가 변형된, 그람-양성 세균.
- 제26항에 있어서, 상기 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소는 IMP 탈수소효소 활성이 있는 효소 및 GMP 합성효소 활성이 있는 효소로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 제1항 내지 제27항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 추가 변형된, 그람-양성 세균.
- 제28항에 있어서, 상기 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 i) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
- 적합한 배양 배지에서 적합한 배양 조건 하에서 제1항 내지 제29항 중 어느 한 항에 따른 세균을 배양하는 단계를 포함하는, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.
- 제30항에 있어서, 상기 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 트랜스-제아틴(tZ), 트랜스-제아틴 리보사이드(tZR), N 6 -(D2-아이소펜테닐)아데닌(iP), N(6)-(다이메틸알릴)아데노신(iPR), 다이하이드로제아틴(DZ), 리보실 다이하이드로제아틴(DZR) 및 이들의 조합으로 이루어진 군으로부터 선택된, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.
- 제30항 또는 제31항에 있어서, 상기 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 각각 트랜스-제아틴(tZ) 및 트랜스-제아틴 리보사이드(tZR)인, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.
- 제30항에 있어서, 상기 방법은 트랜스-제아틴(tZ)을 생산하기 위한 방법인, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20075015.6A EP4006139A1 (en) | 2020-11-26 | 2020-11-26 | Genetically engineered bacterium capable of producing cytokinins with isoprenoid side chains |
EP20075015.6 | 2020-11-26 | ||
PCT/EP2021/083188 WO2022112509A1 (en) | 2020-11-26 | 2021-11-26 | Genetically engineered bacterium capable of producing cytokinins with isoprenoid side chains |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230112679A true KR20230112679A (ko) | 2023-07-27 |
Family
ID=73747858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237021062A KR20230112679A (ko) | 2020-11-26 | 2021-11-26 | 아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240018559A1 (ko) |
EP (2) | EP4006139A1 (ko) |
JP (1) | JP2023550969A (ko) |
KR (1) | KR20230112679A (ko) |
CN (1) | CN116745410A (ko) |
CA (1) | CA3199885A1 (ko) |
WO (1) | WO2022112509A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118202058A (zh) * | 2021-08-15 | 2024-06-14 | 安道麦智利股份有限公司 | 酵母中细胞分裂素的异源生产 |
WO2024123110A1 (ko) * | 2022-12-08 | 2024-06-13 | 씨제이제일제당 (주) | 퓨린 뉴클레오티드를 생산하는 미생물 및 이를 이용한 퓨린 뉴클레오티드의 생산방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SU908092A1 (ru) | 1980-09-04 | 1984-12-30 | Всесоюзный научно-исследовательский институт генетики и селекции промышленных микроорганизмов | Способ получени рибофлавина |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
-
2020
- 2020-11-26 EP EP20075015.6A patent/EP4006139A1/en active Pending
-
2021
- 2021-11-26 JP JP2023532104A patent/JP2023550969A/ja active Pending
- 2021-11-26 CA CA3199885A patent/CA3199885A1/en active Pending
- 2021-11-26 CN CN202180091809.8A patent/CN116745410A/zh active Pending
- 2021-11-26 EP EP21819848.9A patent/EP4251745A1/en active Pending
- 2021-11-26 KR KR1020237021062A patent/KR20230112679A/ko unknown
- 2021-11-26 WO PCT/EP2021/083188 patent/WO2022112509A1/en active Application Filing
- 2021-11-26 US US18/037,918 patent/US20240018559A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3199885A1 (en) | 2022-06-02 |
US20240018559A1 (en) | 2024-01-18 |
EP4006139A1 (en) | 2022-06-01 |
JP2023550969A (ja) | 2023-12-06 |
EP4251745A1 (en) | 2023-10-04 |
CN116745410A (zh) | 2023-09-12 |
WO2022112509A1 (en) | 2022-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ochi | From microbial differentiation to ribosome engineering | |
US20140234258A1 (en) | RNA Interferases and Methods of Use Thereof | |
US20040229305A1 (en) | Novel polynucleotides encoding useful polypeptides in corynebacterium glutamicum SSP. lactofermentum | |
RU2504584C2 (ru) | СПОСОБ ПОЛУЧЕНИЯ ПИРРОЛОХИНОЛИНОХИНОНА (PQQ) С ИСПОЛЬЗОВАНИЕМ БАКТЕРИИ РОДА Methylobacterium ИЛИ Hyphomicrobium | |
KR20180083350A (ko) | 니코틴아미드 리보시드의 미생물학적 제조 | |
KR20230112679A (ko) | 아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균 | |
CN107922464B (zh) | 经改进的维生素生产 | |
Lai et al. | Characterization and regulation of the osmolyte betaine synthesizing enzymes GSMT and SDMT from halophilic methanogen Methanohalophilus portucalensis | |
CA2595873C (en) | Dna fragment encoding an enzyme having polyphosphate-driven adp phosphorylation activity | |
Gray et al. | The cobinamide amidohydrolase (cobyric acid‐forming) CbiZ enzyme: a critical activity of the cobamide remodelling system of Rhodobacter sphaeroides | |
CN114286858B (zh) | 叶酸生产菌株及其制备和应用 | |
KR20130101030A (ko) | 변형된 미생물을 사용한 개선된 글리콜산 발효 생산 | |
WO2021050371A1 (en) | Biotin synthases for efficient production of biotin | |
AU2021201969A1 (en) | Process | |
KR20110104955A (ko) | 리보플라빈의 제조 방법 | |
CN115667518A (zh) | 重组的微生物和方法 | |
CN115175994A (zh) | 组氨酸、嘌呤途径代谢物和质粒dna的增强的产生 | |
CN110607335B (zh) | 一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法 | |
US20040091985A1 (en) | NAD phosphite oxidoreductase, a novel catalyst from bacteria for regeneration of NAD(P)H | |
Rusnak et al. | The adenylate kinases from a mesophilic and three thermophilic methanogenic members of the Archaea | |
US20110217734A1 (en) | Compositions and methods for the synthesis of appa-containing peptides | |
KR100679759B1 (ko) | 관능기에 의해 수식된 이차 대사산물을 생산하는형질전환체 및 신규 생합성 유전자 | |
Ünsaldı et al. | Proteomic analysis of a hom-disrupted, cephamycin C overproducing Streptomyces clavuligerus | |
CN110551739A (zh) | 吡唑霉素生物合成基因簇、重组菌及其应用 | |
CN116096881A (zh) | 生产5-甲基叶酸盐的微生物 |