TW202330903A - 用於重組蛋白產生之定製菌株 - Google Patents
用於重組蛋白產生之定製菌株 Download PDFInfo
- Publication number
- TW202330903A TW202330903A TW111139536A TW111139536A TW202330903A TW 202330903 A TW202330903 A TW 202330903A TW 111139536 A TW111139536 A TW 111139536A TW 111139536 A TW111139536 A TW 111139536A TW 202330903 A TW202330903 A TW 202330903A
- Authority
- TW
- Taiwan
- Prior art keywords
- amino acid
- rna polymerase
- genetically modified
- acid sequence
- modified microorganism
- Prior art date
Links
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title claims abstract description 32
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title claims abstract description 32
- 230000014616 translation Effects 0.000 title description 12
- 244000005700 microbiome Species 0.000 claims abstract description 110
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000014509 gene expression Effects 0.000 claims abstract description 38
- 150000001413 amino acids Chemical group 0.000 claims description 154
- 108090000623 proteins and genes Proteins 0.000 claims description 134
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 126
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 126
- 150000007523 nucleic acids Chemical group 0.000 claims description 121
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 93
- 102000004169 proteins and genes Human genes 0.000 claims description 90
- 101710137500 T7 RNA polymerase Proteins 0.000 claims description 63
- 238000006467 substitution reaction Methods 0.000 claims description 58
- 102000039446 nucleic acids Human genes 0.000 claims description 46
- 108020004707 nucleic acids Proteins 0.000 claims description 46
- 241000588724 Escherichia coli Species 0.000 claims description 36
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 36
- 101150043276 Lon gene Proteins 0.000 claims description 34
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 34
- 229920001184 polypeptide Polymers 0.000 claims description 33
- 210000002706 plastid Anatomy 0.000 claims description 28
- 101150026430 manA gene Proteins 0.000 claims description 26
- 101150041441 fcl gene Proteins 0.000 claims description 25
- 230000004048 modification Effects 0.000 claims description 25
- 238000012986 modification Methods 0.000 claims description 25
- 230000035772 mutation Effects 0.000 claims description 25
- 101150106565 gmd gene Proteins 0.000 claims description 24
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 22
- 101100168102 Yersinia pseudotuberculosis colC gene Proteins 0.000 claims description 21
- 101150093139 ompT gene Proteins 0.000 claims description 21
- AEMOLEFTQBMNLQ-VANFPWTGSA-N D-mannopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@@H]1O AEMOLEFTQBMNLQ-VANFPWTGSA-N 0.000 claims description 20
- 101100345994 Aspergillus oryzae (strain ATCC 42149 / RIB 40) mns1B gene Proteins 0.000 claims description 18
- 101100346210 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pmi1 gene Proteins 0.000 claims description 18
- 101100075926 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) pmi gene Proteins 0.000 claims description 18
- 238000004519 manufacturing process Methods 0.000 claims description 18
- 238000013518 transcription Methods 0.000 claims description 15
- 230000035897 transcription Effects 0.000 claims description 15
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims description 14
- 239000004471 Glycine Substances 0.000 claims description 13
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 claims description 12
- 108010065868 RNA polymerase SP6 Proteins 0.000 claims description 11
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 claims description 11
- 101150079601 recA gene Proteins 0.000 claims description 11
- 101150012763 endA gene Proteins 0.000 claims description 9
- 101150088678 manB gene Proteins 0.000 claims description 9
- 101150032120 manC gene Proteins 0.000 claims description 8
- 101150053253 pgi gene Proteins 0.000 claims description 8
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 claims description 7
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 claims description 7
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 claims description 7
- 230000006819 RNA synthesis Effects 0.000 claims description 6
- 102220005330 rs34956202 Human genes 0.000 claims description 6
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 claims description 5
- 210000003097 mucus Anatomy 0.000 claims description 5
- 101100075927 Aspergillus aculeatus mndA gene Proteins 0.000 claims description 4
- 101100447530 Dictyostelium discoideum gpi gene Proteins 0.000 claims description 4
- 101100022282 Escherichia coli O157:H7 manC2 gene Proteins 0.000 claims description 4
- 101100120969 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) pgi1 gene Proteins 0.000 claims description 4
- 235000003869 genetically modified organism Nutrition 0.000 claims description 4
- 101150089949 kduI gene Proteins 0.000 claims description 4
- 230000023852 carbohydrate metabolic process Effects 0.000 claims description 2
- 235000021256 carbohydrate metabolism Nutrition 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 15
- 108091005804 Peptidases Proteins 0.000 abstract description 9
- 239000004365 Protease Substances 0.000 abstract description 9
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 abstract description 6
- 210000004027 cell Anatomy 0.000 description 94
- 235000018102 proteins Nutrition 0.000 description 76
- 235000001014 amino acid Nutrition 0.000 description 68
- 102000053602 DNA Human genes 0.000 description 52
- 108020004414 DNA Proteins 0.000 description 52
- 239000013598 vector Substances 0.000 description 45
- 101100235786 Rattus norvegicus Lonp1 gene Proteins 0.000 description 26
- 229940024606 amino acid Drugs 0.000 description 25
- 125000003729 nucleotide group Chemical group 0.000 description 25
- 239000002773 nucleotide Substances 0.000 description 24
- 230000001580 bacterial effect Effects 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 21
- 238000012217 deletion Methods 0.000 description 20
- 230000037430 deletion Effects 0.000 description 20
- 238000003786 synthesis reaction Methods 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 19
- 102000004190 Enzymes Human genes 0.000 description 18
- 108090000790 Enzymes Proteins 0.000 description 18
- 229940088598 enzyme Drugs 0.000 description 18
- 238000000855 fermentation Methods 0.000 description 18
- 230000004151 fermentation Effects 0.000 description 18
- 101710136501 Mannan endo-1,4-beta-mannosidase Proteins 0.000 description 17
- 108020004705 Codon Proteins 0.000 description 16
- 150000004676 glycans Chemical class 0.000 description 16
- 108020004999 messenger RNA Proteins 0.000 description 16
- 229920001282 polysaccharide Polymers 0.000 description 16
- 239000005017 polysaccharide Substances 0.000 description 16
- 102000040430 polynucleotide Human genes 0.000 description 15
- 108091033319 polynucleotide Proteins 0.000 description 15
- 239000002157 polynucleotide Substances 0.000 description 15
- MVMSCBBUIHUTGJ-GDJBGNAASA-N GDP-alpha-D-mannose Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=C(NC(=O)C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@@H]1O MVMSCBBUIHUTGJ-GDJBGNAASA-N 0.000 description 13
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 12
- 229920001817 Agar Polymers 0.000 description 11
- 101000658547 Escherichia coli (strain K12) Type I restriction enzyme EcoKI endonuclease subunit Proteins 0.000 description 11
- 108700026244 Open Reading Frames Proteins 0.000 description 11
- 239000003550 marker Substances 0.000 description 11
- 241000894006 Bacteria Species 0.000 description 10
- 239000002253 acid Substances 0.000 description 10
- 239000008272 agar Substances 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 239000008188 pellet Substances 0.000 description 10
- 108091026890 Coding region Proteins 0.000 description 9
- NBSCHQHZLSJFNQ-QTVWNMPRSA-N D-Mannose-6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@@H]1O NBSCHQHZLSJFNQ-QTVWNMPRSA-N 0.000 description 9
- 230000007613 environmental effect Effects 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 8
- 230000012010 growth Effects 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 239000006166 lysate Substances 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 230000000813 microbial effect Effects 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 description 7
- PNHLMHWWFOPQLK-BKUUWRAGSA-N GDP-4-dehydro-6-deoxy-alpha-D-mannose Chemical compound O[C@H]1[C@@H](O)C(=O)[C@@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(NC(N)=N3)=O)N=C2)O1 PNHLMHWWFOPQLK-BKUUWRAGSA-N 0.000 description 7
- 229930006000 Sucrose Natural products 0.000 description 7
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 7
- HXXFSFRBOHSIMQ-RWOPYEJCSA-N alpha-D-mannose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-RWOPYEJCSA-N 0.000 description 7
- 230000008030 elimination Effects 0.000 description 7
- 238000003379 elimination reaction Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 239000005720 sucrose Substances 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- -1 -modified nucleotide triphosphates Chemical class 0.000 description 6
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 6
- 238000012258 culturing Methods 0.000 description 6
- 210000000805 cytoplasm Anatomy 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 238000006317 isomerization reaction Methods 0.000 description 6
- 101150109249 lacI gene Proteins 0.000 description 6
- 230000037361 pathway Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- MVMSCBBUIHUTGJ-UHFFFAOYSA-N 10108-97-1 Natural products C1=2NC(N)=NC(=O)C=2N=CN1C(C(C1O)O)OC1COP(O)(=O)OP(O)(=O)OC1OC(CO)C(O)C(O)C1O MVMSCBBUIHUTGJ-UHFFFAOYSA-N 0.000 description 5
- LQEBEXMHBLQMDB-UHFFFAOYSA-N GDP-L-fucose Natural products OC1C(O)C(O)C(C)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C3=C(C(N=C(N)N3)=O)N=C2)O1 LQEBEXMHBLQMDB-UHFFFAOYSA-N 0.000 description 5
- LQEBEXMHBLQMDB-JGQUBWHWSA-N GDP-beta-L-fucose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(NC(N)=N3)=O)N=C2)O1 LQEBEXMHBLQMDB-JGQUBWHWSA-N 0.000 description 5
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- 108010055016 Rec A Recombinases Proteins 0.000 description 5
- 102000001218 Rec A Recombinases Human genes 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 235000004279 alanine Nutrition 0.000 description 5
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 230000002950 deficient Effects 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000001301 oxygen Substances 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 241000894007 species Species 0.000 description 5
- FPGGTKZVZWFYPV-UHFFFAOYSA-M tetrabutylammonium fluoride Chemical compound [F-].CCCC[N+](CCCC)(CCCC)CCCC FPGGTKZVZWFYPV-UHFFFAOYSA-M 0.000 description 5
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 4
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 108091036066 Three prime untranslated region Proteins 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- 239000004473 Threonine Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 125000003277 amino group Chemical group 0.000 description 4
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 description 4
- 238000005251 capillar electrophoresis Methods 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- OIRDTQYFTABQOQ-KQYNXXCUSA-N Adenosine Natural products C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- 108010054278 Lac Repressors Proteins 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 102000016943 Muramidase Human genes 0.000 description 3
- 108010014251 Muramidase Proteins 0.000 description 3
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 229960003669 carbenicillin Drugs 0.000 description 3
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 210000004081 cilia Anatomy 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 210000003000 inclusion body Anatomy 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- GSXOAOHZAIYLCY-HSUXUTPPSA-N keto-D-fructose 6-phosphate Chemical compound OCC(=O)[C@@H](O)[C@H](O)[C@H](O)COP(O)(O)=O GSXOAOHZAIYLCY-HSUXUTPPSA-N 0.000 description 3
- 238000009630 liquid culture Methods 0.000 description 3
- 229960000274 lysozyme Drugs 0.000 description 3
- 239000004325 lysozyme Substances 0.000 description 3
- 235000010335 lysozyme Nutrition 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000012261 overproduction Methods 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- IMUGYKFHMJLTOU-UCORVYFPSA-N 5-dehydro-4-deoxy-D-glucuronic acid Chemical compound O=C[C@H](O)[C@@H](O)CC(=O)C(O)=O IMUGYKFHMJLTOU-UCORVYFPSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 241001522878 Escherichia coli B Species 0.000 description 2
- 241000672609 Escherichia coli BL21 Species 0.000 description 2
- 241001646716 Escherichia coli K-12 Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 102000015930 Lon proteases Human genes 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108010010677 Phosphodiesterase I Proteins 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 108010023294 Protease La Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- DLRVVLDZNNYCBX-CAPXFGMSSA-N allolactose Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@@H]1OC[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](O)O1 DLRVVLDZNNYCBX-CAPXFGMSSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 238000003209 gene knockout Methods 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 230000008826 genomic mutation Effects 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 125000006308 propyl amino group Chemical group 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- FGDZQCVHDSGLHJ-UHFFFAOYSA-M rubidium chloride Chemical compound [Cl-].[Rb+] FGDZQCVHDSGLHJ-UHFFFAOYSA-M 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 101150061166 tetR gene Proteins 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- IAJILQKETJEXLJ-KLVWXMOXSA-N (2s,3r,4r,5r)-2,3,4,5-tetrahydroxy-6-oxohexanoic acid Chemical compound O=C[C@H](O)[C@H](O)[C@@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-KLVWXMOXSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 101800000535 3C-like proteinase Proteins 0.000 description 1
- 101800002396 3C-like proteinase nsp5 Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101710180995 Endonuclease 1 Proteins 0.000 description 1
- 102100030011 Endoribonuclease Human genes 0.000 description 1
- 108010093099 Endoribonucleases Proteins 0.000 description 1
- 101100280818 Escherichia coli (strain K12) fcl gene Proteins 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241000700662 Fowlpox virus Species 0.000 description 1
- 102100024515 GDP-L-fucose synthase Human genes 0.000 description 1
- 108030006298 GDP-L-fucose synthases Proteins 0.000 description 1
- 108010062427 GDP-mannose 4,6-dehydratase Proteins 0.000 description 1
- 102000002312 GDPmannose 4,6-dehydratase Human genes 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 description 1
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 1
- 108010068370 Glutens Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- 108010038016 Mannose-1-phosphate guanylyltransferase Proteins 0.000 description 1
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 1
- 102000048193 Mannose-6-phosphate isomerases Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 230000027151 SOS response Effects 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- GBXZONVFWYCRPT-KVTDHHQDSA-N [(2s,3s,4r,5r)-3,4,5,6-tetrahydroxy-1-oxohexan-2-yl] dihydrogen phosphate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](C=O)OP(O)(O)=O GBXZONVFWYCRPT-KVTDHHQDSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000010455 autoregulation Effects 0.000 description 1
- 210000003578 bacterial chromosome Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 230000005587 bubbling Effects 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000025084 cell cycle arrest Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 235000015111 chews Nutrition 0.000 description 1
- RPKLZQLYODPWTM-KBMWBBLPSA-N cholanoic acid Chemical compound C1CC2CCCC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@@H](CCC(O)=O)C)[C@@]1(C)CC2 RPKLZQLYODPWTM-KBMWBBLPSA-N 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 101150027335 cpsB gene Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 229920006227 ethylene-grafted-maleic anhydride Polymers 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 238000005469 granulation Methods 0.000 description 1
- 230000003179 granulation Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 101150017580 mcrC gene Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 208000009305 pseudorabies Diseases 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 101150042353 symE gene Proteins 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108020005087 unfolded proteins Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
- C12N9/92—Glucose isomerase (5.3.1.5; 5.3.1.9; 5.3.1.18)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01271—GDP-L-fucose synthase (1.1.1.271)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07013—Mannose-1-phosphate guanylyltransferase (2.7.7.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21053—Endopeptidase La (3.4.21.53)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/23—Aspartic endopeptidases (3.4.23)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/01047—GDP-mannose 4,6-dehydratase (4.2.1.47), i.e. GMD
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y503/00—Intramolecular oxidoreductases (5.3)
- C12Y503/01—Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
- C12Y503/01008—Mannose-6-phosphate isomerase (5.3.1.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y503/00—Intramolecular oxidoreductases (5.3)
- C12Y503/01—Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
- C12Y503/01009—Glucose-6-phosphate isomerase (5.3.1.9)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y503/00—Intramolecular oxidoreductases (5.3)
- C12Y503/01—Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
- C12Y503/01017—5-Dehydro-4-deoxy-D-glucuronate isomerase (5.3.1.17)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y504/00—Intramolecular transferases (5.4)
- C12Y504/02—Phosphotransferases (phosphomutases) (5.4.2)
- C12Y504/02008—Phosphomannomutase (5.4.2.8)
Abstract
本文描述經基因修飾之微生物,其具有降低之使重組蛋白表現之蛋白酶活性,且無黏液表型。亦描述其製造及使用方法。
Description
大腸埃希氏桿菌 (Escherichia coli) (
大腸桿菌)在生物技術及藥物開發方面有著悠久的歷史,且多年來一直用作產生質體DNA之宿主。此係歸因於多種原因,其中包括大腸桿菌之基因簡單性(
例如,約4,400個較少數目之基因)、生長速率、安全性、成功作為外來DNA之宿主以及易於護理。
大腸桿菌使用之悠久歷史亦使其成為研究得很透徹之生物體,其已以多種方式進行操縱。例如,出於不同目的,包括選殖、質體DNA產生及蛋白質表現,已構築若干種不同菌株。
大腸桿菌K12衍生物(諸如DH5α、JM108、DH10β及其他)最常用於質體DNA選殖及產生,因為其具有選殖目的所需之特定基因組突變。此等主要引起編碼核酸酶、重組酶及降低菌株之DNA穩定性、純度及選殖效率之其他酶的基因失活。
由於其作為質體選殖及產生之宿主細菌之歷史,
大腸桿菌亦常用於重組蛋白之表現。然而,
大腸桿菌基因組編碼諸如OmpT及Lon之多種蛋白酶,該等蛋白酶可使細菌表現之蛋白質,尤其是突變或外來蛋白質裂解。此等蛋白酶之存在減少可自給定
大腸桿菌細胞中成功純化之重組蛋白之量。此外,
大腸桿菌之一些蛋白酶缺陷型變異體展現黏液表型,此會干擾細菌之基因操縱、發酵過程中細胞之混合及有氧環境之維持以及細菌細胞與培養基之分離。
本文描述用於增強質體DNA產生、重組蛋白表現及提高蛋白質產量之經工程改造之細菌菌株及載體。諸如OmpT及Lon之細菌蛋白酶可使蛋白質,尤其是突變及外來蛋白質裂解,此限制在細菌細胞中表現之重組蛋白之產量。許多常用於重組蛋白表現之細菌菌株,諸如
大腸埃希氏桿菌BL21細胞,經修飾而缺失
ompT基因,且諸如BL21之
大腸桿菌B菌株被認為由於lon基因之啟動子中的一或多個突變而天然缺乏
lon蛋白酶活性。然而,細菌染色體中完全缺失
lon基因可進一步提高蛋白質產量,但會導致細菌菌株出現黏液表型,此表明
lon基因仍在
大腸桿菌B菌株中表現。此黏液表型歸因於在缺乏Lon蛋白酶活性之情況下過量多醣之積累,干擾細菌之高效粒化及重組蛋白之後續純化。此黏液表型在缺乏
manA之菌株中不存在,
manA催化GDP-甘露糖合成之第一步,因此為產生含有甘露糖之多醣所必需的。因此,相對於未經修飾之細菌菌株,缺少
ompT、
lon及細胞外多醣合成所需之一或多種基因(
例如 manA)的細菌菌株產生更大量之重組蛋白。
因此,本揭示案之一些態樣係關於一種經基因修飾之微生物,其包含
ompT基因及
lon基因已發生突變、失能或缺失之基因組。在一些實施例中,微生物不表現一或多種選自由G6PI、ManA、ManB、ManC、Gmd、Fcl及KduI組成之群之蛋白質的功能形式。在一些實施例中,基因組包含選自由
pgi、
manA、
manB、
manC、
gmd、
fcl及
kduI組成之群之基因中的突變。在一些實施例中,基因組包含與選自由
pgi、
manA、
manB、
manC、
gmd、
fcl及
kduI組成之群之基因可操作地連接之啟動子中的突變。在一些實施例中,基因組不包含編碼選自由G6PI、ManA、ManB、ManC、Gmd、Fcl及KduI組成之群之碳水化合物代謝蛋白的核酸序列。
在一些實施例中,微生物不表現功能性ManA。在一些實施例中,基因組包含
manA基因或與該
manA基因可操作地連接之啟動子中的突變。在一些實施例中,基因組不包含編碼ManA之核酸序列。
在一些實施例中,基因組包含i)與SEQ ID NO: 23具有至少90%序列一致性之第一核酸序列,及ii)與SEQ ID NO: 25具有至少90%序列一致性之第二核酸序列。在一些實施例中,基因組進一步包含與SEQ ID NO: 24具有至少90%序列一致性之第三核酸序列。在一些實施例中,微生物未展現黏液表型。在一些實施例中,經基因修飾之微生物不能合成甘露糖。在一些實施例中,經基因修飾之微生物不能合成岩藻糖。
在一些實施例中,基因組不包含編碼
endA之核酸序列,基因組不包含編碼
recA之核酸序列,且EcoK1限制系統已失活。在一些實施例中,微生物之基因型為
ΔendA ΔrecA Δ(
mrr-hsdRMS-symE-mcrBC)
ΔompT ΔmanA Δlon。在一些實施例中,微生物為
大腸桿菌。在一些實施例中,微生物來源於
大腸桿菌MG1655。
在一些實施例中,經基因修飾之微生物包含編碼重組蛋白之核酸序列。在一些實施例中,編碼重組蛋白之核酸序列位於微生物之基因組中。在一些實施例中,編碼重組蛋白之核酸序列位於質體上。在一些實施例中,重組蛋白為RNA聚合酶。在一些實施例中,RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。
在一些實施例中,RNA聚合酶包含(a)在用於從頭RNA合成之結合位點殘基處之胺基酸取代;及(b)相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。在一些實施例中,胺基酸修飾為相對於野生型RNA聚合酶在位置47處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中,在位置47處之胺基酸取代為G47A。在一些實施例中,相對於野生型RNA聚合酶,胺基酸修飾包含額外C端胺基酸。在一些實施例中,額外C端胺基酸為甘胺酸。在一些實施例中,RNA聚合酶包含胺基酸序列SEQ NO: 41。在一些實施例中,RNA聚合酶變異體包含相對於野生型RNA聚合酶,在位置350處之胺基酸取代,及/或在位置351處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中,在位置350處之胺基酸取代為E350W。在一些實施例中,在位置351處之胺基酸取代為D351V。在一些實施例中,在位置350處之胺基酸取代為E350W,且在位置351處之胺基酸取代為D351V。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 42之胺基酸序列。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 43之胺基酸序列。
在一些態樣中,本揭示案係關於一種用於產生多肽或蛋白質之方法,其包括以下步驟:i)將包含編碼多肽或蛋白質之序列的核酸分子引入至本文所述之經基因修飾之微生物中的一者中;ii)在適於表現該多肽或蛋白質之條件下培養該經基因修飾之生物體;及iii)分離該多肽或蛋白質。
在一些態樣中,本揭示案係關於一種用於產生多肽或蛋白質之方法,其包括以下步驟:i)在適於表現該多肽或蛋白質之條件下培養本文所述之經基因修飾之微生物中的一者;及ii)分離該多肽或蛋白質。
在本文所述之方法的一些實施例中,多肽或蛋白質為RNA聚合酶。在一些實施例中,RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。在一些實施例中,RNA聚合酶包含(a)在用於從頭RNA合成之結合位點殘基處之胺基酸取代;及(b)相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。在一些實施例中,胺基酸修飾為相對於野生型RNA聚合酶在位置47處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中,在位置47處之胺基酸取代為G47A。在一些實施例中,相對於野生型RNA聚合酶,胺基酸修飾包含額外C端胺基酸。在一些實施例中,額外C端胺基酸為甘胺酸。在一些實施例中,RNA聚合酶包含胺基酸序列SEQ NO: 42。在一些實施例中,RNA聚合酶變異體包含相對於野生型RNA聚合酶,在位置350處之胺基酸取代,及/或在位置351處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中,在位置350處之胺基酸取代為E350W。在一些實施例中,在位置351處之胺基酸取代為D351V。在一些實施例中,在位置350處之胺基酸取代為E350W,且在位置351處之胺基酸取代為D351V。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 42之胺基酸序列。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 43之胺基酸序列。
相關申請案
本申請案根據35 U.S.C. § 119(e)主張2021年10月18日提出申請之美國臨時申請案第63/256,690號及2022年1月28日提出申請之美國臨時申請案第63/304,195號較早提出申請日期的權益,該等美國臨時申請案之內容以引用之方式整體併入本文中。
經基因修飾之微生物
本揭示案之一些態樣係關於經基因修飾之微生物,其包含
ompT基因及
lon基因已發生突變、失能或缺失之基因組。如本文所用,微生物之基因組係指微生物之一或多個染色體,其為細胞存活及複製所需之長DNA分子。
ompT基因編碼蛋白質OmpT,該蛋白質為一種在
大腸埃希氏菌外膜中常見之天冬胺醯蛋白酶。當
大腸桿菌細胞溶解時,外膜中之OmpT會裂解在細胞質中穩定之蛋白質,諸如T7 RNA聚合酶,從而減少可自表現該蛋白質之
大腸桿菌細胞中分離之完整蛋白質之量(
參見例如Grodberg
等人 J Bacteriol.1988. 170(3):1245-1253)。因此,基因組中缺失ompT基因增加可自微生物細胞中純化之蛋白質之量。
ompT基因之DNA序列之一個實例由登錄號M23630.1給出且再現為SEQ ID NO: 27。OmpT蛋白之胺基酸序列之一個實例由登錄號P09169給出且再現為SEQ ID NO: 28。
lon基因編碼蛋白質Lon,該蛋白質為一種參與未折疊蛋白質(包括突變及異常蛋白質)之降解的ATP依賴性絲胺酸蛋白酶。因此,Lon在微生物細胞中之存在減少可自表現蛋白質之細胞中分離之蛋白質之量。
lon基因之DNA序列之一個實例由登錄號M38347.1給出且再現為SEQ ID NO: 29。Lon蛋白之胺基酸序列之一個實例由登錄號P0A9M0給出且再現為SEQ ID NO: 30。若基因或核酸序列相對於野生型序列包含一或多個修飾,諸如插入、缺失或取代,則稱其發生突變。插入為一種如下修飾,其中經修飾之核酸序列與野生型核酸序列之不同之處在於向野生型序列添加一或多個核苷酸。缺失係一種如下修飾,其中經修飾之核酸序列與野生型序列之不同之處在於移除一或多個核苷酸。取代係一種如下修飾,其中經修飾之核酸序列與野生型序列之不同之處在於序列位置上之一個核苷酸變為不同核苷酸。若基因或核酸序列編碼之蛋白質相對於野生型基因或核酸序列編碼之蛋白質具有降低之功能,則稱該基因或核酸序列失能。若包含基因或核酸序列之基因組經修飾使得在修飾後基因組不包含該基因或核酸序列,則稱該基因或核酸序列在基因組中缺失。與基因或核酸序列可操作地連接之啟動子之突變或缺失通常會降低基因之表現,但若基因或核酸序列存在於基因組中,則替代啟動子或RNA聚合酶之非特異性轉錄可能引起基因或核酸序列之轉錄,且因此產生編碼之蛋白質。基因組中缺失該基因或核酸序列可防止此類轉錄機制,且防止具有已缺失該基因或核酸序列之基因組之細胞產生蛋白質。
在本文所述之經基因修飾之微生物的一些實施例中,微生物不表現功能性ManA。ManA或甘露糖-6-磷酸異構酶係由
manA基因編碼之酶,其催化D-果糖-6-磷酸轉化為D-哌喃甘露糖6-磷酸或D-甘露糖-6-磷酸。此反應為合成GDP-甘露糖所需途徑之第一步。Lee
等人,
Microb Cell Fact.2012. 11:48 (
參見例如圖1)提供
大腸桿菌中此合成途徑之一個實例。因此,消除ManA功能可抑制甘露糖之合成,且因而抑制含有甘露糖之莢膜多醣之合成,莢膜多醣可在細菌中引起黏液表型。
manA基因之DNA序列之一個實例由登錄號M15380.1給出且再現為SEQ ID NO: 31。ManA蛋白之胺基酸序列之一個實例由登錄號P00946給出且再現為SEQ ID NO: 32。細胞中缺乏功能性ManA可阻止細胞產生GDP-甘露糖。功能性ManA係指能夠催化D-果糖-6-磷酸轉化為D-哌喃甘露糖6-磷酸或D-甘露糖-6-磷酸之ManA形式。若細胞表現不催化D-果糖-6-磷酸轉化為D-哌喃甘露糖6-磷酸或D-甘露糖-6-磷酸之ManA形式,或者若其不表現任何ManA蛋白,則稱細胞缺乏功能性ManA之表現或不表現功能性ManA。
在一些實施例中,基因組包含
manA基因或與該
manA基因可操作地連接之啟動子中的突變。如本文所用,突變係指對核酸序列之一種修飾,其中一或多個核苷酸經不同核苷酸取代(取代),或者添加一或多個核苷酸(插入)或自序列中移除一或多個核苷酸(缺失)。編碼蛋白質之核酸序列中之突變可改變編碼之蛋白質之胺基酸序列。例如,將終止密碼子引入至編碼序列中之突變(無意義突變)引起蛋白質之截短形式之轉譯。引入或移除除三之倍數以外之多個核苷酸(例如1個、2個、4個或5個核苷酸)的突變可導致自插入或缺失點開始之核酸序列編碼不同胺基酸(框移突變)。將編碼第一個胺基酸之密碼子變為編碼不同胺基酸之密碼子的突變引起在對應於發生取代之密碼子之位置處具有不同胺基酸之蛋白質之轉譯(誤義突變)。啟動子中之突變可阻止RNA聚合酶與啟動子相互作用且啟動轉錄,且因此抑制與啟動子可操作地連接之核酸序列的表現。啟動子為控制與其可操作地連接之基因或核酸序列之表現的核酸序列。若啟動子控制基因表現之程度,則稱啟動子與基因可操作地連接。啟動子可為組成型啟動子,其引起可操作地連接之基因以一致之水準表現。啟動子可為條件型啟動子,其基於環境條件調節可操作地連接之基因之表現,該等條件諸如刺激物如小分子、蛋白質或核酸之存在、不存在或數量。在一些實施例中,基因組不包含編碼ManA之核酸序列。
在本文所述之經基因修飾之微生物的一些實施例中,微生物不表現功能性G6PI。G6PI或葡萄糖6-磷酸異構酶係由
pgi基因編碼之酶,其催化葡萄糖6-磷酸可逆異構化成果糖6-磷酸,此為GDP-甘露糖合成所需的。因此,消除G6PI功能可抑制甘露糖之合成,且因而抑制含有甘露糖之莢膜多醣之合成,莢膜多醣可在細菌中引起黏液表型。
pgi基因之DNA序列之一個實例由登錄號X15196給出且再現為SEQ ID NO: 49。G6PI蛋白之胺基酸序列之一個實例由登錄號P0A6T1給出且再現為SEQ ID NO: 50。細胞中缺乏功能性G6PI可阻止細胞將葡萄糖-6-磷酸異構化為果糖-6-磷酸。功能性G6PI係指能夠催化葡萄糖-6-磷酸異構化為果糖-6-磷酸之G6PI形式。若細胞表現不催化葡萄糖-6-磷酸異構化為果糖-6-磷酸之G6PI形式,或者其不表現任何G6PI蛋白,則稱該細胞缺乏功能性G6PI之表現或不表現功能性G6PI。在一些實施例中,基因組包含
pgi基因或與該
pgi基因可操作地連接之啟動子中的突變。在一些實施例中,基因組不包含編碼G6PI之核酸序列。
在本文所述之經基因修飾之微生物的一些實施例中,微生物不表現功能性ManB。ManB或磷酸甘露糖變位酶係由
manB基因編碼之酶,其催化D-甘露糖6-磷酸轉化為α-D-甘露糖1-磷酸,此為GDP-甘露糖合成所需的。因此,消除ManB功能可抑制甘露糖之合成,且因而抑制含有甘露糖之莢膜多醣之合成,莢膜多醣可在細菌中引起黏液表型。ManB在此項技術中亦稱為CpsG,其由
cpsG基因編碼。
manB基因之DNA序列之一個實例由登錄號AAC77847給出且再現為SEQ ID NO: 51。ManB蛋白之胺基酸序列之一個實例由登錄號P24175給出且再現為SEQ ID NO: 52。細胞中缺乏功能性ManB可阻止細胞產生α-D-甘露糖1-磷酸。功能性ManB係指能夠催化D-甘露糖6-磷酸轉化為α-D-甘露糖1-磷酸之ManB形式。若細胞表現不催化D-甘露糖-6-磷酸轉化為α-D-甘露糖1-磷酸之ManB形式,或者其不表現任何ManB蛋白,則稱該細胞缺乏功能性ManB之表現或不表現功能性ManB。在一些實施例中,基因組包含
manB基因或與該
manB基因可操作地連接之啟動子中的突變。在一些實施例中,基因組不包含編碼ManB之核酸序列。
在本文所述之經基因修飾之微生物的一些實施例中,微生物不表現功能性ManC。ManC或甘露糖-1-磷酸鳥苷酸轉移酶係由
manC基因編碼之酶,其催化α-D-甘露糖1-磷酸轉化為GDP-α-D-甘露糖,此為GDP-甘露糖合成所需的。因此,消除ManC功能可抑制甘露糖之合成,且因而抑制含有甘露糖之莢膜多醣之合成,莢膜多醣可在細菌中引起黏液表型。ManC在此項技術中亦稱為CpsB,其由
cpsB基因編碼。
manC基因之DNA序列之一個實例由登錄號AAC77846給出且再現為SEQ ID NO: 53。ManC蛋白之胺基酸序列之一個實例由登錄號P24174給出且再現為SEQ ID NO: 54。細胞中缺乏功能性ManC可阻止細胞產生GDP-α-D-甘露糖。功能性ManC係指能夠催化α-D-甘露糖1-磷酸轉化為GDP-α-D-甘露糖之ManC形式。若細胞表現不催化α-D-甘露糖1-磷酸轉化為GDP-α-D-甘露糖之ManC形式,或者其不表現任何ManC蛋白,則稱該細胞缺乏功能性ManC之表現或不表現功能性ManC。在一些實施例中,基因組包含
manC基因或與該
manC基因可操作地連接之啟動子中的突變。在一些實施例中,基因組不包含編碼ManC之核酸序列。
在本文所述之經基因修飾之微生物的一些實施例中,微生物不表現功能性Gmd。Gmd或GDP-甘露糖4,6-脫水酶係由
gmd基因編碼之酶,其催化GDP-α-D-甘露糖轉化為GDP-4-脫氫-6-去氧-D-甘露糖,此為GDP-L-岩藻糖合成所需的。因此,消除Gmd功能可抑制岩藻糖之合成,且因而抑制含有岩藻糖之莢膜多醣之合成,莢膜多醣可在細菌中引起黏液表型。
gmd基因之DNA序列之一個實例由登錄號AAC77842給出且再現為SEQ ID NO: 55。Gmd蛋白之胺基酸序列之一個實例由登錄號P0AC88給出且再現為SEQ ID NO: 56。 細胞中缺乏功能性Gmd可阻止細胞產生GDP-4-脫氫-6-去氧-D-甘露糖。功能性Gmd係指能夠催化GDP-α-D-甘露糖轉化為GDP-4-脫氫-6-去氧-D-甘露糖之Gmd形式。若細胞表現不催化GDP-α-D-甘露糖轉化為GDP-4-脫氫-6-去氧-D-甘露糖之Gmd形式,或者若其不表現任何Gmd蛋白,則稱該細胞缺乏功能性Gmd之表現或不表現功能性Gmd。在一些實施例中,基因組包含
gmd基因或與該
gmd基因可操作地連接之啟動子中的突變。在一些實施例中,基因組不包含編碼Gmd之核酸序列。
在本文所述之經基因修飾之微生物的一些實施例中,微生物不表現功能性Fcl。Fcl或GDP-L-岩藻糖合酶係由
fcl基因編碼之酶,其催化GDP-4-脫氫-6-去氧-D-甘露糖轉化為GDP-岩藻糖,此為GDP-L-岩藻糖合成所需的。因此,消除Fcl功能可抑制岩藻糖之合成,且因而抑制含有岩藻糖之莢膜多醣之合成,莢膜多醣可在細菌中引起黏液表型。Fcl在此項技術中亦稱為WcaG,其由
wcaG基因編碼。
fcl基因之DNA序列之一個實例由登錄號AAC77843給出且再現為SEQ ID NO: 57。Fcl蛋白之胺基酸序列之一個實例由登錄號P32055給出且再現為SEQ ID NO: 58。細胞中缺乏功能性Fcl可阻止細胞產生GDP-岩藻糖。功能性Fcl係指能夠催化GDP-4-脫氫-6-去氧-D-甘露糖轉化為GDP-岩藻糖之Fcl形式。若細胞表現不催化GDP-4-脫氫-6-去氧-D-甘露糖轉化為GDP-岩藻糖之Fcl形式,或者若其不表現任何Fcl蛋白,則稱該細胞缺乏功能性Fcl之表現或不表現功能性Fcl。在一些實施例中,基因組包含
fcl基因或與該
fcl基因可操作地連接之啟動子中的突變。在一些實施例中,基因組不包含編碼Fcl之核酸序列。
在本文所述之經基因修飾之微生物的一些實施例中,微生物不表現功能性KduI。KduI或4-去氧-L-蘇-5-己酮糖-糖醛酸酮醇-異構酶係由
kduI基因編碼之酶,其催化5-脫氫-4-去氧-D-葡萄糖醛酸異構化為3-去氧-D-甘油-2,5-己二酮糖酸,此為細胞外多醣合成中所涉及之己糖醛酸代謝之第一步,該等多醣可引起細菌黏液表型。
kduI基因之DNA序列之一個實例由登錄號AAC75882給出且再現為SEQ ID NO: 59。KduI蛋白之胺基酸序列之一個實例由登錄號Q46938給出且再現為SEQ ID NO: 60。細胞中缺乏功能性KduI可阻止細胞產生3-去氧-D-甘油-2,5-己二酮糖酸。功能性KduI係指能夠催化5-脫氫-4-去氧-D-葡萄糖醛酸異構化為3-去氧-D-甘油-2,5-己二酮糖酸之KduI形式。若細胞表現不催化5-脫氫-4-去氧-D-葡萄糖醛酸異構化為3-去氧-D-甘油-2,5-己二酮糖酸之KduI形式,或者若其不表現任何KduI蛋白,則稱該細胞缺乏功能性KduI之表現或不表現功能性KduI。在一些實施例中,基因組包含
kduI基因或與該
kduI基因可操作地連接之啟動子中的突變。在一些實施例中,基因組不包含編碼KduI之核酸序列。
在一些實施例中,基因組包含與SEQ ID NO: 23具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或高達100%序列一致性之第一核酸序列及與SEQ ID NO: 25具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或高達100%序列一致性之第二核酸序列。在一些實施例中,基因組包含與SEQ ID NO: 24具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或高達100%序列一致性之第三核酸序列。
在本文所述之經基因修飾之微生物的一些實施例中,微生物未展現黏液表型。如本文所用,黏液表型係指以糖諸如多醣之過量產生為特徵之表型。具有黏液表型之微生物細胞比具有非黏液表型之細胞更容易相互黏附,且具有黏液表型之微生物在其中生長之液體具有與黏液相似之稠度(
參見例如Hamelin
等人 J Bacteriol.1975. 122(1):19-24)。液體培養基之此黏液樣稠度及存在於微生物細胞上之細胞外多醣可干擾發酵過程中之細菌混合,降低溶解氧含量,及微生物藉由離心之粒化。因此,與具有黏液表型之微生物相比,不具有黏液表型之微生物更容易自液體培養基中分離出來。
大腸埃希氏菌
在本文所述之經基因修飾之微生物的一些實施例中,微生物為
大腸埃希氏菌(
大腸桿菌)。在一些實施例中,微生物來源於
大腸桿菌MG1655。
大腸桿菌多年來一直用作產生質體DNA之宿主。出於許多不同目的,包括選殖、質體DNA產生及蛋白質表現,構築若干種不同菌株。所用之
大腸桿菌K12衍生物(諸如DH5α、JM108、DH10β及其他)最常用於質體DNA選殖及產生,因為其具有選殖目的所需之特定基因組突變。此等主要引起編碼核酸酶、重組酶及降低菌株之DNA穩定性、純度及選殖效率之其他酶的基因失活。
此外,
大腸桿菌以及其他生物體具有限制或調節可能需要大量存在之其他產物(
例如,核苷酸)表現之調節途徑。因此,雖然控制此等途徑之基因為活性的,但很難提高
大腸桿菌產生所需產物之效率。
在一些實施例中,基因組不包含編碼
endA之核酸序列,基因組不包含編碼recA之核酸序列,且EcoK1限制系統已失活。
endA基因編碼核酸內切酶-1蛋白,該蛋白質在表現時誘導雙鏈斷裂活性。此活性將退化且以其他方式損害由具有該基因之大腸桿菌產生之質體DNA。
recA基因編碼RecA蛋白,其為修復及維持DNA之關鍵蛋白。然而,RecA經由其促進DNA修復之特性,在DNA之同源重組以及介導同源配對、同源重組、DNA斷裂修復及SOS反應中起核心作用,其中DNA損傷觸發細胞週期停滯,啟動DNA修復及誘變。EndA及RecA之特性均不利於產生一致及相同之DNA質體。
原生
大腸桿菌具有EcoKI限制系統。EcoKI係一種限制修飾酶複合物,負責鑑別及限制未甲基化之外來DNA,以及藉由甲基化修飾原生半甲基化DNA以進行自我鑑別。若任其發展,EcoKI系統會將未甲基化DNA識別為外來物,且若該DNA亦具有獨特EcoKI識別位點,則將其降解。雖然使來自大腸桿菌之EcoKI系統失活並非選殖質體DNA必需的,但若所需質體DNA具有EcoKI識別位點,則缺失會顯著提高選殖及轉型效率。
在一些實施例中,微生物之基因型為
ΔendA ΔrecA Δ(
mrr-hsdRMS-symE-mcrBC)
ΔompT ΔmanA Δlon。
mrr編碼Mrr,Mrr係一種在特定識別位點使甲基化DNA裂解之限制性核酸內切酶。
hsdRMS操縱子編碼HsdR、HsdM及HsdS,該等蛋白質為在特定識別位點使未甲基化之DNA裂解之EcoK1限制系統之三種蛋白質組分。
symE編碼SymE,SymE係一種核糖核酸內切酶。
mcrBC編碼McrBC,McrBC係一種限制性核酸內切酶,其在特定識別位點使甲基化DNA裂解。
編碼重組蛋白之載體
在一些實施例中,本文所述之經基因修飾之微生物包含編碼重組蛋白之核酸序列。如本文所用,「重組蛋白」係指由已選殖至表現載體(諸如質體)中且藉由自載體轉錄mRNA及轉譯所得到之mRNA而自該載體表現的核酸序列編碼之蛋白質。
在一些實施例中,編碼重組蛋白之核酸序列位於微生物之基因組中。若生物體之基因組包含核酸序列,則稱核酸位於基因組中。在一些實施例中,編碼重組蛋白之核酸序列位於質體上。質體係指與微生物之染色體分開之環狀DNA分子。
在一些實施例中,由核酸序列編碼之重組蛋白為RNA聚合酶。RNA聚合酶係結合於模板多核苷酸且合成包含與模板多核苷酸中之序列互補之RNA序列的RNA多核苷酸或轉錄本之蛋白質。在一些實施例中,RNA聚合酶為DNA依賴性RNA聚合酶,其自DNA模板多核苷酸合成RNA轉錄本。在一些實施例中,RNA聚合酶為RNA依賴性RNA聚合酶,其自RNA模板多核苷酸合成RNA轉錄本。RNA聚合酶包括但不限於噬菌體RNA聚合酶,
例如T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、K11 RNA聚合酶及/或突變聚合酶,諸如但不限於能夠併入經修飾之核酸之聚合酶。作為一個非限制性實例,RNA聚合酶可經修飾以展現與未修飾之RNA聚合酶相比併入2'-修飾之三磷酸核苷酸之能力增加。
在一些實施例中,RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。編碼T7 RNA聚合酶之DNA序列之一實例由登錄號M38308.1給出且再現為SEQ ID NO: 33。T7 RNA聚合酶之胺基酸序列之一個實例由登錄號P00573給出且再現為SEQ ID NO: 34。編碼T3 RNA聚合酶之DNA序列之一實例由登錄號X02981.1給出且再現為SEQ ID NO: 35。T3 RNA聚合酶之胺基酸序列之一個實例由登錄號P07659給出且再現為SEQ ID NO: 36。編碼SP6 RNA聚合酶之DNA序列之一實例由登錄號Y00105.1給出且再現為SEQ ID NO: 37。SP6 RNA聚合酶之胺基酸序列之一個實例由登錄號P06221給出且再現為SEQ ID NO: 38。編碼K11 RNA聚合酶之DNA序列之一實例由登錄號X53238.1給出且再現為SEQ ID NO: 39。K11 RNA聚合酶之胺基酸序列之一個實例由登錄號P18147給出且再現為SEQ ID NO: 40。
在一些實施例中,RNA聚合酶為RNA聚合酶變異體。相對於野生型(WT) RNA聚合酶,RNA聚合酶變異體包括至少一個胺基酸取代。例如,參考具有SEQ ID NO: 34之胺基酸序列之WT T7 RNA聚合酶,位置47處之甘胺酸被視為「野生型胺基酸」,而位置47處之甘胺酸取代為丙胺酸被視為具有高螺旋傾向性之「胺基酸取代」。在一些實施例中,RNA聚合酶變異體為相對於WT RNA聚合酶(
例如,具有SEQ ID NO: 34之胺基酸序列之WT T7 RNA聚合酶)包含至少一個(一或多個)胺基酸取代之T7 RNA聚合酶變異體。
在一些實施例中,RNA聚合酶變異體包含包括(至少一個)胺基酸修飾之RNA聚合酶,該胺基酸修飾引起RNA聚合酶變異體之環結構隨著RNA聚合酶變異體自起始複合物轉變為延伸複合物而發生構形變化,變成螺旋結構。在一些實施例中,RNA聚合酶變異體包含(a)在用於從頭RNA合成之結合位點殘基處之胺基酸取代;及(b)相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。在一些實施例中,胺基酸修飾為相對於野生型RNA聚合酶在位置47處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中,胺基酸取代為高傾向性胺基酸取代。高螺旋傾向性胺基酸之實例包括丙胺酸、異白胺酸、白胺酸、精胺酸、甲硫胺酸、離胺酸、麩醯胺酸及/或麩胺酸鹽。在一些實施例中,在位置47處之胺基酸取代為G47A。在一些實施例中,RNA聚合酶變異體包含相對於野生型RNA聚合酶,包括額外C端胺基酸之RNA聚合酶。在一些實施例中,額外C端胺基酸係選自甘胺酸、丙胺酸、蘇胺酸、脯胺酸、麩醯胺酸、絲胺酸。在一些實施例中,額外C端胺基酸(
例如,相對於包含SEQ ID NO: 34之胺基酸序列之野生型RNA聚合酶,在位置884處)為甘胺酸。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 41之胺基酸序列。在一些實施例中,RNA聚合酶變異體包含相對於野生型RNA聚合酶,在位置350處之胺基酸取代,及/或在位置351處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中,在位置350處之胺基酸取代為E350W。在一些實施例中,在位置351處之胺基酸取代為D351V。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 42之胺基酸序列。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 43之胺基酸序列。
重組蛋白產生方法
本揭示案之一些態樣係關於一種用於產生多肽或蛋白質之方法,其包括以下步驟:i)將包含編碼多肽或蛋白質之序列的核酸分子引入至本文所述之經基因修飾之微生物中的一者中;ii)在適於表現該多肽或蛋白質之條件下培養該經基因修飾之生物體;及iii)分離該多肽或蛋白質。
將載體引入至微生物中係指在引起載體併入微生物細胞中之條件下使微生物與載體或供體生物體接觸。可藉由轉型引入載體,轉型係細胞自環境中獲取細胞外DNA之過程。轉型可經由電穿孔或電透化(electropermeabilization)來完成,在該過程中,包含細胞外DNA及微生物細胞之組合物受到電脈衝,瞬時打開細胞壁及細胞膜中之孔,使DNA進入細胞之細胞質。轉型亦可藉由使包含細胞外DNA及勝任型微生物細胞之組合物經受熱休克來完成,其中組合物被快速加熱及冷卻,此導致細胞外DNA進入勝任型細胞之細胞質中。若細胞能夠自環境中獲取細胞外DNA,則稱該細胞為勝任型。細胞可為天然勝任型的,或能夠獲取細胞外DNA,或經誘導成為勝任型,例如藉由與一或多種促進DNA獲取過程之化合物一起培育進行。舉例而言,化學勝任型細胞為用鹽、二甲亞砜(DMSO)及/或聚乙二醇(PEG)處理之細胞。諸如RbCl、MgCl
2及/或CaCl
2之鹽中和細胞膜磷脂、DNA之磷酸骨架之負電荷,使DNA與細胞表面締合而非被排斥。DMSO削弱細胞膜之脂質雙層,降低其厚度且增加其滲透性。因此,藉由用鹽、DMSO及/或PEG處理而變成化學勝任型的細胞比未經修飾之細胞更有可能獲取細胞外DNA。
可藉由結合來引入載體,結合係供體生物體將載體引入至受體生物體例如微生物之細胞中的過程。在結合中,包含纖毛或毛髮樣附屬物之供體生物體細胞與受體生物細胞接觸,且纖毛形成連接兩個細胞內部之隧道。接著載體之一條DNA鏈經由纖毛轉移至受體細胞中。在此轉移之後,各含載體之單鏈形式之兩個細胞合成互補鏈,使各細胞均帶有載體之雙鏈形式。
可藉由轉導引入載體,轉導係藉由病毒或病毒載體將DNA引入至細胞中之過程。諸如噬菌體之病毒對微生物的感染將病毒DNA引入至微生物細胞之細胞質中。若噬菌體含有載體或質體之DNA序列,則微生物在感染後將含有載體質體,在細胞分裂期間維持及複製質體(
參見例如Ammann
等人 J Bacteriol.2008.190(8):3083-3087)。
培養微生物係指在允許微生物生長及複製之環境中培育微生物。允許微生物生長及複製之環境視微生物而定。環境可為含有微生物用於生長及複製之營養物的液體或固體培養基。可用於培養微生物之培養基的非限制性實例包括溶菌肉湯、盧貝氏(Luria-Bertani,LB)肉湯或瓊脂培養基、胰蛋白腖大豆(TS)肉湯或瓊脂培養基以及托休氏肉湯(Todd-Hewitt broth)或瓊脂培養基。
適合表現多肽或蛋白質之條件視微生物、載體及/或編碼多肽或蛋白質之核酸序列以及多肽或蛋白質本身而定。如前一段所述,培養微生物之環境必須支持其生長及複製,且可為此項技術已知之液體或固體培養基之一。
若編碼多肽或蛋白質之核酸序列存在於諸如質體之載體上,則該載體必須維持在微生物細胞中以表現多肽或蛋白質。將載體維持在微生物中之方法為此項技術所熟知。若載體編碼使細胞對抗生素作用產生抗性之蛋白質,則在微生物中維持載體之一種方法包括在抗生素存在之情況下培養微生物,該抗生素殺死不含該載體之細胞或抑制其生長,但允許含有該載體之細胞生長及複製。
若核酸序列可操作地連接於條件型啟動子,則多肽或蛋白質之表現需要在條件型啟動子具有活性之條件下培養微生物。舉例而言,只有當細胞中存在乳糖時,許多細菌中之
lac操縱子才具有活性。
lac阻遏蛋白複合物與
lac操縱子(位於
lac啟動子與由
lac操縱子編碼之基因之間的核酸序列)結合,且阻止
lac操縱子中編碼之基因轉錄。異乳糖(乳糖之一種異構體)與
lac阻遏子結合,誘導構形變化,導致操縱子釋放
lac阻遏子,從而允許所編碼基因之轉錄。若
lac操縱子存在於編碼待表現之基因或多肽之核酸序列的上游,則多肽或蛋白質將僅在異乳糖或類似化合物(諸如異丙基-β-D-硫代哌喃半乳糖苷(IPTG))存在之情況下表現,且可藉由調節培養環境中IPTG之量來控制表現(
參見例如Donovan
等人 J Ind Microbiol.1996.16(3):145-54)。
分離多肽或蛋白質之方法為此項技術所熟知(
參見例如Wingfield.
Curr Protoc Protein Sci.2016.80:6.1.1-6.1.35)。通常,表現蛋白質之細菌藉由離心粒化以自液體培養基中分離細菌細胞。接著,諸如藉由機械法壓機或藉由溶菌酶處理來酶促溶解細菌細胞。將細菌溶解產物離心以粒化細胞組分。若重組蛋白存在於細菌細胞之細胞質或周質中,則自溶解產物上清液中純化蛋白質。若重組蛋白存在於包涵體中,則用Triton、EDTA及/或尿素處理溶解產物球粒以提取細胞壁組分,且其餘包涵體溶解。接著可自溶解之包涵體中純化變性蛋白質,且若需要,再折疊成所需構形。
本揭示案之一些態樣係關於一種用於產生多肽或蛋白質之方法,其包括以下步驟:i)在適於表現該多肽或蛋白質之條件下培養本文所述之經基因修飾之微生物中的一者;及ii)分離該多肽或蛋白質。
在本文所述之方法的一些實施例中,多肽或蛋白質為RNA聚合酶。在一些實施例中,RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。在一些實施例中,RNA聚合酶為RNA聚合酶變異體。相對於野生型(WT) RNA聚合酶,RNA聚合酶變異體包括至少一個胺基酸取代。例如,參考具有SEQ ID NO: 34之胺基酸序列之WT T7 RNA聚合酶,位置47處之甘胺酸被視為「野生型胺基酸」,而位置47處之甘胺酸取代為丙胺酸被視為具有高螺旋傾向性之「胺基酸取代」。在一些實施例中,RNA聚合酶變異體為相對於WT RNA聚合酶(
例如,具有SEQ ID NO: 34之胺基酸序列之WT T7 RNA聚合酶)包含至少一個(一或多個)胺基酸取代之T7 RNA聚合酶變異體。
在一些實施例中,RNA聚合酶變異體包含包括(至少一個)胺基酸修飾之RNA聚合酶,該胺基酸修飾引起RNA聚合酶變異體之環結構隨著RNA聚合酶變異體自起始複合物轉變為延伸複合物而發生構形變化,變成螺旋結構。在一些實施例中,RNA聚合酶變異體包含(a)在用於從頭RNA合成之結合位點殘基處之胺基酸取代;及(b)相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。在一些實施例中,胺基酸修飾為相對於野生型RNA聚合酶在位置47處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中,胺基酸取代為高傾向性胺基酸取代。高螺旋傾向性胺基酸之實例包括丙胺酸、異白胺酸、白胺酸、精胺酸、甲硫胺酸、離胺酸、麩醯胺酸及/或麩胺酸鹽。在一些實施例中,在位置47處之胺基酸取代為G47A。
在一些實施例中,RNA聚合酶變異體包含相對於野生型RNA聚合酶,包括額外C端胺基酸之RNA聚合酶。在一些實施例中,額外C端胺基酸係選自甘胺酸、丙胺酸、蘇胺酸、脯胺酸、麩醯胺酸、絲胺酸。在一些實施例中,額外C端胺基酸(
例如,相對於包含SEQ ID NO: 34之胺基酸序列之野生型RNA聚合酶,在位置884處)為甘胺酸。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 41之胺基酸序列。在一些實施例中,RNA聚合酶變異體包含相對於野生型RNA聚合酶,在位置350處之胺基酸取代,及/或在位置351處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。在一些實施例中,在位置350處之胺基酸取代為E350W。在一些實施例中,在位置351處之胺基酸取代為D351V。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 42之胺基酸序列。在一些實施例中,RNA聚合酶變異體包含SEQ ID NO: 43之胺基酸序列。
核酸
「核酸」係至少兩個共價連接在一起之核苷酸,且在一些情況下,可含有磷酸二酯鍵(
例如,磷酸二酯「骨架」)。如本文所用,術語「核酸序列」及「多核苷酸」可互換使用且不暗示任何長度限制。如本文所用,術語「核酸」及「核苷酸」可互換使用。術語「核酸序列」及「多核苷酸」涵蓋DNA (包括cDNA)及RNA序列。本文所述之核酸序列包括已自其天然存在之環境中移出之核酸序列、重組或經選殖之DNA分離物以及化學合成之類似物或由異源系統生物合成之類似物。
「經工程改造之核酸」係自然界中不存在之核酸。然而,應理解,雖然經工程改造之核酸整體並非天然存在的,但其可包括自然界中存在之核苷酸序列。在一些實施例中,經工程改造之核酸包含來自不同生物體(
例如,來自不同物種)之核苷酸序列。舉例而言,在一些實施例中,經工程改造之核酸包括細菌核苷酸序列、人類核苷酸序列及/或病毒核苷酸序列。經工程改造之核酸包括重組核酸及合成核酸。「重組核酸」係藉由接合核酸(
例如,經分離之核酸、合成核酸或其組合)而構築之分子且在一些實施例中,可在活細胞中複製。「合成核酸」係經擴增或化學合成或藉由其他方式合成之分子。合成核酸包括經化學修飾或以其他方式進行修飾、但可與天然存在之核酸分子進行鹼基配對的彼等核酸。重組及合成核酸亦包括由前述任一者複製產生之彼等分子。核酸可包含天然存在之核苷酸及/或非天然存在之核苷酸,諸如經修飾之核苷酸。
可使用標準分子生物學方法產生經工程改造之核酸。在一些實施例中,經工程改造之核酸係使用GIBSON ASSEMBLY®選殖產生(
參見例如Gibson, D.G.
等人Nature Methods, 343-345, 2009;及Gibson, D.G.
等人Nature Methods, 901-903, 2010)。GIBSON ASSEMBLY®通常在單管反應中使用三種酶活性:5
'核酸外切酶、DNA聚合酶之3
'延伸活性及DNA連接酶活性。5
'核酸外切酶活性回嚼(chew back)5
'末端序列且暴露互補序列以進行退火。接著聚合酶活性填充退火區域之間隙。接著DNA連接酶密封切口且將DNA片段共價連接在一起。相鄰片段之重疊序列比Golden Gate Assembly中使用之序列長得多,因此使得正確組裝之百分比更高。
本文所述之核酸載體亦可存在或移除一或多個終止子序列。終止子序列係發出表現卡匣或轉錄區末端信號之核酸序列。為有效轉錄,載體通常包括一或多個終止子序列。終止子序列包括例如T7及T4終止子序列。
本文所述之較佳載體亦可具有抗性標記物,或特定載體特有之標記物。舉例而言,載體最初可具有胺苄青黴素(ampicillin)抗性標記物。在本文所述之一些實施例中,胺苄青黴素標記物替換成不同標記物,諸如康黴素(kanamycin)抗性標記物。在一些實施例中,本文揭示之
大腸桿菌基因組可進一步表現基於第一環境因素之陽性選擇標記物或基於第二環境因素之陰性選擇標記物的基因,其中第一環境因素與第二環境因素不相同。在一些實施例中,本文揭示之
大腸桿菌基因組可進一步表現基於第一環境因素之陽性選擇標記物及基於第二環境因素之陰性選擇標記物的基因,其中第一環境因素與第二環境因素不相同。在一些實施例中,陽性選擇標記物為能夠賦予康黴素抗性之基因。在一些實施例中,陰性選擇標記物為能夠表現聚果糖蔗糖酶之基因。
本文揭示之載體亦可移除任何病原體來源序列。移除病原體來源序列可對產品產量產生積極影響。
複製起點(ori)包括在本文描述之核酸中且可如本文揭示進行修飾。在一些實施例中,核酸可含有若干個ori,例如2個ori。舉例而言,其可為低複本ori與溫度依賴性ori之組合,或者例如允許在各種宿主生物體中繁殖之ori。
核酸亦可含有來自其他已知載體之一或多種元件。舉例而言,其他載體包括噬菌體、黏接質體、質體、F型黏接質體(fosmid)、細菌人工染色體、酵母人工染色體、病毒及逆轉錄病毒(例如牛痘、腺病毒、腺相關病毒、慢病毒、單純疱疹病毒、愛普斯坦-巴爾病毒(Epstein-Barr virus)、禽痘病毒、偽狂犬病、桿狀病毒)及源自其之載體。在其他實施例中,本文描述之核酸不包括來自任一或多種其他載體之任何元件。
當應用於核酸序列時,術語「經分離」在本文所用之背景下表示多核苷酸序列已自其天然遺傳環境中移出且因此不含其他外來或不想要之編碼序列(但可包括天然存在之5′及3′未轉譯區,諸如啟動子及終止子),且呈適合在經基因工程改造之蛋白質產生系統內使用之形式。此類經分離之分子係與其天然環境分離之彼等分子。
存在許多已建立之演算法可用於比對兩個核酸序列。通常,一個序列充當參考序列,可將測試序列與其進行比較。序列比較演算法基於指定之程式參數計算測試序列相對於參考序列之序列一致性百分比。用於比較之核酸序列比對可例如藉由電腦執行之演算法(
例如GAP、BESTFIT、FASTA或TFASTA)或BLAST及BLAST 2.0演算法進行。
在序列一致性比較中,一致性可存在於長度為至少10個核酸殘基(
例如長度為至少15個、20個、30個、40個、50個、75個、100個、150個、200個、250個、300個、350個、400個、450個、500個、550個、600個、650個或685個核苷酸,
例如長達參考序列全長)之序列區域上。
基本上同源或基本上一致之核酸具有一或多個核苷酸取代、缺失或添加。在許多實施例中,彼等變化並不太重要,例如,僅涉及可產生在轉譯過程中編碼之相同胺基酸或產生不同但保守之胺基酸取代的保守核酸取代。保守胺基酸取代係藉由將一個胺基酸替換成以下組內之另一胺基酸而產生的胺基酸取代:鹼性:精胺酸、離胺酸、組胺酸;酸性:麩胺酸、天冬胺酸;極性:麩醯胺酸、天冬醯胺;疏水性:白胺酸、異白胺酸、纈胺酸;芳族:苯丙胺酸、色胺酸、酪胺酸;小:甘胺酸、丙胺酸、絲胺酸、蘇胺酸、甲硫胺酸。基本上同源之核酸亦涵蓋包含不顯著影響轉譯產物之折疊或活性之其他取代的彼等核酸。
本文所述之核酸載體可為空載體,或可包括插入物,該插入物可為表現卡匣或開放閱讀框架(ORF)。「開放閱讀框架」係以起始密碼子(
例如甲硫胺酸(ATG))開始且以終止密碼子(
例如TAA、TAG或TGA)結束之連續DNA區段且編碼蛋白質或肽。表現卡匣編碼至少包括以下元件之RNA:5′未轉譯區、編碼mRNA之開放閱讀框架區、3′未轉譯區及多聚A尾。開放閱讀框架可編碼任何mRNA序列。
「5′未轉譯區(UTR)」係指mRNA中直接位於起始密碼子(
亦即,由核糖體轉譯之mRNA轉錄本之第一個密碼子)上游(
亦即,5′)的區域,該區域不編碼蛋白質或肽。
「3′未轉譯區(UTR)」係指mRNA中直接位於終止密碼子(
亦即,mRNA轉錄本中發送轉譯終止信號之密碼子)下游(
亦即,3′)之區域,該區域不編碼蛋白質或肽。
「多聚A尾」係mRNA中在3′ UTR下游,
例如直接下游(
亦即,3′)之區域,其含有多個連續之單磷酸腺苷。多聚A尾可含有10至300個單磷酸腺苷。例如,多聚A尾可含有10個、20個、30個、40個、50個、60個、70個、80個、90個、100個、110個、120個、130個、140個、150個、160個、170個、180個、190個、200個、210個、220個、230個、240個、250個、260個、270個、280個、290個或300個單磷酸腺苷。在一些實施例中,多聚A尾含有50至250個單磷酸腺苷。在相關生物學背景中(
例如,在細胞中、在活體內等),多聚(A)尾用於保護mRNA免於酶促降解(
例如在細胞質中),且有助於轉錄終止、mRNA自細胞核中輸出以及轉譯。
熟習此項技術者理解不同物種展現「優先密碼子使用」。如本文所用,術語「優先密碼子使用」係指在特定物種之細胞中最常使用之密碼子,因此有利於編碼各胺基酸之可能密碼子之一個或幾個代表。例如,胺基酸蘇胺酸(Thr)可能由ACA、ACC、ACG或ACT編碼,但在哺乳動物宿主細胞中,ACC為最常用之密碼子;在其他物種中,不同Thr密碼子可能優先。可藉由此項技術已知之多種方法將特定宿主細胞物種之優先密碼子引入至本文所述之多核苷酸中。或者可使用非較佳密碼子。在一些實施例中,核酸序列經密碼子最佳化。密碼子最佳化之方法為此項技術已知的。
所關注多核苷酸之「片段」包含來自該全長多核苷酸序列之一連串連續核苷酸。舉例而言,所關注多核苷酸之「片段」可包含(或由以下組成)來自多核苷酸序列之至少30個連續核苷酸(
例如該多核苷酸之至少35個、50個、75個、100個、150個、200個、250個、300個、350個、400個、450個、500個、550個、600個、650個、700個、750個、800個、850個、900個、950個或1000個連續核酸殘基)。
「核酸載體」係攜帶至少一個外源或異源核酸片段之多核苷酸。核酸載體可如「分子載體」般發揮作用,將核酸、分別多核苷酸之片段遞送至宿主細胞中或作為IVT之模板。如本文所用,「活體外轉錄模板」(IVT模板)係指適合用於IVT反應以產生信使RNA (mRNA)之去氧核糖核酸(DNA)。在一些實施例中,IVT模板編碼5′未轉譯區,含有開放閱讀框架,且編碼3′未轉譯區及多聚A尾。IVT模板之特定核苷酸序列組成及長度將視由該模板編碼之所關注mRNA而定。
在一些實施例中,本文所述之核酸載體為環狀核酸,諸如質體。在其他實施例中,其為線性化核酸。根據一個實施例,核酸載體包含預定限制位點,其可用於載體線性化。線性化限制位點之明智置放係重要的,因為該限制位點決定載體核酸打開/線性化之位置。針對線性化而選擇之限制酶較佳應不在載體之關鍵組分內切割。
術語5′及3′在本文中用於描述與遺傳元件之位置及/或事件之方向(5′至3′)相關之核酸序列特徵,諸如在5′至3′方向上進行之RNA聚合酶之轉錄或核糖體之轉譯。同義詞為上游(5′)及下游(3′)。按慣例,DNA序列、基因圖譜、載體卡及RNA序列自左至右以5′至3′繪製,或用箭頭指示5′至3′方向,其中箭頭指向3′方向。因此,當遵循此慣例時,5′ (上游)指示朝向左手側定位之遺傳元件,且3′ (下游)指示朝向右手側定位之遺傳元件。
實例
實例1:在Lon、OmpT及ManA缺乏之經基因修飾之大腸桿菌菌株中T7 RNA聚合酶變異體1及T7 RNA聚合酶變異體2之產生。
引言
本實例中描述之工作的目標係產生用於表現重組蛋白之大腸桿菌菌株。
lon與
ompTORF均自菌株2中完全移除,菌株2係一種接受及維持質體DNA之菌株,且由於自基因組中移除EcoKI限制系統
endA及
recA,因此可自宿主中純化。已成功產生一種用於進行質體攜帶之酶表現之穩健菌株,該菌株具有顯著降低之蛋白酶活性,且因此能夠產生高純度之重組酶。
方法
表1:本實例中使用之菌株.
表2:本實例中使用之質體.
表3:本實例中使用之引子.
『*』表示前面核苷酸之硫代磷酸酯修飾
『/5Phos/』表示5'末端核苷酸之5'磷酸化
表4:本實例中使用之gBlock
剔除卡匣之構築
菌株名稱 | 菌株基因型 | 質體 |
菌株1 | ΔendA ΔrecA | 無 |
菌株9 | ΔendA ΔrecA | pStrain 21 |
菌株5 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC)::kan-sacB | pStrain 21 |
菌株2 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) | 無 |
菌株10 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT | 無 |
菌株11 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT Δlon | 無 |
菌株12 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT Δlon | pStrain 2 |
菌株13 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA::kan-sacB | pStrain 21 |
菌株14 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA | pStrain 21 |
菌株15 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon::kan-sacB | 無 |
菌株16 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon::kan-sacB | pStrain 21 |
菌株17 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon | 無 |
菌株18 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon | pStrain 2 |
菌株19 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon | pStrain 23 |
菌株20 | ΔendA ΔrecA Δ(mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon | pStrain 23 |
質體名稱 | 質體基因型 |
pStrain 21 | |<repA101|ori101_ts|<recA|<bla|<tetR|<P(tetR)|P(tet)>|γ>|β>|exo>|60a>| |
pStrain 22 | |R6K>|Ori_R6Kγ|ompT UHR | ompT DHR | kanR>| SacB> | |
pStrain 2 | |pUC>|term_rpoC|term_bla|P(T5)>| T7 RNA聚合酶變異體1> |P(amp)>|kan>|P(lacI)>|lacI| |
pStrain 23 | |pUC>|term_rpoC|term_bla|P(T5)>| T7 RNA聚合酶變異體2> |P(amp)>|kan>|P(lacI)>|lacI| |
pStrain 24 | |pUC>|term_rpoC|term_bla|P(T5)>| T7 RNA聚合酶變異體3> |P(amp)>|kan>|P(lacI)>|lacI| |
引子 | 序列 (5′ - 3′) | 注釋 |
KS786 | /5Phos/AAAAATACATATTCAATCATTAAAACGATTGAATGGAGAACTTTTGTGTAGGCTGGAGCTGCTTC (SEQ ID NO: 1) | ompT之KO卡匣 |
KS787 | T*T*C*C*C*C*GGGGCGATTTTCACCTCGGGGAAATTTTAGTTGGCGTTCTTAATTCTCATGTTTGACAG (SEQ ID NO: 2) | ompT之KO卡匣 |
KS651 | AACGGATAAGACGGGCATAAATGAGG (SEQ ID NO: 3) | ΔompT::kan-sacB之彈出卡匣 |
KS652 | GTTTAATAAAAAAAAGATTAAGGGATGAAGGAAC (SEQ ID NO: 4) | ΔompT::kan-sacB之彈出卡匣 |
KS1727 | /5Phos/GCTTTAATAGTGGGATTAATTTCCACATTAAAACAGGGATTGATCGTGTAGGCTGGAGCTGCTTCGG (SEQ ID NO: 5) | manA之KO卡匣 |
KS1728 | C*C*T*T*TAATAAGCTTAGCAAGAGATGTTAATTTTTTCAGTAAGCTCTTAATTCTCATGTTTGACAGGGTACCCAT (SEQ ID NO: 6) | manA之KO卡匣 |
KS1729 | /5Phos/GATGTCGGAGTTACGCAGGAATTG (SEQ ID NO: 7) | ΔmanA::kan-sacB之彈出卡匣 |
KS1730 | T*A*T*C*AAACAGTGGTTTGCTTACTTCGTTATTAAC (SEQ ID NO: 8) | ΔmanA::kan-sacB之彈出卡匣 |
KS1132 | /5Phos/CCCATACAATTAGTTAACCAAAAAGGGGGGATTTTATCTCCCCTTGTGTAGGCTGGAGCTGCTTCGG (SEQ ID NO: 9) | lon之KO卡匣 |
KS1133 | GCCTGCCAGCCCTGTTTTTATTAGTGCATTTTGCGCGAGGTCACGTTAATTCTCATGTTTGACAGGGTACCCAT (SEQ ID NO: 10) | lon之KO卡匣 |
KS1260 | /5Phos/TCTGATTCAGATCCTCAAAGAGCCG (SEQ ID NO: 11) | Δlon::kan-sacB之彈出卡匣 |
KS1261 | G*G*C*A*G*C*ACGCTCTTTAACGGC (SEQ ID NO: 12) | Δlon::kan-sacB之彈出卡匣 |
KS518 | CATCAGTTCGAACTGCAATCCGTG (SEQ ID NO: 13) | PCR確認 endA |
KS519 | CATCTTCGCAAAGCGCGATG (SEQ ID NO: 14) | PCR確認 endA |
KS520 | GGCGGCAGTGAAGAGAAGCCT (SEQ ID NO: 15) | PCR確認 recA |
KS521 | GCAATAACGCGCTCGTAATCTTCTG(SEQ ID NO: 16) | PCR確認 recA |
KS1431 | CGGCGTACCGCAACACTTTTG (SEQ ID NO: 17) | PCR確認 purR |
KS1432 | TGTCGCCTGCGTTAACCTGGTT (SEQ ID NO: 18) | PCR確認 purR |
KS1112 | GCGTTGTTGGGATCAATTCTGAGAC (SEQ ID NO: 19) | PCR確認 EcoKI |
KS1113 | TGCTGACCAAAACCGACGTCG (SEQ ID NO: 20) | PCR確認 EcoKI |
KS651 | AACGGATAAGACGGGCATAAATGAGG (SEQ ID NO: 3) | PCR確認 ompT |
KS652 | GTTTAATAAAAAAAAGATTAAGGGATGAAGGAAC (SEQ ID NO: 4) | PCR確認 ompT |
KS1729 | GATGTCGGAGTTACGCAGGAATTG (SEQ ID NO: 7) | PCR確認 manA |
KS1730 | TATCAAACAGTGGTTTGCTTACTTCGTTATTAAC (SEQ ID NO: 8) | PCR確認 manA |
KS979 | GTCGCAACGTTGAATGAACTGAGC (SEQ ID NO: 21) | PCR確認 lon |
KS980 | AGCTCGGTACTTTAGCAGCAGCGA (SEQ ID NO: 22) | PCR確認 lon |
KS gBlock 編號 | DNA 序列 (5’ - 3’) | 注釋 |
KS gBlock 165 | AACGGATAAGACGGGCATAAATGAGGAAGAAATGGCGCGCCCTGCAGGATTCGAACCTGCGGCCCACGACTTAGAAGTTCCTAGAACGACATTTTAAGTCAACAACTTACCGCGCCATCTCTGCGCTCACACGTCCCACTACCTCAAAACATGTAAAGCCTTGCAAGCCATTGCGAGGCCTTATGTGTCTCAGTTTTGTCCCTCTTTTTTGTACTAAAAAACATAGTAATTGAGGATAAACCTCATGCTATTTTCGCTTATATGCCTCTAAAGGCATGGCACTTAAATAGATAAAAGCACCACAAAAGCATAAAAAAACCACACAGTAAAACCGAAATATGAAACAATAACAGATAATTAAACCAAAAACAGATAGCGCATTGTGATAATCATTCAATACTAAACAAAATATAAACAGTGGAGCAATATGTAATTGACTCATTAAGTTAGATATAAAAAATACATATTCAATCATTAAAACGATTGAATGGAGAACTTTTGAACGCCAACTAAAATTTCCCCGAGGTGAAAATCGCCCCGGGGAATAACTAGCCATTTCAATGTAACAATTAACCCTTAAAATAAACCCAGAAGGTTATTAACTAAATCACATAGAAAACCATCAATTATAGTATGTATAAAATAGGCGACAGCAACCCAATTACAAATTAATGGTTCCAGAATATCACATCAAAAAAAACGCTGTATAATATTATAATTAACATGTAGACAACTTGTAATAAACATTATCAGTCAATTGTTTTGTTTATTCCATCTGTGACGCCGATTATTTTCTCAAAATAATGAGATGGCGTGACACCATAATAATCTTTAAATGCACATATGAAATATGAAGTACTGTTATAGCCACATTTCTGGGCTACGACATTGATAGAATAAGAGTTTGAAGTTATGAGTTTTTTTGCATACCTCATCCTAGTATCTCTCAATATTTCAGTAAATGACGTTCCTTCATCCCTTAATCTTTTTTTTATTAAAC (SEQ ID NO: 23) | 擴增 ompT彈出卡匣之模板 |
KS gBlock 659 | ACGCCTTTCGCCGCGATGTCGGAGTTACGCAGGAATTGCAGCGCCACATATTTATCATTTTCGCTGGCCTCCGGGTCACGCAGAATGTCGGCCACCTGTTGTTGGTGCGCCGGACGCAGCATGAACGACGCATCATGAAACGCCTGGCGCGCCAACAGAGTTAACGCTTCGGGTGCGACTTTCAAAATCTCCTGCCCTTCAAATTCAGATACGCTAACGTGTTCGCTGGTTAGCAGGTAATACTCAGTATCATCTTTTTTGAGTGGAAAAGGAGCCTGATAATGAAAGGGTTTGTTTGACATTGTTCTCTCACTTACTGCCTGGTTTGGTTATGCTCTGGGCGGGTGTTCCGTTGCCCTGTTAAAAGCGAGTAACAATATCCTACACACTTTTTTAACAAAAACTGAGACTAGTACGACTTTTTGCGGCTCCAGGTTACTTCCCGTAGGATTCTTGCTTTAATAGTGGGATTAATTTCCACATTAAAACAGGGATTGATCGAGCTTACTGAAAAAATTAACATCTCTTGCTAAGCTTATTAAAGGCTTATAACACCTTCAGGCGGCCAGTCCGCCTGATTTCATTTTATGGATAATCATTATGAATAAATCGCTGGTAGCGGTAGGCGTCATTGTTGCGCTAGGCGTAGTCTGGACAGGCGGCGCATGGTATACAGGCAAGAAGATTGAAACCCATCTCGAAGACATGGTCGCGCAGGCGAACGCGCAACTCAAACTGACAGCTCCTGAATCCAACCTGGAAGTGAGTTATCAAAACTATCATCGCGGCGTATTCAGCAGCCAGTTGCAACTGTTGGTGAAACCCATTGCCGGGAAAGAAAATCCGTGGATTAAAAGCGGTCAGAGCGTCATCTTCAACGAATCGGTTGATCATGGTCCCTTCCCGCTTGCCCAGCTTAAAAAACTGAACCTGATCCCGTCGATGGCATCAATTCAAACCACGCTGGTTAATAACGAAGTAAGCAAACCACTGTTTGATA (SEQ ID NO: 24) | 擴增 manA彈出卡匣之模板 |
KS gBlock 166 | TCTGATTCAGATCCTCAAAGAGCCGAAAAACGCCCTGACCAAGCAGTATCAGGCGCTGTTTAATCTGGAAGGCGTGGATCTGGAATTCCGTGACGAGGCGCTGGATGCTATCGCTAAGAAAGCGATGGCGCGTAAAACCGGTGCCCGTGGCCTGCGTTCCATCGTAGAAGCCGCACTGCTCGATACCATGTACGATCTGCCGTCCATGGAAGACGTCGAAAAAGTGGTTATCGACGAGTCGGTAATTGATGGTCAAAGCAAACCGTTGCTGATTTATGGCAAGCCGGAAGCGCAACAGGCATCTGGTGAATAATTAACCATTCCCATACAATTAGTTAACCAAAAAGGGGGGATTTTATCTCCCCTTTAATTTTTCCTCTATTCTCGGCGTTGAATGTGGGGGAAACATCCCCATATACTGACGTACATGTTAATAGATGGCGTGAAGCACAGTCGTGTCATCTGATTACCTGGCGGAAATTAAACTAAGAGAGAGCTCTTGACCTCGCGCAAAATGCACTAATAAAAACAGGGCTGGCAGGCTAATTCGGGCTTGCCAGCCTTTTTTTGTCTCGCTAAGTTAGATGGCGGATCGGGCTTGCCCTTATTAAGGGGTGTTGTAAGGGGATGGCTGGCCTGATATAACTGCTGCGCGTTCGTACCTTGAAGGATTCAAGTGCGATATAAATTATAAAGAGGAAGAGAAGAGTGAATAAATCTCAATTGATCGACAAGATTGCTGCAGGGGCTGATATCTCTAAAGCTGCGGCTGGCCGTGCGTTAGATGCTATTATTGCTTCCGTAACTGAATCTCTGAAAGAAGGGGATGATGTAGCACTGGTAGGTTTTGGTACTTTTGCCGTTAAAGAGCGTGCTGCCCGTACTGGCCGCAACCCGCAGACCGGTAAAGAGATCACCATCGCTGCTGCTAAAGTACCGAGCTTCCGTGCAGGTAAAGCACTGAAAGACGCGGTAAACTAAGCGTTGTCCCCAGTGGGGA (SEQ ID NO: 25) | 擴增 lon彈出卡匣之模板 |
除用於陰性選擇之
sacB(編碼酶聚果糖蔗糖酶)外,用於菌株工程改造工作之基因剔除卡匣亦包括編碼康黴素抗性標記物(
kan)之DNA卡匣。為允許將此
kan-sacB剔除卡匣整合至基因組之正確位置,使用PCR (
圖 1)及Invitrogen Platinum SuperFi PCR預混液,將小的45 bp上游及下游同源區(分別為UHR及DHR)附加至剔除卡匣。剔除卡匣係自內部產生之含有kan-sacB表現卡匣之質體pStrain 22中擴增。
在
大腸桿菌中引入無痕基因組缺失
待基因修飾之菌株首先用pStrain 21轉型,且藉由塗鋪至含有100 μg/ml卡本西林(carbenicillin)之LB無動物成分(LBAF)瓊脂對轉型體進行選擇。接著使單個轉型體在含有100 μg/ml卡本西林之LBAF肉湯中在30℃下成長,歷時16小時,接著將30 μl此隔夜培養物轉移至含有3 ml具有100 μg/ml卡本西林之LBAF肉湯之試管中且在30℃、250 rpm下培育2小時。培育2小時後,分別使用100 ng/ml脫水四環素及1 mM異丙基β-D-1-硫代哌喃半乳糖苷誘導編碼λ red系統之基因及密碼子優化之
大腸桿菌 recA的表現。在30℃下再震盪培育2-3小時後,當OD600為約0.6-1.0時,收穫1 ml培養物來製備0.1 ml電轉勝任型細胞。將50 ul電轉勝任型細胞與1 μg經純化之剔除卡匣混合,且在1 mm有缺口之比色管中在1800伏特下進行電穿孔。在1 ml SOC培養基中在30℃、300 rpm下挽救轉型2小時,接著塗鋪至含有50 μg/ml康黴素及100 μg/ml卡本西林之LBAF瓊脂上,且在30℃下培育隔夜。 接著使用與康黴素抗性基因
kan結合之通用引子,以及與旨在剔除之基因上游結合之位置特異性引子,利用LongAmp Taq DNA聚合酶進行菌落PCR (cPCR)以篩選初級整合體。與cPCR同時,將相同純系點樣至含有35 μg/ml康黴素及100 μg/ml卡本西林之LBAF瓊脂及含有60 g/l蔗糖之LB瓊脂上。將此等培養盤在30℃下培育隔夜。藉由cPCR確認初級整合體後,藉由目視檢查「無生長」表型確認預期之蔗糖敏感性,其中將純系點樣至含有60 g/l蔗糖之LBAF瓊脂上。一旦藉由cPCR確認初級整合純系且亦確認其對蔗糖敏感,則使用如下所述之類似方法移除剔除卡匣。
為移除給定之剔除卡匣且獲得無痕缺失,自如
表 1所示之gBlocks (IDT)及獨特引子組擴增僅含UHR及DHR區之線性dsDNA片段。為方便起見,此等用於移除
kan-sacB卡匣之線性dsDNA片段稱為『彈出卡匣』。使確認之初級整合體在含有100 μg/ml卡本西林及50 μg/ml康黴素之LBAF肉湯中在30℃下成長,歷時16小時,接著將30 ul此隔夜培養物轉移至含有具有100 μg/ml卡本西林及50 μg/ml康黴素之3 ml LBAF肉湯之試管中且在30℃、250 rpm下培育2小時。培育2小時後,分別使用100 ng/ml aTc及1 mM IPTG誘導編碼λ red系統之基因及密碼子最佳化之
大腸桿菌 recA的表現。在30℃下再震盪培育2-3小時後,當OD600為約0.6-1.0時,收穫1 ml培養物來製備0.1 ml電轉勝任型細胞。將50 ul電轉勝任型細胞與1 μg經純化之彈出卡匣混合,且在1 mm有缺口之比色管中在1800伏特下進行電穿孔。在1 ml SOC培養基中在30℃、300 rpm下挽救轉型2小時,接著轉移至含有9 ml LBAF肉湯之125 ml搖瓶中。接著使此經稀釋之培養物在30℃、300 rpm下生長5-16小時,接著將50 ul培養物轉移至含有5 ml含有蔗糖之LBAF-無鹽肉湯(10 g/l大豆腖、5 g/l酵母提取物、60 g/l蔗糖;用0.2 uM過濾器過濾滅菌)之試管。接著將此含蔗糖之培養物在30℃、250 rpm下培育隔夜(約16小時)。接著將成長之培養物在無菌LBAF肉湯中稀釋100萬倍,塗鋪至LBAF瓊脂(塗鋪200 μl)上,且在37℃下培育隔夜。
在LBAF瓊脂盤上獲得分離之菌落後,使用cPCR及與待剔除之基因上游及下游結合之引子篩選純系以成功移除剔除卡匣(
kan-sacB)。同時,將純系複製點樣至LBAF瓊脂及含有100 μg/ml卡本西林之LBAF瓊脂。將此等培養盤在30℃下培育隔夜(16小時),以確認基因組編輯所需之溫度敏感性質體pStrain 21喪失。用於構築菌株11及菌株17之線性彈出卡匣之DNA序列列在
示例性序列表中。
菌株17之菌株確認
進行PCR以確認菌株17之基因型。使用來自菌株17甘油原液之刮取物分離模板DNA。使用適合各標靶基因之引子(表3)及LongAmp Taq DNA聚合酶(目錄號M0323S)設置PCR反應。在
圖 3中對凝膠進行分析後,所有條帶圖案均與所編輯基因座處之預期分子量一致。此外,對PCR產物進行序列確認,以驗證預期突變是否已引入所需基因座處。
表5:使用指示之引子(參見表3之引子序列),親本菌株菌株2及定製蛋白表現菌株菌株17中各種基因組基因座之預期PCR擴增子尺寸。
結果
菌株11之T7 RNA聚合酶變異體1表現
藉由 PCR 進行身份驗證之標靶基因組基因座 | 正向引子 | 反向引子 | 菌株 2 之預期 PCR 產物長度 (bp) | 菌株 17 之預期 PCR 產物長度 (bp) |
endA | KS518 | KS519 | 499 | 499 |
recA | KS520 | KS521 | 500 | 500 |
purR | KS1431 | KS1432 | 1226 | 1226 |
mrr-hsdRMS-symE-mcrBC (EcoKI) | KS1112 | KS1113 | 1048 | 1048 |
ompT | KS651 | KS652 | 1954 | 955 |
manA | KS1729 | KS1730 | 2162 | 986 |
lon | KS979 | KS980 | 3330 | 843 |
將菌株11/pStrain 2及BL21/pStrain 2純系在30℃、300 rpm下培育隔夜。次日準備含有60 ml TBAF++及50 μg/ml康黴素之帶擋板之500 mL搖瓶。將各隔夜培養物之一部分轉移至燒瓶中以獲得初始OD600 = 0.05。接著在實驗期間將燒瓶在28℃、300 rpm下培育。在第12小時(大約OD600 = 15)用1 mM IPTG誘導燒瓶。誘導後每小時量測OD600,且保存1 OD600等效細胞球粒,用於-20℃下之溶解及蛋白質凝膠。
成功創建菌株11後,用質體pStrain 2對其進行轉型,創建菌株12,以實現T7 RNA聚合酶變異體1之高複本、IPTG誘導表現。如方法部分所述,最初在搖瓶中測定菌株12之T7 RNA聚合酶變異體1蛋白之生長概況、特徵、產量及純度。作為比較,攜帶pStrain 2之BL21亦包括在搖瓶研究中。如
圖 4所示,菌株12之生長及T7 RNA聚合酶變異體1酶之表現與BL21相當。此外,BL21顯示展現T7 RNA聚合酶變異體1之降解產物,此在菌株11中未觀測到。不幸地,菌株11展現陰性生長表型,導致非常黏稠之漿狀培養物,此降低Ambr生物反應器之混合效能,導致氧質傳減少及維持目標%溶解氧之能力降低(資料未顯示)。
黏液表型似乎為
lon缺失之結果,因為菌株10中本身
ompT剔除具有正常之生長及培養外觀(資料未顯示)。不受理論之束縛,完全移除Lon可能引起RcsA過度積累,因此導致稱為可拉酸(colanic acid)之多醣過量產生。因此,基因組中缺失
manA,其為編碼甘露糖生物合成途徑第一步之基因。基因組中缺失該非必需基因以消除多醣之過量產生,從而消除黏液表型。
manA剔除引起不希望之黏液表型喪失
在構築菌株17後,證明
manA剔除移除由必要之
lon剔除產生的黏液表型。用pStrain 2 (用於表現T7 RNA聚合酶變異體1)轉型菌株11、BL21及菌株17,分別獲得菌株12、菌株24及菌株18。自
圖 5A可清楚看出,菌株12 (菌株11/pStrain 2)展示緻密之黏液形成,由缺乏起泡及禁錮氣泡顯而易見。另一方面,在存在編碼T7 RNA聚合酶變異體1之質體下菌株24及菌株18 (分別為宿主菌株BL21及菌株17)之菌株展現正常表型。為進一步證明細胞形態之改善及其在工業製程中之效用,藉由在13,000×g下離心,使菌株12、菌株24及菌株18培養物粒化。如
圖 5B所示,菌株24 (BL21/pStrain 2)產生緻密球粒。然而,
manA完整之菌株12 (菌株11/pStrain 2)未充分粒化。但是,
manA剔除菌株菌株18 (菌株17/pStrain 2)產生脆的緻密球粒,上清液清澈。此等搖瓶發酵結果支持進一步測試菌株17在搖瓶及Ambr250生物反應器中之重組蛋白表現。
在宿主菌株17下T7 RNA聚合酶變異體1之表現
為進行搖瓶表現發酵,將菌株17/pStrain 2純系接種至3 ml具有50 μg/ml康黴素之LBAF的試管中且在30℃下在300 rpm下培育隔夜。確定各培養物之OD600且將獲得初始OD600 = 0.1所需之量的各種菌培養物轉移至含有30 ml TBAF + 50 μg/ml康黴素的無菌250 ml帶擋板之通氣搖瓶中。接著將接種之燒瓶在37℃、300 rpm下培育。在3小時時間點,添加0.5 mM IPTG以誘導T7 RNA聚合酶變異體1表現。誘導後4小時獲取OD600及1 OD等效細胞球粒。
本研究評估在菌株17中表現T7 RNA聚合酶變異體1之四個不同純系。在
圖 6中,在所有純系中均觀測到T7 RNA聚合酶變異體1之過度表現,而純系1似乎具有最高之T7 RNA聚合酶變異體1表現。可能由於缺乏黏液表型,與使用菌株11作為宿主菌株之實驗相比,溶解更高效,從而產生純淨凝膠影像。
表現T7 RNA聚合酶變異體2之菌株17在Ambr250生物反應器中之效能
用攜帶編碼T7 RNA聚合酶變異體2之IPTG誘導型DNA序列的pStrain 23轉型菌株17後,挑出兩個純系用於進一步篩选及表徵:菌株19及菌株20。一旦純系之質體及基因型得到確認,即可評估其在AMBR250生物反應器中之效能。此過程涉及使用TBAF培養基、酵母提取物(yeastolate)及甘油進料之有氧補料分批發酵。
在此實驗中,使用自甘油原液刮取至75 mL TBAF + 50 μg/mL康黴素之冰刮取物,接種一個500 mL搖瓶且在28℃下生長9.5小時。各生物反應器接種6.7%之接種物(初始OD
6000.05),此係基於200 mL之初始起始體積計算,且接著乘以0.8之種菌瓶目標OD600。接著藉由實際種菌瓶OD600對此值進行正規化。
表6:來自28小時EFT時間點之濕細胞重量.
反應器編號 | 純系 | 濕細胞重量 (g/L) |
1 | 菌株19 | 163 |
2 | 菌株19 | 151 |
3 | 菌株20 | 148 |
4 | 菌株20 | 157 |
線上概況與預期一致且在所有生物反應器之間一致(
圖 7)。CER在第9小時達到60之值,在IPTG大劑量添加下觸發所有四個生物反應器之誘導。CER在整個培養持續時間內繼續攀升,達到90之CER峰值。在整個培養持續時間內,溶解氧維持在50%,只有此等感測器典型之微小波動。pH值維持在6.95 ± 0.05之目標值。在觸發酸添加之指數階段,pH值攀升至7.0以上,直至pH值在第11小時左右穩定。一旦pH值停止上升且在第11小時開始穩定,即可觸發鹼,以接近恆定之速率進料以維持6.95之pH值。28小時時,收穫培養物且送去進行純化及LabChip分析(藉由毛細管電泳進行蛋白質定量)。菌株19及菌株20該兩個純系行為相似,生長至相似之最終濕細胞重量(表6),且重要地,在高密度生物反應器發酵中使用宿主菌株菌株17進行重組蛋白表現未觀測到任何問題。
最後,對T7 RNA聚合酶變異體2之表現進行目測、定量且自上述Ambr發酵過程中取出之冷凍細胞球粒中純化。來自菌株19生物反應器之細胞球粒如下進行處理:在-80℃下冷凍,解凍至環境溫度,在存在Tris-HCl、NaCl、DTT、蛋白酶抑制劑、PMSF、溶菌酶、DNA酶、Triton-X 100之情況下溶解細菌細胞。過濾溶解產物,且藉由毛細管電泳分析濾液中存在之T7 RNA聚合酶變異體2。結果展示在
圖 8中。由此產生之最終蛋白質產量為約2.5 g/L (每升培養物中之蛋白質公克數)且經由密度測定法,純度>95%之純度。此處實現之T7 RNA聚合酶變異體2產量對於第一代菌株及發酵過程而言相當高,且若成功擴大至30 L發酵,預計將提供每個發酵批次>60公克未純化之T7酶。就上下文而言,產生100-150 g mRNA需要大約1 g T7 RNA聚合酶。
結論
已開發出一種用於表現重組蛋白之定製
大腸桿菌菌株。首先,選擇菌株2作為親本菌株,開始引入對重組蛋白表現特別有益之基因組修飾。菌株2具有若干個可用於工業蛋白表現菌株之突變。此等突變包括
endA及
recA剔除以提高純化後質體之穩定性及純度,以及EcoKI限制性系統之失活以提高轉型及選殖效率。此工作之一個目的為降低菌株2之蛋白酶活性,以提供可表現高純度重組酶之菌株。
基因組中缺失
ompT基因,該基因編碼在大腸桿菌外膜中發現之主要蛋白酶。其次,基因組中缺失一種主要管家蛋白酶Lon。發現菌株中之
lon剔除導致陰性黏液表型,此由多醣合成途徑之上調引起。此
lon剔除展現Ambr250生物反應器之效能較差,因為培養物黏度成為對培養物之攪拌及通氣之限制。根據大腸桿菌BL21之基因組序列(Genbank: CP053601.1),
lonORF在此菌株中保持完整。BL21可能展現一些殘留之Lon活性,因此未表現出黏液表型。為防止所需重組蛋白降解,需要一種完全缺乏Lon活性之菌株。為開發一種真正
lon剔除但亦不表現出黏液表型之菌株,引入額外基因剔除
ΔmanA以移除非必需多醣合成途徑之第一步。第一代蛋白表現菌株菌株17之最終基因型為大腸桿菌MG1655
ΔendA ΔrecA Δ(
mrr-hsdRMS-symE-mcrBC)
ΔompT ΔmanA Δlon。
實例2:在Lon、OmpT及ManA缺乏之經基因修飾之
大腸桿菌菌株中T7 RNA聚合酶變異體3及T7 RNA聚合酶變異體3之產生.
藉由定點誘變對編碼IPTG誘導之編碼T7 RNA聚合酶變異體2之DNA序列的pStrain 23進行修飾,以便編碼序列改為編碼T7 RNA聚合酶變異體3。此經修飾之質體稱為pStrain 24。菌株17用pStrain 24轉型,pStrain 24攜帶IPTG誘導之編碼T7 RNA聚合酶變異體3之DNA序列。一旦確認細菌菌株及轉型質體之基因型,即將菌株接種至AMBR250生物反應器中以啟動T7 RNA聚合酶變異體3之發酵及產生。此過程涉及使用TBAF培養基、酵母提取物及甘油進料之有氧補料分批發酵。
將IPTG添加至各生物反應器中以觸發T7 RNA聚合酶變異體3表現之誘導。使細菌培養物生長,且接著收穫培養物且送去進行T7 RNA聚合酶變異體3純化及後續LabChip分析(藉由毛細管電泳進行蛋白質定量)。
最後,對T7 RNA聚合酶變異體3之表現進行目測、定量且自上述Ambr發酵過程中取出之冷凍細胞球粒中純化。來自菌株19生物反應器之細胞球粒如下進行處理:在-80℃下冷凍,解凍至環境溫度,在存在Tris-HCl、NaCl、DTT、蛋白酶抑制劑、PMSF、溶菌酶、DNA酶、Triton-X 100之情況下溶解細菌細胞。過濾溶解產物,且藉由毛細管電泳分析濾液中存在之T7 RNA聚合酶變異體3。若擴大至30 L發酵,預計發酵將提供每個發酵批次>60公克未純化之T7 RNA聚合酶變異體3酶。就上下文而言,產生100-150 g mRNA需要大約1 g T7 RNA聚合酶。
示例性序列
*除非另有說明,否則描繪及列出序列,且如下讀取:核苷酸序列為5'至3';及胺基酸序列為N端至C端。**除非另有說明,否則NT表示核苷酸序列,且AA表示胺基酸序列
等效物及範疇
SEQ ID NO | 序列 | 描述 |
26 | TATTGAAGATCCGCTTCGATCAGGGGATGGGCTACTGGCGCATCAACTTTTCATCGCAATGGCATTACTTTGATTTCCGCGATGACGTTTCTTTCCAGTTAGTCAAAATGGCTCAGGCCTGCAAGGAAGGGAATGTCGCCAACAGCGAAGAGAGTTGGGCAACGGATGTGCTGGTGGAGGTGATCGCCTCCTGATGATGAGCCGCTCCCGATGTGGTGTCGGGAGCGGTATTTTCTATAAAACTTACCGCAATATCAGGCCGGATGCGGCTGCGCCTTATCCGGCCCATAACCCCTTACTTCCTCAACCCCGCAAACGCAGCCCGAATCTCTTCCTCCGGCAGCTGGATCCCGATAAACACCATCGTGCTATGCGGTTTTTCATCGCCCCACGGCCTGTCCCAGTCGGCGCTGTAGAGGCGCTGGACGCCCTGGAACAGCAGGCGGTTAGGTTCGCCGTCAATCCACAGCATCCCTTTGTAACGTAGCAGTTTATCCGCC | mcrC缺失卡匣 |
23 | AACGGATAAGACGGGCATAAATGAGGAAGAAATGGCGCGCCCTGCAGGATTCGAACCTGCGGCCCACGACTTAGAAGTTCCTAGAACGACATTTTAAGTCAACAACTTACCGCGCCATCTCTGCGCTCACACGTCCCACTACCTCAAAACATGTAAAGCCTTGCAAGCCATTGCGAGGCCTTATGTGTCTCAGTTTTGTCCCTCTTTTTTGTACTAAAAAACATAGTAATTGAGGATAAACCTCATGCTATTTTCGCTTATATGCCTCTAAAGGCATGGCACTTAAATAGATAAAAGCACCACAAAAGCATAAAAAAACCACACAGTAAAACCGAAATATGAAACAATAACAGATAATTAAACCAAAAACAGATAGCGCATTGTGATAATCATTCAATACTAAACAAAATATAAACAGTGGAGCAATATGTAATTGACTCATTAAGTTAGATATAAAAAATACATATTCAATCATTAAAACGATTGAATGGAGAACTTTTGAACGCCAACTAAAATTTCCCCGAGGTGAAAATCGCCCCGGGGAATAACTAGCCATTTCAATGTAACAATTAACCCTTAAAATAAACCCAGAAGGTTATTAACTAAATCACATAGAAAACCATCAATTATAGTATGTATAAAATAGGCGACAGCAACCCAATTACAAATTAATGGTTCCAGAATATCACATCAAAAAAAACGCTGTATAATATTATAATTAACATGTAGACAACTTGTAATAAACATTATCAGTCAATTGTTTTGTTTATTCCATCTGTGACGCCGATTATTTTCTCAAAATAATGAGATGGCGTGACACCATAATAATCTTTAAATGCACATATGAAATATGAAGTACTGTTATAGCCACATTTCTGGGCTACGACATTGATAGAATAAGAGTTTGAAGTTATGAGTTTTTTTGCATACCTCATCCTAGTATCTCTCAATATTTCAGTAAATGACGTTCCTTCATCCCTTAATCTTTTTTTTATTAAAC | ompT缺失卡匣 |
25 | TCTGATTCAGATCCTCAAAGAGCCGAAAAACGCCCTGACCAAGCAGTATCAGGCGCTGTTTAATCTGGAAGGCGTGGATCTGGAATTCCGTGACGAGGCGCTGGATGCTATCGCTAAGAAAGCGATGGCGCGTAAAACCGGTGCCCGTGGCCTGCGTTCCATCGTAGAAGCCGCACTGCTCGATACCATGTACGATCTGCCGTCCATGGAAGACGTCGAAAAAGTGGTTATCGACGAGTCGGTAATTGATGGTCAAAGCAAACCGTTGCTGATTTATGGCAAGCCGGAAGCGCAACAGGCATCTGGTGAATAATTAACCATTCCCATACAATTAGTTAACCAAAAAGGGGGGATTTTATCTCCCCTTTAATTTTTCCTCTATTCTCGGCGTTGAATGTGGGGGAAACATCCCCATATACTGACGTACATGTTAATAGATGGCGTGAAGCACAGTCGTGTCATCTGATTACCTGGCGGAAATTAAACTAAGAGAGAGCTCTTGACCTCGCGCAAAATGCACTAATAAAAACAGGGCTGGCAGGCTAATTCGGGCTTGCCAGCCTTTTTTTGTCTCGCTAAGTTAGATGGCGGATCGGGCTTGCCCTTATTAAGGGGTGTTGTAAGGGGATGGCTGGCCTGATATAACTGCTGCGCGTTCGTACCTTGAAGGATTCAAGTGCGATATAAATTATAAAGAGGAAGAGAAGAGTGAATAAATCTCAATTGATCGACAAGATTGCTGCAGGGGCTGATATCTCTAAAGCTGCGGCTGGCCGTGCGTTAGATGCTATTATTGCTTCCGTAACTGAATCTCTGAAAGAAGGGGATGATGTAGCACTGGTAGGTTTTGGTACTTTTGCCGTTAAAGAGCGTGCTGCCCGTACTGGCCGCAACCCGCAGACCGGTAAAGAGATCACCATCGCTGCTGCTAAAGTACCGAGCTTCCGTGCAGGTAAAGCACTGAAAGACGCGGTAAACTAAGCGTTGTCCCCAGTGGGGA | lon缺失卡匣 |
24 | ACGCCTTTCGCCGCGATGTCGGAGTTACGCAGGAATTGCAGCGCCACATATTTATCATTTTCGCTGGCCTCCGGGTCACGCAGAATGTCGGCCACCTGTTGTTGGTGCGCCGGACGCAGCATGAACGACGCATCATGAAACGCCTGGCGCGCCAACAGAGTTAACGCTTCGGGTGCGACTTTCAAAATCTCCTGCCCTTCAAATTCAGATACGCTAACGTGTTCGCTGGTTAGCAGGTAATACTCAGTATCATCTTTTTTGAGTGGAAAAGGAGCCTGATAATGAAAGGGTTTGTTTGACATTGTTCTCTCACTTACTGCCTGGTTTGGTTATGCTCTGGGCGGGTGTTCCGTTGCCCTGTTAAAAGCGAGTAACAATATCCTACACACTTTTTTAACAAAAACTGAGACTAGTACGACTTTTTGCGGCTCCAGGTTACTTCCCGTAGGATTCTTGCTTTAATAGTGGGATTAATTTCCACATTAAAACAGGGATTGATCGAGCTTACTGAAAAAATTAACATCTCTTGCTAAGCTTATTAAAGGCTTATAACACCTTCAGGCGGCCAGTCCGCCTGATTTCATTTTATGGATAATCATTATGAATAAATCGCTGGTAGCGGTAGGCGTCATTGTTGCGCTAGGCGTAGTCTGGACAGGCGGCGCATGGTATACAGGCAAGAAGATTGAAACCCATCTCGAAGACATGGTCGCGCAGGCGAACGCGCAACTCAAACTGACAGCTCCTGAATCCAACCTGGAAGTGAGTTATCAAAACTATCATCGCGGCGTATTCAGCAGCCAGTTGCAACTGTTGGTGAAACCCATTGCCGGGAAAGAAAATCCGTGGATTAAAAGCGGTCAGAGCGTCATCTTCAACGAATCGGTTGATCATGGTCCCTTCCCGCTTGCCCAGCTTAAAAAACTGAACCTGATCCCGTCGATGGCATCAATTCAAACCACGCTGGTTAATAACGAAGTAAGCAAACCACTGTTTGATA | manA缺失卡匣 |
27 | GATTCGAACTCGGCCCACGACTTAGAAGTTCTAGAACGACATTTTAAGTCAACAACTTACCGCGCCATCTCTGCGCTCACACGTCCCACTACCTCAAAACATGTAAAGCCTTGCAAGCCATTGCGAGGCCTTATGTGTCTCAGTTTTGTCCCTCTTTTTTGTACTAAAAAACATAGTAATTGAGGATAAACCTCATGCTATTTTCGCTTATATGCCTCTAAAGGCATGGCACTTAAATAGATAAAAGCACCACAAAAGCATAAAAAAACCACACAGTAAAACCGAAATATGAAACAATAACAGATAATTAAACCAAAAACAGATAGCGCATTGTGATAATCATTCAATACTAAACAAAATATAAACAGTGGAGCAATATGTAATTGACTCATTAAGTTAGATATAAAAAATACATATTCAATCATTAAAACGATTGAATGGAGAACTTTTATGCGGGCGAAACTTCTGGGAATAGTCCTGACAACCCCTATTGCGATCAGCTCTTTTGCTTCTACCGAGACTTTATCGTTTACTCCTGACAACATAAATGCGGACATTAGTCTTGGAACTCTGAGCGGAAAAACAAAAGAGCGTGTTTATCTAGCCGAAGAAGGAGGCCGAAAAGTCAGTCAACTCGACTGGAAATTCAATAACGCTGCAATTATTAAAGGTGCAATTAATTGGGATTTGATGCCCCAGATATCTATCGGGGCTGCTGGCTGGACAACTCTCGGCAGCCGAGGTGGCAATATGGTCGATCAGGACTGGATGGATTCCAGTAACCCCGGAACCTGGACGGATGAAAGTAGACACCCTGATACACAACTCAATTATGCCAACGAATTTGATCTGAATATCAAAGGCTGGCTCCTCAACGAACCCAATTACCGCCTGGGACTCATGGCCGGATATCAGGAAAGCCGTTATAGCTTTACAGCCAGAGGTGGTTCCTATATCTACAGTTCTGAGGAGGGATTCAGAGATGATATCGGCTCCTTCCCGAATGGAGAAAGAGCAATCGGCTACAAACAACGTTTTAAAATGCCCTACATTGGCTTGACTGGAAGTTATCGTTATGAAGATTTTGAACTCGGTGGCACATTTAAATACAGCGGCTGGGTGGAATCATCTGATAACGATGAACACTATGACCCGGGAAAAAGAATCACTTATCGCAGTAAGGTCAAAGACCAAAATTACTATTCTGTTGCAGTCAATGCAGGTTATTACGTCACACCTAACGCAAAAGTTTATGTTGAAGGCGCATGGAATCGGGTTACGAATAAAAAAGGTAATACTTCACTTTATGATCACAATAATAACACTTCAGACTACAGCAAAAATGGAGCAGGTATAGAAAACTATAACTTCATCACTACTGCTGGTCTTAAGTACACATTTTAAGAACGCCAACTAAAATTTCCCCGAGGTGAAAATCGCCCCGGGAATAACTAGCCATTTCAATGTAACAATTAACCCTTAAAATAAACCCAGAAGGTTATTAACTAAATCACATAGAAAACCATCAATTATAGTATGTATAAAATAGGCGACAGCAACCCAATTACAAATTAATGGTTCCAGAATATCACATCAAAAAAAACGCTGTATAATATTATAATTAACATGTAGACAACTTGTAATAAACATTATCAGTCAATTGTTTTGTTTATTCCATCTGTGACGCCGATTATTTTCTCAAAATAATGAGATGGCGTGAGACCATAATAATCTTTAAATGCACATATGAAATATGAAG | ompTDNA編碼序列 |
28 | MRAKLLGIVLTTPIAISSFASTETLSFTPDNINADISLGTLSGKTKERVYLAEEGGRKVSQLDWKFNNAAIIKGAINWDLMPQISIGAAGWTTLGSRGGNMVDQDWMDSSNPGTWTDESRHPDTQLNYANEFDLNIKGWLLNEPNYRLGLMAGYQESRYSFTARGGSYIYSSEEGFRDDIGSFPNGERAIGYKQRFKMPYIGLTGSYRYEDFELGGTFKYSGWVESSDNDEHYDPGKRITYRSKVKDQNYYSVAVNAGYYVTPNAKVYVEGAWNRVTNKKGNTSLYDHNNNTSDYSKNGAGIENYNFITTAGLKYTF | OmpT胺基酸序列 |
29 | GAATTCCGTGACGAGGCGCTGGATGCTATCGCTAAGAAAGCGATGGCGCGTAAAACCGGTGCCCGTGGCCTGCGTTCCATCGTAGAAGCCGCACTGCTCGATACCATGTACGATCTGCCGTCCATGGAAGATGTCGAAAAAGTGGTTATCGACGAGTCGGTAATTGATGGTCAAAGCAAACCGTTGCTGATTTATGGTAAGCCGGAAGCGCAACAGGCATCTGGTGAATAATTAACCATTCCCATACAATTAGTTAACCAAAAAGGGGGGATTTTATCTCCCCTTTAATTTTTCCTCTATTCTCGGCGTTGAATGTGGGGGAAACATCCCCATATACTGACGTACATGTTAATAGATGGCGTGAAGCACAGTCGTGTCATCTGATTACCTGGCGGAAATTAAACTAAGAGAGAGCTCTATGAATCCTGAGCGTTCTGAACGCATTGAAATCCCCGTATTGCCGCTGCGCGATGTGGTGGTTTATCCGCACATGGTCATCCCCTTATTTGTCGGGCGGGAAAAATCTATCCGTTGTCTGGAAGCGGCGATGGACCATGATAAAAAAATTATGCTGGTCGCGCAGAAAGAAGCTTCAACGGATGAGCCGGGTGTAAACGATCTTTTCACCGTCGGGACCGTGGCCTCTATATTGCAGATGCTGAAACTGCCTGACGGCACCGTCAAAGTGCTGGTCGAGGGGTTACAGCGCGCGCGTATTTCTGCGCTCTCTGACAATGGCGAACACTTTTCTGCGAAGGCGGAGTATCTGGAGTCGCCGACCATTGATGAGCGGGAACAGGAAGTGCTGGTGCGTACTGCAATCAGCCAGTTCGAAGGCTACATCAAGCTGAACAAAAAAATCCCACCAGAAGTGCTGACGTCGCTGAATAGCATCGACGATCCGGCGCGTCTGGCGGATACCATTGCTGCACATATGCCGCTGAAACTGGCTGACAAACAGTCCGTTCTGGAGATGTCCGACGTTAACGAACGTCTGGAATATCTGATGGCAATGATGGAATCGGAAATCGATCTGCTGCAGGTTGAGAAACGCATTCGCAACCGCGTTAAAAAGCAGATGGAGAAATCCCAGCGTGAGTACTATCTGAACGAGCAAATGAAAGCTATTCAGAAAGAACTCGGTGAAATGGACGACGCGCCGGACGAAAACGAAGCCCTGAAGCGCAAAATCGACGCGGCGAAGATGCCGAAAGAGGCAAAAGAGAAAGCGGAAGCAGAGTTGCAGAAGCTGAAAATGATGTCTCCGATGTCGGCAGAAGCGACCGTAGTGCGTGGTTATATCGACTGGATGGTACAGGTACCGTGGAATGCGCGCAGCAAGGTCAAAAAAGACCTGCGTCAGGCGCAGGAAATCCTTGATACCGACCATTATGGTCTGGAGCGCGTGAAAGATCGCATCCTTGAGTACCTTGCGGTTCAAAGCCGTGTCAACAAAATCAAGGGACCAATCCTCTGCCTGGTAGGGCCGCCGGGGGTAGGTAAAACCTCTCTTGGTCAGTCCATTGCCAAAGCCACCGGGCGTAAATATGTCCGTATGGCGCTGGGCGGCGTGCGTGATGAAGCGGAAATCCGTGGTCACCGCCGTACTTACATCGGTTCTATGCCGGGTAAACTGATCCAGAAAATGGCGAAAGTGGGCGTGAAAAACCCGCTGTTCCTGCTCGATGAGATCGACAAAATGTCTTCTGACATGCGAGGCGATCCGGCCTCTGCACTGCTTGAAGTGCTGGATCCAGAGCAGAACGTAGCGTTCAGCGACCACTACCTGGAAGTGGATTACGATCTCAGCGACGTGATGTTTGTCGCGACGTCGAACTCCATGAACATTCCGGCACCGCTGCTGGATCGTATGGAAGTGATTCGCCTCTCCGGTTATACCGAAGATGAAAAACTGAACATCGCCAAACGTCACCTGCTGCCGAAGCAGATTGAACGTAATGCACTGAAAAAAGGTGAGCTGACCGTCGACGATAGCGCCATTATCGGCATTATTCGTTACTACACCCGTGAGGCGGGCGTGCGTGGTCTGGAGCGTGAAATCTCCAAACTGTGCCGCAAAGCGGTTAAGCAGTTACTGCTCGATAAGTCATTAAAACATATCGAAATTAACGGCGATAACCTGCATGACTACCTCGGTGTTCAGCGTTTCGACTATGGTCGCGCTGATAACGAAAACCGTGTCGGTCAGGTAACCGGTCTGGCGTGGACGGAAGTGGGCGGTGACTTGCTGACCATTGAAACCGCATGTGTTCCGGGTAAAGGCAAACTGACCTATACCGGTTCGCTCGGCGAAGTGATGCAGGAGTCTATTCAGGCGGCGTTAACGGTGGTTCGTGCGCGTGCGGAAAAACTGGGGATCAACCCTGATTTTTACGAAAAACGTGACATCCACGTCCACGTACCGGAAGGTGCGACGCCGAAAGATGGTCCGAGTGCCGGTATTGCTATGTGCACCGCGCTGGTTTCTTGCCTGACCGGTAACCCGGTTCGTGCCGATGTGGCAATGACCGGTGAGATCACTCTGCGTGGTCAGGTACTGCCGATCGGTGGTTTGAAAGAAAAACTCCTGGCAGCGCATCGCGGCGGGATTAAAACAGTGCTAATTCCGTTCGAAAATAAACGCGATCTGGAAGAGATTCCTGACAACGTAATTGCCGATCTGGACATTCATCCTGTGAAGCGCATTGAGGAAGTTCTGACTCTGGCGCTGCAAAATGAACCGTCCGGCATGCACCATTCCTTGCGGCGGCGGTGCTCAACGGCCTCAACCTACTACTGGGCTGCTTCCTAA | lonDNA編碼序列 |
30 | MNPERSERIEIPVLPLRDVVVYPHMVIPLFVGREKSIRCLEAAMDHDKKIMLVAQKEASTDEPGVNDLFTVGTVASILQMLKLPDGTVKVLVEGLQRARISALSDNGEHFSAKAEYLESPTIDEREQEVLVRTAISQFEGYIKLNKKIPPEVLTSLNSIDDPARLADTIAAHMPLKLADKQSVLEMSDVNERLEYLMAMMESEIDLLQVEKRIRNRVKKQMEKSQREYYLNEQMKAIQKELGEMDDAPDENEALKRKIDAAKMPKEAKEKAEAELQKLKMMSPMSAEATVVRGYIDWMVQVPWNARSKVKKDLRQAQEILDTDHYGLERVKDRILEYLAVQSRVNKIKGPILCLVGPPGVGKTSLGQSIAKATGRKYVRMALGGVRDEAEIRGHRRTYIGSMPGKLIQKMAKVGVKNPLFLLDEIDKMSSDMRGDPASALLEVLDPEQNVAFSDHYLEVDYDLSDVMFVATSNSMNIPAPLLDRMEVIRLSGYTEDEKLNIAKRHLLPKQIERNALKKGELTVDDSAIIGIIRYYTREAGVRGLEREISKLCRKAVKQLLLDKSLKHIEINGDNLHDYLGVQRFDYGRADNENRVGQVTGLAWTEVGGDLLTIETACVPGKGKLTYTGSLGEVMQESIQAALTVVRARAEKLGINPDFYEKRDIHVHVPEGATPKDGPSAGIAMCTALVSCLTGNPVRADVAMTGEITLRGQVLPIGGLKEKLLAAHRGGIKTVLIPFENKRDLEEIPDNVIADLDIHPVKRIEEVLTLALQNEPSGMQVVTAK | Lon胺基酸序列 |
31 | CCGGACGCAGCATGAACGACGCATCATGAAACGCCTGGCGCGCCAACAGAGTTAACGCTTCGGGTGCGACTTTCAAAATCTCCTGCCCTTCAAATTCAGATACGCTAACGTGTTCGCTGGTTAGCAGGTAATACTCAGTATCATCTTTTTTGAGTGGAAAAGGAGCCTGATAATGAAAGGGTTTGTTTGACATTGTTCTCTCACTTACTGCCTGGTTTGGTTATGCTCTGGGCGGGTGTTCCGTTGCCCTGTTAAAAGCGAGTAACAATATCCTACACACTTTTTTAACAAAAACTGAGACTAGTACGACTTTTTGCGGCTCCAGGTTACTTCCCGTAGGATTCTTGCTTTAATAGTGGGATTAATTTCCACATTAAAACAGGGATTGATCATGCAAAAACTCATTAACTCAGTGCAAAACTATGCCTGGGGCAGCAAAACGGCGTTGACTGAACTTTATGGTATGGAAAATCCGTCCAGCCAGCCGATGGCCGAGCTGTGGATGGGCGCACATCCGAAAAGCAGTTCACGAGTGCAGAATGCCGCCGGAGATATCGTTTCACTGCGTGATGTGATTGAGAGTGATAAATCGACTCTGCTCGGAGAGGCCGTTGCCAAACGCTTTGGCGAACTGCCTTTCCTGTTCAAAGTATTATGCGCAGCACAGCCACTCTCCATTCAGGTTCATCCAAACAAACACAATTCTGAAATCGGTTTTGCCAAAGAAAATGCCGCAGGTATCCCGATGGATGCCGCCGAGCGTAACTATAAAGATCCTAACCACAAGCCGGAGCTGGTTTTTGCGCTGACGCCTTTCCTTGCGATGAACGCGTTTCGTGAATTTTCCGAGATTGTCTCCCTACTCCAGCCGGTCGCAGGTGCACATCCGGCGATTGCTCACTTTTTACAACAGCCTGATGCCGAACGTTTAAGCGAACTGTTCGCCAGCCTGTTGAATATGCAGGGTGAAGAAAAATCCCGCGCGCTGGCGATTTTAAAATCGGCCCTCGATAGCCAGCAGGGTGAACCGTGGCAAACGATTCGTTTAATTTCTGAATTTTACCCGGAAGACAGCGGTCTGTTCTCCCCGCTATTGCTGAATGTGGTGAAATTGAACCCTGGCGAAGCGATGTTCCTGTTCGCTGAAACACCGCACGCTTACCTGCAAGGCGTGGCGCTGGAAGTGATGGCAAACTCCGATAACGTGCTGCGTGCGGGTCTGACGCCTAAATACATTGATATTCCGGAACTGGTTGCCAATGTGAAATTCGAAGCCAAACCGGCTAACCAGTTGTTGACCCAGCCGGTGAAACAAGGTGCAGAACTGGACTTCCCGATTCCAGTGGATGATTTTGCCTTCTCGCTGCATGACCTTAGTGATAAAGAAACCACCATTAGCCAGCAGAGTGCCGCCATTTTGTTCTGCGTCGAAGGCGATGCAACGTTGTGGAAAGGTTCTCAGCAGTTACAGCTTAAACCGGGTGAATCAGCGTTTATTGCCGCCAACGAATCACCGGTGACTGTCAAAGGCCACGGCCGTTTAGCGCGTGTTTACAACAAGCTGTAAGAGCTTACTGAAAAAATTAACATCTCTTGCTAAGCTT | manADNA編碼序列 |
32 | MQKLINSVQNYAWGSKTALTELYGMENPSSQPMAELWMGAHPKSSSRVQNAAGDIVSLRDVIESDKSTLLGEAVAKRFGELPFLFKVLCAAQPLSIQVHPNKHNSEIGFAKENAAGIPMDAAERNYKDPNHKPELVFALTPFLAMNAFREFSEIVSLLQPVAGAHPAIAHFLQQPDAERLSELFASLLNMQGEEKSRALAILKSALDSQQGEPWQTIRLISEFYPEDSGLFSPLLLNVVKLNPGEAMFLFAETPHAYLQGVALEVMANSDNVLRAGLTPKYIDIPELVANVKFEAKPANQLLTQPVKQGAELDFPIPVDDFAFSLHDLSDKETTISQQSAAILFCVEGDATLWKGSQQLQLKPGESAFIAANESPVTVKGHGRLARVYNKL | ManA胺基酸序列 |
33 | TCGCGCTGCACTGGCGTAATGCTGACCGGATGGCTATCGCTAATGGTCTTACGCTCAACATTGATAAGCAACTTGACGCAATGTTAATGGGCTGATAGTCTTATCTTACAGGTCATCTGCGGGTGGCCTGAATAGGTACGATTTACTAACTGGAAGAGGCACTAAATGAACACGATTAACATCGCTAAGAACGACTTCTCTGACATCGAACTGGCTGCTATCCCGTTCAACACTCTGGCTGACCATTACGGTGAGCGTTTAGCTCGCGAACAGTTGGCCCTTGAGCATGAGTCTTACGAGATGGGTGAAGCACGCTTCCGCAAGATGTTTGAGCGTCAACTTAAAGCTGGTGAGGTTGCGGATAACGCTGCCGCCAAGCCTCTCATCACTACCCTACTCCCTAAGATGATTGCACGCATCAACGACTGGTTTGAGGAAGTGAAAGCTAAGCGCGGCAAGCGCCCGACAGCCTTCCAGTTCCTGCAAGAAATCAAGCCGGAAGCCGTAGCGTACATCACCATTAAGACCACTCTGGCTTGCCTAACCAGTGCTGACAATACAACCGTTCAGGCTGTAGCAAGCGCAATCGGTCGGGCCATTGAGGACGAGGCTCGCTTCGGTCGTATCCGTGACCTTGAAGCTAAGCACTTCAAGAAAAACGTTGAGGAACAACTCAACAAGCGCGTAGGGCACGTCTACAAGAAAGCATTTATGCAAGTTGTCGAGGCTGACATGCTCTCTAAGGGTCTACTCGGTGGCGAGGCGTGGTCTTCGTGGCATAAGGAAGACTCTATTCATGTAGGAGTACGCTGCATCGAGATGCTCATTGAGTCAACCGGAATGGTTAGCTTACACCGCCAAAATGCTGGCGTAGTAGGTCAAGACTCTGAGACTATCGAACTCGCACCTGAATACGCTGAGGCTATCGCAACCCGTGCAGGTGCGCTGGCTGGCATCTCTCCGATGTTCCAACCTTGCGTAGTTCCTCCTAAGCCGTGGACTGGCATTACTGGTGGTGGCTATTGGGCTAACGGTCGTCGTCCTCTGGCGCTGGTGCGTACTCACAGTAAGAAAGCACTGATGCGCTACGAAGACGTTTACATGCCTGAGGTGTACAAAGCGATTAACATTGCGCAAAACACCGCATGGAAAATCAACAAGAAAGTCCTAGCGGTCGCCAACGTAATCACCAAGTGGAAGCATTGTCCGGTCGAGGACATCCCTGCGATTGAGCGTGAAGAACTCCCGATGAAACCGGAAGACATCGACATGAATCCTGAGGCTCTCACCGCGTGGAAACGTGCTGCCGCTGCTGTGTACCGCAAGGACAGGGCTCGCAAGTCTCGCCGTATCAGCCTTGAGTTCATGCTTGAGCAAGCCAATAAGTTTGCTAACCATAAGGCCATCTGGTTCCCTTACAACATGGACTGGCGCGGTCGTGTTTACGCCGTGTCAATGTTCAACCCGCAAGGTAACGATATGACCAAAGGACTGCTTACGCTGGCGAAAGGTAAACCAATCGGTAAGGAAGGTTACTACTGGCTGAAAATCCACGGTGCAAACTGTGCGGGTGTCGATAAGGTTCCGTTCCCTGAGCGCATCAAGTTCATTGAGGAAAACCACGAGAACATCATGGCTTGCGCTAAGTCTCCACTGGAGAACACTTGGTGGGCTGAGCAAGATTCTCCGTTCTGCTTCCTTGCGTTCTGCTTTGAGTACGCTGGGGTACAGCACCACGGCCTGAGCTATAACTGCTCCCTTCCGCTGGCGTTTGACGGGTCTTGCTCTGGCATCCAGCACTTCTCCGCGATGCTCCGAGATGAGGTAGGTGGTCGCGCGGTTAACTTGCTTCCTAGTGAGACCGTTCAGGACATCTACGGGATTGTTGCTAAGAAAGTCAACGAGATTCTACAAGCAGACGCAATCAATGGGACCGATAACGAAGTAGTTACCGTGACCGATGAGAACACTGGTGAAATCTCTGAGAAAGTCAAGCTGGGCACTAAGGCACTGGCTGGTCAATGGCTGGCTCACGGTGTTACTCGCAGTGTGACTAAGCGTTCAGTCATGACGCTGGCTTACGGGTCCAAAGAGTTCGGCTTCCGTCAACAAGTGCTGGAAGATACCATTCAGCCAGCTATTGATTCCGGCAAGGGTCCGATGTTCACTCAGCCGAATCAGGCTGCTGGATACATGGCTAAGCTGATTTGGGAATCTGTGAGCGTGACGGTGGTAGCTGCGGTTGAAGCAATGAACTGGCTTAAGTCTGCTGCTAAGCTGCTGGCTGCTGAGGTCAAAGATAAGAAGACTGGAGAGATTCTTCGCAAGCGTTGCGCTGTGCATTGGGTAACTCCTGATGGTTTCCCTGTGTGGCAGGAATACAAGAAGCCTATTCAGACGCGCTTGAACCTGATGTTCCTCGGTCAGTTCCGCTTACAGCCTACCATTAACACCAACAAAGATAGCGAGATTGATGCACACAAACAGGAGTCTGGTATCGCTCCTAACTTTGTACACAGCCAAGACGGTAGCCACCTTCGTAAGACTGTAGTGTGGGCACACGAGAAGTACGGAATCGAATCTTTTGCACTGATTCACGACTCCTTCGGTACCATTCCGGCTGACGCTGCGAACCTGTTCAAAGCAGTGCGCGAAACTATGGTTGACACATATGAGTCTTGTGATGTACTGGCTGATTTCTACGACCAGTTCGCTGACCAGTTGCACGAGTCTCAATTGGACAAAATGCCAGCACTTCCGGCTAAAGGTAACTTGAACCTCCGTGACATCTTAGAGTCGGACTTCGCGTTCGCGTAACGCCAAATCAATACGACTCACTATAGAGGGACAAACTCAAGGTCATTCGCAAGAGTGGCC | T7 RNA聚合酶DNA編碼序列 |
34 | MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFA | T7 RNA聚合酶胺基酸序列 |
35 | GATGAGGTGCGCATTGTGGGGCAAACCGTTACACATAGACGCATACCTTGACAAGCGTCTACAAGGCTGATAGAGTCTTTTCTTACAGGTCATCATGAGGTGGCCTGAATAGGAACGATTTATTCACAATGAGGTAAGCAATGAACATCATCGAAAACATCGAAAAGAATGACTTCTCAGAAATCGAACTGGCTGCTATCCCGTTCAACACACTGGCTGACCACTACGGAAGCGCCTTGGCTAAAGAGCAGTTGGCTTTAGAACATGAGTCTTATGAGCTAGGCGAGCGCCGCTTCCTCAAGATGCTTGAGCGTCAAGCGAAAGCTGGTGAGATTGCAGACAACGCAGCCGCTAAGCCGTTACTCGCTACGCTTCTCCCTAAGTTAACCACACGTATCGTCGAGTGGCTCGAAGAGTACGCATCGAAGAAAGGCCGCAAGCCTAGCGCATACGCACCGCTCCAGTTACTCAAGCCGGAGGCCTCCGCGTTTATCACCCTGAAAGTTATCCTTGCGTCACTAACCAGTACGAACATGACAACCATTCAGGCCGCTGCTGGTATGCTGGGGAAAGCCATTGAGGACGAGGCACGATTTGGGCGCATCCGTGACCTAGAAGCGAAGCACTTCAAGAAGCACGTTGAGGAACAGCTTAACAAGCGCCACGGGCAAGTCTACAAGAAAGCATTTATGCAGGTGGTCGAGGCCGATATGATTGGTCGAGGTCTGCTTGGTGGCGAGGCGTGGTCTAGCTGGGATAAAGAAACCACGATGCACGTAGGGATTCGCCTGATTGAAATGCTGATTGAATCCACGGGTCTGGTGGAATTACAGCGCCACAACGCAGGTAACGCAGGCTCTGACCATGAGGCACTGCAACTGGCCCAAGAGTACGTGGACGTATTAGCGAAGCGTGCAGGCGCTCTGGCGGGTATCTCTCCGATGTTCCAGCCGTGTGTCGTACCGCCGAAACCTTGGGTAGCAATCACAGGGGGCGGCTATTGGGCTAACGGTCGCAGACCTTTGGCACTCGTTCGCACTCACTCTAAGAAGGGCTTGATGCGCTACGAAGACGTTTACATGCCAGAAGTCTACAAGGCTGTGAACCTCGCGCAAAACACCGCATGGAAAATCAACAAGAAAGTTCTTGCTGTTGTCAATGAGATTGTTAACTGGAAGAATTGCCCGGTAGCAGACATTCCATCGCTGGAGCGCCAAGAGTTACCGCCTAAGCCTGACGACATTGACACCAACGAGGCAGCGCTCAAGGAGTGGAAGAAAGCCGCTGCTGGTATCTATCGCTTGGACAAGGCACGAGTGTCTCGCCGTATCAGCTTAGAGTTCATGCTGGAGCAGGCCAACAAGTTCGCAAGTAAGAAAGCAATCTGGTTCCCTTACAACATGGACTGGCGCGGTCGTGTGTACGCTGTGCCGATGTTCAACCCGCAAGGCAACGACATGACGAAAGGTCTGCTGACCCTTGCTAAAGGCAAGCCAATCGGTGAGGAAGGTTTCTACTGGCTGAAAATCCACGGTGCGAACTGTGCGGGTGTTGATAAGGTTCCATTCCCGGAGCGCATCGCGTTCATTGAGAAGCACGTAGACGACATTCTGGCTTGCGCTAAAGACCCAATCAATAACACTTGGTGGGCTGAGCAGGATTCACCGTTCTGTTTCCTCGCGTTTTGCTTCGAGTATGCAGGCGTTACGCACCACGGTCTGAGCTACAATTGCTCTCTGCCGCTGGCGTTCGACGGGTCTTGCTCTGGTATCCAGCACTTCTCCGCGATGCTCCGCGATGAGGTAGGCGGTCGTGCGGTTAACCTGCTGCCAAGCGAAACCGTGCAGGACATTTACGGCATCGTTGCACAGAAAGTAAACGAGATTCTCAAACAGGATGCAATCAACGGCACGCCTAACGAGATGATTACCGTGACCGACAAGGACACCGGGGAAATCTCAGAGAAGCTCAAACTTGGAACCTCAACGCTGGCGCAACAGTGGCTGGCATATGGTGTAACCCGTAGCGTAACTAAACGTTCGGTCATGACGCTGGCTTACGGTTCCAAGGAGTTCGGCTTTCGTCAACAGGTATTGGATGACACCATTCAGCCTGCAATTGACAGCGGTAAGGGCTTGATGTTCACCCAACCGAACCAAGCGGCTGGCTATATGGCTAAGCTGATTTGGGATGCGGTAAGCGTGACCGTAGTTGCAGCGGTTGAGGCGATGAACTGGCTCAAATCTGCCGCTAAGCTGCTGGCTGCTGAGGTCAAGGACAAGAAGACCAAGGAGATTCTGCGCCACCGTTGCGCGGTTCACTGGACTACGCCGGACGGCTTCCCGGTCTGGCAGGAATACCGCAAGCCACTCCAGAAGCGTCTCGATATGATTTTCTTAGGGCAATTCCGTCTGCAACCGACGATTAATACCCTCAAGGATTCAGGCATTGACGCACACAAGCAGGAGTCTGGCATCGCTCCTAACTTTGTTCACTCACAGGACGGTAGCCACCTCCGCATGACAGTCGTTTATGCTCACGAGAAGTATGGCATTGAGTCCTTTGCGCTCATCCATGACAGCTTTGGGACTATCCCGGCAGACGCTGGTAAGCTCTTTAAGGCTGTGCGTGAAACGATGGTTATCACCTATGAGAACAACGATGTGCTGGCAGACTTCTACTCTCAGTTTGCCGACCAGCTACACGAGACCCAACTGGACAAGATGCCTCCGCTTCCGAAGAAAGGAAACCTGAACCTGCAAGACATTCTCAAGTCTGACTTTGCCTTTGCATAACAAGCACTTAGCATTAACCCTCACTAACGGGAGACTACTTAAGGTCTCCCACTTTAAGACACTTTAGGTACTAAGAGATTAAATTTATGATTAACATTAAG | T3 RNA聚合酶DNA編碼序列 |
36 | MNIIENIEKNDFSEIELAAIPFNTLADHYGSALAKEQLALEHESYELGERRFLKMLERQAKAGEIADNAAAKPLLATLLPKLTTRIVEWLEEYASKKGRKPSAYAPLQLLKPEASAFITLKVILASLTSTNMTTIQAAAGMLGKAIEDEARFGRIRDLEAKHFKKHVEEQLNKRHGQVYKKAFMQVVEADMIGRGLLGGEAWSSWDKETTMHVGIRLIEMLIESTGLVELQRHNAGNAGSDHEALQLAQEYVDVLAKRAGALAGISPMFQPCVVPPKPWVAITGGGYWANGRRPLALVRTHSKKGLMRYEDVYMPEVYKAVNLAQNTAWKINKKVLAVVNEIVNWKNCPVADIPSLERQELPPKPDDIDTNEAALKEWKKAAAGIYRLDKARVSRRISLEFMLEQANKFASKKAIWFPYNMDWRGRVYAVPMFNPQGNDMTKGLLTLAKGKPIGEEGFYWLKIHGANCAGVDKVPFPERIAFIEKHVDDILACAKDPINNTWWAEQDSPFCFLAFCFEYAGVTHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAQKVNEILKQDAINGTPNEMITVTDKDTGEISEKLKLGTSTLAQQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLDDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWDAVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTKEILRHRCAVHWTTPDGFPVWQEYRKPLQKRLDMIFLGQFRLQPTINTLKDSGIDAHKQESGIAPNFVHSQDGSHLRMTVVYAHEKYGIESFALIHDSFGTIPADAGKLFKAVRETMVITYENNDVLADFYSQFADQLHETQLDKMPPLPKKGNLNLQDILKSDFAFA | T3 RNA聚合酶胺基酸序列 |
37 | GCGCTCAATTAAGTTTTCTAGTACCGCATGAGGATACAAGATGCAAGATTTACACGCTATCCAGCTTCAATTAGAAGAAGAGATGTTTAATGGTGGCATTCGTCGCTTCGAAGCAGATCAACAACGCCAGATTGCAGCAGGTAGCGAGAGCGACACAGCATGGAACCGCCGCCTGTTGTCAGAACTTATTGCACCTATGGCTGAAGGCATTCAGGCTTATAAAGAAGAGTACGAAGGTAAGAAAGGTCGTGCACCTCGCGCATTGGCTTTCTTACAATGTGTAGAAAATGAAGTTGCAGCATACATCACTATGAAAGTTGTTATGGATATGCTGAATACGGATGCTACCCTTCAGGCTATTGCAATGAGTGTAGCAGAACGCATTGAAGACCAAGTGCGCTTTTCTAAGCTAGAAGGTCACGCCGCTAAATACTTTGAGAAGGTTAAGAAGTCACTCAAGGCTAGCCGTACTAAGTCATATCGTCACGCTCATAACGTAGCTGTAGTTGCTGAAAAATCAGTTGCAGAAAAGGACGCGGACTTTGACCGTTGGGAGGCGTGGCCAAAAGAAACTCAATTGCAGATTGGTACTACCTTGCTTGAAATCTTAGAAGGTAGCGTTTTCTATAATGGTGAACCTGTATTTATGCGTGCTATGCGCACTTATGGCGGAAAGACTATTTACTACTTACAAACTTCTGAAAGTGTAGGCCAGTGGATTAGCGCATTCAAAGAGCACGTAGCGCAATTAAGCCCAGCTTATGCCCCTTGCGTAATCCCTCCTCGTCCTTGGAGAACTCCATTTAATGGAGGGTTCCATACTGAGAAGGTAGCTAGCCGTATCCGTCTTGTAAAAGGTAACCGTGAGCATGTACGCAAGTTGACTCAAAAGCAAATGCCAAAGGTTTATAAGGCTATCAACGCATTACAAAATACACAATGGCAAATCAACAAGGATGTATTAGCAGTTATTGAAGAAGTAATCCGCTTAGACCTTGGTTATGGTGTACCTTCCTTCAAGCCACTGATTGACAAGGAGAACAAGCCAGCTAACCCGGTACCTGTTGAATTCCAACACCTGCGCGGTCGTGAACTGAAAGAGATGCTATCACCTGAGCAGTGGCAACAATTCATTAACTGGAAAGGCGAATGCGCGCGCCTATATACCGCAGAAACTAAGCGCGGTTCAAAGTCCGCCGCCGTTGTTCGCATGGTAGGACAGGCCCGTAAATATAGCGCCTTTGAATCCATTTACTTCGTGTACGCAATGGATAGCCGCAGCCGTGTCTATGTGCAATCTAGCACGCTCTCTCCGCAGTCTAACGACTTAGGTAAGGCATTACTCCGCTTTACCGAGGGACGCCCTGTGAATGGCGTAGAAGCGCTTAAATGGTTCTGCATCAATGGTGCTAACCTTTGGGGATGGGACAAGAAAACTTTTGATGTGCGCGTGTCTAACGTATTAGATGAGGAATTCCAAGATATGTGTCGAGACATCGCCGCAGACCCTCTCACATTCACCCAATGGGCTAAAGCTGATGCACCTTATGAATTCCTCGCTTGGTGCTTTGAGTATGCTCAATACCTTGATTTGGTGGATGAAGGAAGGGCCGACGAATTCCGCACTCACCTACCAGTACATCAGGACGGGTCTTGTTCAGGCATTCAGCACTATAGTGCTATGCTTCGCGACGAAGTAGGGGCCAAAGCTGTTAACCTGAAACCCTCCGATGCACCGCAGGATATCTATGGGGCGGTGGCGCAAGTGGTTATCAAGAAGAATGCGCTATATATGGATGCGGACGATGCAACCACGTTTACTTCTGGTAGCGTCACGCTGTCCGGTACAGAACTGCGAGCAATGGCTAGCGCATGGGATAGTATTGGTATTACCCGTAGCTTAACCAAAAAGCCCGTGATGACCTTGCCATATGGTTCTACTCGCTTAACTTGCCGTGAATCTGTGATTGATTACATCGTAGACTTAGAGGAAAAAGAGGCGCAGAAGGCAGTAGCAGAAGGGCGGACGGCAAACAAGGTACATCCTTTTGAAGACGATCGTCAAGATTACTTGACTCCGGGCGCAGCTTACAACTACATGACGGCACTAATCTGGCCTTCTATTTCTGAAGTAGTTAAGGCACCGATAGTAGCTATGAAGATGATACGCCAGCTTGCACGCTTTGCAGCGAAACGTAATGAAGGCCTGATGTACACCCTGCCTACTGGCTTCATCTTAGAACAGAAGATCATGGCAACCGAGATGCTACGCGTGCGTACCTGTCTGATGGGTGATATCAAGATGTCCCTTCAGGTTGAAACGGATATCGTAGATGAAGCCGCTATGATGGGAGCAGCAGCACCTAATTTCGTACACGGTCATGACGCAAGTCACCTTATCCTTACCGTATGTGAATTGGTAGACAAGGGCGTAACTAGTATCGCTGTAATCCACGACTCTTTTGGTACTCATGCAGACAACACCCTCACTCTTAGAGTGGCACTTAAAGGGCAGATGGTTGCAATGTATATTGATGGTAATGCGCTTCAGAAACTACTGGAGGAGCATGAAGTGCGCTGGATGGTTGATACAGGTATCGAAGTACCTGAGCAAGGGGAGTTCGACCTTAACGAAATCATGGATTCTGAATACGTATTTGCCTAATAGAACAATAAATATACAGGTCAGCCTTCGGGCTGGCCTTTTCTTTTAACTATTACCTGTAACATTTAATTAACAAGTCCAACGTGTTGGACAC | SP6 RNA聚合酶DNA編碼序列 |
38 | MQDLHAIQLQLEEEMFNGGIRRFEADQQRQIAAGSESDTAWNRRLLSELIAPMAEGIQAYKEEYEGKKGRAPRALAFLQCVENEVAAYITMKVVMDMLNTDATLQAIAMSVAERIEDQVRFSKLEGHAAKYFEKVKKSLKASRTKSYRHAHNVAVVAEKSVAEKDADFDRWEAWPKETQLQIGTTLLEILEGSVFYNGEPVFMRAMRTYGGKTIYYLQTSESVGQWISAFKEHVAQLSPAYAPCVIPPRPWRTPFNGGFHTEKVASRIRLVKGNREHVRKLTQKQMPKVYKAINALQNTQWQINKDVLAVIEEVIRLDLGYGVPSFKPLIDKENKPANPVPVEFQHLRGRELKEMLSPEQWQQFINWKGECARLYTAETKRGSKSAAVVRMVGQARKYSAFESIYFVYAMDSRSRVYVQSSTLSPQSNDLGKALLRFTEGRPVNGVEALKWFCINGANLWGWDKKTFDVRVSNVLDEEFQDMCRDIAADPLTFTQWAKADAPYEFLAWCFEYAQYLDLVDEGRADEFRTHLPVHQDGSCSGIQHYSAMLRDEVGAKAVNLKPSDAPQDIYGAVAQVVIKKNALYMDADDATTFTSGSVTLSGTELRAMASAWDSIGITRSLTKKPVMTLPYGSTRLTCRESVIDYIVDLEEKEAQKAVAEGRTANKVHPFEDDRQDYLTPGAAYNYMTALIWPSISEVVKAPIVAMKMIRQLARFAAKRNEGLMYTLPTGFILEQKIMATEMLRVRTCLMGDIKMSLQVETDIVDEAAMMGAAAPNFVHGHDASHLILTVCELVDKGVTSIAVIHDSFGTHADNTLTLRVALKGQMVAMYIDGNALQKLLEEHEVRWMVDTGIEVPEQGEFDLNEIMDSEYVFA | SP6 RNA聚合酶胺基酸序列 |
39 | ACGAGGTGTATCTTAGGTGTCTCCGAACGGTGAGGCACCCATAGATAAACTTTATCCACAAAGAGGCACACAATGAACGCATTAAACATTGGACGTAATGACTTCTCCGAGATTGAACTTGCTGCTATTCCGTACAACATCCTGAGCGAGCACTACGGGGACCAAGCGGCACGTGAGCAGTTAGCACTGGAGCATGAGGCATACGAGCTTGGCAGACAACGTTTCCTGAAGATGTTAGAACGTCAGGTGAAAGCTGGTGAGTTCGCTGACAACGCGGCCGCTAAGCCGCTGGTCTTAACGTTGCACCCACAGCTGACCAAGCGCATTGACGACTGGAAGGAGGAGCAAGCAAACGCTCGCGGTAAGAAGCCTCGCGCATACTACCCGATTAAGCACGGCGTCGCCTCAGAGTTAGCTGTTAGCATGGGCGCTGAGGTGCTAAAAGAGAAGCGCGGAGTGTCCAGTGAGGCAATCGCACTGCTGACCATTAAGGTCGTCTTGGGGAACGCTCACAGACCGCTCAAAGGCCACAATCCAGCAGTATCCTCTCAGTTAGGCAAGGCTCTTGAGGATGAGGCCCGCTTCGGTCGTATCCGTGAGCAGGAAGCCGCATACTTCAAGAAGAACGTAGCGGACCAGCTGGACAAGCGAGTAGGCCACGTGTACAAGAAGGCTTTCATGCAGGTAGTCGAGGCCGATATGATATCCAAAGGGATGCTGGGCGGCGACAACTGGGCGAGCTGGAAAACTGACGAGCAGATGCACGTAGGGACCAAGCTGCTGGAGCTACTCATTGAGGGAACTGGTCTGGTGGAAATGACCAAGAACAAGATGGCCGATGGCTCCGATGATGTAACCAGTATGCAGATGGTCCAGCTGGCTCCGGCCTTTGTGGAACTCCTGAGCAAACGGGCAGGCGCACTCGCGGGTATCAGCCCGATGCACCAGCCGTGCGTAGTCCCTCCGAAACCTTGGGTGGAGACCGTAGGCGGTGGCTACTGGTCAGTCGGTCGCCGTCCGCTGGCACTGGTGCGTACCCACTCCAAGAAGGCGCTGCGCCGCTACGCTGACGTGCACATGCCAGAGGTATACAAGGCGGTAAACCTCGCGCAAAACACGCCGTGGAAGGTGAACAAGAAGGTGCTGGCGGTAGTCAACGAGATTGTCAACTGGAAGCACTGCCCGGTAGGTGACGTCCCAGCGATTGAACGCGAAGAGTTACCGCCGCGCCCGGACGATATTGACACCAACGAGGTGGCACGTAAGGCATGGCGCAAGGAGGCCGCAGCGGTCTACCGTAAGGACAAGGCCCGCCAGTCTCGCCGTTGTCGATGTGAGTTCATGGTCGCACAGGCTAACAAGTTCGCTAACCACAAGGCCATTTGGTTCCCGTACAACATGGACTGGCGCGGGCGTGTGTACGCTGTGAGCATGTTCAACCCACAGGGTAACGATATGACCAAGGGGAGTCTGACGCTGGCCAAGGGTAAGCCAATTGGTCTCGACGGGTTCTACTGGCTGAAGATTCACGGCGCAAACTGTGCAGGTGTCGACAAGGTTCCCTTCCCTGAGCGCATCAAGTTCATCGAAGAGAACGAGGGCAACATTCTGGCGAGCGCAGCGGACCCGCTGAATAACACTTGGTGGACCCAGCAAGATTCGCCGTTCTGTTTCTTAGCGTTCTGCTTCGAGTACGCAGGTGTTAAGCATCACGGCCTGAATTACAACTGCTCGCTGCCGCTGGCGTTCGATGGGTCCTGCTCTGGGATTCAGCACTTCAGCGCGATGCTCCGAGATTCCATCGGTGGTCGTGCGGTTAACCTGCTGCCTTCTGATACCGTGCAGGATATCTACAAGATTGTGGCCGACAAGGTGAACGAAGTGCTCCACCAGCACGCCGTCAACGGGTCTCAGACCGTGGTCGAGCAGATTGCTGACAAAGAGACTGGCGAGTTTCACGAGAAGGTGACTCTGGGCGAGTCCGTACTGGCTGCGCAGTGGTTGCAATATGGTGTGACCCGCAAGGTGACTAAGCGTTCGGTCATGACGCTGGCATACGGTTCCAAAGAGTCGTTGGTCCGCCAGCAGGTTCTTGAGGACACCATTCAGCCTGCTATTGACAACGGCGAGGGCCTGATGTTTACGCACCCTAACCAAGCAGCTGGCTACATGGCTAAGCTGATTTGGGACGCTGTGACCGTGACCGTAGTGGCCGCTGTCGAGGCAATGAACTGGCTGAAGTCTGCCGCTAAGCTGCTGGCTGCTGAAGTCAAGGACAAGAAGACCAAAGAGGTGCTGCGTAAGCGCTGCGCAATCCACTGGGTAACACCCGATGGCTTCCCGGTGTGGCAGGAGTACCGCAAGCAGAACCAAGCGCGCCTGAAGCTGGTCTTCCTCGGGCAGGCCAACGTCAAGATGACGTATAACACTGGGAAGGACTCCGAGATTGATGCCCACAAGCAGGAATCCGGCATCGCTCCTAACTTTGTTCACTCACAGGATGGCAGTCACCTGCGCATGACTGTAGTACACGCCAACGAGGTCTACGGGATTGACTCCTTCGCACTCATTCACGACTCCTCTGGGACCATTCCGGCTGACGCTGGGAATCTCTTTAAGGCAGTCCGCGAGACGATGGTCAAGACCTACGAGGACAACGATGTAATTGCAGACTTCTACGACCAGTTTGCCGACCAGCTGCACGAGTCTCAACTGGACAAGATGCCTGCGGTTCCGGCCAAAGGTGACCTGAATCTGCGCGATATCTTGGAGTCTGACTTCGCGTTTGCGTAAGGTCTCAGGCAATTAGGGCACACTATAGGGAACCTTCGAATGACCGAGGG | K11 RNA聚合酶DNA編碼序列 |
40 | MNALNIGRNDFSEIELAAIPYNILSEHYGDQAAREQLALEHEAYELGRQRFLKMLERQVKAGEFADNAAAKPLVLTLHPQLTKRIDDWKEEQANARGKKPRAYYPIKHGVASELAVSMGAEVLKEKRGVSSEAIALLTIKVVLGNAHRPLKGHNPAVSSQLGKALEDEARFGRIREQEAAYFKKNVADQLDKRVGHVYKKAFMQVVEADMISKGMLGGDNWASWKTDEQMHVGTKLLELLIEGTGLVEMTKNKMADGSDDVTSMQMVQLAPAFVELLSKRAGALAGISPMHQPCVVPPKPWVETVGGGYWSVGRRPLALVRTHSKKALRRYADVHMPEVYKAVNLAQNTPWKVNKKVLAVVNEIVNWKHCPVGDVPAIEREELPPRPDDIDTNEVARKAWRKEAAAVYRKDKARQSRRCRCEFMVAQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGSLTLAKGKPIGLDGFYWLKIHGANCAGVDKVPFPERIKFIEENEGNILASAADPLNNTWWTQQDSPFCFLAFCFEYAGVKHHGLNYNCSLPLAFDGSCSGIQHFSAMLRDSIGGRAVNLLPSDTVQDIYKIVADKVNEVLHQHAVNGSQTVVEQIADKETGEFHEKVTLGESVLAAQWLQYGVTRKVTKRSVMTLAYGSKESLVRQQVLEDTIQPAIDNGEGLMFTHPNQAAGYMAKLIWDAVTVTVVAAVEAMNWLKSAAKLLAAEVKDKKTKEVLRKRCAIHWVTPDGFPVWQEYRKQNQARLKLVFLGQANVKMTYNTGKDSEIDAHKQESGIAPNFVHSQDGSHLRMTVVHANEVYGIDSFALIHDSSGTIPADAGNLFKAVRETMVKTYEDNDVIADFYDQFADQLHESQLDKMPAVPAKGDLNLRDILESDFAFA | K11 RNA聚合酶胺基酸序列 |
41 | MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMAEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFAG | T7 RNA聚合酶變異體1胺基酸序列 |
42 | MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMAEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVWVIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFAG | T7 RNA聚合酶變異體2胺基酸序列 |
43 | MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLEAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVWVIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFA | T7 RNA聚合酶變異體3胺基酸序列 |
44 | MYRYLSIAAVVLSAAFSGPALAEGINSFSQAKAAAVKVHADAPGTFYCGCKINWQGKKGVVDLQSCGYQVRKNENRASRVEWEHVVPAWQFGHQRQCWQDGGRKNCAKDPVYRKMESDMHNLQPSVGEVNGDRGNFMYSQWNGGEGQYGQCAMKVDFKEKAAEPPARARGAIARTYFYMRDQYNLTLSRQQTQLFNAWNKMYPVTDWECERDERIAKVQGNHNPYVQRACQARKS | EndA胺基酸序列 |
45 | MAIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGRIVEIYGPESSGKTTLTLQVIAAAQREGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPDTGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAGNLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGSETRVKVVKNKIAAPFKQAEFQILYGEGINFYGELVDLGVKEKLIEKAGAWYSYKGEKIGQGKANATAWLKDNPETAKEIEKKVRELLLSNPNSTPDFSVDDSEGVAETNEDF | RecA胺基酸序列 |
46 | MTVPTYDKFIEPVLRYLATKPEGAAARDVHEAAADALGLDDSQRAKVITSGQLVYKNRAGWAHDRLKRAGLSQSLSRGKWCLTPAGFDWVASHPQPMTEQETNHLAFAFVNVKLKSRPDAVDLDPKADSPDHEELAKSSPDDRLDQALKELRDAVADEVLENLLQVSPSRFEVIVLDVLHRLGYGGHRDDLQRVGGTGDGGIDGVISLDKLGLEKVYVQAKRWQNTVGRPELQAFYGALAGQKAKRGVFITTSGFTSQARDFAQSVEGMVLVDGERLVHLMIENEVGVSSRLLKVPKLDMDYFE | Mrr胺基酸序列 |
47 | agagttgggcaacggatgtgctggtggaggtgatcgcctcctgatgatgagccgctcccgatgtggtgtcgggagcggtattttctataaaacttaccgc tcactcaaaatagtccatatccagtttcggcaccttcaacaaacgtgaagaaacccctacttcgttttcgatcattaagtgcaccaggcgttccccatcaaccaacaccataccctcgacggattgggcaaagtcacgcgcctgagaagtaaatccagaagtggtaataaacaccccacgtttcgctttttgcccagccagtgcgccgtaaaatgcctgtaattctggcctgcctacagtattctgccaacgttttgcctgaacataaactttctccaggccaagtttatcaagcgatatcacaccatcgatgccaccatctccagtaccgccaacacgctgcaaatcatcacggtggccgccataccccaggcgatgcaaaacatccagaacaatgacttcaaagcgcgaaggagaaacctgcaataagttttccagaacctcatcagccaccgcatcacgaagctcttttagcgcctgatctaaccgatcgtccgggctgctctttgcaagttcttcatgatcgggagagtcggctttcggatctaaatcgacggcatccggccgtgacttaagtttgacattcacaaaagcgaaggccagatggttcgtctcctgctccgtcattggctggggatgagacgcaacccagtcaaaacccgcaggagtcaggcaccatttgccacgcgacaaactttgcgacaacccggcacgttttaaacggtcatgcgcccagcctgcacgatttttataaacaagttgtccgctggtaatgactttcgctcgctggctgtcatccagtcctaatgcatccgcggcagcctcatgaacatcacgcgcggctgcaccttccggttttgttgccagataacgcagaacaggttcaataaatttgtcataggtaggaaccgtcatagtacatccttgcagaatcaggtagatgtttttcggctactatagcactacaaaaatagacgaacacgttagaaatgagtcagttgctgtgaccgtggtcattgcccggaaaggtacagaaagctaagatgagatgttatgggccttaaatatttggacaggcccgcacagcaatggattaataacaatgatgaataaatccaattttgaattcctgaagggcgtcaacgacttcacttatgccatcgcctgtgcggcggaaaataactacccggatgatcccaacacgacgctgattaaaatgcgtatgtttggcgaagccacagcgaaacatcttggtctgttactcaacatccccccttgtgagaatcaacacgatctcctgcgtgaactcggcaaaatcgcctttgttgatgacaacatcctctctgtatttcacaaattacgccgcattggtaaccaggcggtgcacgaatatcataacgatctcaacgatgcccagatgtgcctgcgactcgggttccgcctggctgtctggtactaccgtctggtcactaaagattatgacttcccggtgccggtgtttgtgttgccggaacgtggtgaaaacctctatcaccaggaagtgctgacgctaaaacaacagcttgaacagcaggtgcgagaaaaagcgcagactcaggcagaagtcgaagcgcaacagcagaagctggttgccctgaacggctatatcgccattctggaaggcaaacagcaggaaaccgaagcgcaaacccaggctcgccttgcggcactggaagcacagctcgccgagaagaacgcggaactggcaaaacagaccgaacaggaacgtaaggcttaccacaaagaaattaccgatcaggccatcaagcgcacactcaaccttagcgaagaagagagtcgcttcctgattgatgcgcaactgcgtaaagcaggctggcaggccgacagcaaaaccctgcgcttctccaaaggcgcacgtccggaacccggcgtcaataaagccattgccgaatggccgaccggaaaagatgaaacgggtaatcagggctttgcggattatgtgctgtttgtcggcctcaaacccatcgcggtggtagaggcgaaacgtaacaatatcgacgttcccgccaggctcaatgagtcgtatcgctacagtaaatgtttcgataatggcttcctgcgggaaaccttgcttgagcactactcaccggatgaagtgcatgaagcagtgccagagtatgaaaccagctggcaggacaccagcggcaaacaacggtttaaaatccccttctgctactcgaccaacgggcgcgaataccgcgcaacaatgaagaccaaaagcggcatctggtatcgcgacgtgcgtgatacccgcaatatgtcgaaagccttacccgagtggcaccgcccggaagagctgctggaaatgctcggcagcgaaccgcaaaaacagaatcagtggtttgccgataaccctggcatgagcgagctgggcctgcgttattatcaggaagatgccgtccgcgcggttgaaaaggcaatcgtcaaggggcaacaagagatcctgctggcgatggcgaccggtaccggtaaaacccgtacggcaatcgccatgatgttccgcctgatccagtcccagcgttttaaacgcattctcttccttgtcgaccgccgttctcttggcgaacaggcgctgggcgcgtttgaagatacgcgtattaacggcgacaccttcaacagcattttcgacattaaagggctgacggataaattcccggaagacagcaccaaaattcacgttgccaccgtacagtcgctggtgaaacgcaccctgcaatcagatgaaccgatgccggtggcccgttacgactgtatcgtcgttgacgaagcgcatcgcggctatattctcgataaagagcagaccgaaggcgaactgcagttccgcagccagctggattacgtctctgcctaccgtcgcattctcgatcacttcgatgcggtaaaaatcgctctcaccgccaccccggcgctacatactgtgcagattttcggcgagccggtttaccgttatacctaccgtaccgcggttatcgacggttttctgatcgaccaggatccgcctattcagatcatcacccgcaacgcgcaggagggggtttatctctccaaaggcgagcaggtagagcgcatcagcccgcagggagaagtgatcaatgacaccctggaagacgatcaggattttgaagtcgccgactttaaccgtggcctggtgatcccggcgtttaaccgcgccgtctgtaacgaactcaccaattatcttgacccgaccggatcgcaaaaaacgctggtcttctgcgtcaccaatgcccatgccgatatggtggtggaagagctgcgtgccgcgttcaagaaaaagtatccgcaactggagcacgacgcgatcatcaagatcaccggtgatgccgataaagacgcgcgcaaagtgcagaccatgatcacccgcttcaataaagagcggctgcccaatatcgtggtaaccgtcgacctgctgacgaccggcgtcgatattccgtcgatctgtaatatcgtgttcctgcgtaaagtacgcagccgcattctgtacgaacagatgaaaggccgcgccacgcgcttatgcccggaggtgaataaaaccagctttaagatttttgactgtgtcgatatctacagcacgctggagagcgtcgacaccatgcgtccggtggtggtgcgcccgaaggtggaactgcaaacgctggtcaatgaaattaccgattcagaaacctataaaatcaccgaagcggatggccgcagttttgccgagcacagccatgaacaactggtggcgaagctccagcgtatcatcggtctggccacgtttaaccgtgaccgcagcgaaacgatagataaacaggtgcgtcgtctggatgagctatgccaggacgcggcgggcgtgaactttaacggcttcgcctcgcgcctgcgggaaaaagggccgcactggagcgccgaagtctttaacaaactgcctggctttatcgcccgtctggaaaagctgaaaacggacatcaacaacctgaatgatgcgccgatcttcctcgatatcgacgatgaagtggtgagtgtaaaatcgctgtacggtgattacgacacgccgcaggatttcctcgaagcctttgactcgctggtgcaacgttccccgaacgcgcaaccggcattgcaggcagttattaatcgcccgcgcgatctcacccgtaaagggctggtcgagctacaggagtggtttgaccgccagcactttgaggaatcttccctgcgcaaagcatggaaagagacgcgcaatgaagatatcgccgcccggctgattggtcatattcgccgcgctgcggtgggcgatgcgctgaaaccgtttgaggaacgtgtcgatcacgcgctgacgcgcattaagggcgaaaacgactggagcagcgagcaattaagctggctcgatcgtttagcgcaggcgctgaaagagaaagtggtgctcgacgacgatgtcttcaaaaccggcaacttccaccgtcgcggcgggaaggcgatgctgcaaagaacctttgacgataatctcgataccctgctgggcaaattcagcgattatatctgggacgagctggcctgacacgtatacacttcatccttcaggctgcctctgcgttggctgcgctcgttcaccccggtcacgtacttctgtacgctcccggggattcactcacttgccgccttgatgcaacctgaatgattttgtgtatattaccctcggcaatttcttcttctgcggctcgatgaatttgggccgctgcttaatttacggaactcacaatgaacaataacgatctggtcgcgaagctgtggaagctgtgcgacaacctgcgcgatggcggcgtttcctatcaaaactacgtcaatgaactcgcctcgctgctgtttttgaaaatgtgtaaagagaccggtcaggaagcggaatacctgccggaaggttaccgctgggatgacctgaaatcccgcatcggccaggagcagttgcagttctaccgaaaaatgctcgtgcatttaggcgaagatgacaaaaagctggtacaggcagtttttcataatgttagtaccaccatcaccgagccgaaacaaataaccgcactggtcagcaatatggattcgctggactggtacaacggcgcgcacggtaagtcgcgcgatgacttcggcgatatgtacgaagggctgttgcagaagaacgcgaatgaaaccaagtctggtgcaggccagtacttcaccccgcgtccgctgattaaaaccattattcatctgctgaaaccgcagccgcgtgaagtggtgcaggacccggcggcaggtacggcgggctttttgattgaagccgaccgctatgttaagtcgcaaaccaatgatctggacgaccttgatggcgacacgcaggatttccagatccaccgcgcgtttatcggcctcgaactggtgcccggcacccgtcgtctggcactgatgaactgcctgctgcacgatattgaaggcaacctcgaccacggcggcgcaatccgtctgggcaacactctgggtagcgacggtgaaaacctgccgaaggcgcatattgtcgccactaacccgccgtttggcagcgccgcaggcaccaacattacccgcacctttgttcacccgaccagcaacaaacagttgtgctttatgcagcatattatcgaaacgctgcatcccggcggtcgtgcggcggtggtggtgccggataacgtgctgtttgaaggcggcaaaggcaccgacattcgtcgtgacctgatggataagtgtcatctgcacaccattctgcgtctgccgaccggtattttttacgctcagggcgtgaagaccaacgtgctgttctttaccaaagggacggtggcgaacccgaatcaggataagaactgtaccgatgatgtgtgggtgtatgacctgcgtaccaatatgccgagtttcggcaagcgcacaccgtttaccgacgagcatttgcagccgtttgagcgcgtgtatggcgaagacccgcacggtttaagcccgcgcactgaaggtgaatggagttttaacgccgaagagacggaagttgccgacagcgaagagaacaaaaacaccgaccagcatcttgctaccagccgctggcgcaagttcagccgtgagtggatccgcaccgcaaaatccgattcgctggatatctcctggctgaaagataaagacagtattgatgccgacagcctgccggagccggatgtattagcggcagaagcgatgggcgaactggtacaggcgctgtctgaactggatgcgctgatgcgtgaactgggggcgagcgatgaggccgatttgcagcgtcagttgctggaagaagcgtttggtggggtgaaggaatgagtgcggggaaattgccggaggggtgggttatcgccccagtatctacggtcacaactctaatccgaggagtaacgtataaaaaagagcaggcaataaattatctaaaagatgattatttgcctcttatccgtgcgaacaatattcagaatggcaagtttgatactacggacttggtttttgttcctaaaaatcttgttaaagaaagtcaaaaaatatctcctgaagatattgttattgcaatgtcatcagggagcaaatccgtagttggtaaatccgcacatcagcatctaccatttgaatgtagtttcggcgcattttgcggtgtattacgtcctgaaaaacttatattttctggttttattgctcatttcacaaaatcttctctttatcgaaacaaaatttcatcactttctgctggtgcaaatattaataatattaagccggcaagctttgatttgataaatataccaatcccaccacttgccgaacaaaaaatcatcgctgaaaaactcgatacgctgctggcgcaggtagacagcaccaaagcacgttttgagcaaatcccacaaatcctgaaacgttttcgtcaagcggtattggggggcgcagttaatggaaaattgacagaaaaatggcgtaattttgagccgcaacattctgtatttaagaagttaaattttgaatctatcttaactgaattacgtaatggtctttcatcaaagccaaatgaaagtggtgttggtcatccaatactacgcattagttctgtacgtgctggccatgtagatcaaaacgatattcggtttctagaatgttcagaaagtgaactaaaccgccacaaattacaagatggagatcttttatttactcgctataacggaagtttagaatttgttggtgtttgtgggttattgaaaaaattacaacatcaaaatttgctatatcctgataaacttattcgagctcgattaaccaaagatgctttaccagaatatatcgaaatatttttttcatccccctcagcacgaaatgcaatgatgaactgcgtgaaaacaacttctggtcaaaaaggtatttcaggaaaagatatcaaatcccaagttgttttattacctccagtaaaagaacaagccgaaatcgttcgccgcgtcgagcaactcttcgcctacgccgacaccatagaaaaacaggtcaacaacgccttagcccgcgtcaacaacctgacgcaatccatcctggcaaaagcgttccgtggtgaacttaccgcccagtggcgggccgaaaacccggatttgatcagcggagaaaacagcgccgccgcgttgctggaaaaaatcaaagctgaacgcgcagctagcgggggtaaaaaagcctcacgtaaaaaatcctgaacattattttctggcgcacctttccggtgcgctttttattatttcacgccaatcataacccacataaatatatttaaatcattccagaaattgcccattttattctatttttagctggactttccccatatttactgatgatatatacaggtatttagcgcggtgcggatgtgcgccaacacacccgcatcgctaatcacaatcactattcctggagaatagcagttatgactgacacgcattctattgcacaaccgttcgaagcagaagtctccccggcaaataaccgtcatgtcaccgtcggttatgcgagtcgctacccggattacagccgtattcccgccatcaccctgaaaggtcagtggctggaagccgccggttttgccactggcacggcggtagatgtcaaagtgatggaaggctgtattgtcctcaccgcccaaccacccgccgccgaggagagcgaactgatgcagtcgctacgccaggtgtgcaaactgtcggcgcgtaaacaaaagcaggtgcaggcgtttattggagtgattgccggtaaacagaaagtcgcgtaacagcgtttactcccggttaaccaccgggagccttccactgactcaatagaaactttccccctcagtaaatatttaccagtctgattttgcagtaaaaatctattgtttcagtacgttgcgaaagcgataatagaggcttagcaatgaggaaggcatatcttatggaatctattcaaccctggattgaaaaatttattaagcaagcacagcaacaacgttcgcaatccactaaagattatccaacgtcttaccgtaacctgcgagtaaaattgagtttcggttatggtaattttacgtctattccctggtttgcatttcttggagaaggtcaggaagcttctaacggtatatatcccgttattctctattataaagattttgatgagttggttttggcttatggtataagcgacacgaatgaaccacatgcccaatggcagttctcttcagacatacctaaaacaatcgcagagtattttcaggcaacttcgggtgtatatcctaaaaaatacggacagtcctattacgcctgttcccaaaaagtctcacagggtattgattacacccgatttgcctctatgctggacaacataatcaacgactataaattaatatttaattctggcaagagtgttattccacctatgtcaaaaactgaatcatactgtctggaagatgcgttaaatgatttgtttatccctgaaaccacaatagagacgatactcaaacgattaaccatcaaaaaaaatattatcctccaggggccgcccggcgttggaaaaacctttgttgcacgccgtctggcttacttgctgacaggagaaaaggctccgcaacgcgtcaatatggttcagttccatcaatcttatagctatgaggattttatacagggctatcgtccgaatggcgtcggcttccgacgtaaagacggcatattttacaatttttgtcagcaagctaaagagcagccagagaaaaagtatatttttattatagatgaaatcaatcgtgccaatctcagtaaagtatttggcgaagtgatgatgttaatggaacatgataaacgaggtgaaaactggtctgttcccctaacctactccgaaaacgatgaagaacgattctatgtcccggagaatgtttatatcatcggtttaatgaatactgccgatcgctctctggccgttgttgactatgccctacgcagacgattttctttcatagatattgagccaggttttgatacaccacagttccggaattttttactgaataaaaaagcagaaccttcatttgttgagtctttatgccaaaaaatgaacgagttgaaccaggaaatcagcaaagaggccactatccttgggaaaggattccgcattgggcatagttacttctgctgtgggttggaagatggcacctctccggatacgcaatggcttaatgaaattgtgatgacggatatcgcccctttactcgaagaatatttctttgatgacccctataaacaacagaaatggaccaacaaattattaggggactcatagtggaacagcccgtgatacctgtccgtaatatctattacatgcttacctatgcatggggttatttacaggaaattaagcaggcaaaccttgaagccatacccggtaacaatcttcttgatatcctggggtatgtattaaataaaggggttttacagctttcacgccgagggcttgagcttgattacaatcctaacaccgagatcattcctggcatcaaagggcgaatagagtttgctaaaacaatacgcggcttccatcttaatcatgggaaaaccgtcagtacttttgatatgcttaatgaagacacgctggctaaccgaattataaaaagcacattagccatattaattaagcatgaaaagttaaattcaactatcagagatgaagctcgttcactttatagaaaattaccgggcattagcactcttcatttaactccgcagcatttcagctatctgaatggcggaaaaaatacgcgttattataaattcgttatcagtgtctgcaaattcatcgtcaataattctattccaggtcaaaacaaaggacactaccgtttctatgattttgaaagaaacgaaaaagagatgtcattactttatcaaaagtttctttatgaattttgccgtcgtgaattaacgtctgcaaacacaacccgctcttatttaaaatgggatgcatcgagtatatcggatcagtcacttaatttgttacctcgaatggaaactgacatcaccattcgctcatcagaaaaaatacttatcgttgacgccaaatactataagagcattttttcacgacgaatgggaacagaaaaatttcattcgcaaaatctttatcaactgatgaattacttatggtcgttaaagcctgaaaatggcgaaaacataggggggttattaatatatccccacgtagataccgcagtgaaacatcgttataaaattaatggcttcgatattggcttgtgtaccgtcaatttaggtcaggaatggccgtgtatacatcaagaattactcgacattttcgatgaatatctcaaataa aatatcaggccggatgcggctgcgccttatccggcccataaccccttacttcctcaaccccgcaaacgcagcccgaatctcttcctccggcagctggatc | 野生型大腸桿菌MG1655中之Mrr-hsdRMS-symRE-mcrBC基因座(待缺失區域上游(單下劃線)及下游(斜體)之序列) |
48 | caatttctacaaaacacttgatactgtatgagcatacagtataattgcttcaacagaacatattgactatccggtattacccggcatgacaggagtaaaa atggctatcgacgaaaacaaacagaaagcgttggcggcagcactgggccagattgagaaacaatttggtaaaggctccatcatgcgcctgggtgaagaccgttccatggatgtggaaaccatctctaccggttcgctttcactggatatcgcgcttggggcaggtggtctgccgatgggccgtatcgtcgaaatctacggaccggaatcttccggtaaaaccacgctgacgctgcaggtgatcgccgcagcgcagcgtgaaggtaaaacctgtgcgtttatcgatgctgaacacgcgctggacccaatctacgcacgtaaactgggcgtcgatatcgacaacctgctgtgctcccagccggacaccggcgagcaggcactggaaatctgtgacgccctggcgcgttctggcgcagtagacgttatcgtcgttgactccgtggcggcactgacgccgaaagcggaaatcgaaggcgaaatcggcgactctcacatgggccttgcggcacgtatgatgagccaggcgatgcgtaagctggcgggtaacctgaagcagtccaacacgctgctgatcttcatcaaccagatccgtatgaaaattggtgtgatgttcggtaacccggaaaccactaccggtggtaacgcgctgaaattctacgcctctgttcgtctcgacatccgtcgtatcggcgcggtgaaagagggcgaaaacgtggtgggtagcgaaacccgcgtgaaagtggtgaagaacaaaatcgctgcgccgtttaaacaggctgaattccagatcctctacggcgaaggtatcaacttctacggcgaactggttgacctgggcgtaaaagagaagctgatcgagaaagcaggcgcgtggtacagctacaaaggtgagaagatcggtcagggtaaagcgaatgcgactgcctggctgaaagataacccggaaaccgcgaaagagatcgagaagaaagtacgtgagttgctgctgagcaacccgaactcaacgccggatttctctgtagatgatagcgaaggcgtagcagaaactaacgaagatttttaa tcgtcttgtttgatacacaagggtcgcatctgcggcccttttgcttttttaagttgtaaggatatgccatgacagaatcaacatcccgtcgcccggcata | Mrr-hsdRMS-symRE-mcrBC基因座(缺失)(ORF上游序列: 單下劃線;ORF下游序列:斜體;及ORF呈雙下劃線) |
儘管本文已描述且說明若干本發明之實施例,但熟習此項技術者將容易設想用於執行功能及/或獲得結果及/或一或多種本文所述之優勢的多種其他手段及/或結構,且此類變化及/或修改中之各者均應視為在本文所述之本發明實施例之範疇內。更一般而言,熟習此項技術者將容易瞭解,本文所述之所有參數、尺寸、材料及組態均意欲為示例性的,且實際參數、尺寸、材料及/或組態將視使用本發明教示之一或多種特定應用而定。熟習此項技術者將認識到,或能夠僅使用常規實驗即可確定本文所述之特定本發明實施例之許多等效物。因此,應理解,前述實施例僅藉助實例呈現,且在隨附申請專利範圍及其等效物之範疇內,本發明實施例可以不同於如特定描述及主張之其他方式來實踐。本揭示案之本發明實施例係針對本文所述之各個別特徵、系統、物品、材料、套組及/或方法。另外,若此類特徵、系統、物品、材料、套組及/或方法不相互矛盾,則兩個或更多個此類特徵、系統、物品、材料、套組及/或方法之任何組合均包括於本揭示案之發明範疇內。
應理解,如本文所定義且使用之所有定義均優先於字典定義、以引用之方式併入之文件中的定義及/或所定義術語之通常含義。
本文所揭示之所有參考文獻、專利及專利申請案就各自所引用之主題而言均以引用之方式併入,在一些情形下可涵蓋文件全部。
除非相反明確指示,否則在說明書及申請專利範圍中使用之不定冠詞「一(a)」及「一(an)」應理解為「至少一」。
如本文在說明書中及申請專利範圍中所用,片語「及/或」應理解為意謂如此結合之要素中之「任一者或兩者」,
亦即,要素在一些情形下以結合方式存在且在其他情形下以分離方式存在。以「及/或」列出之多個要素應以相同方式解釋,
亦即,如此結合之要素中之「一或多者」。可視情況存在除由「及/或」子句特定鑑別之要素以外的其他要素,無論與特定鑑別之彼等要素相關抑或不相關。因此,作為非限制性實例,當與諸如「包含」之開放式語言聯合使用時,對「A及/或B」之提及在一些實施例中可指僅A (視情況包括除B以外之要素);在另一實施例中,可指僅B (視情況包括除A以外之要素);在另一實施例中,可指A及B兩者(視情況包括其他要素);等。如本文在說明書中及申請專利範圍中所用,「或」應理解為具有與如上文所定義之「及/或」相同之含義。舉例而言,在分開清單中之項目時,「或」或「及/或」應解釋為包括性的,
亦即,包括多個要素或要素清單中之至少一者(而且包括一者以上)及視情況存在之額外未列出之項目。只有明確相反指示之術語,諸如「……中之僅一者」或「……中之恰好一者」,或在用於申請專利範圍中時,「由……組成」將指包括多個要素或要素清單中之恰好一個要素。一般而言,當前面有排他性術語(諸如「任一」、「……中之一者」、「……中之僅一者」或「……中之恰好一者」)時,如本文所用之術語「或」應僅解釋為指示排他性替代物(
亦即,「一者或另一者但非兩者」)。當在申請專利範圍中使用時,「基本上由……組成」應具有其在專利法領域中所用之通常含義。
如本文在說明書中及申請專利範圍中所用,在提及一或多個要素之清單時,片語「至少一個」應理解為意謂至少一個選自要素清單中之任一或多個要素之要素,但不一定包括要素清單內明確列出之每一及每個要素中之至少一者,且不排除要素清單中要素之任何組合。此定義亦容許可視情況存在除片語「至少一個」所指之要素清單內特定鑑別之要素以外的要素,無論與特定鑑別之彼等要素相關抑或不相關。因此,作為非限制性實例,「A及B中之至少一者」(或等效地,「A或B中之至少一者」,或等效地,「A及/或B中之至少一者」)在一些實施例中可指至少一個(視情況包括一個以上) A而不存在B (且視情況包括除B以外之要素);在另一實施例中,可指至少一個(視情況包括一個以上) B而不存在A (且視情況包括除A以外之要素);在另一實施例中,可指至少一個(視情況包括一個以上) A及至少一個(視情況包括一個以上) B (且視情況包括其他要素);等。各種可能性代表本發明之單獨實施例。
應理解,除非明確相反指示,否則如熟習此項技術者所理解,本說明書中關於數值及數值範圍之揭示內容包括i)所說明之精確值或範圍,及ii)「約」為所說明之值或範圍之值(
例如,落入合理範圍內之值或範圍(
例如,約10%相似))。
亦應理解,除非明確相反指示,否則在本文所揭示之包括一個以上步驟或動作之任何方法中,該方法之步驟或動作之次序未必受限於揭示該方法之步驟或動作時之次序。
在申請專利範圍以及在上文說明書中,所有過渡性片語(諸如「包含」、「包括」、「攜帶」、「具有」、「含有」、「涉及」、「持有」、「由……構成」及其類似術語)均應理解為係開放式的,
亦即意謂包括但不限於。如美國專利局專利審查程序手冊(United States Patent Office Manual of Patent Examining Procedures)第2111.03節中所陳述,僅過渡性片語「由……組成」及「基本上由……組成」應分別為封閉式或半封閉式過渡性片語。
附圖並不意欲按比例繪製。在圖式中,各個圖中所示之各相同或幾乎相同之組件由相似之數字表示。為清楚起見,並非每幅圖中之每個組件均被標記。在圖式中:
圖 1展示用於將基因剔除引入至
大腸桿菌中之陽性及陰性選擇策略。
圖 2展示實例中進行之
大腸桿菌菌株構築之譜系。
圖 3展示菌株17基因型之PCR確認。使用菌株17菌落作為模板DNA進行7種不同PCR反應,以確認PCR擴增子具有如
表 5所示之預期長度。1 kb + DNA階梯展示在泳道1左側之泳道中。
圖 4A-4B展示商業BL21及菌株11菌株之T7 RNA聚合酶變異體1表現。
圖 4A展示T7 RNA聚合酶變異體1過度表現之菌株11及BL21溶解產物之總蛋白質凝膠。
圖 4B展示顯示菌株11與BL21兩者之最終細胞密度之生長概況。
圖 5A-5B展示菌株12中之黏液表型以及菌株24及菌株18中黏液表型之缺乏。
圖 5A展示搖瓶發酵後培養之菌株12、菌株24 (BL21宿主)及菌株18之外觀。
圖 5B展示在微量離心管中離心100 uL培養物後菌株之外觀。
圖 6展示由菌株17過度表現之T7 RNA聚合酶變異體1之總蛋白SDS-PAGE凝膠影像。
圖 7A-7F展示來自發酵實驗之線上AMBR概況。
圖 7A展示CER概況。
圖 7B展示溶解氧%。
圖 7C展示pH概況。
圖 7D展示鹼添加。
圖 7E展示抽吸之酸。
圖 7F展示進料概況,其中誘導發生在第9小時,且進料在第13小時開始。
圖 8A-8B展示菌株19 (用pStrain 23轉型之菌株17菌株)對T7 RNA聚合酶變異體2之表現。
圖 8A展示自菌株19 (菌株17/pStrain 23)表現及純化之T7 RNA聚合酶變異體2之SDS-PAGE。
圖 8B展示自菌株19細胞糊獲得之特定T7 RNA聚合酶變異體2產量(mg蛋白質/g生物質)及溶解產物中之T7 RNA聚合酶變異體2濃度。
TW202330903A_111139536_SEQL.xml
Claims (50)
- 一種經基因修飾之微生物,其包含 ompT基因及 lon基因已發生突變、失能或缺失之基因組。
- 如請求項1之經基因修飾之微生物,其中該微生物不表現一或多種選自由G6PI、ManA、ManB、ManC、Gmd、Fcl及KduI組成之群之蛋白質的功能形式。
- 如請求項1或2之經基因修飾之微生物,其中該基因組包含選自由 pgi、 manA、 manB、 manC、 gmd、 fcl及 kduI組成之群之基因中的突變。
- 如請求項1至3中任一項之經基因修飾之微生物,其中該基因組包含與選自由 pgi、 manA、 manB、 manC、 gmd、 fcl及 kduI組成之群之基因可操作地連接之啟動子中的突變。
- 如請求項1至4中任一項之經基因修飾之微生物,其中該基因組不包含編碼選自由G6PI、ManA、ManB、ManC、Gmd、Fcl及KduI組成之群之碳水化合物代謝蛋白的核酸序列。
- 如請求項1至5中任一項之經基因修飾之微生物,其中該微生物不表現功能性ManA。
- 如請求項1至6中任一項之經基因修飾之微生物,其中該基因組包含 manA基因或與該 manA基因可操作地連接之啟動子中的突變。
- 如請求項1至7中任一項之經基因修飾之微生物,其中該基因組不包含編碼ManA之核酸序列。
- 如請求項1至8中任一項之經基因修飾之微生物,其中該基因組包含i)與SEQ ID NO: 23具有至少90%序列一致性之第一核酸序列,及ii)與SEQ ID NO: 25具有至少90%序列一致性之第二核酸序列。
- 如請求項9之經基因修飾之微生物,其中該基因組進一步包含與SEQ ID NO: 24具有至少90%序列一致性之第三核酸序列。
- 如請求項1至10中任一項之經基因修飾之微生物,其中該微生物未展現黏液表型。
- 如請求項1至11中任一項之經基因修飾之微生物,其中該微生物不能合成甘露糖。
- 如請求項1至12中任一項之經基因修飾之微生物,其中該微生物不能合成岩藻糖。
- 如請求項1至13中任一項之經基因修飾之微生物,其中 i) 該基因組不包含編碼endA之核酸序列; ii) 該基因組不包含編碼recA之核酸序列;且 iii) EcoK1限制系統已失活。
- 如請求項1至14中任一項之經基因修飾之微生物,其中該微生物之基因型為 ΔendA ΔrecA Δ( mrr-hsdRMS-symE-mcrBC) ΔompT ΔmanA Δlon。
- 如請求項1至15中任一項之經基因修飾之微生物,其中該微生物為 大腸桿菌( E. coli)。
- 如請求項16之經基因修飾之微生物,其中該微生物來源於 大腸桿菌MG1655。
- 如請求項1至17中任一項之經基因修飾之微生物,其進一步包含編碼重組蛋白之核酸序列。
- 如請求項18之經基因修飾之微生物,其中該編碼重組蛋白之核酸序列位於該微生物之該基因組中。
- 如請求項19之經基因修飾之微生物,其中該編碼重組蛋白之核酸序列位於質體上。
- 如請求項18至20中任一項之經基因修飾之微生物,其中該重組蛋白為RNA聚合酶。
- 如請求項21之經基因修飾之微生物,其中該RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。
- 如請求項22之經基因修飾之微生物,其中該RNA聚合酶包含 (a) 在用於從頭RNA合成之結合位點殘基處之胺基酸取代;及 (b) 相對於野生型RNA聚合酶引起轉錄效率增加之胺基酸修飾。
- 如請求項23之經基因修飾之微生物,其中該胺基酸修飾為相對於該野生型RNA聚合酶在位置47處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。
- 如請求項24之經基因修飾之微生物,其中在位置47處之該胺基酸取代為G47A。
- 如請求項23至25中任一項之經基因修飾之微生物,其中相對於該野生型RNA聚合酶,該胺基酸修飾包含額外C端胺基酸。
- 如請求項26之經基因修飾之微生物,其中該額外C端胺基酸為甘胺酸。
- 如請求項23至27中任一項之經基因修飾之微生物,其中該RNA聚合酶包含SEQ ID NO: 41之胺基酸序列。
- 如請求項21至27中任一項之經基因修飾之微生物,其中該RNA聚合酶包含相對於該野生型RNA聚合酶, (a) 在位置350處之胺基酸取代;及/或 (b) 在位置351處之胺基酸取代, 其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。
- 如請求項29之經基因修飾之微生物,其中在位置350處之該胺基酸取代為E350W。
- 如請求項29之經基因修飾之微生物,其中在位置351處之該胺基酸取代為D351V。
- 如請求項29之經基因修飾之微生物,其中在位置350處之該胺基酸取代為E350W,且在位置351處之該胺基酸取代為D351V。
- 如請求項29至32中任一項之經基因修飾之微生物,其中該RNA聚合酶包含SEQ ID NO: 42之胺基酸序列。
- 如請求項23或29至32中任一項之經基因修飾之微生物,其中該RNA聚合酶包含SEQ ID NO: 43之胺基酸序列。
- 一種用於產生多肽或蛋白質之方法,其包括以下步驟: i) 將包含編碼多肽或蛋白質之序列的核酸分子引入至如請求項1至17中任一項之經基因修飾之微生物中; ii) 在適於表現該多肽或蛋白質之條件下培養該經基因修飾之生物體;及 iii) 分離該多肽或蛋白質。
- 一種用於產生多肽或蛋白質之方法,其包括以下步驟: i) 在適於表現該多肽或蛋白質之條件下培養如請求項18至34中任一項之經基因修飾之生物體;及 ii) 分離該多肽或蛋白質。
- 如請求項35或36之方法,其中該多肽或蛋白質為RNA聚合酶。
- 如請求項37之方法,其中該RNA聚合酶為T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶或K11 RNA聚合酶。
- 如請求項38之方法,其中該RNA聚合酶包含 (a) 在用於從頭RNA合成之結合位點殘基處之胺基酸取代;及 (b) 相對於野生型RNA聚合酶,引起轉錄效率增加之胺基酸修飾。
- 如請求項39之方法,其中該胺基酸修飾為相對於該野生型RNA聚合酶在位置47處之胺基酸取代,其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。
- 如請求項40之方法,其中在位置47處之該胺基酸取代為G47A。
- 如請求項39至41中任一項之方法,其中相對於該野生型RNA聚合酶,該胺基酸修飾包含額外C端胺基酸。
- 如請求項42之方法,其中該額外C端胺基酸為甘胺酸。
- 如請求項40至43中任一項之方法,其中該RNA聚合酶包含SEQ ID NO: 41之胺基酸序列。
- 如請求項37至43中任一項之方法,其中該RNA聚合酶包含相對於該野生型RNA聚合酶, (a) 在位置350處之胺基酸取代;及 (b) 在位置351處之胺基酸取代, 其中該野生型RNA聚合酶包含SEQ ID NO: 34之胺基酸序列。
- 如請求項45之方法,其中在位置350處之該胺基酸取代為E350W。
- 如請求項45之方法,其中在位置351處之該胺基酸取代為D351V。
- 如請求項45之方法,其中在位置350處之該胺基酸取代為E350W,且在位置351處之該胺基酸取代為D351V。
- 如請求項45至48中任一項之方法,其中該RNA聚合酶包含SEQ ID NO: 42之胺基酸序列。
- 如請求項39或45至48中任一項之方法,其中該RNA聚合酶包含SEQ ID NO: 43之胺基酸序列。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163256690P | 2021-10-18 | 2021-10-18 | |
US63/256,690 | 2021-10-18 | ||
US202263304195P | 2022-01-28 | 2022-01-28 | |
US63/304,195 | 2022-01-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202330903A true TW202330903A (zh) | 2023-08-01 |
Family
ID=84389070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111139536A TW202330903A (zh) | 2021-10-18 | 2022-10-18 | 用於重組蛋白產生之定製菌株 |
Country Status (2)
Country | Link |
---|---|
TW (1) | TW202330903A (zh) |
WO (1) | WO2023069900A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11905525B2 (en) | 2017-04-05 | 2024-02-20 | Modernatx, Inc. | Reduction of elimination of immune responses to non-intravenous, e.g., subcutaneously administered therapeutic proteins |
US11786607B2 (en) | 2017-06-15 | 2023-10-17 | Modernatx, Inc. | RNA formulations |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3172334B1 (en) * | 2014-07-25 | 2021-11-10 | R.P. Scherer Technologies, LLC | Improved host cell for producing proteins |
MX2021011031A (es) * | 2019-03-11 | 2021-12-10 | Modernatx Inc | Proceso de transcripción in vitro en lotes alimentados. |
-
2022
- 2022-10-17 WO PCT/US2022/078214 patent/WO2023069900A1/en unknown
- 2022-10-18 TW TW111139536A patent/TW202330903A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023069900A9 (en) | 2023-11-02 |
WO2023069900A1 (en) | 2023-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102554781B1 (ko) | 푸코실화 올리고당(fucosylated oligosaccharide)의 생산을 위한 향상된 공정 | |
US9528137B2 (en) | Methods for cell-free protein synthesis | |
EP1095158B1 (en) | Process and materials for production of glucosamine | |
TW202330903A (zh) | 用於重組蛋白產生之定製菌株 | |
US9695453B2 (en) | Process for the production of hyaluronic acid in Escherichia coli or bacillus megaterium | |
US10465221B2 (en) | Genomically recoded organisms lacking release factor 1 (RF1) and engineered to express a heterologous RNA polymerase | |
JP7015836B2 (ja) | 新規無機リン酸ベースエネルギー再生機能を備えた無細胞発現系 | |
WO1998030713A1 (en) | Process for production of n-glucosamine | |
US11447755B2 (en) | Genetically engineered Vibrio sp. and uses thereof | |
CN111094574A (zh) | 使用包括硫代磷酸酯化的核苷酸的双链多联体dna的体内rna或蛋白质表达 | |
CN110741091A (zh) | 增加nadph的生物合成途径的基因组工程化 | |
CN113166741A (zh) | Dna文库的多重确定性组装 | |
WO2023076952A1 (en) | Enzymes with hepn domains | |
JP2023539237A (ja) | カーゴヌクレオチド配列を転位させるための系および方法 | |
JP7222902B2 (ja) | オリゴ糖転移酵素ポリペプチド | |
KR20220116504A (ko) | 정밀 화학물의 제조에서 공시 수율, 탄소-전환-효율 및 탄소 기질 적응성의 증가 | |
RU2790445C2 (ru) | Улучшенный способ получения фукозилированных олигосахаридов | |
KR20230005137A (ko) | 헤파로산의 제조 방법 및 헤파로산 생산능을 갖는 에스케리키아 속의 세균 | |
WO2023039377A1 (en) | Class ii, type v crispr systems | |
EP1564289A1 (en) | Stabilization of linear double-stranded DNA in the presence of exonucleases | |
WO2022046618A1 (en) | Plasmid addiction systems | |
WO2023039434A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
WO2023166132A1 (en) | Microorganism strain for antibiotic-free plasmid-based fermentation and method for generation thereof | |
EA046260B1 (ru) | Получение огм |