KR20230142696A - C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물 - Google Patents
C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물 Download PDFInfo
- Publication number
- KR20230142696A KR20230142696A KR1020237013483A KR20237013483A KR20230142696A KR 20230142696 A KR20230142696 A KR 20230142696A KR 1020237013483 A KR1020237013483 A KR 1020237013483A KR 20237013483 A KR20237013483 A KR 20237013483A KR 20230142696 A KR20230142696 A KR 20230142696A
- Authority
- KR
- South Korea
- Prior art keywords
- cases
- microorganism
- heterologous
- bdo
- alpha
- Prior art date
Links
- 244000005700 microbiome Species 0.000 title claims abstract description 462
- 238000000034 method Methods 0.000 title claims abstract description 184
- OWBTYPJTUOEWEK-UHFFFAOYSA-N butane-2,3-diol Chemical compound CC(O)C(C)O OWBTYPJTUOEWEK-UHFFFAOYSA-N 0.000 title description 17
- AXPZIVKEZRHGAS-UHFFFAOYSA-N 3-benzyl-5-[(2-nitrophenoxy)methyl]oxolan-2-one Chemical compound [O-][N+](=O)C1=CC=CC=C1OCC1OC(=O)C(CC=2C=CC=CC=2)C1 AXPZIVKEZRHGAS-UHFFFAOYSA-N 0.000 claims abstract description 299
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 claims abstract description 135
- 229910052799 carbon Inorganic materials 0.000 claims abstract description 99
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims abstract description 72
- 239000000758 substrate Substances 0.000 claims abstract description 63
- 108090000623 proteins and genes Proteins 0.000 claims description 622
- 125000003729 nucleotide group Chemical group 0.000 claims description 230
- 239000002773 nucleotide Substances 0.000 claims description 229
- 108010036467 butanediol dehydrogenase Proteins 0.000 claims description 219
- 239000013598 vector Substances 0.000 claims description 219
- 108010000700 Acetolactate synthase Proteins 0.000 claims description 199
- 102000040430 polynucleotide Human genes 0.000 claims description 183
- 108091033319 polynucleotide Proteins 0.000 claims description 183
- 229910052746 lanthanum Inorganic materials 0.000 claims description 179
- FZLIPJUXYLNCLC-UHFFFAOYSA-N lanthanum atom Chemical compound [La] FZLIPJUXYLNCLC-UHFFFAOYSA-N 0.000 claims description 179
- 108010084631 acetolactate decarboxylase Proteins 0.000 claims description 171
- ZWEHNKRNPOVVGH-UHFFFAOYSA-N 2-Butanone Chemical compound CCC(C)=O ZWEHNKRNPOVVGH-UHFFFAOYSA-N 0.000 claims description 166
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 claims description 136
- 230000001419 dependent effect Effects 0.000 claims description 131
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 93
- KAKZBPTYRLMSJV-UHFFFAOYSA-N Butadiene Chemical compound C=CC=C KAKZBPTYRLMSJV-UHFFFAOYSA-N 0.000 claims description 91
- ROWKJAVDOGWPAT-UHFFFAOYSA-N Acetoin Chemical compound CC(O)C(C)=O ROWKJAVDOGWPAT-UHFFFAOYSA-N 0.000 claims description 86
- 229910052761 rare earth metal Inorganic materials 0.000 claims description 70
- 150000002910 rare earth metals Chemical class 0.000 claims description 67
- 238000004519 manufacturing process Methods 0.000 claims description 59
- GFAZHVHNLUBROE-UHFFFAOYSA-N hydroxymethyl propionaldehyde Natural products CCC(=O)CO GFAZHVHNLUBROE-UHFFFAOYSA-N 0.000 claims description 43
- 239000003054 catalyst Substances 0.000 claims description 40
- 241000894006 Bacteria Species 0.000 claims description 36
- 150000007523 nucleic acids Chemical class 0.000 claims description 34
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 claims description 32
- 230000001939 inductive effect Effects 0.000 claims description 31
- MZAGXDHQGXUDDX-JSRXJHBZSA-N (e,2z)-4-ethyl-2-hydroxyimino-5-nitrohex-3-enamide Chemical compound [O-][N+](=O)C(C)C(/CC)=C/C(=N/O)/C(N)=O MZAGXDHQGXUDDX-JSRXJHBZSA-N 0.000 claims description 27
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 26
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims description 26
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 26
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 26
- 102000039446 nucleic acids Human genes 0.000 claims description 24
- 108020004707 nucleic acids Proteins 0.000 claims description 24
- 241000193403 Clostridium Species 0.000 claims description 21
- 230000010354 integration Effects 0.000 claims description 19
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 claims description 17
- 229910002091 carbon monoxide Inorganic materials 0.000 claims description 17
- 239000001569 carbon dioxide Substances 0.000 claims description 16
- 229910002092 carbon dioxide Inorganic materials 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 14
- 244000063299 Bacillus subtilis Species 0.000 claims description 13
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 11
- 229910052684 Cerium Inorganic materials 0.000 claims description 9
- 229910052779 Neodymium Inorganic materials 0.000 claims description 9
- GWXLDORMOJMVQZ-UHFFFAOYSA-N cerium Chemical compound [Ce] GWXLDORMOJMVQZ-UHFFFAOYSA-N 0.000 claims description 9
- QEFYFXOXNSNQGX-UHFFFAOYSA-N neodymium atom Chemical compound [Nd] QEFYFXOXNSNQGX-UHFFFAOYSA-N 0.000 claims description 9
- 241001656809 Clostridium autoethanogenum Species 0.000 claims description 8
- 241000589345 Methylococcus Species 0.000 claims description 8
- 229910052777 Praseodymium Inorganic materials 0.000 claims description 8
- PUDIUYLPXJFUGB-UHFFFAOYSA-N praseodymium atom Chemical compound [Pr] PUDIUYLPXJFUGB-UHFFFAOYSA-N 0.000 claims description 8
- 230000001580 bacterial effect Effects 0.000 claims description 7
- 238000007865 diluting Methods 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 6
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 5
- 241001141454 Crenothrix Species 0.000 claims description 5
- 241000589346 Methylococcus capsulatus Species 0.000 claims description 5
- 241000192125 Firmicutes Species 0.000 claims description 4
- 241000589350 Methylobacter Species 0.000 claims description 4
- 241001085182 Methylocapsa Species 0.000 claims description 4
- 241000514364 Methylocella Species 0.000 claims description 4
- 241000589966 Methylocystis Species 0.000 claims description 4
- 241001014266 Methylohalobius Species 0.000 claims description 4
- 241001533203 Methylomicrobium Species 0.000 claims description 4
- 241000589344 Methylomonas Species 0.000 claims description 4
- 241000862909 Methylosoma Species 0.000 claims description 4
- 241000530467 Methylosphaera Species 0.000 claims description 4
- 230000002062 proliferating effect Effects 0.000 claims description 4
- 230000001718 repressive effect Effects 0.000 claims description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 3
- 241001015568 Clonothrix Species 0.000 claims description 3
- 241000919309 Methylogaea Species 0.000 claims description 3
- 241000589354 Methylosinus Species 0.000 claims description 3
- 241001316800 Methylothermus Species 0.000 claims description 3
- 229910004298 SiO 2 Inorganic materials 0.000 claims description 3
- QPTUMKXXAAHOOE-UHFFFAOYSA-M cesium;hydron;phosphate Chemical compound [Cs+].OP(O)([O-])=O QPTUMKXXAAHOOE-UHFFFAOYSA-M 0.000 claims description 3
- 239000011973 solid acid Substances 0.000 claims description 3
- 241001264650 Methylocaldum Species 0.000 claims description 2
- 241000321843 Methylosarcina Species 0.000 claims description 2
- 241000270515 Methylovulum Species 0.000 claims description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 2
- ACFIXJIJDZMPPO-NNYOXOHSSA-N NADPH Chemical group C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 ACFIXJIJDZMPPO-NNYOXOHSSA-N 0.000 claims 5
- 230000001131 transforming effect Effects 0.000 claims 2
- 239000000126 substance Substances 0.000 abstract description 24
- 238000000855 fermentation Methods 0.000 description 126
- 230000004151 fermentation Effects 0.000 description 126
- 230000014509 gene expression Effects 0.000 description 83
- 239000000047 product Substances 0.000 description 70
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 69
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 62
- 210000004027 cell Anatomy 0.000 description 60
- 238000011533 pre-incubation Methods 0.000 description 58
- 102000004190 Enzymes Human genes 0.000 description 49
- 108090000790 Enzymes Proteins 0.000 description 49
- 108020005004 Guide RNA Proteins 0.000 description 48
- 238000006243 chemical reaction Methods 0.000 description 48
- 108020004414 DNA Proteins 0.000 description 43
- 102000053602 DNA Human genes 0.000 description 43
- 108090000765 processed proteins & peptides Proteins 0.000 description 42
- 239000002609 medium Substances 0.000 description 40
- 102000004196 processed proteins & peptides Human genes 0.000 description 39
- 102000004169 proteins and genes Human genes 0.000 description 39
- 229920001184 polypeptide Polymers 0.000 description 38
- 238000010790 dilution Methods 0.000 description 32
- 239000012895 dilution Substances 0.000 description 32
- 239000002157 polynucleotide Substances 0.000 description 27
- 108091026890 Coding region Proteins 0.000 description 26
- 230000037361 pathway Effects 0.000 description 25
- 101150015366 budA gene Proteins 0.000 description 24
- IAQRGUVFOMOMEM-UHFFFAOYSA-N butene Natural products CC=CC IAQRGUVFOMOMEM-UHFFFAOYSA-N 0.000 description 24
- 239000003999 initiator Substances 0.000 description 24
- VXNZUUAINFGPBY-UHFFFAOYSA-N 1-Butene Chemical compound CCC=C VXNZUUAINFGPBY-UHFFFAOYSA-N 0.000 description 22
- 229920002477 rna polymer Polymers 0.000 description 21
- 230000000694 effects Effects 0.000 description 20
- 241000894007 species Species 0.000 description 20
- 235000000346 sugar Nutrition 0.000 description 19
- NMDWGEGFJUBKLB-UHFFFAOYSA-M 2-acetyllactate Chemical compound CC(=O)C(C)(O)C([O-])=O NMDWGEGFJUBKLB-UHFFFAOYSA-M 0.000 description 18
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 18
- 239000007789 gas Substances 0.000 description 18
- 210000000349 chromosome Anatomy 0.000 description 17
- 238000001890 transfection Methods 0.000 description 16
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 15
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 15
- 230000037431 insertion Effects 0.000 description 15
- 238000003780 insertion Methods 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 108091033409 CRISPR Proteins 0.000 description 14
- BTANRVKWQNVYAZ-UHFFFAOYSA-N butan-2-ol Chemical compound CCC(C)O BTANRVKWQNVYAZ-UHFFFAOYSA-N 0.000 description 13
- 230000001450 methanotrophic effect Effects 0.000 description 13
- 230000010076 replication Effects 0.000 description 13
- 150000008163 sugars Chemical class 0.000 description 13
- 238000010367 cloning Methods 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 12
- 238000013518 transcription Methods 0.000 description 12
- 239000006227 byproduct Substances 0.000 description 11
- 150000001875 compounds Chemical class 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 11
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 11
- -1 propene Chemical class 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 238000011084 recovery Methods 0.000 description 10
- 108020004705 Codon Proteins 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- 238000012239 gene modification Methods 0.000 description 9
- 230000005017 genetic modification Effects 0.000 description 9
- 235000013617 genetically modified food Nutrition 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- AMIMRNSIRUDHCM-UHFFFAOYSA-N Isopropylaldehyde Chemical compound CC(C)C=O AMIMRNSIRUDHCM-UHFFFAOYSA-N 0.000 description 8
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 8
- 108700026244 Open Reading Frames Proteins 0.000 description 8
- 150000001413 amino acids Chemical class 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 239000012466 permeate Substances 0.000 description 8
- 241000194108 Bacillus licheniformis Species 0.000 description 7
- 230000004075 alteration Effects 0.000 description 7
- 230000003115 biocidal effect Effects 0.000 description 7
- 230000018044 dehydration Effects 0.000 description 7
- 238000006297 dehydration reaction Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- 108091079001 CRISPR RNA Proteins 0.000 description 6
- 238000010453 CRISPR/Cas method Methods 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- 241000588747 Klebsiella pneumoniae Species 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 108090000854 Oxidoreductases Proteins 0.000 description 6
- 102000004316 Oxidoreductases Human genes 0.000 description 6
- 241000194105 Paenibacillus polymyxa Species 0.000 description 6
- 108010065027 Propanediol Dehydratase Proteins 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 239000002585 base Substances 0.000 description 6
- 239000007795 chemical reaction product Substances 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 239000003345 natural gas Substances 0.000 description 6
- 238000006722 reduction reaction Methods 0.000 description 6
- 230000003362 replicative effect Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 102100031780 Endonuclease Human genes 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- 102000018120 Recombinases Human genes 0.000 description 5
- 108010091086 Recombinases Proteins 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000010353 genetic engineering Methods 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010081551 glycylphenylalanine Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 108010085325 histidylproline Proteins 0.000 description 5
- 239000000543 intermediate Substances 0.000 description 5
- 229930027917 kanamycin Natural products 0.000 description 5
- 229960000318 kanamycin Drugs 0.000 description 5
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 5
- 229930182823 kanamycin A Natural products 0.000 description 5
- 238000001638 lipofection Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 229910052751 metal Inorganic materials 0.000 description 5
- 239000002184 metal Substances 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 235000015097 nutrients Nutrition 0.000 description 5
- 239000001301 oxygen Substances 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- AOWPAWLEXIYETE-UHFFFAOYSA-N 2,3-Dihydroxy-2-methylbutanoic acid Chemical compound CC(O)C(C)(O)C(O)=O AOWPAWLEXIYETE-UHFFFAOYSA-N 0.000 description 4
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 241000195493 Cryptophyta Species 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- 108010061833 Integrases Proteins 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 4
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 4
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000001311 chemical methods and process Methods 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- TVIDDXQYHWJXFK-UHFFFAOYSA-N dodecanedioic acid Chemical compound OC(=O)CCCCCCCCCCC(O)=O TVIDDXQYHWJXFK-UHFFFAOYSA-N 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 210000001161 mammalian embryo Anatomy 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- 239000013600 plasmid vector Substances 0.000 description 4
- 239000013587 production medium Substances 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 238000005185 salting out Methods 0.000 description 4
- 229920003051 synthetic elastomer Polymers 0.000 description 4
- 239000005061 synthetic rubber Substances 0.000 description 4
- 125000000383 tetramethylene group Chemical group [H]C([H])([*:1])C([H])([H])C([H])([H])C([H])([H])[*:2] 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- WTLNOANVTIKPEE-UHFFFAOYSA-N 2-acetyloxypropanoic acid Chemical compound OC(=O)C(C)OC(C)=O WTLNOANVTIKPEE-UHFFFAOYSA-N 0.000 description 3
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 3
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 3
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 3
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 3
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 3
- 108010090461 DFG peptide Proteins 0.000 description 3
- 229920002307 Dextran Polymers 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 3
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 3
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 3
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 3
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 3
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 3
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- WQYPAGQDXAJNED-AAEUAGOBSA-N Trp-Cys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N WQYPAGQDXAJNED-AAEUAGOBSA-N 0.000 description 3
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 3
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 3
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 229910052783 alkali metal Inorganic materials 0.000 description 3
- 150000001340 alkali metals Chemical class 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 210000004507 artificial chromosome Anatomy 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000001851 biosynthetic effect Effects 0.000 description 3
- 239000001506 calcium phosphate Substances 0.000 description 3
- 229910000389 calcium phosphate Inorganic materials 0.000 description 3
- 235000011010 calcium phosphates Nutrition 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 238000004821 distillation Methods 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 239000002608 ionic liquid Substances 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- OFBQJSOFQDEBGM-UHFFFAOYSA-N n-pentane Natural products CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 3
- 150000003833 nucleoside derivatives Chemical class 0.000 description 3
- 150000002894 organic compounds Chemical class 0.000 description 3
- 239000004033 plastic Substances 0.000 description 3
- 229920003023 plastic Polymers 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 238000001179 sorption measurement Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 3
- 241001515965 unidentified phage Species 0.000 description 3
- 239000010457 zeolite Substances 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 239000004912 1,5-cyclooctadiene Substances 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- 108050006142 Acetoin reductases Proteins 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 2
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 2
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 2
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 2
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 108090000489 Carboxy-Lyases Proteins 0.000 description 2
- 102000004031 Carboxy-Lyases Human genes 0.000 description 2
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- QSJXEFYPDANLFS-UHFFFAOYSA-N Diacetyl Chemical group CC(=O)C(C)=O QSJXEFYPDANLFS-UHFFFAOYSA-N 0.000 description 2
- 229910052692 Dysprosium Inorganic materials 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 229910052691 Erbium Inorganic materials 0.000 description 2
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 2
- 229910052693 Europium Inorganic materials 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 229910052688 Gadolinium Inorganic materials 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 2
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- WGHJXSONOOTTCZ-JYJNAYRXSA-N His-Glu-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WGHJXSONOOTTCZ-JYJNAYRXSA-N 0.000 description 2
- LDFWDDVELNOGII-MXAVVETBSA-N His-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N LDFWDDVELNOGII-MXAVVETBSA-N 0.000 description 2
- 229910052689 Holmium Inorganic materials 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- KWURTLAFFDOTEQ-GUBZILKMSA-N Leu-Cys-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KWURTLAFFDOTEQ-GUBZILKMSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- 229910052765 Lutetium Inorganic materials 0.000 description 2
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 2
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 2
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 2
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 2
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108091061960 Naked DNA Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000179039 Paenibacillus Species 0.000 description 2
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 2
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 2
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- 229910052773 Promethium Inorganic materials 0.000 description 2
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 2
- QQONPFPTGQHPMA-UHFFFAOYSA-N Propene Chemical compound CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 241000831652 Salinivibrio sharmensis Species 0.000 description 2
- 229910052772 Samarium Inorganic materials 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108010052160 Site-specific recombinase Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 229910052771 Terbium Inorganic materials 0.000 description 2
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 2
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 2
- 229910052775 Thulium Inorganic materials 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 2
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 2
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 229910052769 Ytterbium Inorganic materials 0.000 description 2
- 239000003377 acid catalyst Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- BTGRAWJCKBQKAO-UHFFFAOYSA-N adiponitrile Chemical compound N#CCCCCC#N BTGRAWJCKBQKAO-UHFFFAOYSA-N 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 150000001298 alcohols Chemical class 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- PNEYBMLMFCGWSK-UHFFFAOYSA-N aluminium oxide Inorganic materials [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 229950006334 apramycin Drugs 0.000 description 2
- XZNUGFQTQHRASN-XQENGBIVSA-N apramycin Chemical compound O([C@H]1O[C@@H]2[C@H](O)[C@@H]([C@H](O[C@H]2C[C@H]1N)O[C@@H]1[C@@H]([C@@H](O)[C@H](N)[C@@H](CO)O1)O)NC)[C@@H]1[C@@H](N)C[C@@H](N)[C@H](O)[C@H]1O XZNUGFQTQHRASN-XQENGBIVSA-N 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 235000011148 calcium chloride Nutrition 0.000 description 2
- 229960002713 calcium chloride Drugs 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- IAQRGUVFOMOMEM-ARJAWSKDSA-N cis-but-2-ene Chemical compound C\C=C/C IAQRGUVFOMOMEM-ARJAWSKDSA-N 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 150000001924 cycloalkanes Chemical class 0.000 description 2
- 150000001925 cycloalkenes Chemical class 0.000 description 2
- XNMQEEKYCVKGBD-UHFFFAOYSA-N dimethylacetylene Natural products CC#CC XNMQEEKYCVKGBD-UHFFFAOYSA-N 0.000 description 2
- LQZZUXJYWNFBMV-UHFFFAOYSA-N dodecan-1-ol Chemical compound CCCCCCCCCCCCO LQZZUXJYWNFBMV-UHFFFAOYSA-N 0.000 description 2
- KBQHZAAAGSGFKK-UHFFFAOYSA-N dysprosium atom Chemical compound [Dy] KBQHZAAAGSGFKK-UHFFFAOYSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- JBKVHLHDHHXQEQ-UHFFFAOYSA-N epsilon-caprolactam Chemical compound O=C1CCCCCN1 JBKVHLHDHHXQEQ-UHFFFAOYSA-N 0.000 description 2
- UYAHIZSMUZPPFV-UHFFFAOYSA-N erbium Chemical compound [Er] UYAHIZSMUZPPFV-UHFFFAOYSA-N 0.000 description 2
- OGPBJKLSAFTDLK-UHFFFAOYSA-N europium atom Chemical compound [Eu] OGPBJKLSAFTDLK-UHFFFAOYSA-N 0.000 description 2
- 238000001704 evaporation Methods 0.000 description 2
- 230000008020 evaporation Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- UIWYJDYFSGRHKR-UHFFFAOYSA-N gadolinium atom Chemical compound [Gd] UIWYJDYFSGRHKR-UHFFFAOYSA-N 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 239000003292 glue Substances 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- KJZYNXUDTRRSPN-UHFFFAOYSA-N holmium atom Chemical compound [Ho] KJZYNXUDTRRSPN-UHFFFAOYSA-N 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- NNPPMTNAJDCUHE-UHFFFAOYSA-N isobutane Chemical compound CC(C)C NNPPMTNAJDCUHE-UHFFFAOYSA-N 0.000 description 2
- QWTDNUCVQCZILF-UHFFFAOYSA-N isopentane Chemical compound CCC(C)C QWTDNUCVQCZILF-UHFFFAOYSA-N 0.000 description 2
- 239000004922 lacquer Substances 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- OHSVLFRHMCKCQY-UHFFFAOYSA-N lutetium atom Chemical compound [Lu] OHSVLFRHMCKCQY-UHFFFAOYSA-N 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- SYSQUGFVNFXIIT-UHFFFAOYSA-N n-[4-(1,3-benzoxazol-2-yl)phenyl]-4-nitrobenzenesulfonamide Chemical class C1=CC([N+](=O)[O-])=CC=C1S(=O)(=O)NC1=CC=C(C=2OC3=CC=CC=C3N=2)C=C1 SYSQUGFVNFXIIT-UHFFFAOYSA-N 0.000 description 2
- IJDNQMDRQITEOD-UHFFFAOYSA-N n-butane Chemical compound CCCC IJDNQMDRQITEOD-UHFFFAOYSA-N 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 229920000620 organic polymer Polymers 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000003973 paint Substances 0.000 description 2
- 239000012188 paraffin wax Substances 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920001343 polytetrafluoroethylene Polymers 0.000 description 2
- 239000004810 polytetrafluoroethylene Substances 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- VQMWBBYLQSCNPO-UHFFFAOYSA-N promethium atom Chemical compound [Pm] VQMWBBYLQSCNPO-UHFFFAOYSA-N 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000001223 reverse osmosis Methods 0.000 description 2
- 229910052701 rubidium Inorganic materials 0.000 description 2
- FGDZQCVHDSGLHJ-UHFFFAOYSA-M rubidium chloride Chemical compound [Cl-].[Rb+] FGDZQCVHDSGLHJ-UHFFFAOYSA-M 0.000 description 2
- KZUNJOHGWZRPMI-UHFFFAOYSA-N samarium atom Chemical compound [Sm] KZUNJOHGWZRPMI-UHFFFAOYSA-N 0.000 description 2
- 229910052706 scandium Inorganic materials 0.000 description 2
- SIXSYDAISGFNSX-UHFFFAOYSA-N scandium atom Chemical compound [Sc] SIXSYDAISGFNSX-UHFFFAOYSA-N 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- GZCRRIHWUXGPOV-UHFFFAOYSA-N terbium atom Chemical compound [Tb] GZCRRIHWUXGPOV-UHFFFAOYSA-N 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000004753 textile Substances 0.000 description 2
- FRNOGLGSGLTDKL-UHFFFAOYSA-N thulium atom Chemical compound [Tm] FRNOGLGSGLTDKL-UHFFFAOYSA-N 0.000 description 2
- IAQRGUVFOMOMEM-ONEGZZNKSA-N trans-but-2-ene Chemical compound C\C=C\C IAQRGUVFOMOMEM-ONEGZZNKSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 239000002966 varnish Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 108010000998 wheylin-2 peptide Proteins 0.000 description 2
- NAWDYIZEMPQZHO-UHFFFAOYSA-N ytterbium Chemical compound [Yb] NAWDYIZEMPQZHO-UHFFFAOYSA-N 0.000 description 2
- 229910052727 yttrium Inorganic materials 0.000 description 2
- VWQVUPCCIRVNHF-UHFFFAOYSA-N yttrium atom Chemical compound [Y] VWQVUPCCIRVNHF-UHFFFAOYSA-N 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- BXXWFOGWXLJPPA-ZXZARUISSA-N (2r,3s)-2,3-dibromobutane Chemical compound C[C@@H](Br)[C@H](C)Br BXXWFOGWXLJPPA-ZXZARUISSA-N 0.000 description 1
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- OJOWICOBYCXEKR-KRXBUXKQSA-N (5e)-5-ethylidenebicyclo[2.2.1]hept-2-ene Chemical compound C1C2C(=C/C)/CC1C=C2 OJOWICOBYCXEKR-KRXBUXKQSA-N 0.000 description 1
- ALSTYHKOOCGGFT-KTKRTIGZSA-N (9Z)-octadecen-1-ol Chemical compound CCCCCCCC\C=C/CCCCCCCCO ALSTYHKOOCGGFT-KTKRTIGZSA-N 0.000 description 1
- VYXHVRARDIDEHS-UHFFFAOYSA-N 1,5-cyclooctadiene Chemical compound C1CC=CCCC=C1 VYXHVRARDIDEHS-UHFFFAOYSA-N 0.000 description 1
- BXXWFOGWXLJPPA-UHFFFAOYSA-N 2,3-dibromobutane Chemical compound CC(Br)C(C)Br BXXWFOGWXLJPPA-UHFFFAOYSA-N 0.000 description 1
- OTEWWRBKGONZBW-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]-4-methylpentanoyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NC(CC(C)C)C(=O)NCC(=O)NCC(O)=O OTEWWRBKGONZBW-UHFFFAOYSA-N 0.000 description 1
- WFUGQJXVXHBTEM-UHFFFAOYSA-N 2-hydroperoxy-2-(2-hydroperoxybutan-2-ylperoxy)butane Chemical compound CCC(C)(OO)OOC(C)(CC)OO WFUGQJXVXHBTEM-UHFFFAOYSA-N 0.000 description 1
- 101150090724 3 gene Proteins 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- BBDKZWKEPDTENS-UHFFFAOYSA-N 4-Vinylcyclohexene Chemical compound C=CC1CCC=CC1 BBDKZWKEPDTENS-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- NLHHRLWOUZZQLW-UHFFFAOYSA-N Acrylonitrile Chemical compound C=CC#N NLHHRLWOUZZQLW-UHFFFAOYSA-N 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- YHOPXCAOTRUGLV-XAMCCFCMSA-N Ala-Ala-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YHOPXCAOTRUGLV-XAMCCFCMSA-N 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- GITAWLWBTMJPKH-AVGNSLFASA-N Arg-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GITAWLWBTMJPKH-AVGNSLFASA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 1
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- GOPFMQJUQDLUFW-LKXGYXEUSA-N Asn-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O GOPFMQJUQDLUFW-LKXGYXEUSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 1
- ILQCHXURSRRIRY-YUMQZZPRSA-N Asp-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N ILQCHXURSRRIRY-YUMQZZPRSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 1
- XSXVLWBWIPKUSN-UHFFFAOYSA-N Asp-Leu-Glu-Asp Chemical compound OC(=O)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(O)=O)C(O)=O XSXVLWBWIPKUSN-UHFFFAOYSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- FIRWLDUOFOULCA-XIRDDKMYSA-N Asp-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N FIRWLDUOFOULCA-XIRDDKMYSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Natural products CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 1
- YSIRYCYALNLZRE-UHFFFAOYSA-N C(C)O.C(C(=O)C)OC(CCC)O Chemical compound C(C)O.C(C(=O)C)OC(CCC)O YSIRYCYALNLZRE-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 238000010446 CRISPR interference Methods 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- NOCCABSVTRONIN-CIUDSAMLSA-N Cys-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N NOCCABSVTRONIN-CIUDSAMLSA-N 0.000 description 1
- BUIYOWKUSCTBRE-CIUDSAMLSA-N Cys-Arg-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O BUIYOWKUSCTBRE-CIUDSAMLSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 1
- SFRQEQGPRTVDPO-NRPADANISA-N Cys-Gln-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O SFRQEQGPRTVDPO-NRPADANISA-N 0.000 description 1
- DZIGZIIJIGGANI-FXQIFTODSA-N Cys-Glu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DZIGZIIJIGGANI-FXQIFTODSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 1
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- LBSKYJOZIIOZIO-DCAQKATOSA-N Cys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N LBSKYJOZIIOZIO-DCAQKATOSA-N 0.000 description 1
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- BCWIFCLVCRAIQK-ZLUOBGJFSA-N Cys-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O BCWIFCLVCRAIQK-ZLUOBGJFSA-N 0.000 description 1
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 1
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 1
- LHRCZIRWNFRIRG-SRVKXCTJSA-N Cys-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O LHRCZIRWNFRIRG-SRVKXCTJSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 238000005698 Diels-Alder reaction Methods 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000702055 Escherichia virus HK022 Species 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- UVAOVENCIONMJP-GUBZILKMSA-N Gln-Cys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O UVAOVENCIONMJP-GUBZILKMSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- LHMWTCWZARHLPV-CIUDSAMLSA-N Gln-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LHMWTCWZARHLPV-CIUDSAMLSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- ZJFNRQHUIHKZJF-GUBZILKMSA-N Glu-His-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ZJFNRQHUIHKZJF-GUBZILKMSA-N 0.000 description 1
- BIHMNDPWRUROFZ-JYJNAYRXSA-N Glu-His-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BIHMNDPWRUROFZ-JYJNAYRXSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 1
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 1
- IFHJOBKVXBESRE-YUMQZZPRSA-N Gly-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN IFHJOBKVXBESRE-YUMQZZPRSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- ZNPRMNDAFQKATM-LKTVYLICSA-N His-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZNPRMNDAFQKATM-LKTVYLICSA-N 0.000 description 1
- FPNWKONEZAVQJF-GUBZILKMSA-N His-Asn-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FPNWKONEZAVQJF-GUBZILKMSA-N 0.000 description 1
- FLYSHWAAHYNKRT-JYJNAYRXSA-N His-Gln-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLYSHWAAHYNKRT-JYJNAYRXSA-N 0.000 description 1
- BQFGKVYHKCNEMF-DCAQKATOSA-N His-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 BQFGKVYHKCNEMF-DCAQKATOSA-N 0.000 description 1
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 1
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 1
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- WTJBVCUCLWFGAH-JUKXBJQTSA-N His-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WTJBVCUCLWFGAH-JUKXBJQTSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- WYSJPCTWSBJFCO-AVGNSLFASA-N His-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N WYSJPCTWSBJFCO-AVGNSLFASA-N 0.000 description 1
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 1
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 1
- SWBUZLFWGJETAO-KKUMJFAQSA-N His-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O SWBUZLFWGJETAO-KKUMJFAQSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- IIXDMJNYALIKGP-DJFWLOJKSA-N Ile-Asn-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IIXDMJNYALIKGP-DJFWLOJKSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- MSASLZGZQAXVFP-PEDHHIEDSA-N Ile-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N MSASLZGZQAXVFP-PEDHHIEDSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- CRYJOCSSSACEAA-VKOGCVSHSA-N Ile-Trp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N CRYJOCSSSACEAA-VKOGCVSHSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- ZSESFIFAYQEKRD-CYDGBPFRSA-N Ile-Val-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N ZSESFIFAYQEKRD-CYDGBPFRSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- JHWNWJKBPDFINM-UHFFFAOYSA-N Laurolactam Chemical compound O=C1CCCCCCCCCCCN1 JHWNWJKBPDFINM-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 1
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 1
- KVNLHIXLLZBAFQ-RWMBFGLXSA-N Lys-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N KVNLHIXLLZBAFQ-RWMBFGLXSA-N 0.000 description 1
- ZZHPLPSLBVBWOA-WDSOQIARSA-N Lys-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N ZZHPLPSLBVBWOA-WDSOQIARSA-N 0.000 description 1
- NQSFIPWBPXNJII-PMVMPFDFSA-N Lys-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 NQSFIPWBPXNJII-PMVMPFDFSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- BVRNWWHJYNPJDG-XIRDDKMYSA-N Lys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N BVRNWWHJYNPJDG-XIRDDKMYSA-N 0.000 description 1
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 1
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 1
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 1
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 1
- UOENBSHXYCHSAU-YUMQZZPRSA-N Met-Gln-Gly Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UOENBSHXYCHSAU-YUMQZZPRSA-N 0.000 description 1
- HHCOOFPGNXKFGR-HJGDQZAQSA-N Met-Gln-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HHCOOFPGNXKFGR-HJGDQZAQSA-N 0.000 description 1
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 1
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 1
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 1
- XLTSAUGGDYRFLS-UMPQAUOISA-N Met-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCSC)N)O XLTSAUGGDYRFLS-UMPQAUOISA-N 0.000 description 1
- VVWQHJUYBPJCNS-UMPQAUOISA-N Met-Trp-Thr Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 VVWQHJUYBPJCNS-UMPQAUOISA-N 0.000 description 1
- VEKRTVRZDMUOQN-AVGNSLFASA-N Met-Val-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 VEKRTVRZDMUOQN-AVGNSLFASA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 101100494762 Mus musculus Nedd9 gene Proteins 0.000 description 1
- 241000237536 Mytilus edulis Species 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 1
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- MRNRMSDVVSKPGM-AVGNSLFASA-N Phe-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRNRMSDVVSKPGM-AVGNSLFASA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 1
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- LYCOGHUNJCETDK-JYJNAYRXSA-N Phe-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N LYCOGHUNJCETDK-JYJNAYRXSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 1
- 238000010475 Pinacol rearrangement reaction Methods 0.000 description 1
- 239000005062 Polybutadiene Substances 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 101150044917 Prl3b1 gene Proteins 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 1
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 1
- CMOIIANLNNYUTP-SRVKXCTJSA-N Pro-Gln-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CMOIIANLNNYUTP-SRVKXCTJSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- NTXFLJULRHQMDC-GUBZILKMSA-N Pro-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 NTXFLJULRHQMDC-GUBZILKMSA-N 0.000 description 1
- QCMYJBKTMIWZAP-AVGNSLFASA-N Pro-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 QCMYJBKTMIWZAP-AVGNSLFASA-N 0.000 description 1
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 235000003976 Ruta Nutrition 0.000 description 1
- 240000005746 Ruta graveolens Species 0.000 description 1
- KJTLSVCANCCWHF-UHFFFAOYSA-N Ruthenium Chemical compound [Ru] KJTLSVCANCCWHF-UHFFFAOYSA-N 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- WKLJLEXEENIYQE-SRVKXCTJSA-N Ser-Cys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WKLJLEXEENIYQE-SRVKXCTJSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 1
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 239000004902 Softening Agent Substances 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000702031 Streptomyces phage R4 Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- NSFFHOGKXHRQEW-UHFFFAOYSA-N Thiostrepton B Natural products N1C(=O)C(C)NC(=O)C(=C)NC(=O)C(C)NC(=O)C(C(C)CC)NC(C(C2=N3)O)C=CC2=C(C(C)O)C=C3C(=O)OC(C)C(C=2SC=C(N=2)C2N=3)NC(=O)C(N=4)=CSC=4C(C(C)(O)C(C)O)NC(=O)C(N=4)CSC=4C(=CC)NC(=O)C(C(C)O)NC(=O)C(N=4)=CSC=4C21CCC=3C1=NC(C(=O)NC(=C)C(=O)NC(=C)C(N)=O)=CS1 NSFFHOGKXHRQEW-UHFFFAOYSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- MJBBMTOGSOSAKJ-HJXMPXNTSA-N Trp-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MJBBMTOGSOSAKJ-HJXMPXNTSA-N 0.000 description 1
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 1
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 1
- HJWLQSFTGDQSRX-BPUTZDHNSA-N Trp-Met-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HJWLQSFTGDQSRX-BPUTZDHNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 1
- WDIJBEWLXLQQKD-ULQDDVLXSA-N Tyr-Arg-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O WDIJBEWLXLQQKD-ULQDDVLXSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- DWJQKEZKLQCHKO-SRVKXCTJSA-N Tyr-Asn-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O DWJQKEZKLQCHKO-SRVKXCTJSA-N 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 1
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 1
- YRBHLWWGSSQICE-IHRRRGAJSA-N Tyr-Asp-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O YRBHLWWGSSQICE-IHRRRGAJSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- XDGPTBVOSHKDFT-KKUMJFAQSA-N Tyr-Met-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XDGPTBVOSHKDFT-KKUMJFAQSA-N 0.000 description 1
- XYNFFTNEQDWZNY-ULQDDVLXSA-N Tyr-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N XYNFFTNEQDWZNY-ULQDDVLXSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- KWKJGBHDYJOVCR-SRVKXCTJSA-N Tyr-Ser-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O KWKJGBHDYJOVCR-SRVKXCTJSA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 1
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- DLMNFMXSNGTSNJ-PYJNHQTQSA-N Val-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N DLMNFMXSNGTSNJ-PYJNHQTQSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- MCRPZFQGVZLTAI-UHFFFAOYSA-N Val-Leu-Trp-Tyr Natural products C=1NC2=CC=CC=C2C=1CC(NC(=O)C(NC(=O)C(N)C(C)C)CC(C)C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 MCRPZFQGVZLTAI-UHFFFAOYSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- UXODSMTVPWXHBT-ULQDDVLXSA-N Val-Phe-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N UXODSMTVPWXHBT-ULQDDVLXSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- LNWSJGJCLFUNTN-ZOBUZTSGSA-N Val-Trp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LNWSJGJCLFUNTN-ZOBUZTSGSA-N 0.000 description 1
- UFCHCOKFAGOQSF-BQFCYCMXSA-N Val-Trp-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N UFCHCOKFAGOQSF-BQFCYCMXSA-N 0.000 description 1
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 229920006266 Vinyl film Polymers 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 241000482268 Zea mays subsp. mays Species 0.000 description 1
- 229910021536 Zeolite Inorganic materials 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- WDJHALXBUFZDSR-UHFFFAOYSA-M acetoacetate Chemical compound CC(=O)CC([O-])=O WDJHALXBUFZDSR-UHFFFAOYSA-M 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000001273 butane Substances 0.000 description 1
- 229910052792 caesium Inorganic materials 0.000 description 1
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical compound [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 229960005069 calcium Drugs 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- YACLQRRMGMJLJV-UHFFFAOYSA-N chloroprene Chemical compound ClC(=C)C=C YACLQRRMGMJLJV-UHFFFAOYSA-N 0.000 description 1
- 239000012459 cleaning agent Substances 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000035071 co-translational protein modification Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- ZOLLIQAKMYWTBR-RYMQXAEESA-N cyclododecatriene Chemical compound C/1C\C=C\CC\C=C/CC\C=C\1 ZOLLIQAKMYWTBR-RYMQXAEESA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 238000007256 debromination reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005695 dehalogenation reaction Methods 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 239000011928 denatured alcohol Substances 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 150000001993 dienes Chemical class 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- IJKVHSBPTUYDLN-UHFFFAOYSA-N dihydroxy(oxo)silane Chemical compound O[Si](O)=O IJKVHSBPTUYDLN-UHFFFAOYSA-N 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- NKDDWNXOKDWJAK-UHFFFAOYSA-N dimethoxymethane Chemical compound COCOC NKDDWNXOKDWJAK-UHFFFAOYSA-N 0.000 description 1
- AFABGHUZZDYHJO-UHFFFAOYSA-N dimethyl butane Natural products CCCC(C)C AFABGHUZZDYHJO-UHFFFAOYSA-N 0.000 description 1
- BTVWZWFKMIUSGS-UHFFFAOYSA-N dimethylethyleneglycol Natural products CC(C)(O)CO BTVWZWFKMIUSGS-UHFFFAOYSA-N 0.000 description 1
- HNPSIPDUKPIQMN-UHFFFAOYSA-N dioxosilane;oxo(oxoalumanyloxy)alumane Chemical compound O=[Si]=O.O=[Al]O[Al]=O HNPSIPDUKPIQMN-UHFFFAOYSA-N 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000012262 fermentative production Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004508 fractional distillation Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 239000002316 fumigant Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 239000003502 gasoline Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 150000003944 halohydrins Chemical class 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000007871 hydride transfer reaction Methods 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 229910000037 hydrogen sulfide Inorganic materials 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000003317 industrial substance Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000000976 ink Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 239000001282 iso-butane Substances 0.000 description 1
- 235000013847 iso-butane Nutrition 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000011344 liquid material Substances 0.000 description 1
- 238000000622 liquid--liquid extraction Methods 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 230000012976 mRNA stabilization Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 235000020638 mussel Nutrition 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 229940055577 oleyl alcohol Drugs 0.000 description 1
- XMLQWXUVTXCDDL-UHFFFAOYSA-N oleyl alcohol Natural products CCCCCCC=CCCCCCCCCCCO XMLQWXUVTXCDDL-UHFFFAOYSA-N 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 235000011007 phosphoric acid Nutrition 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000004014 plasticizer Substances 0.000 description 1
- 229920002857 polybutadiene Polymers 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000002952 polymeric resin Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000011027 product recovery Methods 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- IGLNJRXAVVLDKE-UHFFFAOYSA-N rubidium atom Chemical compound [Rb] IGLNJRXAVVLDKE-UHFFFAOYSA-N 0.000 description 1
- 229940102127 rubidium chloride Drugs 0.000 description 1
- 235000005806 ruta Nutrition 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 229920003048 styrene butadiene rubber Polymers 0.000 description 1
- HXJUTPCZVOIRIF-UHFFFAOYSA-N sulfolane Chemical compound O=S1(=O)CCCC1 HXJUTPCZVOIRIF-UHFFFAOYSA-N 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 229920003002 synthetic resin Polymers 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- NSFFHOGKXHRQEW-AIHSUZKVSA-N thiostrepton Chemical compound C([C@]12C=3SC=C(N=3)C(=O)N[C@H](C(=O)NC(/C=3SC[C@@H](N=3)C(=O)N[C@H](C=3SC=C(N=3)C(=O)N[C@H](C=3SC=C(N=3)[C@H]1N=1)[C@@H](C)OC(=O)C3=CC(=C4C=C[C@H]([C@@H](C4=N3)O)N[C@H](C(N[C@@H](C)C(=O)NC(=C)C(=O)N[C@@H](C)C(=O)N2)=O)[C@@H](C)CC)[C@H](C)O)[C@](C)(O)[C@@H](C)O)=C\C)[C@@H](C)O)CC=1C1=NC(C(=O)NC(=C)C(=O)NC(=C)C(N)=O)=CS1 NSFFHOGKXHRQEW-AIHSUZKVSA-N 0.000 description 1
- 229930188070 thiostrepton Natural products 0.000 description 1
- 229940063214 thiostrepton Drugs 0.000 description 1
- NSFFHOGKXHRQEW-OFMUQYBVSA-N thiostrepton A Natural products CC[C@H](C)[C@@H]1N[C@@H]2C=Cc3c(cc(nc3[C@H]2O)C(=O)O[C@H](C)[C@@H]4NC(=O)c5csc(n5)[C@@H](NC(=O)[C@H]6CSC(=N6)C(=CC)NC(=O)[C@@H](NC(=O)c7csc(n7)[C@]8(CCC(=N[C@@H]8c9csc4n9)c%10nc(cs%10)C(=O)NC(=C)C(=O)NC(=C)C(=O)N)NC(=O)[C@H](C)NC(=O)C(=C)NC(=O)[C@H](C)NC1=O)[C@@H](C)O)[C@](C)(O)[C@@H](C)O)[C@H](C)O NSFFHOGKXHRQEW-OFMUQYBVSA-N 0.000 description 1
- ZCUFMDLYAMJYST-UHFFFAOYSA-N thorium dioxide Chemical compound O=[Th]=O ZCUFMDLYAMJYST-UHFFFAOYSA-N 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- STCOOQWBFONSKY-UHFFFAOYSA-N tributyl phosphate Chemical compound CCCCOP(=O)(OCCCC)OCCCC STCOOQWBFONSKY-UHFFFAOYSA-N 0.000 description 1
- 229940093635 tributyl phosphate Drugs 0.000 description 1
- 238000005829 trimerization reaction Methods 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 239000012808 vapor phase Substances 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C11/00—Aliphatic unsaturated hydrocarbons
- C07C11/12—Alkadienes
- C07C11/16—Alkadienes with four carbon atoms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1022—Transferases (2.) transferring aldehyde or ketonic groups (2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
- C12P5/023—Methane
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/16—Butanols
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01004—R,R-butanediol dehydrogenase (1.1.1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01076—(S,S)-Butanediol dehydrogenase (1.1.1.76)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01304—Diacetyl reductase, (S)-acetoin forming (1.1.1.304)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y202/00—Transferases transferring aldehyde or ketonic groups (2.2)
- C12Y202/01—Transketolases and transaldolases (2.2.1)
- C12Y202/01006—Acetolactate synthase (2.2.1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01004—Acetoacetate decarboxylase (4.1.1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01005—Acetolactate decarboxylase (4.1.1.5)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/30—Fuel from waste, e.g. synthetic alcohol or diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
탄소 기질을 2,3-BDO와 같은 화학적 생성물로 전환시키는 능력을 갖는 유전자 변형된 미생물을 개시한다. 예를 들어, 2,3-BDO를 메탄 공급원으로부터 높은 역가로 생성시킬 수 있는 유전자 변형된 메탄영양체를 개시한다. 상기 유전자 변형된 미생물의 제조 방법 및 그의 사용 방법을 또한 개시한다.
Description
상호참조
본 출원은 2017년 1월 30일자로 출원된 미국 가출원 제 62/451,819 호; 2017년 5월 11일자로 출원된 제 62/504,626 호; 2017년 5월 30일자로 출원된 제 62/512,312 호; 및 2017년 11월 21일자로 출원된 제 62/588,985 호의 우선권 이득을 주장하며, 이들 출원은 내용 전체가 본 명세서에 참고로 인용된다.
서열 목록
본 출원은, ASCII 포맷으로 전자 제출되었고 내용 전체가 본 명세서에 참고로 인용된 서열 목록을 함유한다. 상기 ASCII 사본은 2018년 1월 29일에 생성되었으며, INX00382_SL.txt라 명명하고 크기가 65,784 바이트이다.
기술분야
본 발명은 탄소 기질을 2,3-BDO와 같은 화학적 생성물로 전환시키는 능력을 갖는 유전자 변형된 미생물을 개시한다. 예를 들어, 2,3-BDO를 메탄 공급원으로부터 높은 역가로 생성시킬 수 있는 유전자 변형된 메탄영양체를 개시한다. 상기 유전자 변형된 미생물의 제조 방법 및 그의 사용 방법을 또한 개시한다.
화합물 2,3-부탄디올("2,3-BDO")(또한 2,3-부틸렌 글리콜, 디메틸렌 글리콜, 디메틸에틸렌 글리콜 및 부탄-2,3-디올(C4H10O2; CAS No. 513-85-9)로서 공지된다)은 현재 주로 석유 공급원으로부터 생산되는 고가의 화학물질이다. 2,3-BDO는 다수의 산업적인 용도를 갖는다. 예를 들어, 2,3-BDO를 다양한 플라스틱, 살충제, 합성 고무, 인쇄용 잉크, 향료, 훈증제, 습윤 및 유연제, 폭발물, 가소제, 식품 및 약제에 대한 전구체로서 사용할 수 있다(Garg, S.K., and Jain, A., "Fermentative production of 2,3-butanediol," Bioresource Technology, p. 103-109 (1995)).
2,3-BDO는 현재 원유의 사용을 통해 생산된다. 그러나, 2,3-BDO는 또한 각종 미생물에 의해 생성되며 코코아 버터, 루타 그라베올런스의 뿌리, 스위트콘, 및 로튼 홍합에서 발견될 수 있다. 2,3-BDO는 또한 효모에 의한 알콜 발효 부산물이며 대개는 와인의 가장 풍부한 미량 성분 중 하나이다. 상기는 아세토인의 환원으로부터 기원한다(Romano, P. and Suzzi, G., "Origin and Production of Acetoin during Wine Yeast Fermentation," Applied and Environmental Microbiology, p. 309-315 (1996)).
최근 수년간 발효에 의해 2,3-BDO를 생성시키는 것에 일부 관심을 가졌다. 발효는 전형적으로 탄소원(대개는 당)을 채취하고 상기 탄소원을 목적하는 생성물로 전환시킬 수 있는 미생물을 사용하여 발효시킴을 수반한다.
탄소를 글리세롤 및 2,3-BDO를 향해 재-배향시켜 바람직한 관능적 특징을 갖는 저-알콜 효모를 수득함으로써 와인 중 에탄올 함량을 3℃ 이하까지 감소되게 하는, 감소된 아세토인 수율을 갖는 사카로마이세스 세레베지아에(Saccharomyces cerevisiae)를 조작하는 다수의 시도가 수행되었다(Ehsani, M., et al, "Engineering of 2,3-butanediol dehydrogenase to reduce acetoin formation by glycerol-overproducing, low-alcohol Saccharomyces cerevisiae," Applied and Environmental Microbiology, p. 3196-3205 (2009)).
발효에 의해 2,3-BDO와 같은 화학물질을 생성시키는 비용은 전형적으로, 사용되는 탄소원에 따라 변한다. 식품 공급물의 감소를 또한 생성시키는 당이 일반적으로 보다 고비용의 탄소원이다. 1 탄소원이 현재 대단히 비용-효과적이며 이는 천연 가스 중에 풍부하다. 천연 가스내 탄소의 주 공급원은 C1 탄소인 메탄(CH4)이다. 메탄과 같은 저렴한 탄소원을 사용함으로써 2,3-BDO를 경제적으로 생산할 수 있다.
2,3-BDO는 또한 현재 일부 비-유전자 변형된 미생물에 의해 매우 적은 역가로 생산된다. 상기 역가에서, 발효 비용은 경제적으로 실현 가능하기에는 너무 클 수 있다. 따라서, 2,3-BDO를 경제적으로 실행가능한 수준으로 생성시키는 유전 공학이 필요하다. 상기 도전은 메탄과 같은 저렴한 탄소원을 발효 공정을 사용하여 2,3-BDO로 효율적으로 전환시키도록 발효 방법 및 미생물을 조작하는데 있다.
본 발명의 발명의 요지는 2,3-BDO 생합성을 실질적으로 개선시키기 위해 유전자 변형시킨 미생물, 예를 들어 메탄영양체 또는 효모에 관한 것이다.
참고문헌의 인용
본 명세서의 모든 공보, 특허 및 특허출원은 각각의 개별적인 공보, 특허 또는 특허출원이 구체적이고 개별적으로 참고로 인용됨을 가리키는 바와 동일한 정도로 참고로 인용된다. 본 명세서의 용어와 인용된 참고문헌의 용어간에 갈등이 있는 경우에, 본 명세서의 용어가 지배한다.
임의의 공보의 인용은 그의 개시가 출원일에 선행한다는 것이며 본 발명이 선행 발명에 의해 상기와 같은 공보에 선행할 자격이 없음을 인정하는 것으로서 해석해서는 안 된다. 추가로, 제공된 공개일은 실제 공개일과 상이할 수 있으며 이는 개별적으로 확인할 필요가 있을 수 있다.
발명의 요약
본 명세서는 메탄과 같은 탄화수소 분자를 함유하는 단일 탄소로부터 출발하여, 목적하는 유기 화합물을 생성시킬 수 있는 유전자 변형된 미생물을 개시한다. 유전자 변형된 미생물의 사용에 의한 방법을 포함하여, 상기 목적하는 유기 화합물의 다양한 생성 방법을 개시한다.
예를 들어, C1 탄소를 2,3-부탄디올(2,3-BDO)로 전환시킬 수 있는 유전자 변형된 미생물을 개시한다. 미생물에 의해 전환될 수 있는 C1 탄소의 예는 일산화탄소(CO), 이산화탄소(CO2), 메탄(CH4), 또는 이들의 임의의 조합일 수 있다. 유전자 변형된 미생물은 이종 효소, 예를 들어 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제(budA), 및/또는 아세토락테이트 신타제(AlsS)를 암호화하는 하나 이상의 유전자를 포함할 수 있다. 상기 미생물에서 AlsS 유전자를 일시적으로 발현시킬 수 있다. 유전자 중 하나 이상은 스위치, 예를 들어 배지 중 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다.
암호화된 AlsS는 예를 들어 서열번호 1, 3 또는 19 중 어느 하나에 적어도 90% 일치하는 아미노산 서열을 포함할 수 있다. 암호화된 알파-아세토락테이트 데카복실라제(budA)는 예를 들어 서열번호 7에 적어도 90% 일치하는 아미노산 서열을 포함할 수 있다. 암호화된 아세토인 리덕타제는 예를 들어 서열번호 9에 적어도 90% 일치성인 아미노산 서열을 포함할 수 있다. 암호화된 아세토인 리덕타제는 예를 들어 클로스트리디움 속, 예를 들어 클로스트리디움 아우토에타노게늄(Clostridium autoethanogenum)으로부터의 그람 양성 세균 NADPH-의존성 아세토인 리덕타제일 수 있다. 일부의 경우에 아세토인 리덕타제는 NADPH-의존성일 수 있다. 일부의 경우에, 아세토인 리덕타제는 NADH-의존성일 수 있다.
유전자 변형된 미생물은 예를 들어 메틸로박터(Methylobacter), 메틸로미크로비움(Methylomicrobium), 메틸로모나스(Methylomonas), 메틸로칼듐(Methylocaldum), 메틸로코커스(Methylococcus), 메틸로소마(Methylosoma), 메틸로사르시나(Methylosarcina), 메틸로써무스(Methylothermus), 메틸로할로비우스(Methylohalobius), 메틸로가에아(Methylogaea), 메틸로불륨(Methylovulum), 크레노트릭스(Crenothrix), 클로노트릭스(Clonothrix), 메틸로스파에라(Methylosphaera), 메틸로카프사(Methylocapsa), 메틸로셀라(Methylocella), 메틸로시누스(Methylosinus), 메틸로시스티스(Methylocystis), 또는 메틸로아시도필룸(Methyloacidophilum) 속으로부터의 메탄영양체(methanotroph)일 수 있다. 메탄영양체는 메틸로코커스(Methylococcus), 예를 들어 메틸로코커스 캅술라투스(Methylococcus capsulatus) 종으로부터 유래할 수 있다.
유전자 변형된 미생물은 또한 원핵생물일 수 있다. 일부의 경우에, 유전자 변형된 미생물은 세균, 효모 또는 조류일 수 있다.
일부의 경우에, 유전자 변형된 미생물은 또한 37℃에서 동일한 유기체에 비해 42℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 또한 37℃에서 동일한 유기체에 비해 41℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 또한 45℃에서 동일한 유기체에 비해 42℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 또한 45℃에서 동일한 유기체에 비해 41℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 또한 45℃에서 동일한 유기체에 비해 37℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있다.
일부의 경우에, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합 벡터에 의해 통합시킨다. 일부의 경우에, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시킨다.
일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다.
이종 유전자들의 순서는 미생물과의 접촉 전에, 상기 접촉 중에, 또는 상기 접촉 후에 벡터상에 존재할 수 있다. 예를 들어, 유전자는 미생물과의 접촉 전에 벡터상의 임의의 다른 이종 유전자와 관련하여 5'일 수 있다. 그러나, 유전자를 미생물과 접촉 후에 하나의 위치에 삽입하거나, 또는 또 다른 유전자를, 상기 유전자가 벡터상의 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니게 벡터내에 삽입할 수 있다. 예를 들어, 벡터를 유전자들의 순서가 변경되도록 하는 방식으로 미생물내에서 변형시킬 수 있다. 일부의 경우에, 유전자들의 특정한 순서를 하나 이상의 이종 유전자(들)를 미생물의 게놈내에 삽입한 후에 성취할 수 있다. 예를 들어, 미생물의 게놈내에서 특정한 유전자 순서를 성취하기 위해 상이한 통합 벡터를 사용할 수 있다.
아세토인 리덕타제(예를 들어 NADPH-의존성) 유전자, 알파-아세토락테이트 데카복실라제(budA) 유전자, 및 AlsS 유전자 중 2개 이상을 포함하는 벡터를 또한 본 명세서에 개시한다. 일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 일부의 경우에, 상이한 유전자들이 스위치, 예를 들어 배지 중 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 상이한 유전자들은 구성적으로 발현된 프로모터 또는 비-구성적으로 발현된 프로모터와 같은 상이한 프로모터의 조절하에 있을 수 있다. 사용된 프로모터는 또한 메탄영양체내에서 활성일 수 있다. 상기와 같은 벡터의 예는 서열번호 15 내지 18 중 어느 하나에 적어도 90% 일치하는 뉴클레오티드 서열을 포함하는 것들을 포함한다. 일부의 경우에, 벡터는 통합 벡터인 반면, 다른 경우에 벡터는 에피솜 발현된 벡터이다.
미생물을 i) 아세토인 리덕타제(예를 들어 NADPH-의존성); ii) 알파-아세토락테이트 데카복실라제(budA); iii) 아세토락테이트 신타제(AlsS) 또는 iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 발현하는 핵산으로 형질전환시킴을 포함하는, C1 탄소를 2,3-BDO로 전환시킬 수 있는 유전자 변형된 미생물의 제조 방법을 또한 본 명세서에 개시한다. 적어도 하나의 이종 유전자는 예를 들어 스위치, 예를 들어 배지 중 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 일부의 경우에, 상기 방법은 37℃에서 동일한 유기체에 비해 42℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있는 유전자 변형된 미생물을 제조할 수 있다. 일부의 경우에, 상기 방법은 37℃에서 동일한 유기체에 비해 41℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있는 유전자 변형된 미생물을 제조할 수 있다. 일부의 경우에, 상기 방법은 45℃에서 동일한 유기체에 비해 42℃에서 더 많은 양의 2,3-BDO를 를 생성시킬 수 있는 유전자 변형된 미생물을 제조할 수 있다. 일부의 경우에, 상기 방법은 45℃에서 동일한 유기체에 비해 41℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있는 유전자 변형된 미생물을 제조할 수 있다. 일부의 경우에, 상기 방법은 45℃에서 동일한 유기체에 비해 37℃에서 더 많은 양의 2,3-BDO를 생성시킬 수 있는 유전자 변형된 미생물을 제조할 수 있다.
일부의 경우에, 상기 방법은 이종 아세토인 리덕타제, 이종 알파-아세토락테이트 데카복실라제 및/또는 이종 아세토락테이트 신타제를 암호화하는 유전자(들)를 미생물의 게놈내에 통합 벡터에 의해 통합시킨 미생물을 포함할 수 있다. 일부의 경우에, 상기 방법은 이종 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 유전자(들)를 에피솜 벡터상에서 발현시킨 미생물을 포함할 수 있다. 일부의 경우에, 상기 방법은 이종 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 유전자(들)를 에피솜 벡터상에서 발현시키고 미생물의 게놈내에 통합시킨(예를 들어 통합 벡터에 의해) 미생물을 포함할 수 있다.
일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다.
(a) 유전자 변형된 미생물을 C1 탄소와 접촉시키는 단계로서, 이때 상기 미생물은 (i) 아세토인 리덕타제(예를 들어 NADPH-의존성); (ii) 알파-아세토락테이트 데카복실라제(budA); (iii) AlsS; 또는 (iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함하는 단계; 및 (b) 상기 미생물을 증식시켜 2,3-BDO를 생성시키는 단계를 포함하는 2,3-BDO의 제조 방법을 추가로 개시한다. 일부의 경우에, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합 벡터에 의해 통합시킨다. 일부의 경우에, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시킨다. 일부의 경우에, 상기 방법은 이종 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 유전자(들)를 에피솜 벡터상에서 발현시키고 미생물의 게놈내에 통합시킨(예를 들어 통합 벡터에 의해) 미생물을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 상기 방법은 32℃ 내지 49℃의 온도에서 미생물을 증식시킴을 포함할 수 있다. 일부의 경우에, 미생물을 37℃ 내지 42℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 미생물을 약 42℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 미생물을 약 41℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 적어도 하나의 이종 유전자는 예를 들어 스위치, 예를 들어 배지 중 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 또한 미생물을 먼저 란타늄(예를 들어 적어도 1 μM 란타늄)과 같은 희토 금속을 함유하는 배지에서 증식시키고 이어서 후속적으로 희토 금속, 예를 들어 란타늄을 희석할 수 있다. 이는 미생물을 증식시켜 2,3-BDO를 생성시키기 전에 발생할 수 있다. 상기 방법으로부터 생성된 2,3-BDO를 회수할 수 있으며, 일부의 경우에 상기는 실질적으로 순수할 수 있다.
(a) 유전자 변형된 미생물을 C1 탄소와 접촉시키는 단계로서, 이때 상기 미생물은 알파-아세토락테이트 데카복실라제(budA)를 암호화하는 이종 유전자를 포함하는 단계; 및 (b) 상기 미생물을 증식시켜 아세토인을 생성시키는 단계를 포함하는 아세토인의 제조 방법을 추가로 개시한다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합 벡터에 의해 통합시킨다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시킨다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시키고 미생물의 게놈내에 통합시킨다(예를 들어 통합 벡터에 의해). 상기 방법은 32℃ 내지 49℃의 온도에서 미생물을 증식시킴을 포함할 수 있다. 일부의 경우에, 미생물을 37℃ 내지 42℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 미생물을 약 42℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 미생물을 약 41℃의 온도에서 증식시킬 수 있다. 일부의 경우에, budA 유전자는 예를 들어 스위치, 예를 들어 유도성 또는 억제성 스위치, 예를 들어 아라비노스 또는 란타늄 스위치의 조절하에 있을 수 있다. 일부의 경우에, 미생물을 먼저 란타늄(예를 들어 적어도 1 μM 란타늄)을 함유하는 배지에서 증식시킬 수 있다. 란타늄을 후속적으로 소비하고, 제거하고, 및/또는 희석할 수 있다. 이는 미생물을 증식시켜 아세토인을 생성시키기 전에 발생할 수 있다. 상기 방법으로부터 생성된 아세토인을 회수할 수 있으며, 일부의 경우에 상기는 실질적으로 순수할 수 있다. 상기 방법에 의해 생성된 아세토인이 실질적으로 순수하지 않은 경우, 비-아세토인 부산물, 예를 들어 2,3-BDO가 또한 회수될 수 있다.
일단, 2,3-BDO가 제조되면, 상기를 다른 목적하는 생성물, 예를 들어 부탄디엔 또는 메틸 에틸 케톤(MEK)으로 전환시킬 수 있다. 따라서, (a) 유전자 변형된 미생물을 C1 탄소 기질과 접촉시키는 단계로서, 이때 미생물은 (i) NADPH-의존성 아세토인 리덕타제; (ii) 알파-아세토락테이트 데카복실라제(budA); (iii) AlsS; 또는 (iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함하는 단계; 및 (b) 상기 미생물을 증식시켜 2,3-BDO를 생성시키는 단계; 및 (c) 상기 (b)로부터의 2,3-BDO를 촉매와 접촉시켜 부타디엔을 생성시키는 단계를 포함하는 부타디엔의 제조 방법을 또한 개시한다. 일부의 경우에, 상기 (b)로부터의 2,3-BDO를 (c)에 앞서 제거한다. 일부의 경우에, 상기 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합 벡터에 의해 통합시킨다. 일부의 경우에, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시킨다. 일부의 경우에, 이종 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시키고 미생물의 게놈내에 통합시킨다(예를 들어 통합 벡터에 의해). 일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 상기 방법은 32℃ 내지 49℃의 온도에서 미생물을 증식시킴을 포함할 수 있다. 일부의 경우에, 미생물을 37℃ 내지 42℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 미생물을 약 42℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 미생물을 약 41℃의 온도에서 증식시킬 수 있다. 추가로, 촉매는 2,3-BDO를 탈수시킬 수 있는 임의의 촉매, 예를 들어 SiO2-지지된 세슘 이수소 포스페이트(CsH2PO4) 촉매일 수 있다. 상기 방법으로부터 생성된 부타디엔을 회수할 수 있으며 상기는 일부의 경우에 실질적으로 순수할 수 있다. 부타디엔을 또한 합성 고무로 추가로 가공할 수 있다.
(a) 유전자 변형된 미생물을 C1 탄소 기질과 접촉시키는 단계로서, 이때 상기 미생물은 (i) NADPH-의존성 아세토인 리덕타제; (ii) 알파-아세토락테이트 데카복실라제(budA); (iii) 아세토락테이트 신타제(AlsS); 또는 (iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함하는 단계; (b) 상기 미생물을 증식시켜 2,3-BDO를 생성시키는 단계; 및 (c) 상기 (b)로부터의 2,3-BDO를 촉매와 접촉시켜 MEK를 생성시키는 단계를 포함하는 MEK의 제조 방법을 또한 개시한다. 일부의 경우에, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합 벡터에 의해 통합시킨다. 일부의 경우에, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시킨다. 일부의 경우에, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시키고 미생물의 게놈내에 통합시킨다(예를 들어 통합 벡터에 의해). 일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 상기 방법은 32℃ 내지 49℃의 온도에서 미생물을 증식시킴을 포함할 수 있다. 일부의 경우에, 미생물을 37℃ 내지 42℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 미생물을 약 42℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 미생물을 약 41℃의 온도에서 증식시킬 수 있다. 일부의 경우에, 촉매는 고체 산 촉매이다. 상기 방법으로부터 생성된 MEK를 회수할 수 있으며 상기는 일부의 경우에 실질적으로 순수할 수 있다. MEK를 또한 플라스틱, 직물, 파라핀 왁스, 래커, 니스, 도료 제거제, 아교, 및/또는 세척제로 추가로 가공할 수 있다. 일부의 경우에, (c)로부터의 촉매는 디올 데하이드라타제(B12)일 수 있다. 일부의 경우에, 디올 데하이드라타제 유전자를 동일하거나 상이한 유전자 변형된 미생물에 의해 발현시킬 수 있다. 따라서, (a) 유전자 변형된 미생물을 C1 탄소 기질과 접촉시키는 단계로서, 이때 상기 미생물은 (i) NADPH-의존성 아세토인 리덕타제; (ii) 알파-아세토락테이트 데카복실라제(budA); (iii) AlsS; (iv) 디올 데하이드라타제 또는 (v) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함하는 단계; 및 (b) 상기 미생물을 증식시켜 MEK를 생성시키는 단계를 포함하는 MEK의 제조 방법을 본 명세서에 개시한다.
또한, 서열번호 2에 적어도 84% 일치하거나, 서열번호 4에 적어도 88% 일치하거나, 또는 서열번호 20에 적어도 60% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산을 또한 개시한다. 이들 뉴클레오티드 서열은 아세토락테이트 신타제 활성을 갖는 단백질을 암호화할 수 있다. 서열번호 6 또는 8에 적어도 85% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산을 추가로 개시한다. 이들 뉴클레오티드 서열은 알파-아세토락테이트 데카복실라제 활성을 갖는 단백질을 암호화할 수 있다. 서열번호 10, 12 또는 14 중 어느 하나에 적어도 85% 일치하는 단리된 다중핵산을 추가로 개시한다. 이들 뉴클레오티드 서열은 부탄디올 데하이드로게나제 활성을 갖는 단백질을 암호화할 수 있다.
상기에 요약한 바와 같이, 본 발명의 태양은 탄소 기질을 2,3-BDO와 같은 화학적 생성물로 전환시킬 수 있는 유전자 변형된 미생물을 포함한다. 유전자 변형된 미생물은 2,3-BDO를 고 역가로 메탄 공급원으로부터 생성시킬 수 있는 메탄영양체를 포함한다. 상기와 같은 유전자 변형된 미생물의 제조 및 사용 방법을 또한 개시한다.
본 발명을 보다 상세히 기재하기 전에, 본 발명을 기재된 특정한 경우들로 제한되지 않는 것으로 이해해야 하며, 물론 그 자체가 변화할 수 있다. 또한, 본 명세서에 사용된 용어는 단지 특정한 경우를 기재하기 위한 것이고 제한을 의도하는 것은 아님을 알아야 하며, 따라서 본 발명의 범위는 단지 첨부된 청구항에 의해서만 제한될 것이다.
값의 범위가 제공되는 경우, 문맥상 달리 명확히 지시되지 않는 한, 상기 범위의 각각의 사이값, 하한의 단위의 1/10, 상한과 하한 사이 및 서술된 범위 중 임의의 다른 서술되거나 사이에 있는 값은 본 발명내에 포함되는 것으로 이해한다. 상기 보다 작은 범위의 상한 및 하한은 독립적으로 상기 보다 작은 범위 중에 포함될 수 있으며 상기 서술된 범위 중 임의의 특별히 제외된 한계가 가해진 경우도 또한 본 발명내에 포함된다. 상기 서술된 범위가 상기 한계의 한쪽 또는 양쪽을 모두 포함하는 경우, 상기 포함된 한계 중 어느 하나 또는 둘 다를 제외하는 범위도 또한 본 발명에 포함된다.
I. 정의
본 명세서에 사용되는 바와 같은 "2,3-부탄디올" 또는 "2,3-BDO"란 용어 및 이들의 문법적 등가어는 라세미, 부분 입체이성질체성으로 순수한 및/또는 실질적으로 입체이성질체성으로 순수한 형태의, (R,R), (S,S) 및 메사 형태를 포함한 상기 화합물의 모든 거울상 이성질체 및 부분입체 이성질체 형태를 지칭할 수 있다.
본 명세서에 사용되는 바와 같은 "부텐" 또는 "부틸렌"이란 용어 및 이들의 문법적 등가어는 이성질체들의 혼합물 및 순수한 및/또는 실질적으로 순수한 형태의, 2-부텐, 부트-1-엔, 2-메틸프로펜을 포함한 알켄의 모든 구조 이성질체, 및 Z-부트-2-엔, E-부트-2-엔을 포함한 상기 화합물의 모든 입체이성질체 및 기하이성질체 형태를 지칭할 수 있다.
본 명세서에 사용되는 바와 같은 "부타디엔"이란 용어 및 그의 문법적 등가어는 이성질체들의 혼합물 및 순수한 및/또는 실질적으로 순수한 형태의, 시스 및 트랜스 1,3-부타디엔을 포함한 디엔의 모든 기하 이성질체를 지칭할 수 있다.
본 명세서에 사용되는 바와 같은 "메틸 에틸 케톤" 또는 "MEK" 또는 "부타논"이란 용어 및 이들의 문법적 등가어는 부분적으로 순수한 및/또는 실질적으로 순수한 형태의, 케톤의 모든 이성질체를 지칭할 수 있다.
본 명세서에 사용되는 바와 같은 참조 수치와 관련된 "약"이란 용어 및 그의 문법적 등가어는 상기 수치 자체 및 상기 수치의 플러스 또는 마이너스 10% 값의 범위를 포함할 수 있다. 예를 들어, "약 10"이란 양은 10 및 9 내지 11의 임의의 양을 포함한다. 예를 들어, 참조 수치와 관련하여 "약"이란 용어는 또한 상기 값으로부터 플러스 또는 마이너스 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 또는 1% 값의 범위를 포함할 수 있다. 일부의 경우에, 전체를 통해 개시된 수치는 "약"이란 용어를 구체적으로 언급하지 않는다 하더라도 "약" 상기 수치일 수 있다.
본 명세서 및 첨부된 청구항에 사용되는 바와 같이, "하나의" 및 "상기"란 단수형은 문맥상 달리 명확히 지시되지 않는 한 복수의 지시대상을 포함함에 유의한다. 청구항을 임의의 선택적 요소를 제외하는 것으로 드래프팅할 수도 있음에 또한 유의한다. 이와 같이, 상기 서술을 청구항 요소의 인용과 관련하여 "단독으로", "오직" 등과 같은 배타적인 용어의 사용, 또는 "부정적" 한정의 사용에 대한 선행사로서 제공하고자 한다.
본 명세서에 사용되는 바와 같은 "유전자 변형" 또는 "유전자 변형된"이란 용어 및 이들의 문법적 등가어는 핵산, 예를 들어 미생물 게놈내 핵산의 하나 이상의 변경을 지칭할 수 있다. 예를 들어, 유전자 변형은 핵산(예를 들어 전체 유전자 또는 유전자의 단편)의 변경, 부가 및/또는 결실을 지칭할 수 있다.
본 명세서에 사용되는 바와 같은 "붕괴"란 용어 및 그의 문법적 등가어는 예를 들어 결실, 삽입, 돌연변이, 재배열, 또는 이들의 임의의 조합에 의한 유전자의 변경 과정을 지칭할 수 있다. 예를 들어, 유전자를 녹아웃에 의해 붕괴시킬 수 있다. 유전자 붕괴는 유전자의 발현(예를 들어 mRNA 및/또는 단백질 발현)의 부분적인 감소 또는 완전한 억제일 수 있다. 붕괴는 또한 유전자 또는 단백질의 기능 또는 발현을 억제하기 위한 억제 기술, 예를 들어 shRNA, siRNA, 미세RNA, 우성 음성, 또는 임의의 다른 수단을 포함할 수 있다.
본 명세서에 사용되는 바와 같은 "유전자 편집"이란 용어 및 그의 문법적 등가어는 하나 이상의 뉴클레오티드를 삽입하거나, 교체하거나, 또는 게놈으로부터 제거하는 유전 공학을 지칭할 수 있다. 예를 들어, 유전자 편집을 뉴클레아제(예를 들어 천연의 기존 뉴클레아제 또는 인공적으로 조작된 뉴클레아제)를 사용하여 수행할 수 있다.
본 명세서에 사용되는 바와 같은 "및/또는" 및 "그의 임의의 조합"이란 용어 및 이들의 문법적 등가어는 호환 가능하게 사용될 수 있다. 상기 용어는 임의의 조합이 특별히 고려됨을 전달할 수 있다. 오직 예시를 목적으로, 하기 어구 "A, B 및/또는 C" 또는 "A, B, C, 또는 이들의 임의의 조합"은 "A 개별적으로; B 개별적으로; C 개별적으로; A 및 B; B 및 C; A 및 C; 및 A, B 및 C"를 의미할 수 있다.
본 개시의 판독시 당해 분야의 숙련가들에게 자명한 바와 같이, 본 명세서에 기재되고 예시된 개별적인 각각의 경우는 본 발명의 범위 또는 진의로부터 이탈됨 없이 다른 다수의 경우들 중 임의의 경우의 특징과 쉽게 분리되거나 또는 병용될 수 있는 별도의 성분 및 특징을 갖는다. 임의의 인용된 방법을 인용된 사건들의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행할 수 있다.
달리 정의되지 않는 한, 본 명세서에 사용된 모든 과학기술 용어는 본 발명이 속하는 분야의 통상적인 숙련가에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 바와 유사하거나 동등한 임의의 방법 및 물질을 또한 본 발명의 실시 또는 시험에 사용할 수 있지만, 이제 전형적인 예시적인 방법 및 물질을 기재한다.
본 명세서에 사용되는 바와 같은 "다중핵산"이란 용어 및 그의 문법적 등가어는, 비제한적으로 임의의 길이의 단일 가닥 또는 이중 가닥, 센스 또는 안티센스 데옥시리보핵산(DNA), 및 적합한 경우, siRNA를 포함하여, 임의의 길이의 단일 가닥 또는 이중 가닥, 센스 또는 안티센스 리보핵산(RNA)을 포함하여, 뉴클레오티드, 뉴클레오시드 또는 그의 유사체를 포함한 2개 이상의 단량체로 구성된 유기 중합체를 지칭할 수 있다. "뉴클레오티드"란 용어는 퓨린 또는 피리미딘 염기 및 포스페이트기에 결합된 리보스 또는 데옥시리보스 당으로 이루어지고 핵산의 기본 구조 단위인 다수의 화합물 중 어느 하나를 지칭한다. 뉴클레오티드는 천연, 인공 및/또는 변형된 뉴클레오티드일 수 있다. "뉴클레오시드"란 용어는 데옥시리보스 또는 리보스와 결합된 퓨린 또는 피리미딘 염기로 이루어지고 특히 다중핵산 중에서 발견되는 화합물(구아노신 또는 아데노신으로서)을 지칭한다. "뉴클레오티드 유사체" 또는 "뉴클레오시드 유사체"란 용어는 각각, 하나 이상의 개별적인 원자가 상이한 원자 또는 상이한 작용기로 교체된 뉴클레오티드 또는 뉴클레오시드를 지칭한다. 본 명세서에 사용되는 바와 같은 "다중핵산"이란 용어는 DNA, RNA, 개방 판독 프레임, 그의 유사체 및 단편을 포함하여, 임의의 길이의 핵산을 포함한다.
다중핵산의 예는 전형적으로 길이가 2 뉴클레오티드 내지 약 100 뉴클레오티드 범위인 올리고뉴클레오티드, 및 약 100 뉴클레오티드 초과의 길이를 갖는 폴리뉴클레오티드를 포함한다. 본 명세서에 기재된 다중핵산은 "유전자", "프로모터", "오페론", 및/또는 "벡터"와 같은 폴리뉴클레오티드를 포함하는 것으로 이해된다. 본 명세서에 사용되는 바와 같이, "유전자"란 용어 및 그의 문법적 등가어는, 하나 이상의 단백질 또는 효소의 전부 또는 일부를 포함하는 특정한 아미노산 서열을 암호화하고 예를 들어 상기 유전자가 발현되는 조건을 결정하는 조절성(비-전사된) DNA 서열, 예를 들어 프로모터 서열을 포함할 수 있는 폴리뉴클레오티드를 지칭한다. 유전자의 전사된 영역은 암호화 서열뿐만 아니라, 인트론, 5'-번역되지 않은 영역(UTR), 및 3'-UTR을 포함한, 번역되지 않은 영역을 포함할 수 있다.
본 명세서에 사용되는 바와 같은 "프로모터"란 용어 및 그의 문법적 등가어는 암호화 서열 또는 기능성 RNA의 발현을 조절할 수 있는 핵산 서열을 지칭할 수 있다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'에 위치한다. 프로모터는 그의 전체가 고유 유전자로부터 유래되거나, 또는 자연에서 발견되는 상이한 프로모터로부터 유래된 상이한 요소로 구성되거나 또는 심지어 합성 핵산 분절을 포함할 수 있다. 당해 분야의 숙련가들은 상이한 프로모터가 상이한 조직 또는 세포 유형에서 또는 상이한 발생 단계에서 또는 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 이해한다. 대부분의 세포 유형에서 가장 많은 횟수로 유전자가 발현되게 하는 프로모터를 통상적으로 "구성적 프로모터"라 칭한다. 대부분의 경우에 조절 서열의 정확한 경계는 완벽하게 한정되지 않았기 때문에, 상이한 길이의 DNA 단편들이 일치하는 프로모터 활성을 가질 수도 있는 것으로 추가로 인식되고 있다.
본 명세서에 사용되는 바와 같은 "작동적으로 연결된"이란 용어 및 그의 문법적 등가어는 하나의 기능이 다른 것에 의해 영향을 받도록 하는 단일 핵산 단편상의 핵산 서열의 연계를 지칭할 수 있다. 예를 들어, 프로모터는 암호화 서열의 발현에 영향을 미칠 수 있는 경우(즉 상기 암호화 서열이 상기 프로모터의 전사 조절하에 있는 경우) 상기 암호화 서열과 작동적으로 연결된다. 암호화 서열을 조절 서열에 센스 또는 안티센스 배향으로 작동적으로 연결시킬 수 있다.
본 명세서에 사용되는 바와 같은 "코돈 최적화된"이란 용어 및 그의 문법적 등가어는 상기가 다양한 숙주의 형질전환을 위한 핵산 분자(또는 개방 판독 프레임)의 유전자 또는 암호화 영역을 지칭하는 한, DNA에 의해 암호화된 폴리펩티드의 변경 없이 숙주 유기체의 전형적인 코돈 사용을 반영하기 위한 상기 핵산 분자의 유전자 또는 암호화 영역 중의 코돈의 변경을 지칭할 수 있다.
본 명세서에 사용되는 바와 같은 "개방 판독 프레임"("ORF")이란 용어 및 그의 문법적 등가어는 (i) 개시 코돈, (ii) 아미노산을 나타내는 일련의 2개 이상의 코돈, 및 (iii) 종결 코돈으로 이루어지는 연속된 판독 프레임을 포함하는 다중핵산 또는 핵산 서열(천연이든, 비-천연이든, 합성이든 간에)을 지칭하며, 상기 ORF는 5'에서 3' 방향으로 판독된다(또는 번역된다).
본 명세서에 사용되는 바와 같은 "오페론"이란 용어 및 그의 문법적 등가어는 공통의 프로모터로부터 단일의 전사 단위로서 전사되는 2개 이상의 유전자를 지칭할 수 있다. 몇몇 경우에, 오페론을 포함하는 유전자, 폴리뉴클레오티드 또는 ORF는 연속적이다. 전체 오페론의 전사를, 공통의 프로모터를 변형시킴으로써 변형(즉 증가, 감소 또는 제거)시킬 수 있는 것으로 이해된다. 한편으로, 오페론 중 임의의 유전자, 폴리뉴클레오티드 또는 ORF, 또는 이들의 임의의 조합을 변형시켜, 암호화된 폴리펩티드의 기능 또는 활성을 변경시킬 수 있다. 상기 변형은 암호화된 폴리펩티드의 활성 또는 기능의 증가 또는 감소를 생성시킬 수 있다. 더욱이, 상기 변형은 암호화된 폴리펩티드에 대해 새로운 활성을 부여할 수 있다.
본 명세서에 사용되는 바와 같은 "벡터"란 용어 및 그의 문법적 등가어는 유기체, 세포 또는 세포 성분들간에 핵산을 번식 및/또는 이동시킬 수 있는 임의의 수단을 지칭할 수 있다. 벡터는 "에피솜"인, 즉 숙주 미생물의 염색체로 자율적으로 복제하거나 또는 상기 염색체내에 통합될 수 있는 바이러스, 박테리오파지, 프로-바이러스, 플라스미드, 파지미드, 트랜스포손, 및 인공 염색체, 예를 들어 YAC(효모 인공 염색체), BAC(세균 인공 염색체), 및 PLAC(식물 인공 염색체) 등을 포함한다. 벡터는 또한, 자연에서 에피솜이 아닌 네이키드 RNA 폴리뉴클레오티드, 네이키드 DNA 폴리뉴클레오티드, 동일한 가닥내에서 DNA 및 RNA 모두로 구성된 폴리뉴클레오티드, 폴리-리신-접합된 DNA 또는 RNA, 펩티드-접합된 DNA 또는 RNA, 리포솜-접합된 DNA 등이거나 또는 아그로박테리움 또는 박테리움과 같은 상기 폴리뉴클레오티드 구조물 중 하나 이상을 포함하는 유기체일 수 있다.
본 명세서에 사용되는 바와 같은 "폴리펩티드"란 용어 및 그의 문법적 등가어는 그의 크기와 상관없이, 2개 이상의 아미노산을 포함하는 임의의 유기 중합체를 지칭할 수 있다. "단백질"이 종종 비교적 큰 폴리펩티드와 관련하여 사용되고 "펩티드"가 종종 작은 폴리펩티드와 관련하여 사용되지만, 당해 분야에서 상기 용어의 사용은 중복되며 다양하다. 본 명세서에 사용되는 바와 같은 "폴리펩티드"란 용어는 달리 나타내지 않는 한, 펩티드, 폴리펩티드 및 단백질을 지칭한다. 본 명세서에 사용되는 바와 같이, "단백질", "폴리펩티드" 및 "펩티드"란 용어는 유전자 생성물을 지칭하는 경우 본 명세서에서 호환 가능하게 사용된다. 달리 지시되지 않는 한, 특정한 폴리펩티드는 또한 그의 보존적으로-치환된 변체를 암묵적으로 포함한다.
본 명세서에 사용되는 바와 같은 "효소"란 용어 및 그의 문법적 등가어는 생물학적 촉매로서 작용하는 다수의 단백질 중 어느 하나를 지칭할 수 있다. 전통적인 화학 촉매와 유사하게, 효소는 촉매화되지 않은 반응보다 더 낮은 활성화 에너지로 전이 상태를 생성시킴으로써 생물반응의 속도를 가속화한다. 즉, 효소는 상기가 촉진하는 반응에 전문화된 단백질이다. 본 명세서에 기재된 효소의 예는 아세토락테이트 신타제(AlsS 유전자에 의해 암호화됨), 알파-아세토락테이트 데카복실라제(유전자 BudA에 의해 암호화됨), 및 아세토인 리덕타제(유전자 ButA에 의해 암호화됨)를 포함한다.
본 명세서에 사용되는 바와 같은 "재조합 숙주 세포", "유전자 조작된 숙주 세포", "조작된 숙주 세포", "유전자 변형된 숙주 세포"란 어구 및 그들의 문법적 등가어는 호환 가능하게 사용될 수 있으며 (a) 하나 이상의 외인성 다중핵산을 발현하거나; (b) 하나 이상의 내인성 및/또는 하나 이상의 외인성 다중핵산, 예를 들어 벡터 중에 포함되거나 또는 내인성 유전자의 발현에 변경을 갖는 것들을 과발현하거나; 또는 (c) 내인성 유전자를 녹-아웃시키거나 또는 하향-조절하도록 유전자 변형된 숙주 세포를 지칭할 수 있다. 또한, 몇몇 유전자를 게놈으로부터 물리적으로 제거하거나(예를 들어 녹-아웃시키거나), 또는 감소되거나, 변경되거나 증대된 활성을 갖도록 조작할 수 있다. "재조합 숙주 세포", "유전자 조작된 숙주 세포", "조작된 숙주 세포", 및 "유전자 변형된 숙주 세포"란 어구는 특정한 피실험자 숙주 세포뿐만 아니라 상기와 같은 세포의 자손 또는 잠재적인 자손을 지칭한다. 몇몇 변형이 돌연변이나 환경적 영향으로 인해 다음 세대에서 발생할 수 있기 때문에, 상기와 같은 자손은 실제로 모 세포와 동일하지 않을 수 있으나, 본 명세서에 사용되는 바와 같은 상기 용어(들)의 범위내에 여전히 포함된다.
본 명세서에 사용되는 바와 같은 "시험관내"란 용어 및 그의 문법적 등가어는 세포의 위치와 상관없이, 살아있는 세포의 외부를 지칭할 수 있다. 본 명세서에 사용되는 바와 같은 "생체내"란 용어 및 그의 문법적 등가어는 세포의 위치와 상관없이, 살아있는 세포의 내부를 지칭할 수 있다.
본 명세서에 사용되는 바와 같은 "조작하다", "유전자 조작하다", "변형시키다", "유전자 변형시키다"란 용어 및 그들의 문법적 등가어는 미생물 중에서 검출 가능한 변화를 생성시키는 상기 미생물의 임의의 조작을 지칭할 수 있으며, 이때 상기 조작은 비제한적으로 이종(외인성) 다중핵산을 통해 비-고유의 대사 기능을 도입시키거나 또는 다중핵산 결실, 돌연변이 또는 녹-아웃을 통해 고유의 기능을 제거함을 포함한다. "대사적으로 조작된"이란 용어는 일반적으로, 목적하는 대사산물의 생성을 위한, 생합성 유전자(또는 개방 판독 프레임), 오페론과 관련된 유전자, 및 상기와 같은 다중핵산의 조절 요소의 합리적인 경로 설계 및 조립을 수반한다. "대사적으로 조작된"은 유전자 조작 및 적합한 배양 조건을 사용하는 전사, 번역, 단백질 안정성 및 단백질 기능의 조절 및 최적화, 예를 들어 중간체와 경쟁하여 목적하는 경로로 이끄는 경쟁적 대사 경로의 감소, 붕괴 또는 녹아웃에 의해 대사 흐름을 최적화함을 추가로 포함할 수 있다.
본 명세서에 사용되는 바와 같은 "스위치"란 용어 및 그의 문법적 등가어는 발현을 유도하거나 억제하기 위해 특정한 자극에 반응할 수 있는 유전자 또는 유전자들의 조절 단위를 의미할 수 있다. 예를 들어, 스위치는 당(예를 들어 아라비노스) 또는 희토 금속(예를 들어 란타늄)에 반응하는 조절 단위를 포함할 수 있다.
본 명세서에 사용되는 바와 같은 "유전자 변형", "유전자 변형된"이란 용어 및 그들의 문법적 등가어는 변경된 핵산 또는 폴리펩티드(즉 야생형 핵산 또는 폴리펩티드 서열에 비해)를 생성시키는 다중핵산 및/또는 폴리펩티드의 임의의 변형을 지칭할 수 있다. 유전자 변형은 예를 들어 다중 핵산(또는 암호화된 폴리펩티드) 중의 단일 또는 다중 잔기의 점 돌연변이, 치환, 결실 또는 삽입을 포함하며, 비제한적으로 조절 또는 프로모터 서열과 같은 단백질-암호화 서열 밖 영역의 변경뿐만 아니라 유전자의 단백질-암호화 영역 내에서 발생하는 변경을 포함한다. 유전자 변형은 임의의 유형의 변경일 수 있다. 예를 들어, 상기 변형은 결실, 삽입, 돌연변이, 재배열, 또는 이들의 임의의 조합일 수 있다. 몇몇 경우에, 유전자 변형된 미생물 게놈의 일부를 하나 이상의 이종(외인성) 다중핵산으로 교체할 수 있다. 일부의 경우에, 상기 변형은 자연 발생적이다. 다른 경우에, 상기 변형은 인공 선택압의 결과이다. 더욱 다른 경우에, 상기 변형은 유전공학의 결과이다. 유전자 변형의 한 형태는 예를 들어 녹아웃에 의한 붕괴이다. 본 명세서에 사용되는 바와 같이, 적어도 하나의 다중핵산을 "숙주 세포내에 도입시킴"과 같은 어구에 사용되는 바와 같은 "도입"이란 용어 및 그의 문법적 등가어는 다중핵산을 세포에 도입시킴에 대해 당해 분야에 공지된 방법, 예를 들어 비제한적으로 형질전환(예를 들어 염화 칼슘, 일렉트로포레이션), 형질도입, 형질감염, 접합 등을 포함한다.
본 명세서에 사용되는 바와 같이, 유전자 서열, ORF 서열 또는 다중핵산 서열에 관한 "발현" 또는 "발현된"이란 용어 및 그들의 문법적 등가어는 상기 유전자, 개방 판독 프레임 또는 다중핵산의 전사, 및 적합한 경우, 생성되는 mRNA 전사물의 단백질로의 번역을 지칭할 수 있다. 따라서, 문맥상 명백하게 되는 바와 같이, 단백질의 발현은 개방 판독 프레임 서열의 전사 및 번역으로부터 생성된다. 숙주 세포에서 목적하는 최종 생성물의 발현 수준을 상기 숙주 세포 중에 존재하는 상응하는 mRNA의 양, 또는 선택된 서열에 의해 암호화된 목적하는 최종 생성물의 양을 근거로 측정할 수 있다. 예를 들어, 선택된 서열로부터 전사된 mRNA를 PCR에 의해 또는 노던 하이브리드화에 의해 정량분석할 수 있다(예를 들어 문헌[Sambrook et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1989]을 참조하시오). 선택된 서열에 의해 암호화된 단백질을 다양한 방법에 의해(예를 들어 ELISA에 의해, 단백질의 생물 활성에 대한 분석에 의해, 또는 상기와 같은 활성과 독립적인 분석, 예를 들어 단백질을 인식하여 결합하는 항체를 사용하는 웨스턴 블럿팅 또는 방사성면역분석을 사용함으로써) 정량분석할 수 있다.
본 명세서에 사용되는 바와 같이, "내인성"이란 용어 및 그의 문법적 등가어는 다중핵산(및 상기 중에서 암호화된 폴리펩티드)과 관련하여 사용시 상기 다중핵산 및 폴리펩티드가 기원하는 유기체(즉 이들은 상기 유기체에 선천성이다)에서 발현되는 상기 다중핵산 및 폴리펩티드를 지칭한다. 대조적으로, "이종" 및 "외인성"이란 용어는 호환 가능하게 사용되며, 다중핵산(및 상기 중에서 암호화된 폴리펩티드)과 관련하여 본 명세서에서 정의된 바와 같이, 이들이(상기 다중핵산 또는 폴리펩티드 서열) 기원하거나 유래되는 유기체 이외의 유기체에서 발현되는 상기 다중핵산 및 폴리펩티드를 가리킨다. 일부의 경우에, "이종"이란 용어 및 그의 문법적 등가어는 상이한 종으로부터 유래됨을 의미할 수 있다. 예를 들어, "이종 유전자"는 참조 종과 상이한 종으로부터 유래된 유전자를 의미할 수 있다. 예를 들어, "이종 유전자"를 포함하는 메탄영양체는 동일한 메탄영양체로부터 유래되지 않은 유전자를 포함한다. 상기 유전자는 효모와 같은 상이한 미생물로부터 또는 상이한 메탄영양체 종과 같은 상이한 종으로부터 유래될 수 있다.
본 명세서에 사용되는 바와 같이, "기질"이란 용어 및 그의 문법적 등가어는 효소의 작용에 의해 또 다른 화합물로 전환되거나, 또는 전환됨을 의미하는 임의의 물질 또는 화합물을 지칭할 수 있다. 상기 용어는 단일 화합물뿐만 아니라, 화합물들의 조합, 예를 들어 적어도 하나의 기질, 또는 그의 유도체를 함유하는 용액, 혼합물 및 다른 물질을 포함한다.
본 명세서에 사용되는 바와 같이, "C1 탄소", "C1-탄소 기질"이란 용어 및 그들의 문법적 등가어는 단일 탄소 원자를 함유하는 임의의 유기 화합물을 지칭할 수 있다. 예로는 비제한적으로 일산화탄소(CO), 메탄(CH4) 및 이산화탄소(CO2)를 포함한다.
본 명세서에 사용되는 바와 같이, "발효" 또는 "발효 공정"이란 용어 및 그들의 문법적 등가어는 숙주 세포를 원료 물질, 예를 들어 공급원료 및 영양분을 함유하는 배양 배지에서 배양하는 공정일 수 있으며, 이때 상기 세포는 원료 물질, 예를 들어 공급원료를 바람직한 최종 생성물로 전환시킨다.
본 명세서에 사용되는 바와 같이, "상동체"란 용어 및 그의 문법적 등가어는 제1 과 또는 종의 원래 단백질, 폴리펩티드, 유전자, 또는 다중핵산(또는 상기를 암호화하는 ORF)과 관련하여 사용시, 상기 제1 과 또는 종의 원래 단백질, 유전자 또는 다중핵산에 상응하는(구조적으로, 기능적으로, 및/또는 게놈에 의해) 제2 과 또는 종의 별개의 단백질, 유전자 또는 다중핵산을 지칭할 수 있다. 종종, "상동체"는 기능적, 구조적 또는 게놈 유사성을 가질 것이다. 단백질, 유전자 또는 다중핵산의 상동체를 유전자 탐침 및 PCR을 사용하여 쉽게 클로닝할 수 있는 기법이 공지되어 있다. "상동체"로서 클로닝된 서열의 일치성을 기능 분석을 사용하여 및/또는 유전자의 게놈 맵핑에 의해 확인할 수 있다.
폴리펩티드(또는 단백질 또는 효소)는 상기 폴리펩티드를 암호화하는 핵산 서열이 제2 폴리펩티드를 암호화하는 핵산 서열과 유사한 서열을 갖는 경우 상기 제2 폴리펩티드에 대해 "상동성"을 갖거나 또는 "상동성"이다. 한편으로, 폴리펩티드는 상기 두 단백질이 "유사한" 아미노산 서열을 갖는 경우 제2 폴리펩티드에 대해 상동성을 갖는다. 따라서, "상동성 단백질" 또는 "상동성 폴리펩티드"란 용어 및 그들의 문법적 등가어는 상기 두 폴리펩티드가 유사한 아미노산 서열을 가짐을 지칭할 수 있다. 본 발명의 몇몇 경우에, 표 1에 제시된 하나 이상의 폴리뉴클레오티드 및/또는 폴리펩티드에 상동성인 폴리뉴클레오티드 및 폴리펩티드를 서열분석 및 비교에 대해 당해 분야에 공지된 방법을 사용하여 쉽게 확인할 수 있다.
본 발명의 상동성 폴리뉴클레오티드 또는 폴리펩티드 서열을 또한, 의문의 뉴클레오티드 또는 폴리펩티드 서열을 공지된 서열의 데이터베이스에 비교하는 BLAST 분석(유전자 위치 정보 검색) 또는 유사한 생물정보 도구에 의해 측정하거나 확인할 수 있다. 예를 들어, 검색 분석을 BLAST를 사용하여 수행하여 앞서 공개된 서열에 대한 서열 일치성 또는 유사성을 측정하고, 상기 서열이 아직 공개되지 않은 경우, DNA 또는 단백질 서열의 기능에 대한 관련된 통찰을 제공할 수 있다.
본 명세서에 사용되는 바와 같이, "실질적으로 순수한"이란 용어 및 그의 문법적 등가어는 다수의 또 다른 물질을 함유하지 않는 특정 물질을 지칭할 수 있다. 예를 들어, "실질적으로 순수한 2,3-BDO"는 적어도 90%의 2,3-BDO를 의미할 수 있다. 일부의 예에서, "실질적으로 순수한 2,3-BDO"는 적어도 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%, 99.99%, 99.999%, 또는 99.9999% 2,3-BDO를 의미할 수 있다. 예를 들어, 실질적으로 순수한 2,3-BDO는 적어도 70% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 75% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 80% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 85% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 90% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 91% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 92% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 93% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 94% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 95% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 96% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 97% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 98% 2,3-BDO를 의미할 수 있다. 일부의 경우에, 실질적으로 순수한 2,3-BDO는 적어도 99% 2,3-BDO를 의미할 수 있다.
본 명세서에 사용되는 바와 같이, "실질적으로 유사한"이란 용어 및 그의 문법적 등가어는 서열 및 참조 서열간의 유사성과 관련하여 사용시, 상기 서열들이 적어도 50%(그러나 100%는 아님) 일치함을 의미한다. 일부의 경우에, 상기 서열들은 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치한다. 일부의 경우에, 실질적으로 유사한이란 용어는 적어도 50% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 55% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 60% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 65% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 70% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 75% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 80% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 81% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 82% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 83% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 84% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 85% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 86% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 87% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 88% 일치하는 서열을 지칭한다. 다른 예에서, 실질적으로 유사한이란 용어는 89% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 90% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 91% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 92% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 93% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 94% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 95% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 96% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 97% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 98% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 99% 일치하는 서열을 지칭한다. 일부의 예에서, 실질적으로 유사한이란 용어는 100% 일치하는 서열을 지칭한다. 2개 서열간의 일치성 백분율을 측정하기 위해서, 상기 두 서열간에 가장 높은 정도의 합치가 획득되도록, 상기 2개의 서열을 예를 들어 문헌[Needleman and Wunsch (J. Mol. Biol., 1970, 48: 443)](스미스와 워터맨(Smith and Waterman)(Adv. Appl. Math., 1981, 2: 482)에 의해 개정됨)의 정렬 방법을 사용하여 정렬시키고 일치하는 아미노산/뉴클레오티드의 수를 상기 두 서열 사이에서 측정한다. 두 아미노산 서열간의 일치성 백분율을 계산하는 방법은 일반적으로 인지된 분야이며 예를 들어 문헌[Carillo and Lipton(SIAM J. Applied Math., 1988, 48: 1073)]에 기재된 방법 및 문헌[Computational Molecular Biology, Lesk, e.d. Oxford University Press, New York, 1988, Biocomputing: Informatics and Genomics Projects]에 기재된 방법을 포함한다. 일반적으로, 컴퓨터 프로그램이 상기와 같은 계산에 사용될 것이다. 이와 관련하여 사용될 수 있는 컴퓨터 프로그램은 비제한적으로 GCG(Devereux et al, Nucleic Acids Res., 1984, 12: 387) BLASTP, BLASTN 및 FASTA(Altschul et al, J. Molec. Biol., 1990:215:403)를 포함한다. 두 폴리펩티드간의 일치성 백분율을 측정하기에 특히 바람직한 방법은 10의 끊김 벌점 및 0.1의 끊김 확장 벌점(따라서 상기 두 서열 중 하나의 전체 길이의 적어도 50%가 정렬에 관련되는 경우 상기 두 서열간에 가장 높은 정도의 합치가 획득된다)을 사용하는 BLOSUM 62 채점 행렬(Henikoff S & Henikoff, J G, 1992, Proc. Natl. Acad. Sci. USA 89: 10915-10919)과 병용되는 클러스탈 W 연산(Clustal W algorithm)(Thompson, J D, Higgines, D G and Gibson T J, 1994, Nucleic Acid Res 22(22): 4673-4680)이다.
II. 유전자 변형된 미생물 및 그의 제조 방법
본 개시는 부분적으로, 야생형 미생물에서 관찰된 것에 비해 대단히 개선된 2,3-BDO 생합성률을 갖는 유전자 변형된 미생물에 관한 것이다. 일부의 경우에, 상기 생합성률은 통상적으로 생성될 수 있는 것보다 훨씬 더 높다. 일부의 경우에, 2,3-BDO를 자연적으로 생성시키지 못하는 미생물을 유전자 변형시켜 2,3-BDO를, 현저하게 높은 수준을 포함하여, 합성시켰다.
미생물
일부의 경우에 미생물은 목적하는 최종 생성물을 합성하기 위해 C1 탄소 기질, 예를 들어 CO, CO2 및 CH4를 사용할 수 있다. 그러나, 이는 미생물이 오직 C1 탄소만을 사용함을 의미하지 않는다. 미생물 중 일부를, 상기 미생물이 자연적으로 사용하는 탄소 기질을 포함하여, 추가적인 탄소 기질을 사용하도록 만들 수 있다. 예를 들어, 미생물이 자연적으로 탄소 기질용으로 당을 사용하는 경우, 상기 미생물을 C1 탄소와 같은 상이한 탄소원을 사용하도록 만들 수 있다.
미생물은 원핵생물 또는 진핵생물일 수 있다. 일부의 경우에, 예를 들어 미생물은 세균, 효모 또는 조류일 수 있다.
C1 탄소 기질을 목적하는 생성물로 전환시킬 수 있는 미생물은 탄소 기질로서 천연 가스를 사용할 수 있는 것들을 포함한다. 예를 들어, 미생물은 상기와 같은 목적하는 생성물을 제조하기 위해 탄소원으로서 천연 가스내에 함유된 메탄을 사용할 수 있다. 상기와 같은 미생물은 메탄영양체를 포함할 수 있다. 특히 유용할 수 있는 메탄영양체는 메틸로박터, 메틸로미크로비움, 메틸로모나스, 메틸로칼듐, 메틸로코커스, 메틸로소마, 메틸로사르시나, 메틸로써무스, 메틸로할로비우스, 메틸로가에아, 메틸로불륨, 크레노트릭스, 클로노트릭스, 메틸로스파에라, 메틸로카프사, 메틸로셀라, 메틸로시누스, 메틸로시스티스, 메틸로아시도필룸 속, 또는 이들의 임의의 조합으로부터의 것을 포함한다. 일부의 경우에, 메탄영양체는 메틸로코커스 속으로부터 유래한다. 하나의 예에서, 메탄영양체는 메틸로코커스 캅술라투스 종으로부터의 메탄영양체일 수 있다.
일부 미생물은 기질로서 CO2를 사용할 수 있다. 상기와 같은 미생물은 메타노젠을 포함한다. 기질로서 CO2를 사용할 수 있는 미생물은 엽록소를 함유할 수 있다. 그의 예는 조류 및 시아노박테리아를 포함한다.
일부 미생물은 기질로서 CO를 사용할 수 있다. 예로서 혐기성 미생물, 예를 들어 클로스트리디움을 포함한다. 상기 미생물을, 상당량의 2,3-BDO를 만들도록 유전자 변형시킬 수 있다.
일부의 경우에, 전체를 통해 기재된 유전자 변형된 미생물은 보다 높은 온도에서 발효시 목적하는 생성물을 보다 높은 역가로 생성시킬 수 있다. 예를 들어, 유전자 변형된 미생물을 37℃ 초과의 온도에서(그러나 100℃의 온도를 초과하지 않는) 배양시 더 높은 역가의 생성물, 예를 들어 2,3-BDO, 부타디엔, 및/또는 MEK를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 37℃에 비해 42℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 37℃에 비해 41℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 45℃에 비해 42℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 45℃에 비해 41℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 45℃에 비해 37℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형은 보다 높은 온도에 대해 증가된 관용/선호를 생성시킨다.
효소
몇몇 미생물을 몇몇 유용한 생성물, 예를 들어 2,3-BDO, 부타디엔 및/또는 MEK를 생성하도록 유전자 조작하기 위해서, 미생물을 특정한 효소를 암호화하는 하나 이상의 유전자로 형질전환시킬 수 있다. 이들 효소는 상기 미생물에 이종성일 수 있다.
예를 들어, 2,3-BDO를 생성할 수 있는 미생물을 조작하기 위해서, 하나 이상의 유전자(예를 들어 이종 유전자)를 상기 미생물내에, 일시적으로 또는 안정하게 형질전환시키거나 형질감염시킬 수 있다. 일부의 경우에, 이들 유전자 중 하나 이상을 에피솜 발현시킬 수 있다. 일부의 경우에, 이들 유전자 중 하나 이상을 미생물의 게놈에 통합시킬 수 있다. 일부의 경우에, 이들 유전자 중 하나 이상을 에피솜 발현시킬 수 있는 반면 이들 유전자 중 하나 이상을 또한 미생물의 게놈에 통합시킬 수 있다. 일부의 경우에, 조작된 미생물은 하기의 효소 중 하나 이상을 사용할 수 있다: (i) 아세토락테이트 신타제, (ii) 알파-아세토락테이트 데카복실라제, 및/또는 (iii) 아세토인 리덕타제. 아세토락테이트 신타제(유전자 AlsS에 의해 암호화된다)는 2 분자의 피루베이트를 2-아세토락테이트로 전환시킨다. 알파-아세토락테이트 데카복실라제(유전자 BudA에 의해 암호화된다)는 2-아세토락테이트를 아세토인으로 전환시킨다. 아세토인 리덕타제(유전자 ButA에 의해 암호화된다)는 환원된 보조인자로서 NADPH 또는 NADH를 사용하여 아세토인을 2,3-BDO로 전환시킨다. 보조인자로서 NADPH를 사용하는 아세토인 리덕타제를 "NADPH-의존성 아세토인 리덕타제(들)"라 지칭한다. 보조인자로서 NADH를 사용하는 아세토인 리덕타제를 "NADH-의존성 아세토인 리덕타제(들)"라 지칭한다. 일부의 경우에, 유전자를 발현시키거나 미생물내로 통합시키기 위해 벡터를 사용하는 경우, 아세토락테이트 신타제를 암호화하는 유전자는 벡터상의 임의의 다른 유전자와 관련하여 5'일 수 있다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 유전자는 벡터상의 임의의 다른 유전자와 관련하여 3'일 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자는 벡터상의 임의의 다른 유전자와 관련하여 5'도 3'도 아닐 수 있다(예를 들어 알파-아세토락테이트 데카복실라제 유전자의 3'인 적어도 하나의 유전자뿐만 아니라 5'인 적어도 하나의 유전자가 존재한다). 유전자의 순서는 미생물과의 접촉 전에, 상기 접촉 중에 또는 상기 접촉 후에 벡터상에 존재할 수 있다. 예를 들어, 유전자는 미생물과의 접촉 전에 벡터상의 임의의 다른 유전자와 관련하여 5'일 수 있다. 미생물과 접촉 후에, 유전자를, 상기 유전자가 벡터상의 임의의 다른 유전자와 관련하여 3'이거나 또는 벡터상의 임의의 다른 유전자와 관련하여 3'도 5'도 아닌 미생물의 게놈 위치에 삽입할 수 있다. 일부의 경우에, 유전자는 임의의 다른 유전자와 관련하여 5'에 남아있을 수 있다. 예를 들어, 벡터를 유전자의 순서를 변경시킬 수 있는 바와 같은 방식으로 미생물내에서 변형시킬 수 있다. 일부의 경우에, 미생물과 접촉 후에, 유전자를, 상기 유전자가 벡터상의 임의의 다른 유전자와 관련하여 3'이거나 또는 벡터상의 임의의 다른 유전자와 관련하여 3'도 5'도 아닌 벡터내에 삽입할 수 있다. 일부의 경우에, 유전자의 특정한 순서를, 하나 이상의 이종 유전자(들)가 미생물의 게놈내에 삽입된 후에 성취할 수 있다. 예를 들어, 미생물의 게놈내에서 특정한 유전자 순서를 성취하기 위해 상이한 통합 벡터를 사용할 수 있다. 일부의 경우에, 이종 유전자를 미생물의 게놈에 삽입한 후에 유전자의 순서를 측정한다.
C1 탄소(예를 들어 메탄)으로부터 2,3-BDO를 제조하는데 사용되는 미생물을 본 명세서에 기재한다. 일부의 경우에, 본 명세서의 미생물을 하기의 효소 중 하나 이상을 암호화하는 유전자로 형질전환시킬 수 있다: (i) 아세토인 리덕타제(NADPH-의존성 및/또는 NADH-의존성); (ii) 알파-아세토락테이트 데카복실라제; 및/또는 (iii) 아세토락테이트 신타제(AlsS). 예를 들어, 미생물을 NADPH- 또는 NADH-의존성 아세토인 리덕타제를 암호화하는 유전자로 형질전환시킬 수 있다. 또 다른 예로서, 미생물을 알파-아세토락테이트 데카복실라제를 암호화하는 유전자로 형질전환시킬 수 있다. 더욱 또 다른 예로서, 미생물을 아세토락테이트 신타제를 암호화하는 유전자로 형질전환시킬 수 있다. 이들 유전자는 미생물에 이종성일 수 있다. 일부의 경우에, 이들 유전자를 에피솜 발현시키거나, 미생물의 게놈내에 통합시키거나(예를 들어 통합 벡터의 사용을 통해), 또는 이들의 임의의 조합을 수행할 수 있다. 일부의 경우에, 이종 아세토락테이트 신타제를 암호화하는 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다.
일부의 경우에, 미생물을 2개 이상의 유전자, 예를 들어 NADPH- 및/또는 NADH-의존성 아세토인 리덕타제 및 알파-아세토락테이트 데카복실라제를 암호화하는 것들로 형질전환시킬 수 있다. 또 다른 예로서, 미생물을 또한 NADPH- 또는 NADH-의존성 아세토인 리덕타제 및 아세토락테이트 신타제를 암호화하는 유전자로 형질전환시킬 수 있다. 더욱 또 다른 예로서, 미생물을 알파-아세토락테이트 데카복실라제 및 아세토락테이트 신타제를 암호화하는 유전자로 형질전환시킬 수 있다. 유전자 중 하나 이상은 미생물에 이종성일 수 있다. 일부의 경우에, 이들 유전자를 에피솜 발현시키거나, 미생물의 게놈에 통합시키거나, 또는 이들의 임의의 조합을 수행할 수 있다.
일부의 경우에, 미생물을 NADPH- 및/또는 NADH-의존성 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및 아세토락테이트 신타제를 암호화하는 것들과 같은 적어도 3개 이상의 유전자로 형질전환시킬 수 있다. 유전자 중 하나 이상은 미생물에 이종성일 수 있다. 일부의 경우에, 이들 유전자를 에피솜 발현시키거나, 미생물의 게놈에 통합시키거나, 또는 이들의 임의의 조합을 수행할 수 있다.
NADPH-의존성 아세토인 리덕타제를 암호화하는 유전자는 세균(예를 들어 그람 양성 또는 그람 음성 세균)으로부터 유래할 수 있다. 상기 세균은, 예를 들어, 클로스트리디움 속, 예를 들어 클로스트리디움 아우토에타노게늄으로부터 유래할 수 있다.
NADPH-의존성 아세토인 리덕타제는 서열번호 9에 실질적으로 유사한 아미노산 서열을 포함할 수 있다. 예를 들어, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 60% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 65% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 70% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 75% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 80% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 85% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 90% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 91% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 92% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 93% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 94% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 95% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 96% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 97% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 98% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9에 적어도 99% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 서열번호 9인 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제는 아미노산 서열 서열번호 9를 포함한다.
NADH-의존성 아세토인 리덕타제를 암호화하는 유전자는 세균(예를 들어 그람 양성 또는 그람 음성 세균)으로부터 유래할 수 있다. 예로는 바실러스 속, 예를 들어 바실러스 서브틸리스로부터의 것들을 포함한다. 세균은 파에니바실러스(Paenibacillus) 속, 예를 들어 파에니바실러스 폴리믹사(Paenibacillus polymyxa)로부터 유래할 수 있다.
일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 실질적으로 유사한 아미노산 서열을 포함할 수 있다. 예를 들어, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 60% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 65% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 70% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 75% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 80% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 85% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 90% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 91% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 92% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 93% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 94% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 95% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 96% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 97% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 98% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 서열번호 11 또는 13에 적어도 99% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제는 아미노산 서열 서열번호 11 또는 13을 포함한다.
알파-아세토락테이트 데카복실라제(budA)를 암호화하는 유전자는 세균(예를 들어 그람 양성 세균 또는 그람 음성 세균)으로부터 유래할 수 있다. 예로는 클로스트리디움 속, 예를 들어 클로스트리디움 아우토에타노게늄으로부터의 것들을 포함한다. 다른 예는 클렙시엘라(Klebsiella) 속, 예를 들어 클렙시엘라 뉴모니아에(Klebsiella pneumoniae)로부터의 것들을 포함한다.
일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 실질적으로 유사한 아미노산 서열을 포함할 수 있다. 예를 들어, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 60% 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 60% 일치하는 아미노산 서열을 포함할 수 있다. 예를 들어, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 65% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 70% 일치하는 아미노산 서열을 포함할 수 있다. 예를 들어, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 75% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 80% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 85% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 90% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 91% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 92% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 93% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 94% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 95% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 96% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 97% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 98% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 적어도 99% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 서열번호 5 또는 7에 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 아미노산 서열 서열번호 5 또는 7을 포함한다.
아세토락테이트 신타제(AlsS)를 암호화하는 유전자는 세균(예를 들어 그람 양성 세균)으로부터 유래할 수 있다. 예로는 클로스트리디움 속, 예를 들어 클로스트리디움 아우토에타노게늄으로부터의 것들을 포함한다. 다른 예는 바실러스 속, 예를 들어 바실러스 서브틸리스로부터의 것들을 포함한다. 추가적인 종의 예는 바실러스 리케니포르미스를 포함한다.
일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 실질적으로 유사한 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토아세테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 60% 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 60% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 65% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 70% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 75% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 80% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 85% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 90% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 91% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 92% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 93% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 94% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 95% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 96% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 97% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 98% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 적어도 99% 일치하는 아미노산 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제는 서열번호 1, 3 또는 19 중 어느 하나에 일치하는 아미노산 서열을 포함할 수 있다.
일부의 경우에, 추가적인 효소를 미생물에 제공하여 발효에 의해 다른 목적하는 최종 생성물을 생성시킬 수 있다.
일부의 경우에, 아미노산 서열을, 유전자가 제공되거나 효소가 발현되는 미생물을 근거로 최적화할 수 있다. 상기와 같은 경우에, 미생물이 전형적으로 특정한 아미노산을 사용하는지의 여부 또는 얼마나 많은 상기 특정한 아미노산이 상기 미생물내에서의 사용에 이용될 수 있는지를 근거로 보존적 아미노산 치환을 수행할 수 있다.
벡터
진핵생물 또는 원핵생물 숙주내로의 도입을 위해 제조된 폴리뉴클레오티드 구조물은 전형적으로, 항상은 아니지만, 상기 숙주에 의해 인식되는 복제 시스템(즉 벡터)을 포함할 수 있다. 벡터는 목적하는 폴리펩티드를 암호화하는 의도된 폴리뉴클레오티드 단편, 및 임의로 상기 폴리펩티드-암호화 분절에 작동적으로 연결된 전사 및 번역 개시 조절 서열을 포함한다. 발현 시스템(예를 들어 발현 벡터)는 예를 들어 복제 기원 또는 자율적으로 복제하는 서열(ARS), 발현 조절 서열, 프로모터, 인헨서 및 필요한 처리 정보 부위, 예를 들어 리보솜-결합 부위, RNA 이어맞추기 부위, 폴리아데닐화 부위, 전사 종결자 서열, mRNA 안정화 서열, 숙주 염색체 DNA에 상동성인 뉴클레오티드 서열, 및/또는 다중 클로닝 부위를 포함할 수 있다. 신호 펩티드가 또한, 적합한 경우, 바람직하게는 동일하거나 관련된 종의 분비된 폴리펩티드로부터 포함될 수 있으며, 상기는 단백질이 세포막을 횡단하고/하거나 박히게 하거나 세포로부터 분비되게 한다.
벡터를 표준 방법을 사용하여 구성할 수 있다(예를 들어 하기 문헌을 참조하시오: Sambrook et al, Molecular Biology: A Laboratory Manual, Cold Spring Harbor, N.Y. 1989; 및 Ausubel, et al, Current Protocols in Molecular Biology, Greene Publishing, Co. N.Y, 1995).
본 명세서에 개시된 효소를 암호화하는 폴리뉴클레오티드의 조작을 전형적으로 재조합 벡터에서 수행한다. 사용될 수 있는 벡터는 세균 플라스미드, 박테리오파지, 인공 염색체, 에피솜 벡터 및 유전자 발현 벡터를 포함한다. 벡터를 목적하는 크기의 단백질을 암호화하는 폴리뉴클레오티드를 수용하도록 선택할 수 있다. 선택된 벡터의 생성에 이어서, 적합한 숙주 세포(예를 들어 본 명세서에 기재된 미생물)를 상기 벡터로 형질감염시키거나 형질전환시킨다. 각각의 벡터는 다양한 기능성 성분을 함유하며, 여기에는 일반적으로 클로닝 부위, 복제 기원 및 적어도 하나의 선택성 마커 유전자가 포함된다. 벡터는 하기의 요소 중 하나 이상을 추가로 가질 수 있다: 인헨서, 프로모터, 전사 종결 서열 및/또는 다른 신호 서열. 상기와 같은 서열 요소를 선택된 숙주 종에 최적화할 수 있다. 상기와 같은 서열 요소를 클로닝 부위의 부근에 배치할 수 있으며, 따라서 상기 요소는 사전선택된 효소를 암호화하는 유전자에 작동적으로 연결된다.
클로닝 및 발현 벡터를 비롯한 벡터는 하나 이상의 선택된 미생물에서 상기 벡터를 복제할 수 있게 하는 핵산 서열을 함유할 수 있다. 예를 들어, 서열은 숙주 염색체 DNA와 독립적으로 벡터를 복제할 수 있게 하는 것일 수 있으며 복제 기원 또는 자율적으로 복제하는 서열을 포함할 수 있다. 상기와 같은 서열은 다양한 세균, 효모 및 바이러스에 대해 주지되어 있다. 예를 들어, 플라스미드 pBR322로부터의 복제 기원은 대부분의 그람-음성 세균에 적합하고, 2 마이크론 플라스미드에 대한 복제 기원은 효모에 적합하며, 다양한 바이러스 복제 기원(예를 들어 SV40, 아데노바이러스)은 클로닝 벡터에 유용하다.
클로닝 또는 발현 벡터는 선택 유전자(또한 선택성 마커로서 지칭된다)를 함유할 수 있다. 상기 유전자는 선택성 배양 배지에서 형질전환된 미생물의 생존 또는 생육에 필요한 단백질을 암호화한다. 따라서 상기 선택 유전자를 함유하는 벡터로 형질전환되지 않은 미생물은 배양 배지에서 생존하지 않을 것이다. 전형적인 선택 유전자는 항생제 및 다른 독소, 예를 들어 암피실린, 네오마이신, 메토트렉세이트, 하이그로마이신, 티오스트렙톤, 아프라마이신 또는 테트라사이클린에 대한 내성, 보체 영양요구성 결핍을 부여하거나, 또는 생육 배지에서 입수할 수 없는 중요한 영양분을 공급하는 단백질을 암호화한다.
벡터의 복제를 이.콜라이에서 수행할 수 있다. 이.콜라이-선택성 마커의 예는 항생제 암피실린에 내성을 부여하는 β-락타마제 유전자이다. 상기 선택성 마커를 이.콜라이 플라스미드, 예를 들어 pBR322 또는 pUC 플라스미드, 예를 들어 pUC18 또는 pUC19, 또는 pUC119로부터 수득할 수 있다.
본 발명의 벡터는 하나 이상의 스위치, 예를 들어 유도성 또는 억제성 스위치, 예를 들어 아라비노스 또는 란타늄 민감성 스위치를 포함할 수 있다. 벡터는 또한 하나 이상의 상이한/동일한 프로모터를 포함할 수 있다.
프로모터
벡터는 숙주 미생물에 의해 인식되는 프로모터를 함유할 수 있다. 프로모터를 관심 암호화 서열에 작동적으로 연결시킬 수 있다. 상기와 같은 프로모터는 유도성이거나 구성적일 수 있다. 폴리뉴클레오티드는 상기 폴리뉴클레오티드가 의도된 방식으로 기능하도록 하는 관계로 놓일 때 작동적으로 연결된다.
상이한 프로모터를 사용하여 유전자의 발현을 구동할 수 있다. 예를 들어, 일시적인 유전자 발현(즉 비-구성적으로 발현된다)을 원하는 경우, 발현을 유도성 프로모터에 의해 구동할 수 있다.
일부의 경우에, AlsS 유전자는 일시적으로 발현된다. 즉, AlsS 유전자는 구성적으로 발현되지 않는다. AlsS 유전자의 발현을 유도성 또는 억제성 프로모터에 의해 구동할 수 있다. 유도성 또는 억제성 프로모터의 예는 비제한적으로 (a) 당, 예를 들어 아라비노스 및 락토스(또는 비대사성 유사체, 예를 들어 이소프로필 β-D-1-티오갈락토피라노시드(IPTG)); (b) 금속, 예를 들어 란타늄, 구리, 칼슘; (c) 온도; (d) 질소원; (e) 산소; (f) 세포 상태(생육 또는 정지); (g) 대사산물, 예를 들어 포스페이트; (h) CRISPRi; (i) jun; (j) fos, (k) 메탈로티오네인 및/또는 (l) 열 충격에 의해 유도성이거나 억제성인 프로모터를 포함한다. 상기 프로모터를 메탄영양체 시스템에 사용할 수 있다. 메탄영양체내에서 사용될 수 있는 유도성 프로모터의 일례는 pBAD 프로모터 또는 pMxaF 프로모터이다.
특히 유용할 수 있는 유도성 또는 억제성 프로모터는 당 및 희토 금속 스위치이다. 예를 들어, 당 아라비노스에 민감한 프로모터를 유도성 스위치로서 사용할 수 있다. 일부의 경우에, 아라비노스 스위치를 사용하여 하나 이상의 유전자의 발현을 구동할 수 있다. 예를 들어, 아라비노스의 존재하에서 2,3-BDO 생성 기구가 "켜"질 수 있다. 아라비노스 스위치는 아세토인 리덕타제의 발현을 켤 수 있다. 아라비노스 스위치는 또한 알파-아세토락테이트 데카복실라제(budA)의 발현을 켤 수 있다. 아라비노스 스위치는 또한 아세토락테이트 신타제(AlsS)의 발현을 켤 수 있다.
다른 특히 유용한 스위치는 희토 금속 스위치, 예를 들어 란타늄 스위치(또는 세륨, 프라세오디뮴, 또는 네오디뮴 스위치)일 수 있다. 일부의 경우에, 희토 금속(예를 들어 란타늄, 세륨, 프라세오디뮴, 또는 네오디뮴) 스위치는, 리프레서가 제거될 때까지 하나 이상의 유전자의 발현을 억제하는데 사용될 수 있는 억제성 스위치일 수 있으며, 상기 제거 후에 상기 유전자가 "켜"진다. 예를 들어, 금속 란타늄의 존재하에서 2,3-BDO 생성 기구를 "끌" 수 있다. 란타늄 스위치를, 배지로부터 상기 란타늄을 제거하거나 배지 중에서 란타늄을, 그의 억제 효과가 감소되거나, 최소화되거나 제거되는 수준으로 희석함으로써 끌 수 있다(및 유전자의 발현을 유도할 수 있다). 일부의 경우에, 희토 금속(예를 들어 란타늄, 세륨, 프라세오디뮴, 또는 네오디뮴) 스위치는 NADPH-의존성 아세토인 리덕타제의 발현을 조절할 수 있다. 희토 금속(예를 들어 란타늄, 세륨, 프라세오디뮴, 또는 네오디뮴) 스위치를 사용하여 알파-아세토락테이트 데카복실라제(budA)의 발현을 조절할 수 있다. 추가로, 희토 금속(예를 들어 란타늄, 세륨, 프로세오디뮴, 또는 네오디뮴) 스위치를 사용하여 아세토락테이트 신타제(AlsS)의 발현을 조절할 수 있다.
구성적으로 발현된 프로모터를 또한 본 명세서에서 벡터 시스템에 사용할 수 있다. 예를 들어, NADPH- 또는 NADH-의존성 아세토인 리덕타제 및/또는 알파-아세토락테이트 데카복실라제의 발현을 구성적으로 활성인 프로모터에 의해 조절할 수 있다. 상기와 같은 프로모터의 예는 비제한적으로 pMxaF 및 p.Bba.J23111을 포함한다.
원핵생물 숙주에 사용하기에 적합한 프로모터는 예를 들어 a-락타마제 및 락토스 프로모터 시스템, 알칼리성 포스파타제, 트립토판(trp) 프로모터 시스템, 에리쓰로마이신 프로모터, 아프라마이신 프로모터, 하이그로마이신 프로모터, 메틸레노마이신 프로모터 및 하이브리드 프로모터, 예를 들어 tac 프로모터를 포함할 수 있다. 세균 시스템에 사용하기 위한 프로모터는 또한 일반적으로 암호화 서열에 작동적으로 연결된 샤인-달가노 서열을 함유할 것이다.
일반적으로, 강한 프로모터를 사용하여 목적하는 생성물의 높은 수준의 전사 및 발현을 제공할 수 있다.
전사 단위의 하나 이상의 프로모터는 유도성 프로모터일 수 있다. 예를 들어, GFP를 구성 프로모터로부터 발현시킬 수 있는 반면 유도성 프로모터는 본 명세서에 개시된 바와 같은 하나 이상의 효소를 암호화하는 유전자 및/또는 증폭가능한 선택성 마커의 전사를 구동하는데 사용된다.
일부 벡터는 세균에서 벡터의 전파를 촉진하는 원핵생물 서열을 함유할 수 있다. 따라서, 벡터는 다른 성분, 예를 들어 복제 기원(예를 들어 하나 이상의 선택된 미생물 중에서 벡터를 복제할 수 있게 하는 핵산 서열), 세균 중 선택을 위한 항생제 내성 유전자, 및/또는 코돈을 통한 판독을 위해 번역을 허용할 수 있는 앰버 정지 코돈을 가질 수 있다. 추가적인 선택성 유전자(들)를 또한 통합시킬 수 있다. 일반적으로, 클로닝 벡터에서, 복제 기원은 숙주 염색체 DNA와 독립적으로 벡터를 복제할 수 있게 하는 것이며, 복제 기원 또는 자율적으로 복제하는 서열을 포함한다. 상기와 같은 서열은 세균 중의 ColE1 복제 기원 또는 다른 공지된 서열을 포함할 수 있다.
유전자
전체를 통해 기재된 벡터는 i) 아세토인 리덕타제(NADPH-의존성 및/또는 NADH-의존성); ii) 알파-아세토락테이트 데카복실라제; 및/또는 iii) 아세토락테이트 신타제(AlsS)를 암호화하는 하나 이상의 유전자의 핵산 서열을 포함할 수 있다. 예를 들어 벡터는 NADPH- 또는 NADH-의존성 아세토인 리덕타제 유전자를 포함할 수 있다. 벡터는 알파-아세토락테이트 데카복실라제 유전자를 포함할 수 있다. 벡터는 아세토락테이트 신타제 유전자를 포함할 수 있다. 이들 벡터는 또한 벡터내 유전자의 발현을 조절하는 하나 이상의 조절 요소(유도성 및/또는 억제성 프로모터)를 함유할 수 있다. 일부의 경우에, 사용될 수 있는 스위치는 비제한적으로 유도성 또는 억제성 스위치, 예를 들어 아라비노스 또는 란타늄 스위치를 포함한다. 이들 유전자는 벡터와 접촉하는(결국에는 형질전환되는) 미생물에 이종성일 수 있다. 일부의 경우에, 이들 유전자는 에피솜 벡터 중에 있을 수 있다. 일부의 경우에, 벡터는 하나 이상을 미생물의 게놈내에 통합시키는데 사용될 수 있는 것일 수 있다. 일부의 경우에, 에피솜 벡터 및 통합 벡터를 모두 사용할 수 있다. 일부의 경우에, 이종 아세토락테이트 신타제를 암호화하는 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 유전자의 순서는 미생물과의 접촉 전에, 상기 접촉 중에, 또는 상기 접촉 후에 벡터상에 존재할 수 있다. 예를 들어, 유전자는 미생물과의 접촉 전에 벡터상의 임의의 다른 이종 유전자와 관련하여 5'일 수 있다. 유전자를 미생물과 접촉 후에, 상기 유전자가 벡터상의 임의의 다른 유전자와 관련하여 3'이거나 또는 벡터상의 임의의 다른 이종 유전자와 관련하여 3'도 5'도 아닌 상기 미생물의 게놈 위치에 상기 유전자를 삽입할 수 있다. 일부의 경우에, 유전자는 벡터상의 임의의 다른 유전자와 관련하여 5'으로 남아있을 수 있다. 예를 들어, 벡터를 유전자들의 순서가 변경될 수 있도록 하는 방식으로 미생물내에서 변형시킬 수 있다. 일부의 경우에, 유전자를 미생물과 접촉 후에, 상기 유전자가 벡터상의 임의의 다른 유전자와 관련하여 3'이거나 또는 벡터상의 임의의 다른 유전자와 관련하여 3'도 5'도 아닌 위치에 있는 벡터에 상기 유전자를 삽입할 수 있다. 일부의 경우에, 유전자들의 특정한 순서는 하나 이상의 이종 유전자(들)를 미생물의 게놈내에 삽입한 후에 성취될 수 있다. 예를 들어, 미생물의 게놈내에서 특정한 유전자 순서를 성취하기 위해 상이한 통합 벡터를 사용할 수 있다. 일부의 경우에, 유전자의 순서를, 이종 유전자를 미생물의 게놈내에 삽입한 후에 측정할 수 있다.
일부의 경우에, 벡터는 i) 아세토인 리덕타제(NADPH-의존성 및/또는 NADH-의존성); ii) 알파-아세토락테이트 데카복실라제; 및/또는 iii) 아세토락테이트 신타제(AlsS)를 암호화하는 2개 이상의 유전자를 포함할 수 있다. 예를 들어 벡터는 NADPH- 또는 NADH-의존성 아세토인 리덕타제를 포함할 수 있다. 이 경우에, 유전자 중 하나 이상은 벡터와 접촉하는(결국에는 형질전환되는) 미생물에 이종성일 수 있다. 일부의 경우에, 이들 유전자는 에피솜 벡터 중에 있을 수 있다. 일부의 경우에, 벡터는 하나 이상을 미생물의 게놈내에 통합시키는데 사용될 수 있는 것일 수 있다. 일부의 경우에, 이들 유전자는 에피솜 벡터뿐만 아니라 통합 벡터 중에 있을 수 있다. 일부의 경우에, 이종 아세토락테이트 신타제를 암호화하는 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다.
하나의 경우에, 벡터는 NADPH- 및/또는 NADH-의존성 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및 아세토락테이트 신타제를 암호화하는 적어도 3개 이상의 유전자를 포함할 수 있다. 유전자 중 하나 이상은 벡터와 접촉하는(결국에는 형질전환되는) 미생물에 이종성일 수 있다. 일부의 경우에, 이들 유전자는 에피솜 벡터 중에 있을 수 있다. 일부의 경우에, 벡터는 하나 이상을 미생물의 게놈내에 통합시키는데 사용될 수 있는 것일 수 있다. 일부의 경우에, 이들 유전자는 에피솜 벡터뿐만 아니라 통합 벡터 중에 있을 수 있다.
하나의 예에서, 아세토인 리덕타제 유전자는 세균(예를 들어 그람 양성 세균)으로부터 유래한다. 세균은 클로스트리디움 속, 예를 들어 클로스트리디움 아우토에타노게늄 종으로부터 유래할 수 있다.
NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 60%, , 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 60% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 65% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 70% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 75% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 80% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 85% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 90% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 91% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 92% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 93% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 94% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 95% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 96% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 97% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 98% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10에 적어도 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADPH-의존성 아세토인 리덕타제 유전자는 서열번호 10인 뉴클레오티드 서열을 포함할 수 있다.
NADH-의존성 아세토인 리덕타제를 원하는 경우, NADH-의존성 아세토인 리덕타제 유전자는 세균(예를 들어 그람 양성 세균)으로부터 유래할 수 있다. 상기와 같은 세균의 예로는 바실러스 속, 예를 들어 바실러스 서브틸리스 종, 및 파에니바실러스 속, 예를 들어 파에니바실러스 폴리믹사 종으로부터 유래하는 것들을 포함한다.
NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 65% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 70% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 75% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 80% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 85% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 90% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 91% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 92% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 93% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 94% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 95% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 96% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 97% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 98% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 적어도 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, NADH-의존성 아세토인 리덕타제 유전자는 서열번호 12 또는 14에 일치하는 뉴클레오티드 서열을 포함할 수 있다.
알파-아세토락테이트 데카복실라제(budA)를 원하는 경우, 상기 알파-아세토락테이트 데카복실라제 유전자는 세균으로부터 유래할 수 있다. 상기와 같은 세균의 예는 클로스트리디움 속, 예를 들어 클로스트리디움 아우토에타노게늄 종으로부터의 것들, 및 클렙시엘라 속, 예를 들어 클렙시엘라 뉴모니아에 종으로부터의 것들을 포함한다. 상기 알파-아세토락테이트 데카복실라제 유전자는 그람 양성 또는 그람 음성 세균으로부터 유래할 수 있다.
알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 60% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 65% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 70% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 75% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 80% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 85% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 90% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 91% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 92% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 93% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 94% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 95% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 96% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 97% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 98% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 적어도 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 알파-아세토락테이트 데카복실라제 유전자는 서열번호 6 또는 8에 일치하는 뉴클레오티드 서열을 포함할 수 있다.
아세토락테이트 신타제(AlsS)를 원하는 경우, 상기 아세토락테이트 신타제는 세균(예를 들어 그람 양성 세균)으로부터 유래할 수 있다. 상기와 같은 세균의 예는 클로스트리디움 속, 예를 들어 클로스트리디움 아우토에타노게늄 종으로부터의 것들, 및 바실러스 속, 예를 들어 바실러스 서브틸리스 종으로부터의 것들을 포함한다. 추가적인 종의 예는 바실러스 리케니포르미스를 포함한다.
아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, 아세토락테이트 신타제는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 60% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 65% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 70% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 75% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 80% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 85% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 90% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 91% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 92% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 93% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 94% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 95% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 96% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 97% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 98% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 적어도 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 아세토락테이트 신타제 유전자는 서열번호 2, 4 또는 20 중 어느 하나에 일치하는 뉴클레오티드 서열을 포함할 수 있다.
발효에 의해 다른 목적하는 최종 생성물을 제조하기 위해서 미생물 내부에 추가적인 유전자를 넣을 수 있다.
뉴클레오티드 서열(또는 보다 구체적으로 상기 뉴클레오티드 서열에 의해 암호화되는 코돈)을 상기 뉴클레오티드 서열이 발현될 미생물을 기준으로 최적화할 수 있다. 뉴클레오티드 서열을 각각의 개별적인 미생물내에서 이용가능한 tRNA의 양을 기준으로 코돈 최적화할 수 있다. 즉, 보존적 코돈 치환을, 각각의 미생물이 전형적으로 특정한 코돈을 사용하는 지의 여부 또는 얼마나 많은 특정 tRNA가 상기 미생물내에서 이용가능한 지를 기준으로 만들 수 있다.
유전자 복제수
전체를 통해 개시된 유전자 중 어느 유전자든 상기 유전자(통합되든, 에피솜 발현되든, 둘 다이든 간에)의 하나 이상의 사본을 가질 수 있다. 예를 들어, 각각의 아세토인 리덕타제(NADPH-의존성 및/또는 NADH-의존성); ii) 알파-아세토락테이트 데카복실라제; 및/또는 iii) 아세토락테이트 신타제(AlsS)는 유전자의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 그 이상의 사본을 가질 수 있다. 일부의 경우에, 유전자 복제수는 1이다. 일부의 경우에, 유전자 복제수는 2이다. 일부의 경우에, 유전자 복제수는 3이다. 일부의 경우에, 유전자 복제수는 4이다. 일부의 경우에, 유전자 복제수는 5이다. 일부의 경우에, 유전자 복제수는 6이다. 일부의 경우에, 유전자 복제수는 7이다. 일부의 경우에, 유전자 복제수는 8이다. 일부의 경우에, 유전자 복제수는 9이다. 일부의 경우에, 유전자 복제수는 10이다. 일부의 경우에, 유전자 복제수는 11이다. 일부의 경우에, 유전자 복제수는 12이다. 일부의 경우에, 유전자 복제수는 13이다. 일부의 경우에, 유전자 복제수는 14이다. 일부의 경우에, 유전자 복제수는 15이다. 일부의 경우에, 유전자 복제수는 16이다. 일부의 경우에, 유전자 복제수는 17이다. 일부의 경우에, 유전자 복제수는 18이다. 일부의 경우에, 유전자 복제수는 19이다. 일부의 경우에, 유전자 복제수는 20이다. 일부의 경우에, 유전자 복제수는 21이다. 일부의 경우에, 유전자 복제수는 22이다. 일부의 경우에, 유전자 복제수는 23이다. 일부의 경우에, 유전자 복제수는 24이다. 일부의 경우에, 유전자 복제수는 25이다. 전형적으로, 유전자 복제수는 25 사본 이하이나, 일부의 경우에, 더 많을 수 있다. 따라서, 일부의 경우에, 유전자 복제수는 25 초과이다.
더욱이, 전체를 통해 기재된 유전자(예를 들어, 아세토인 리덕타제; 알파-아세토락테이트 데카복실라제; 및/또는 아세토락테이트 신타제) 중 어느 유전자든 동일한 수의 유전자 사본을 가질 수 있다. 예를 들어, 아세토락테이트 신타제를 암호화하는 유전자는 1 내지 25 사본을 가질 수 있고, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자는 1 내지 25 사본을 가질 수 있으며, 아세토인 리덕타제를 암호화하는 유전자는 1 내지 25 사본을 가질 수 있고, 이때 모든 유전자는 같은 수로 존재한다. 일부의 경우에, 전체를 통해 기재된 유전자 중 어느 유전자든 상이한 수의 유전자 사본을 가질 수 있다. 예를 들어, 아세토락테이트 신타제를 암호화하는 유전자는 1 내지 25 사본을 가질 수 있고, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자는 1 내지 25 사본을 가질 수 있으며, 아세토인 리덕타제를 암호화하는 유전자는 1 내지 25 사본을 가질 수 있고, 이때 모든 유전자는 상이한 수로 존재한다. 하나의 특정한 예에서, 아세토락테이트 신타제를 암호화하는 유전자는 5 내지 10 사본을 가질 수 있는 반면, 아세토인 리덕타제를 암호화하는 유전자는 1 내지 6 사본을 가질 수 있는 반면, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자는 3 내지 8 사본을 가질 수 있다. 다시, 전형적으로 유전자 복제수는 임의의 주어진 유전자의 25 사본 이하이다. 그러나, 일부의 경우 상기는 더 많을 수 있다.
임의의 수의 유전자가 통합 벡터, 에피솜 벡터, 또는 이 둘 모두에서 발현될 수 있다. 상기 예와 관련하여, 아세토락테이트 신타제를 암호화하는 유전자는 5 내지 10 사본을 가질 수 있으며, 이때 2 내지 5는 통합될 수 있고 3 내지 5 사본은 에피솜 벡터에서 발현될 수 있다. 상기 예와 관련하여, 아세토인 리덕타제 데카복실라제를 암호화하는 유전자는 1 내지 6 사본을 가질 수 있으며, 이때 1 내지 4 사본은 통합될 수 있고 0 내지 1 사본은 에피솜 벡터에서 발현될 수 있다. 상기 예와 관련하여, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자는 3 내지 8 사본을 가질 수 있으며, 이때 2 내지 6 사본은 통합될 수 있고 1 내지 2 사본은 에피솜 벡터에서 발현될 수 있다.
일부의 경우에, 유전자 사본은 전체 유전자의 부분 서열을 포함할 수 있다. 일부의 경우에, 전체 유전자의 부분 서열은 상기 유전자에 의해 암호화된 효소의 활성 부위를 포함할 수 있다. 전체 유전자 및 상기 유전자의 부분 서열의 임의의 조합이 고려된다. 예를 들어, 전체 유전자의 4 사본 및 상기 유전자의 부분 서열의 2 사본이 존재할 수 있다. 이는 상기 유전자의 6 사본으로 간주될 수 있다.
단리된 핵산
본 명세서에 기재된 유전자는 단리된 다중핵산의 형태로 존재할 수 있다. 즉, 유전자는 자연에 존재하지 않고, 염색체로부터 단리된 형태로 존재할 수 있다. 단리된 다중핵산은 (i) 아세토인 리덕타제(NADPH-의존성 및/또는 NADH-의존성); ii) 알파-아세토락테이트 데카복실라제; 및/또는 iii) 아세토락테이트 신타제(AlsS)를 암호화하는 하나 이상의 유전자의 핵산 서열을 포함할 수 있다. 예를 들어, 단리된 다중핵산은 NADPH-의존성 및/또는 NADH-의존성 아세토인 리덕타제 유전자를 포함할 수 있다. 단리된 다중핵산은 알파-아세토락테이트 데카복실라제 유전자를 포함할 수 있다. 단리된 다중핵산은 아세토락테이트 신타제 유전자를 포함할 수 있다.
일부의 경우에, 단리된 다중핵산은 NADPH-의존성 아세토인 리덕타제 유전자를 암호화할 수 있는 뉴클레오티드 서열을 포함할 수 있다. 예를 들어 단리된 다중핵산은 서열번호 10에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 60% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 65% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 70% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 75% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 80% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 81% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 82% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 83% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 84% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 85% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 86% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 87% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 88% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 89% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 90% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 91% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 92% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 93% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 94% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 95% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 96% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 97% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 98% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10에 적어도 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 10인 뉴클레오티드 서열을 포함할 수 있다.
일부의 경우에, 단리된 다중핵산은 NADH-의존성 아세토인 리덕타제를 암호화할 수 있는 뉴클레오티드 서열을 포함할 수 있다. 예를 들어 단리된 다중핵산은 서열번호 12 또는 14에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 NADH-의존성 아세토인 리덕타제를 암호화할 수 있다. 예를 들어, 단리된 다중핵산은 서열번호 12 또는 14에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 60% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 65% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 70% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 75% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 80% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 81% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 82% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 83% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 84% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 85% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 86% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 87% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 88% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 89% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 90% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 91% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 92% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 93% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 94% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 95% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 96% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 97% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 98% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 적어도 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 12 또는 14에 일치하는 뉴클레오티드 서열을 포함할 수 있다.
일부의 경우에, 단리된 다중핵산은 알파-아세토락테이트 데카복실라제를 암호화하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 60% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 65% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 70% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 75% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 80% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 81% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 82% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 83% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 84% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 85% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 86% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 87% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 88% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 89% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 90% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 91% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 92% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 93% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 94% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 95% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 96% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 97% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 98% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 적어도 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 6 또는 8에 일치하는 뉴클레오티드 서열을 포함할 수 있다.
일부의 경우에, 단리된 다중핵산은 아세토락테이트 신타제를 암호화하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 실질적으로 유사한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 60% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 65% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 70% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 75% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 80% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 81% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 82% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 83% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 84% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 85% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 86% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 87% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 88% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 89% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 90% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 91% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 92% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 93% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 94% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 95% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 96% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 97% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 98% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 적어도 99% 일치하는 뉴클레오티드 서열을 포함할 수 있다. 일부의 경우에, 단리된 다중핵산은 서열번호 2, 4 또는 20 중 어느 하나에 일치하는 뉴클레오티드 서열을 포함할 수 있다.
예시적인 벡터 서열
또한 벡터를 본 명세서에 개시한다. 상기 벡터를 다양한 미생물, 예를 들어 본 명세서에 개시된 메탄영양체에 통합시킬 수 있다(예를 들어 서열번호 15 내지 18 중 어느 하나). 일부의 경우에, 이들 벡터를 에피솜 발현시킬 수 있다. 일부의 경우에, 이들 벡터를 통합시키고 에피솜 발현시킬 수 있다. 일부의 경우에, 벡터의 유효성 또는 벡터가 생성시킬 수 있는 효소의 양을 현저하게 변화시키지 않으면서 벡터에 대해 부수적인 변화를 수행할 수 있다. 따라서, 벡터는 서열번호 15 내지 18 중 어느 하나에 실질적으로 유사할 수 있다.
일부의 경우에, 서열번호 15 또는 상기에 실질적으로 유사한 서열의 발현 카세트를 미생물과 접촉(및 상기 미생물내에 삽입)시킬 수 있다. 상기 발현 카세트는 pBAD 프로모터; g.Bsu AlsS 유전자(개시자 ATG 및 종결자 TAA를 포함한다); 리보솜 결합 부위 rbsGTW001; g.Kpn BudA 유전자(개시자 ATG 및 종결자 TGA를 포함한다); 종결자 rrnB; pmxaF 프로모터; g. Cau ButA 유전자(개시자 ATG 및 종결자 TGA를 포함한다) 및 종결자 람다 T0를 포함한다. 일단 미생물(예를 들어 메탄영양체)이 상기 발현 카세트로 형질전환되면, 상기 미생물을 균주 XZ58이라 칭한다. 일부의 경우에, g.Bsu AlsS 유전자를 g.Blic_AlsS 유전자(예를 들어 서열번호 20) 대신 치환시킬 수 있다.
일부의 경우에, 서열번호 16 또는 상기에 실질적으로 유사한 서열의 발현 카세트를 미생물과 접촉(및 상기 미생물내에 삽입)시킬 수 있다. 상기 발현 카세트는 pBAD 프로모터; g.Bsu AlsS 유전자(개시자 ATG 및 종결자 TAA를 포함한다); 리보솜 결합 부위 rbsGTW001; g.Kpn BudA 유전자(개시자 ATG 및 종결자 TGA를 포함한다); 종결자 rrnB; pmxaF 프로모터; g. Bsu ButA 유전자(개시자 ATG 및 종결자 TGA를 포함한다) 및 종결자 람다 T0를 포함한다. 일단 미생물(예를 들어 메탄영양체)이 상기 발현 카세트로 형질전환되면, 상기 미생물을 균주 XZ59라 칭한다. 일부의 경우에, g.Bsu AlsS 유전자를 g.Blic_AlsS 유전자(예를 들어 서열번호 20) 대신 치환시킬 수 있다.
일부의 경우에, 서열번호 17 또는 상기에 실질적으로 유사한 서열의 발현 카세트를 미생물과 접촉(및 상기 미생물내에 삽입)시킬 수 있다. 상기 발현 카세트는 pBAD 프로모터; g.Bsu AlsS 유전자(개시자 ATG 및 종결자 TAA를 포함한다); 리보솜 결합 부위 rbsGTW001; g.Kpn BudA 유전자(개시자 ATG 및 종결자 TGA를 포함한다); 추가적인 리보솜 결합 부위 rbsGTW001; 종결자 rrnB; pmxaF 프로모터; g. Cau ButA 유전자(개시자 ATG 및 종결자 TGA를 포함한다) 및 종결자 rrnB를 포함한다. 일단 미생물(예를 들어 메탄영양체)이 상기 발현 카세트로 형질전환되면, 상기 미생물을 균주 XZ06이라 칭한다. 일부의 경우에, g.Bsu AlsS 유전자를 g.Blic_AlsS 유전자(예를 들어 서열번호 20) 대신 치환시킬 수 있다.
일부의 경우에, 서열번호 18 또는 상기에 실질적으로 유사한 서열의 발현 카세트를 미생물과 접촉(및 상기 미생물내에 삽입)시킬 수 있다. 상기 발현 카세트는 pBAD 프로모터; g.Bsu AlsS 유전자(개시자 ATG 및 종결자 TAA를 포함한다); 리보솜 결합 부위 rbsGTW001; g.Kpn BudA 유전자(개시자 ATG 및 종결자 TGA를 포함한다); 추가적인 리보솜 결합 부위 rbsGTW001; 종결자 rrnB; pmxaF 프로모터; g. Bsu ButA 유전자(개시자 ATG 및 종결자 TGA를 포함한다) 및 종결자 rrnB를 포함한다. 일단 미생물(예를 들어 메탄영양체)이 상기 발현 카세트로 형질전환되면, 상기 미생물을 균주 XZ08이라 칭한다. 일부의 경우에, g.Bsu AlsS 유전자를 g.Blic_AlsS 유전자(예를 들어 서열번호 20) 대신 치환시킬 수 있다.
III. 유전자 변형된 미생물의 제조 방법
전체를 통해 개시된 유전자 변형된 미생물을 다양한 방식에 의해 제조할 수 있다. 미생물을, 2,3-BDO, MEK 및/또는 부타디엔의 생성 경로에서 발효가능한 탄소원(예를 들어 C1 탄소)의 하나 이상의 중간체로의 전환을 촉진하도록 경로 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함시키고/시키거나 발현시키는 임의의 방식에 의해 변형시킬 수 있다(예를 들어 유전자 조작할 수 있다). 상기와 같은 효소는 아세토락테이트 신타제, 알파-아세토락테이트 데카복실라제, 및 아세토인 리덕타제를 포함할 수 있다. 예를 들어, 상기 유전자 중 어느 하나의 하나 이상을 미생물에 삽입할 수 있다. 유전자를 발현 벡터에 의해 삽입할 수 있다. 유전자는 또한 하나 이상의 상이한/동일한 프로모터의 조절하에 있거나, 또는 하나 이상의 유전자는 스위치, 예를 들어 유도성 또는 억제성 프로모터, 예를 들어 아라비노스 또는 란타늄 민감성 스위치의 조절하에 있을 수 있다. 유전자를 또한 미생물의 게놈내에 안정하게 통합시킬 수 있다. 일부의 경우에, 유전자를 에피솜 벡터에서 발현시킬 수 있다. 일부의 경우에, 유전자를 미생물의 게놈에 통합시킬 수 있다. 일부의 경우에, 이들 유전자를 에피솜 벡터에서 발현시킬 뿐만 아니라 미생물의 게놈내에 통합시킬 수 있다. 일부의 경우에, 아세토락테이트 신타제를 암호화하는 유전자는 벡터상의 임의의 다른 유전자와 관련하여 5'이다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 유전자는 벡터상의 임의의 다른 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자는 벡터상의 임의의 다른 유전자와 관련하여 5'도 3'도 아니다. 유전자의 순서는 미생물과의 접촉 전에, 상기 접촉 중에 또는 상기 접촉 후에 벡터상에 존재할 수 있다. 예를 들어, 유전자는 미생물과의 접촉 전에 벡터상의 임의의 다른 유전자와 관련하여 5'일 수 있다. 그러나, 유전자를 미생물과 접촉 후에, 하나의 위치에 삽입하거나, 또는 또 다른 유전자를, 상기 유전자가 벡터상의 임의의 다른 유전자와 관련하여 5'도 3'도 아닌 벡터내에 삽입할 수 있다. 예를 들어, 벡터를 유전자의 순서를 변경시킬 수 있는 바와 같은 방식으로 미생물내에서 변형시킬 수 있다. 일부의 경우에, 유전자의 특정한 순서를, 하나 이상의 이종 유전자(들)가 미생물의 게놈내에 삽입된 후에 성취할 수 있다. 예를 들어, 미생물의 게놈내에서 특정한 유전자 순서를 성취하기 위해 상이한 통합 벡터를 사용할 수 있다. 일부의 경우에, 유전자의 순서를 상기 유전자를 미생물의 게놈에 삽입한 후에 측정할 수 있다.
상기 방법에 사용되는 미생물은 비제한적으로 원핵생물을 포함하여, 상술한 바와 같을 수 있다. 다른 미생물, 예를 들어 세균, 효모 또는 조류를 사용할 수 있다. 특히 중요한 미생물은 메탄영양체, 예를 들어 메틸로박터, 메틸로미크로비움, 메틸로모나스, 메틸로칼듐, 메틸로코커스, 메틸로소마, 메틸로사르시나, 메틸로써무스, 메틸로할로비우스, 메틸로가에아, 메틸로불륨, 크레노트릭스, 클로노트릭스, 메틸로스파에라, 메틸로카프사, 메틸로셀라, 메틸로시누스, 메틸로시스티스, 또는 메틸로아시도필룸 속으로부터의 것을 포함한다. 하나의 바람직한 종은 메틸로코커스 캅술라투스를 포함할 수 있다.
본 명세서에 개시된 유전자 변형된 미생물의 예시적인 제조 방법은 미생물을, i) 아세토인 리덕타제(예를 들어 NADPH- 또는 NADH-의존성); ii) 알파-아세토락테이트 데카복실라제(budA); iii) 아세토락테이트 신타제, 또는 iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 발현하는 핵산과 접촉시킴(또는 형질전환시킴)이다. 미생물은 C1 탄소를 생성물로 전환시킬 수 있는 임의의 미생물일 수 있다. 일부의 경우에, 생성물은 2,3-BDO이다.
NADPH- 또는 NADH-의존성 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제(budA); 및/또는 아세토락테이트 신타제는 상술한 변체 중 어느 하나일 수 있다. 예를 들어 아세토인 리덕타제는 그람 양성 세균, 예를 들어 클로스트리디움 속, 예를 들어 클로스트리디움 아우토에타노게늄 종으로부터 유래할 수 있다.
미생물에 삽입되는 유전자는 상기 미생물 자체에 이종성일 수 있다. 예를 들어, 미생물이 메탄영양체인 경우, 삽입된 유전자는 예를 들어 효모, 세균, 또는 상이한 종의 메탄영양체로부터 유래할 수 있다. 추가로, 유전자는 미생물의 게놈의 내인성 부분일 수 있다.
유전자를 벡터의 사용을 통해 미생물에 삽입할 수 있다. 일부의 경우에, 유전자를 미생물의 게놈내에 삽입할 수 있다. 일부의 경우에, 2개 이상의 유전자를 미생물에 삽입하는 경우 상기 두 기법을 모두 사용할 수 있다. 예를 들어, 유전자를 예를 들어 통합 벡터의 사용에 의해 미생물의 게놈내에 삽입할 수 있다. 후속적으로 추가적인 유전자를 에피솜 벡터를 통해 상기 미생물내로 형질전환시킬 수 있다. 일부의 경우에, 벡터는 특정한 순서의 유전자를 나타낼 수 있다. 예를 들어, 일부의 경우에 벡터는 벡터상의 임의의 다른 유전자와 관련하여 5'인, 아세토락테이트 신타제를 암호화하는 유전자를 포함할 수 있다. 일부의 경우에, 벡터는 벡터상의 임의의 다른 유전자와 관련하여 3'인, 아세토인 리덕타제를 암호화하는 유전자를 포함할 수 있다. 일부의 경우에, 벡터는 벡터상의 임의의 다른 유전자와 관련하여 5'도 3'도 아닌, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자를 포함할 수 있다.
일부의 경우에, 전체를 통해 기재된 방법에 의해 제조된 유전자 변형된 미생물은 보다 높은 온도에서 발효시 보다 높은 역가로 목적하는 생성물을 생성시킬 수 있다. 예를 들어, 유전자 변형된 미생물을 37℃ 초과의 온도에서(그러나 100℃의 온도를 초과하지 않는) 배양시 더 높은 역가의 생성물, 예를 들어 2,3-BDO, 부타디엔, 및/또는 MEK를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 37℃에 비해 42℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 37℃에 비해 41℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 45℃에 비해 42℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 45℃에 비해 41℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형된 미생물을 45℃에 비해 37℃에서 배양시 더 높은 생성물 역가를 생성하도록 만들 수 있다. 일부의 경우에, 유전자 변형은 보다 높은 온도에 대해 증가된 관용/선호를 생성시킨다.
유전자 변형 기법
본 명세서에 개시된 미생물을 고전적인 미생물학적 기법을 사용하여 유전자 조작할 수 있다. 상기와 같은 기법 중 일부는 예를 들어 문헌[Sambrook et al, 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press]에 일반적으로 개시되어 있다.
본 명세서에 개시된 유전자 변형된 미생물은 상기와 같은 변형이 상기 미생물내에서 본 명세서에 제공된 바와 같은 하나 이상의 효소의 목적하는 발현 효과(예를 들어 과발현)를 제공하도록 하는 방식으로 삽입되거나, 결실되거나 변형된(즉 예를 들어 뉴클레오티드의 삽입, 결실, 치환 및/또는 역위에 의해 돌연변이된) 폴리뉴클레오티드를 포함할 수 있다. 유전자 발현 또는 기능의 증가를 생성시키는 유전자 변형을 유전자의 증폭, 과생산, 과발현, 활성화, 증대, 부가, 또는 상향조절이라 칭할 수 있다. 유전자 발현을 증가시키기 위한 유전자의 부가는 상기 유전자(들)를 복제 플라스미드상에서 유지시키거나 또는 클로닝된 유전자(들)를 생산 미생물의 게놈내에 통합시킴을 포함할 수 있다. 더욱 또한, 목적하는 유전자의 발현의 증가는 클로닝된 유전자(들)를 고유 또는 이종성 전사 조절 요소에 작동적으로 연결시킴을 포함할 수 있다.
목적하는 경우, 본 명세서에 제공된 효소 중 하나 이상의 발현을, 발효 중에 시간-의존적인 방식으로 효소 발현을 직접적으로 또는 간접적으로 조절하는 조절 서열의 조절하에 둔다. 일부의 경우에, 유도성 프로모터를 사용하여 이를 성취할 수 있다.
일부의 경우에, 미생물을 유전자 비히클, 예를 들어 본 명세서에 제공된 효소를 암호화하는 이종 폴리뉴클레오티드 서열을 포함하는 발현 벡터로 형질전환시키거나 형질감염시킨다. 일부의 경우에, 벡터(들)가 에피솜 벡터일 수 있거나, 유전자 서열을 미생물의 게놈에 통합시킬 수 있거나, 또는 이들의 임의의 조합일 수 있다. 일부의 경우에, 본 명세서에 제공된 효소를 암호화하는 이종 폴리뉴클레오티드 서열을 포함하는 벡터를 미생물의 게놈에 통합시킨다.
구조물 또는 발현 벡터로부터의 본 명세서에 개시된 바와 같은 효소를 암호화하는 상이한 유전자의 삽입 및 발현을 용이하게 하기 위해서, 상기 구조물을, 본 명세서에 개시된 임의의 효소를 암호화하는 임의의 유전자의 삽입을 위한 적어도 하나의 클로닝 부위를 갖도록 설계할 수 있다. 클로닝 부위는 예를 들어 다중 제한 부위를 함유하는 다중 클로닝 부위일 수 있다.
형질감염
표준 형질감염 기법을 사용하여 유전자를 미생물에 삽입할 수 있다. 본 명세서에 사용되는 바와 같이, "형질감염" 또는 "형질전환"이란 용어 및 이들의 문법적 등가어는 외인성 핵산 또는 폴리뉴클레오티드의 숙주 세포내로의 삽입을 지칭할 수 있다. 외인성 핵산 또는 폴리뉴클레오티드를 비-통합 벡터, 예를 들어 플라스미드 또는 에피솜 벡터로서 유지시키거나, 또는 한편으로 숙주 세포 게놈에 통합시킬 수 있다. 형질감염시킴 또는 형질감염이란 용어는 핵산 또는 폴리뉴클레오티드의 미생물내로의 모든 통상적인 도입 기법을 포함하고자 한다. 형질감염 기법의 예는 비제한적으로 칼슘 포스페이트 침전, DEAE-덱스트란-매개된 형질감염, 리포펙션, 일렉트로포레이션, 미세주입, 루비듐 클로라이드 또는 다중양이온 매개된 형질감염, 원형질체 융합, 및 초음파처리를 포함한다. 특정한 숙주 세포주 및 유형에서 구조물의 최적의 형질감염 빈도 및 발현을 제공하는 형질감염 방법이 유리하다. 안정한 형질감염체를 위해서, 구조물을 숙주 염색체내에서 안정하게 유지되도록 통합시킨다. 일부의 경우에, 바람직한 형질감염은 안정한 형질감염이다. 일부의 경우에, 유전자의 통합은 미생물의 게놈내 특정한 유전자좌에서 일어난다.
형질전환
발현 벡터 또는 다른 핵산을 임의의 다수의 적합한 방법에 의해 선택된 미생물에 도입시킬 수 있다. 예를 들어, 벡터 구조물을 적합한 세포에, 플라스미드 벡터에 대한 임의의 다수의 형질전환 방법에 의해 도입시킬 수 있다. 표준 칼슘-클로라이드-매개된 세균 형질감염이, 네이키드 DNA를 세균에 도입시키는데 여전히 통상적으로 사용되지만(예를 들어 문헌[Sambrook et al, 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.]을 참조하시오), 일렉트로포레이션 및 접합을 또한 사용할 수도 있다(예를 들어 문헌[Ausubel et al, 1988, Current Protocols in Molecular Biology, John Wiley & Sons, Inc., NY, N.Y.]을 참조하시오).
벡터 구조물의 효모 또는 다른 진균 세포로의 도입을 위해서, 화학적 형질전환 방법을 사용할 수 있다(예를 들어 문헌[Rose et al, 1990, Methods in Yeast Genetics, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.]을 참조하시오). 형질전환된 세포를 사용된 선택성 마커에 적합한 선택성 배지상에서 단리할 수 있다. 한편으로, 또는 추가로, 플레이트 또는 플레이트로부터 들어올린 필터를 GFP 형광에 대해 스캐닝하여 형질전환된 클론을 식별할 수 있다.
몇몇 유형의 세포에의 차별적으로 발현된 서열을 포함하는 벡터의 도입의 경우, 사용되는 방법은 상기 벡터의 형태에 따라 변할 수 있다. 플라스미드 벡터를 임의의 다수의 형질감염 방법, 예를 들어 지질-매개된 형질감염("리포펙션"), DEAE-덱스트란-매개된 형질감염, 일렉트로포레이션 또는 칼슘 포스페이트 침전에 의해 도입시킬 수 있다(예를 들어 문헌[Ausubel et al, 1988, Current Protocols in Molecular Biology, John Wiley & Sons, Inc., NY, N.Y.]을 참조하시오).
광범위하게 다양한 형질전환된 및 비-형질전환된 또는 1차 세포의 일시적인 형질감염에 적합한 리포펙션 시약 및 방법은 광범위하게 입수가능하며, 이는 리포펙션을, 배양시 진핵생물, 및 특히 포유동물 세포로의 구조물의 도입에 매력적인 방법으로 만든다. 다수의 회사가 상기 유형의 형질감염을 위한 키트 및 방법을 제공한다.
숙주 세포는 목적하는 단백질을 암호화하는 구조물을 발현하고, 상기 단백질을 가공하고, 분비된 단백질을 분비를 위한 세포 표면으로 수송할 수 있다. 가공은 동시-번역 및 번역-후 변형, 예를 들어 리더 펩티드 절단, GPI 부착, 글리코실화, 유비퀴틴화, 및 디설파이드 결합 형성을 포함한다.
미생물을 본 명세서에 개시된 바와 같은 하나 이상의 효소를 암호화하는 상술한 발현 벡터 또는 폴리뉴클레오티드로 형질전환 또는 형질감염시키고 특정한 미생물에 적합한 대로 변형된 배양 배지에서 배양하여, 프로모터를 유도하거나, 형질전환체를 선택하거나, 목적하는 서열을 암호화하는 유전자를 증폭시킬 수 있다. 일부의 경우에, 일렉트로포레이션 방법을 사용하여 발현 벡터를 전달할 수 있다.
벡터(및 상기 벡터 중에 함유된 유전자)의 발현을 발현 분석, 예를 들어 qPCR에 의해 또는 RNA의 수준을 측정함으로써 확인할 수 있다. 발현 수준은 또한 복제수를 가리킬 수 있다. 예를 들어, 발현 수준이 대단히 높은 경우, 이는 하나 초과의 유전자 사본이 게놈 중에 통합되었음을 가리킬 수 있다. 한편으로, 높은 발현은 유전자가 고도로 전사된 영역에, 예를 들어 고도로 발현된 프로모터 부근에 통합되었음을 가리킬 수 있다. 발현을 또한 예를 들어 웨스턴 블럿팅을 통해 단백질 수준을 측정함으로써 확인할 수 있다.
CRISPR/cas 시스템
전체를 통해 개시된 방법은 유전자의 핀포인트 삽입 또는 유전자(또는 유전자 부분)의 결실을 수반할 수 있다. 본 명세서에 기재된 방법은 CRISPR/cas 시스템을 사용할 수 있다. 예를 들어, 이중가닥 중단(DSB)을 CRISPR/cas 시스템, 예를 들어 II형 CRISPR/cas 시스템을 사용하여 생성시킬 수 있다. 본 명세서에 개시된 방법에 사용되는 Cas 시스템은 DNA 절단을 촉매화하는 Cas9일 수 있다. 스트렙토코커스 피오게네스로부터의 Cas9 또는 임의의 밀접하게 관련된 Cas9에 의한 효소 작용은, 안내 서열의 20 뉴클레오티드에 하이브리드화하고 표적 서열의 20 뉴클레오티드 다음에 프로토스페이서-인접 동기(PAM)를 갖는 상기 표적 부위 서열에 이중 가닥 중단을 생성시킬 수 있다.
벡터를 CRISPR 효소를 암호화하는 효소-암호화 서열, 예를 들어 Cas 단백질에 작동적으로 연결시킬 수 있다. 사용될 수 있는 Cas 단백질은 1 부류 및 2 부류를 포함한다. Cas 단백질의 비제한적인 예는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas9(또한 Csnl 또는 Csxl2로서 공지됨), CaslO, Csyl, Csy2, Csy3, Csy4, Csel, Cse2, Cse3, Cse4, Cse5e, Cscl, Csc2, Csa5, Csnl, Csn2, Csml, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, CsxlS, Csfl, Csf2, CsO, Csf4, Csdl, Csd2, Cstl, Cst2, Cshl, Csh2, Csal, Csa2, Csa3, Csa4, Csa5, C2cl, C2c2, C2c3, Cpfl, CARF, DinG, 그의 상동체, 또는 그의 변형된 버전을 포함한다. 변형되지 않은 CRISPR 효소, 예를 들어 Cas9는 DNA 절단 활성을 가질 수 있다. CRISPR 효소는 표적 서열에서, 예를 들어 표적 서열 내에서 및/또는 표적 서열의 보체 내에서 하나 또는 2개 가닥 모두의 절단을 지시할 수 있다. 예를 들어, CRISPR 효소는 표적 서열의 첫 번째 또는 마지막 뉴클레오티드로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 300, 400, 500, 또는 그 이상의 염기쌍내에서 하나 또는 2개 가닥 모두의 절단을 지시할 수 있다. 돌연변이된 CRISPR 효소가, 표적 서열을 함유하는 표적 폴리뉴클레오티드의 하나 또는 2개 가닥 모두를 절단하는 능력이 없도록, 상응하는 야생형 효소에 관하여 돌연변이된 CRISPR 효소를 암호화하는 벡터를 사용할 수 있다.
하나 이상의 핵 위치 서열(NLS)을 포함하는 CRISPR 효소를 암호화하는 벡터를 사용할 수 있다. 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 NLS가 사용될 수 있다. CRISPR 효소는 아미노-말단 또는 그 부근에(예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 NLS) 또는 카복시-말단 또는 그 부근에(예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 NLS) NLS, 또는 이들의 임의의 조합(예를 들어 아미노-말단에 하나 이상의 NLS 및 카복시 말단에 하나 이상의 NLS)을 포함할 수 있다. 하나 초과의 NLS가 존재하는 경우, 각각을, 단일 NLS가 하나 초과의 사본 중에 존재하고/하거나 하나 이상의 다른 NLS와 함께 하나 이상의 사본에 존재할 수 있도록 다른 것들과 독립적으로 선택할 수 있다.
상기 방법에 사용되는 CRISPR 효소는 기껏해야 6개의 NLS를 포함할 수 있다. NLS는 상기 NLS에 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 쇄를 따라 50 아미노산 이내에, 예를 들어 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 또는 50 아미노산 이내에 있을 때 N- 또는 C-말단 부근에 있는 것으로 간주된다.
안내 RNA
본 명세서에 사용되는 바와 같이, "안내 RNA"란 용어 및 그의 문법적 등가어는 표적 DNA에 특이적일 수 있고 Cas 단백질과 복합체를 형성할 수 있는 RNA를 지칭할 수 있다. RNA/Cas 복합체는 표적 DNA로 Cas 단백질의 "안내"를 지원할 수 있다.
본 명세서에 개시된 방법은 또한 세포 또는 배아내에 적어도 하나의 안내 RNA 또는 핵산, 예를 들어 적어도 하나의 안내 RNA를 암호화하는 DNA를 도입시킴을 포함할 수 있다. 안내 RNA는 RNA-안내된 엔도뉴클레아제와 상호작용하여 상기 엔도뉴클레아제가 특정한 표적 부위를 향하게 할 수 있으며, 상기 부위에서 상기 안내 RNA 염기의 5' 단부는 염색체 서열 중 특정한 프로토스페이서 서열과 짝을 이룬다.
안내 RNA는 2개의 RNA, 예를 들어 CRISPR RNA(crRNA) 및 전사촉진 crRNA(tracrRNA)를 포함할 수 있다. 안내 RNA는 때때로 단쇄 RNA, 또는 crRNA의 일부(예를 들어 기능성 일부) 및 tracrRNA의 융합에 의해 형성된 단일 안내 RNA(sgRNA)를 포함할 수 있다. 안내 RNA는 또한 crRNA 및 tracrRNA를 포함하는 이중RNA일 수 있다. 더욱 또한, crRNA는 표적 DNA와 하이브리드화할 수 있다.
상기에 논의된 바와 같이, 안내 RNA는 발현 생성물일 수 있다. 예를 들어, 안내 RNA를 암호화하는 DNA는 상기 안내 RNA를 암호화하는 서열을 포함하는 벡터일 수 있다. 안내 RNA를, 세포 또는 미생물을 단리된 안내 RNA 또는 상기 안내 RNA를 암호화하는 서열 및 프로모터를 포함하는 플라스미드 DNA로 형질감염시킴으로써 상기 세포 또는 미생물로 운반할 수 있다. 안내 RNA를 또한 다른 방식으로, 예를 들어 바이러스-매개된 유전자 전달을 사용하여 세포 또는 미생물로 운반할 수 있다.
안내 RNA를 단리할 수 있다. 예를 들어, 안내 RNA를 단리된 RNA의 형태로 세포 또는 미생물내로 형질감염시킬 수 있다. 안내 RNA를 임의의 시험관내 전사 시스템을 사용하여 시험관내 전사에 의해 제조할 수 있다. 안내 RNA를, 안내 RNA에 대한 암호화 서열을 포함하는 플라스미드의 형태보다는 단리된 RNA의 형태로 세포로 운반할 수 있다.
안내 RNA는 3개의 영역: 5' 단부에 염색체 서열 중의 표적 부위에 상보성일 수 있는 제1 영역, 줄기 고리 구조를 형성할 수 있는 제2 내부 영역, 및 단일 가닥일 수 있는 제3 3' 영역을 포함할 수 있다. 각각의 안내 RNA의 제1 영역은 또한, 각각의 안내 RNA가 융합 단백질을 특정한 표적 부위로 안내하도록 상이할 수 있다. 더욱이, 각각의 안내 RNA의 제2 및 제3 영역은 모든 안내 RNA에서 동일할 수 있다.
안내 RNA의 제1 영역은 표적 부위에서 상기 안내 RNA의 제1 영역이 상기 표적 부위와 염기쌍을 이룰 수 있도록 염색체 서열 중의 상기 표적 부위의 서열에 상보성일 수 있다. 일부의 경우에, 안내 RNA의 제1 영역은 10 뉴클레오티드 또는 25 뉴클레오티드(즉 10 nt 내지 25 nt; 또는 10 nt 내지 25 nt; 또는 10 nt 내지 25 nt; 또는 10 nt 내지 25 nt) 이상을 포함할 수 있다. 예를 들어, 안내 RNA의 제1 영역과 염색체 서열 중 표적 부위간의 염기 짝짓기 영역은 길이가 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25 뉴클레오티드일 수 있다. 때때로, 안내 RNA의 제1 영역은 길이가 19, 20 또는 21 뉴클레오티드일 수 있다.
안내 RNA는 또한 2차 구조를 형성하는 제2 영역을 포함할 수 있다. 예를 들어, 안내 RNA에 의해 형성된 2차 구조는 줄기(또는 헤어핀) 및 고리를 포함할 수 있다. 고리 및 줄기의 길이는 다양할 수 있다. 예를 들어, 고리는 길이가 3 내지 10 뉴클레오티드의 범위일 수 있고, 줄기는 길이가 6 내지 20 염기쌍의 범위일 수 있다. 줄기는 1 내지 10 뉴클레오티드의 하나 이상의 벌지를 포함할 수 있다. 제2 영역의 전체 길이는 길이가 16 내지 60 뉴클레오티드의 범위일 수 있다. 예를 들어, 고리는 길이가 4 뉴클레오티드일 수 있고 줄기는 12 염기쌍일 수 있다.
안내 RNA는 또한 3' 단부에 본질적으로 단일 가닥일 수 있는 제3 영역을 포함할 수 있다. 예를 들어, 제3 영역은 때때로 괌심 세포 중의 임의의 염색체 서열에 상보성이 아니며 때때로 안내 RNA의 나머지에 상보성이 아니다. 더욱이, 제3 영역의 길이는 다양할 수 있다. 제3 영역은 길이가 4 뉴클레오티드 초과일 수 있다. 예를 들어, 제3 영역의 길이는 길이가 5 내지 60 뉴클레오티드의 범위일 수 있다.
안내 RNA를 세포 또는 배아에 RNA 분자로서 도입시킬 수 있다. 예를 들어, RNA 분자를 시험관내에서 전사시키고/시키거나 화학적으로 합성할 수 있다. RNA를 합성 DNA 분자, 예를 들어 gBlocks(등록상표) 유전자 단편으로부터 전사시킬 수 있다. 이어서 안내 RNA를 RNA 분자로서 세포 또는 배아에 도입시킬 수 있다. 안내 RNA를 또한 세포 또는 배아에 비-RNA 핵산 분자, 예를 들어 DNA 분자의 형태로 도입시킬 수 있다. 예를 들어, 안내 RNA를 암호화하는 DNA를 관심 세포 또는 배아에 상기 안내 RNA의 발현을 위해 프로모터 조절 서열에 작동적으로 연결시킬 수 있다. RNA 암호화 서열을 RNA 폴리머라제 III(Pol III)에 의해 인식되는 프로모터 서열에 작동적으로 연결시킬 수 있다. 안내 RNA를 발현하는데 사용될 수 있는 플라스미드 벡터는 비제한적으로 px330 벡터 및 px333 벡터를 포함한다. 일부의 경우에, 플라스미드 벡터(예를 들어 px333 벡터)는 2개의 안내 RNA-암호화 DNA 서열을 포함할 수 있다.
안내 RNA를 암호화하는 DNA 서열은 또한 벡터의 부분일 수 있다. 더욱이, 벡터는 추가적인 발현 조절 서열(예를 들어 인헨서 서열, 코작 서열, 폴리아데닐화 서열, 전사 종결 서열 등), 선택성 마커 서열(예를 들어 항생제 내성 유전자), 복제 기원 등을 포함할 수 있다. 안내 RNA를 암호화하는 DNA 분자는 또한 선형일 수 있다. 안내 RNA를 암호화하는 DNA 분자는 또한 환상일 수 있다.
RNA-안내된 엔도뉴클레아제를 암호화하는 DNA 서열 및 안내 RNA를 세포에 도입시키는 경우, 각각의 DNA 서열은 별도의 분자(예를 들어 RNA-안내된 엔도뉴클레아제 암호화 서열을 함유하는 하나의 벡터 및 안내 RNA 암호화 서열을 함유하는 제2 벡터)의 부분이거나 또는 둘 다 동일한 분자(예를 들어 RNA-안내된 엔도뉴클레아제 및 안내 RNA 모두에 대한 암호화(및 조절) 서열을 함유하는 하나의 벡터)의 부분일 수 있다.
부위-특이성 삽입
유전자의 삽입은 부위-특이적일 수 있다. 예를 들어, 하나 이상의 유전자를 프로모터에 인접하여 삽입할 수 있다.
미생물의 표적화된 유전자좌의 변형을, DNA를 미생물에 도입시킴으로써 생성시킬 수 있으며, 이때 상기 DNA는 상기 표적 유전자좌에 대해 상동성을 갖는다. DNA는, 통합된 구조물을 포함하는 세포의 선택을 허용하는 마커 유전자를 포함할 수 있다. 표적 벡터 중의 상동성 DNA는 표적 유전자좌에서 DNA와 재조합할 수 있다. 마커 유전자는 상동성 DNA 서열에 의해 양쪽의 3' 재조합 가지 및 5' 재조합 가지에 인접할 수 있다.
다양한 효소는 외부 DNA의 미생물 게놈내로의 삽입을 촉진할 수 있다. 예를 들어, 부위-특이성 리콤비나제는 별개의 생화학적 성질을 갖는 2개의 단백질 과(family), 즉 티로신 리콤비나제(여기에서 DNA가 티로신 잔기에 공유 부착된다) 및 세린 리콤비나제(세린 잔기에서 공유 부착이 일어난다)로 무리를 이룰 수 있다. 일부의 경우에, 리콤비나제는 Cre, Φ31 인티그라제(스트렙토마이세스 파지 Φ31로부터 유래된 세린 리콤비나제), 또는 박테리오파지 유래된 부위-특이성 리콤비나제(Flp, 람다 인티그라제, 박테리오파지 HK022 리콤비나제, 박테리오파지 R4 인티그라제 및 파지 TP901-1 인티그라제 포함)를 포함할 수 있다.
CRISPR/Cas 시스템을 사용하여 부위 특이성 삽입을 수행할 수 있다. 예를 들어, 게놈 중 삽입 부위상에 CRISPR/cas에 의해 닉(nick)을 만들어 상기 삽입 부위에서 트랜스유전자의 삽입을 촉진할 수 있다.
본 명세서에 기재된 방법은 DNA 또는 RNA 구조물의 숙주 세포내로의 진입을 허용하는데 사용될 수 있는 기법을 사용할 수 있으며, 비제한적으로 칼슘 포스페이트/DNA 공침전, DNA의 핵내로의 미세주사, 일렉트로포레이션, 완전 세포와의 세균 원형질체 융합, 형질감염, 리포펙션, 감염, 입자 총법, 정자 매개된 유전자 전달, 또는 임의의 다른 기법을 포함한다.
본 명세서에 개시된 몇몇 태양은 벡터(상술한 것들 포함)를 사용할 수 있다. 임의의 플라스미드 및 벡터를, 이들이 선택된 숙주 미생물에서 복제 가능하고 생육 가능한 한 사용할 수 있다. 당해 분야에 공지된 벡터 및 상업적으로 입수할 수 있는 벡터(및 그의 변체 또는 유도체)를 상기 방법에 사용하기 위한 하나 이상의 재조합 부위를 포함하도록 조작할 수 있다. 사용될 수 있는 벡터는 비제한적으로 진핵생물 발현 벡터, 예를 들어 pFastBac, pFastBacHT, pFastBacDUAL, pSFV, 및 pTet-Splice(인비트로젠), pEUK-Cl, pPUR, pMAM, pMAMneo, pBHOl, pBI121, pDR2, pCMVEBNA, 및 pYACneo(클론테크(Clontech)), pSVK3, pSVL, pMSG, pCHllO, 및 pKK232-8(파마시아 인코포레이티드(Pharmacia, Inc.)), pXTl, pSG5, pPbac, pMbac, pMClneo, 및 pOG44(스트라타진 인코포레이티드(Stratagene, Inc.)), 및 pYES2, pAC360, pBlueBa-cHis A, B, 및 C, pVL1392, pBlueBaclll, pCDM8, pcDNAl, pZeoSV, pcDNA3, pREP4, pCEP4, 및 pEBVHis(인비트로젠 코포레이션), 및 이들의 변체 또는 유도체를 포함한다.
이들 벡터를 사용하여 관심 유전자 또는 그의 일부를 발현시킬 수 있다. 유전자의 일부 또는 유전자를 공지된 방법, 예를 들어 제한 효소-기반 기법을 사용함으로써 삽입할 수 있다.
IV. 다른 방법
유용한 화학물질의 제조 방법
본 명세서에 기재된 유전자 변형된 미생물을 사용하여, 비제한적으로 아세토인, 2,3-BDO, MEK, 부타디엔, 및/또는 부텐을 포함한 유용한 화학물질을 제조할 수 있다.
미생물은 전체를 통해 논의된 미생물 중 임의의 미생물, 예를 들어 비제한적으로 원핵생물, 예를 들어 메탄영양체일 수 있다.
탄소 기질은 전체를 통해 논의된 임의의 탄소 기질, 예를 들어 비제한적으로 C1 탄소 기질, 예를 들어 메탄일 수 있다.
유용한 화학물질의 제조 중에 사용되는 발효 조건은 전체를 통해 기재된 임의의 조건, 예를 들어 온도일 수 있다. 예를 들어, 발효 온도는 37℃ 내지 45℃일 수 있다. 일부의 경우에, 발효 온도는 42℃일 수 있다. 일부의 경우에, 발효 온도는 41℃일 수 있다.
2-아세토락테이트
유전자 변형된 미생물을 탄소 기질과 접촉시킴을 포함하는 2-아세토락테이트의 제조 방법을 본 명세서에 개시하며, 이때 상기 미생물은 아세토락테이트 신타제(AlsS)를 암호화하는 이종 유전자를 포함한다. 일부의 경우에, 이종 유전자를 미생물의 게놈에 통합시킨다. 일부의 경우에, 이종 유전자를 에피솜 발현시킨다. 일부의 경우에, 이종 유전자를 에피솜 발현시키고 미생물의 게놈에 통합시킨다. 일부의 경우에, 이종 아세토락테이트 신타제 유전자는 임의의 다른 이종 유전자와 관련하여(에피솜 벡터상에서 발현되든 미생물의 게놈에 통합되든 간에) 5'이다. 일부의 경우에, 사용되는 미생물이 하나 초과의 염색체를 갖는 경우, 5' 또는 3'이란 용어는 단일 염색체상에 함유된 유전자와 관련될 수 있다. 상기 방법은 미생물을 증식시켜 2-아세토락테이트를 생성시킴을 추가로 포함할 수 있다. AlsS는 서열번호 1, 3 또는 19 중 어느 하나와 실질적으로 유사할 수 있다. 일부의 경우에, AlsS를 서열번호 2, 4 또는 20 중 어느 하나에 실질적으로 유사한 핵산에 의해 암호화할 수 있다. AlsS 유전자는 스위치, 예를 들어 배지 중의 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 또한 미생물을 먼저 란타늄(예를 들어 적어도 1 μM 란타늄)을 함유하는 배지에서 증식시키고 이어서 후속적으로 란타늄을 희석시킬 수 있다. 이는 미생물이 증식하여 2-아세토락테이트를 생성시키기 전에 일어날 수 있다. 생성된 2-아세토락테이트는 실질적으로 순수할 수 있다. 생성되는 2-아세토락테이트를 회수할 수 있다. 추가로, 2-아세토락테이트 산물(즉, 부산물)을 또한 회수할 수 있다. 예를 들어, 디아세틸을 부산물로서 회수할 수 있다.
2-아세토락테이트를 동일한 미생물, 상이한 미생물에 의해, 또는 미생물 밖에서(즉 시험관내에서) 추가로 가공할 수 있다. 다양한 효소 반응 또는 심지어 자발적인 반응이 발생할 수 있다. 예를 들어, 2-아세토락테이트가 디아세틸로 자발적으로 전환될 수 있다. 2-아세토락테이트를 또한 알파-아세토락테이트 데카복실라제의 사용을 통해 아세토인으로 전환시킬 수 있다. 더욱이 2-아세토락테이트를 또한 3-케토산 리덕타제에 의한 환원 반응을 통해 2,3-디하이드록시-2-메틸부탄산으로 전환시킬 수 있다.
따라서, 동일한 미생물은 알파-아세토락테이트 데카복실라제 및/또는 3-케토산 리덕타제를 포함할 수 있다. 다른 예에서, 상이한 미생물은 알파-아세토락테이트 데카복실라제 및/또는 3-케토산 리덕타제를 포함할 수 있거나 또는 알파-아세토락테이트 데카복실라제 및/또는 3-케토산 리덕타제를 세포로부터 단리한다. 알파-아세토락테이트 데카복실라제 및/또는 3-케토산 리덕타제가 상이한 미생물 중에 있거나 또는 세포로부터 단리되는 경우, 미생물/단리된 효소는 배양 배지 중에 있는 2-아세토락테이트를 전환시킬 수 있다(보충적인 첨가에 의해 또는 아세토인 생성 미생물에 의한 분비에 의해). 알파-아세토락테이트 데카복실라제 및/또는 3-케토산 리덕타제에 의한 2-아세토락테이트의 전환은 각각 아세토인 및/또는 2,3-디하이드록시-2-메틸부탄산을 생성시킬 수 있다.
아세토인
유전자 변형된 미생물을 탄소 기질과 접촉시킴을 포함하는 아세토인의 제조 방법을 본 명세서에 개시하며, 여기에서 상기 미생물은 알파-아세토락테이트 데카복실라제(budA)를 암호화하는 이종 유전자를 포함한다. 일부의 경우에, 이종 유전자를 미생물의 게놈에 통합시킨다. 일부의 경우에, 이종 유전자를 에피솜 발현시킨다. 일부의 경우에, 이종 유전자를 에피솜 발현시키고 미생물의 게놈에 통합시킨다. 일부의 경우에, 알파-아세토락테이트 데카복실라제는 임의의 다른 이종 유전자와 관련하여(에피솜 벡터상에서 발현되든 미생물의 게놈에 통합되든 간에) 5'도 아니고 3'도 아니다. 예를 들어, 아세토락테이트 데카복실라제 유전자에 관하여, 아세토락테이트 데카복실라제 유전자의 상류(추가의 5')에 적어도 하나의 이종 유전자가 존재할뿐만 아니라 아세토락테이트 데카복실라제 유전자의 하류(추가의 3')에 적어도 하나의 추가적인 이종 유전자가 존재한다. 일부의 경우에, 사용되는 미생물이 하나 초과의 염색체를 갖는 경우, 5' 또는 3'이란 용어는 단일 염색체상에 함유된 유전자와 관련될 수 있다. 상기 방법은 미생물을 증식시켜 아세토인을 생성시킴을 추가로 포함할 수 있다. budA 유전자는 스위치, 예를 들어 배지 중의 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 또한 미생물을 먼저 란타늄(예를 들어 적어도 1 μM 란타늄)을 함유하는 배지에서 증식시키고 이어서 후속적으로 란타늄을 희석시킬 수 있다. 이는 미생물이 증식하여 아세토인을 생성시키기 전에 일어날 수 있다. 생성된 아세토인은 실질적으로 순수할 수 있다. 생성되는 아세토인을 회수할 수 있다. 추가로, 비-아세토인 산물(즉, 부산물)을 또한 회수할 수 있다.
아세토인을 동일한 미생물, 상이한 미생물에 의해, 또는 미생물 밖에서(즉 시험관내에서) 아세토인 리덕타제(예를 들어 NADH-의존성 또는 NADPH-의존성 아세토인 리덕타제)를 통해 추가로 가공할 수 있다. 동일한 미생물은 아세토인 리덕타제(예를 들어 NADH-의존성 또는 NADPH-의존성 아세토인 리덕타제)를 포함할 수 있다. 다른 예에서, 상이한 미생물은 아세토인 리덕타제를 포함할 수 있거나 또는 아세토인 리덕타제를 세포로부터 단리한다. 아세토인 리덕타제가 상이한 미생물 중에 있거나 또는 세포로부터 단리되는 경우, 미생물/단리된 효소는 배양 배지 중에 있는 아세토인 리덕타제를 전환시킬 수 있다(보충적인 첨가에 의해 또는 아세토인 생성 미생물에 의한 분비에 의해). 아세토인 리덕타제에 의한 아세토인의 환원은 2,3-BDO를 생성시킬 수 있다.
더욱이 2,3-BDO의 다양한 생성물로의 전환이 상이한 발효 공정을 통해 또는 상이한 촉매 전환에 의해 발생할 수 있다.
2,3-BDO
유전자 변형된 미생물을 탄소 기질과 접촉시킴을 포함하는 2,3-BDO의 제조 방법을 본 명세서에 개시하며, 이때 상기 미생물은 (i) 아세토인 리덕타제; (ii) 알파-아세토락테이트 데카복실라제(budA); (iii) AlsS; 또는 (iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함한다. 일부의 경우에, 적어도 하나의 이종 유전자를 미생물의 게놈에 통합시킨다. 일부의 경우에, 적어도 하나의 이종 유전자를 에피솜 발현시킨다. 일부의 경우에, 적어도 하나의 이종 유전자를 에피솜 발현시키고 미생물의 게놈에 통합시킨다. 일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 사용되는 미생물이 하나 초과의 염색체를 갖는 경우, 5' 또는 3'이란 용어는 단일 염색체상에 함유된 유전자와 관련될 수 있다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3' 이종 유전자이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 상기 방법은 미생물을 증식시켜 2,3-BDO를 생성시킴을 추가로 포함할 수 있다. 적어도 하나의 이종 유전자는 스위치, 예를 들어 배지 중의 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 또한 미생물을 먼저 란타늄(예를 들어 적어도 1 μM 란타늄)을 함유하는 배지에서 증식시키고 이어서 후속적으로 란타늄을 희석시킬 수 있다. 이는 미생물이 증식하여 2,3-BDO를 생성시키기 전에 일어날 수 있다.
상기 방법으로부터 생성된 2,3-BDO는 실질적으로 순수할 수 있다. 생성되는 2,3-BDO를 회수할 수 있다. 추가로, 비-2,3-BDO 산물(즉, 부산물), 예를 들어 2-아세토락테이트 및 아세토인을 또한 회수할 수 있다.
MEK
유전자 변형된 미생물을 탄소 기질과 접촉시킴을 포함하는 MEK의 제조 방법을 본 명세서에 개시하며, 이때 상기 미생물은 (i) 아세토인 리덕타제; (ii) 알파-아세토락테이트 데카복실라제(budA); (iii) AlsS; 또는 (iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함한다. 일부의 경우에, 적어도 하나의 이종 유전자를 미생물의 게놈에 통합시킨다. 일부의 경우에, 적어도 하나의 이종 유전자를 에피솜 발현시킨다. 일부의 경우에, 적어도 하나의 이종 유전자를 에피솜 발현시키고 미생물의 게놈에 통합시킨다. 일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 사용되는 미생물이 하나 초과의 염색체를 갖는 경우, 5' 또는 3'이란 용어는 단일 염색체상에 함유된 유전자와 관련될 수 있다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 상기 방법은 미생물을 증식시켜 2,3-BDO를 생성시킴을 추가로 포함할 수 있다. 또한, 상기 방법은 생성된 2,3-BDO를 촉매와 접촉시켜 MEK를 생성시킴을 또한 추가로 포함할 수 있다. 적어도 하나의 이종 유전자는 스위치, 예를 들어 배지 중의 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 또한 미생물을 먼저 란타늄(예를 들어 적어도 1 μM 란타늄)을 함유하는 배지에서 증식시키고 이어서 후속적으로 란타늄을 희석시킬 수 있다. 이는 미생물이 증식하여 2,3-BDO를 생성시키기 전에 일어날 수 있다. 일부의 경우에, 2,3-BDO를, 상기 생성된 2,3-BDO를 촉매와 접촉시켜 MEK를 생성시킴을 진행하기 전에 단리하거나 정제할 수 있다.
촉매는 효소 촉매 또는 비-효소 촉매일 수 있다. 촉매는 MEK를 생성시킬 수 있는 임의의 촉매를 포함할 수 있다. 예를 들어, MEK를 다양한 촉매, 예를 들어 알루미나상에서 2,3-BDO의 직접 탈수, 황산, Cu, AlO3 및/또는 제올라이트(또는 다른 고체 산 촉매)와의 직접 반응에 의해 수득할 수 있다(예를 들어 문헌[Emerson, R.R., et al, "Kinetics of dehydration of aqueous 2,3-butanediol to methyl ethyl ketone," Ind. Eng. Chem. Prod. Res. Dev., p. 473-477 (1982)]을 참조하시오). 일반적인 산 촉매, 예를 들어 금속 산화물 및 제올라이트는 주로 MEK, IBA, 부텐, 및 C1-C3 기상 화합물을 생성시킨다. 예를 들어, 10% H3PO4/실리카젤 60은 43% 1,3-부타디엔 43%, 41% MEK 및 8% IBA를 생성시킨다. 제올라이트 ZSM-5의 사용은 80%를 초과하는 MEK를 생성시킨다. 일부의 경우에 ZSM-5는 90%를 초과하는 MKE를 생성시킨다. 일부의 경우에, 촉매 및/또는 반응 혼합물은 알칼리 금속, 예를 들어 칼륨(K), 루비듐(Rb) 및/또는 세슘(Cs)을 함유하지 않는다.
2,3-BDO로부터 하나의 물 분자의 산-촉매화된 탈수는 탄소 양이온 중간체를 생성시킨다. 피나콜 재배열은 메틸 에틸 케톤(MEK) 및 이소부틸알데히드(IBA)를 생성시킨다.
추가로, 전체를 통해 기재된 미생물 및 방법에 의해 제조된 2,3-BDO를 디올 데하이드라타제(B12)에 의해 추가로 가공할 수 있다. 상기 효소 반응은 MEK(또한 부탄-2-온으로서 공지됨)를 생성시킬 수 있다. 따라서, (a) 유전자 변형된 미생물을 탄소 기질과 접촉시키는 단계로서, 이때 미생물은 디올 데하이드라타제를 암호화하는 이종 유전자를 포함하는 단계; 및 (b) 미생물을 증식시켜 MEK를 생성시키는 단계를 포함하는 MEK의 제조 방법을 개시한다. 미생물은 또한 아세토락테이트 신타제(AlsS), 알파-아세토락테이트(budA), 및/또는 아세토인 리덕타제(butA)를 포함할 수 있다.
일부의 경우에, MEK를 알콜 데하이드로게나제에 의해 추가로 가공할 수 있다. 상기 효소 반응은 부탄-2-올(또한 2-부탄올로서 공지됨)을 생성시킬 수 있다. 따라서, (a) 유전자 변형된 미생물을 탄소 기질과 접촉시키는 단계로서, 이때 미생물은 알콜 데하이드로게나제를 암호화하는 이종 유전자를 포함하는 단계; 및 (b) 미생물을 증식시켜 부탄-2-올을 생성시키는 단계를 포함하는 부탄-2-올의 제조 방법을 개시한다. 미생물은 또한 아세토락테이트 신타제(AlsS), 알파-아세토락테이트(budA), 아세토인 리덕타제(butA), 및/또는 디올 데하이드라타제(B12)를 포함할 수 있다.
1,3-부타디엔(부타디엔)
유전자 변형된 미생물을 탄소 기질과 접촉시킴을 포함하는 부타디엔의 제조 방법을 본 명세서에 개시하며, 이때 상기 미생물은 (i) 아세토인 리덕타제; (ii) 알파-아세토락테이트 데카복실라제(budA); (iii) AlsS; 또는 (iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함한다. 일부의 경우에, 적어도 하나의 이종 유전자를 미생물의 게놈에 통합시킨다. 일부의 경우에, 적어도 하나의 이종 유전자를 에피솜 발현시킨다. 일부의 경우에, 적어도 하나의 이종 유전자를 에피솜 발현시키고 미생물의 게놈에 통합시킨다. 일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 사용되는 미생물이 하나 초과의 염색체를 갖는 경우, 5' 또는 3'이란 용어는 단일 염색체상에 함유된 유전자와 관련될 수 있다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 상기 방법은 미생물을 증식시켜 2,3-BDO를 생성시킴을 추가로 포함할 수 있다. 상기 방법은 생성된 2,3-BDO를 촉매와 접촉시켜 부타디엔을 생성시킴을 또한 추가로 포함할 수 있다. 적어도 하나의 이종 유전자는 스위치, 예를 들어 배지 중의 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 또한 미생물을 먼저 란타늄(예를 들어 적어도 1 μM 란타늄)을 함유하는 배지에서 증식시키고 이어서 후속적으로 란타늄을 희석시킬 수 있다. 이는 미생물이 증식하여 2,3-BDO를 생성시키기 전에 일어날 수 있다.
촉매는 효소 촉매 또는 비-효소 촉매일 수 있다. 촉매는 2,3-BDO를 생성시킬 수 있는 임의의 촉매를 포함할 수 있다. 촉매는 하이드라이드 이동을 생성시킬 수 있는 임의의 촉매를 포함할 수 있다. 예를 들어, 알루미나 또는 황산과의 직접 반응(Emerson, R.R., et al, "Kinetics of dehydration of aqueous 2,3-butanediol to methyl ethyl ketone," Ind. Eng. Chem. Prod. Res. Dev., 21(3), pp. 473-477 (1982)). 추가로, SiO2-지지된 세슘 이수소 포스페이트(CsH2PO4) 촉매를 사용함으로써 2,3-BDO의 부타디엔으로의 80% 초과의 전환을 이룰 수 있다. 일반적으로, 10%의 CsH2PO4 촉매가 사용될 수 있다. 일부의 경우에, 전환은 90% 초과의 전환일 수 있다. 사용될 수 있는 촉매의 예는 비제한적으로 10% CsH2P04/CARiACT Q6 및/또는 10% CsH2P04/CARiACT Q10을 포함한다. (더욱이, 알칼리 금속, 예를 들어 K, Rb, 또는 Cs이 보다 높은 부타디엔 생성, 및 보다 적은 MEK 생성을 유도할 수 있는 촉매 사용의 용도). (예를 들어 미국특허 출원 공보 제 2016/0229765 호를 참조하시오). 따라서, 본 명세서에 개시된 방법은 추가적인 알칼리 금속을 사용할 수 있다.
추가의 예로서, 부타디엔을 또한, 토리아 촉매상에서 2,3-BDO의 직접적인 탈수에 의해 수득할 수 있지만, 대부분의 다른 탈수 촉매는 주 생성물로서 메틸 에틸 케톤을 제공한다(Winfield, M.E., "The Catalytic Dehydration of 2,3-Butanediol to Butadiene. II. Adsorption Equilibri," Australian Journal of Scientific Research, Series A: Physical Sciences, vol. 3, p. 290-305 (1945)).
2-부텐(부텐)
유전자 변형된 미생물을 탄소 기질과 접촉시킴을 포함하는 부텐의 제조 방법을 본 명세서에 개시하며, 이때 상기 미생물은 (i) 아세토인 리덕타제; (ii) 알파-아세토락테이트 데카복실라제(budA); (iii) AlsS; 또는 (iv) 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함한다. 일부의 경우에, 적어도 하나의 이종 유전자를 미생물의 게놈에 통합시킨다. 일부의 경우에, 적어도 하나의 이종 유전자를 에피솜 발현시킨다. 일부의 경우에, 적어도 하나의 이종 유전자를 에피솜 발현시키고 미생물의 게놈에 통합시킨다. 일부의 경우에, 아세토락테이트 신타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'이다. 일부의 경우에, 사용되는 미생물이 하나 초과의 염색체를 갖는 경우, 5' 또는 3'이란 용어는 단일 염색체상에 함유된 유전자와 관련될 수 있다. 일부의 경우에, 아세토인 리덕타제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 3'이다. 일부의 경우에, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자는 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아니다. 상기 방법은 미생물을 증식시켜 2,3-BDO를 생성시킴을 추가로 포함할 수 있다. 상기 방법은 생성된 2,3-BDO를 촉매와 접촉시켜 부텐을 생성시킴을 또한 추가로 포함할 수 있다. 적어도 하나의 이종 유전자는 스위치, 예를 들어 배지 중의 성분, 예를 들어 아라비노스와 같은 당 또는 란타늄과 같은 희토 원소의 존재 또는 부재에 반응성인 유도성 또는 억제성 프로모터의 조절하에 있을 수 있다. 또한 미생물을 먼저 란타늄(예를 들어 적어도 1 μM 란타늄)을 함유하는 배지에서 증식시키고 이어서 후속적으로 란타늄을 희석시킬 수 있다. 이는 미생물이 증식하여 2,3-BDO를 생성시키기 전에 일어날 수 있다.
부텐을 2,3-BDO로부터 생성시킬 수 있다. 예를 들어, 디알(dial)을 HBr로 처리한 다음 Zn 분말로 처리하여 부텐을 생성시킬 수 있다. 탈브롬화를 고도의 항-입체특이성으로 진행하며(House, H.O, and Ro, R,S, "The Stereochemistry of Elimination Reactions Involving Halohydrin Derivatives and Metals," J. Am. Chem. Soc. 80(1), p. 182-187(1958); Gordon, M., and Hay, J.V., "Stereochemistry of vapor phase dehalogenation of meso- and DL-2,3-dibromobutane with zinc," J. Org. Chem. 33(1), p. 427-427 (1968)), 메사(mesa) 이성질체는 트랜스 부텐을 제공하고, (+)이성질체는 시스 부텐을 제공한다.
부텐을 부타디엔으로 전환시킬 수 있다. 예를 들어, 부텐을 희석제로서 과열된 증기, 및 가열 매질의 존재하에서 1,3-부타디엔으로 접촉 탈수소화시킬 수 있다(Voloch, M., et al, "2,3-Butanediol," Industrial Chemicals, Biochemicals and Fuels, Chapter 45, p. 933-947 (1985)).
상업적으로 유용한 생성물의 제조 방법
2,3-BDO 자체를 일부 상업적으로 유용한 태양에 사용할 수 있지만, 2,3-BDO의 하류부문 생성물 중 다수를 추가의 상업적으로 유용한 생성물의 제조에 사용할 수 있다. 예를 들어, 부타디엔, 부텐 및 MEK를 후속적으로 상업적으로 유용한 생성물의 다양한 제조 공정에 사용할 수 있다.
예를 들어, 부텐을 가솔린 및 부타디엔의 제조에 사용할 수 있다. 부텐을 또한 C12 파라핀, 예를 들어 항공 연료로서 사용되는 이소 파라핀의 제조에 하나의 성분 또는 전구체로서 사용할 수 있다(예를 들어 미국특허 제 7,338,541 호를 참조하시오).
MEK를 다수 물질의 용해에 사용할 수 있으며, 예를 들어 검, 수지, 셀룰로스 아세테이트 및 니트로셀룰로스 코팅을 수반하는 공정 및 비닐 필름에 용매로서 사용할 수 있다. 따라서, MEK는 플라스틱, 직물, 파라핀 왁스의 제조에, 및 래커, 니스 및 도료 제거제, 아교와 같은 가정용품에, 및 세척제로서 유용할 수 있다. MEK를 또한 변성 알콜용 변성제로서 사용할 수 있다. MEK를 또한 지워지는 염료의 용매로서 드라이 이레이즈 마커에 사용할 수 있다. 또한, MEK는 일부 중합 반응에 사용되는 촉매인 메틸 에틸 케톤 퍼옥사이드에 대한 전구체이다. 더욱이, MEK를 탄소상 루테늄과 같은 촉매와 접촉시킴으로써 2-부탄올로 전환시킬 수 있다. MEK를 또한 알콜 데하이드로게나제와의 접촉에 의해 2-부탄올로 전환시킬 수 있다.
본 명세서의 공정에 의해 생성될 수 있는 가장 유용한 화학물질 중 하나는 부타디엔이다. 부타디엔을 합성 고무 및 중합체 수지와 같은 다양한 매우 유용한 제품들의 제조에 사용할 수 있다. 폴리부타디엔 자체는 매우 연성인, 거의 액체인 물질이지만, 부타디엔과 스티렌 또는 아크릴로니트릴과의 혼합물로부터 제조된 중합체, 예를 들어 ABS는 질기면서 탄성이다. 스티렌-부타디엔 고무는 자동차 타이어의 제조에 가장 통상적으로 사용되는 물질이다. 부타디엔은 또한 중간체 아디포니트릴, 다른 합성 고무 물질, 예를 들어 클로로프렌, 및 용매 설폴란을 통해 나일론을 제조하는데 사용될 수 있다. 또한, 부타디엔은 이량체화 반응을 통한 4-비닐사이클로헥센 및 삼량체화 반응을 통한 사이클로도데카트리엔의 산업적인 생산에 사용될 수 있다. 부타디엔은 또한, 딜스-알더 반응을 통해 이중 및 삼중 탄소-탄소 결합과 반응하므로, 사이클로알칸 및 사이클로알켄의 합성에 유용하다. 추가의 예로서, 부타디엔을 사이클로알칸, 사이클로알켄, 도데칸디오산(DDDA), 아디포니트릴, 카프로락탐, 스티렌, 에틸리덴 노르보넨, 라우릴 락탐 및 1,5-사이클로옥타디엔(COD)의 제조에 사용할 수 있다.
본 발명의 방법을 부텐, 부타디엔 및/또는 MEK로부터의 하류부문 생성물의 하나 이상의 제조 방법과 통합시키거나 연계할 수 있다. 예를 들어, 본 발명의 방법은 부텐, 부타디엔 및/또는 MEK를 다른 유용한 화학적 생성물의 전환 또는 생산에 충분한 화학 공정 또는 반응에 직접적으로 또는 간접적으로 공급할 수 있다. 일부의 경우에, 본 명세서에서 이전에 나타낸 바와 같이, 2,3-BDO를 중간체 화합물 부텐, 부타디엔 및/또는 MEK를 통해, 하나 이상의 화학적 생성물의 제조에 후속적으로 사용하기 전에 상기 방법으로부터 부텐, 부타디엔 및/또는 MEK를 회수할 필요 없이 직접 하나 이상의 화학적 생성물로 전환시킬 수 있다.
특정한 경우에, 메탄을 2,3-BDO로 전환시키고, 이어서 이를 후속적으로 하나 이상의 화학 공정에 의해 부텐, 부타디엔 및/또는 MEK로 전환시키고, 차례로 이를 하나 이상의 화학 공정에 의해 하나 이상의 화학적 생성물로 전환시킨다. 특정한 경우에, 하나 이상의 화학적 생성물을 부텐, 부타디엔 및/또는 MEK의 회수 없이 생성시킨다. 또 다른 실시태양에서, 2,3-BDO를 단일의 화학 공정에서 부탄, 부타디엔 및/또는 MEK 중간체 화합물 중 하나 이상을 통해 하나 이상의 화학적 생성물로 전환시킨다.
V. 발효
일반적으로, 본 명세서에 개시된 미생물을, C1 탄소(예를 들어 메탄)를 2,3-BDO(또는 다른 목적하는 생성물)로 전환시키기에 적합한 발효 조건에서 사용해야 한다. 고려되어야 하는 반응 조건은 온도, 배지 유량, pH, 배지 산화환원 전위, 교반 속도(연속 교반식 탱크 반응기를 사용하는 경우), 접종 수준, 최대 기질 농도 및 기질 수준이 제한이 되지 않게 하는 상기 기질의 생물반응기로의 도입 속도, 및 생성물 억제를 피하기 위한 최대 생성물 농도를 포함한다.
최적의 반응 조건은 부분적으로, 사용되는 특정 미생물에 따라 변할 것이다. 그러나, 일반적으로, 발효를 주변 압력보다 높은 압력에서 수행할 수 있다. 증가된 압력에서의 실행은 기체상에서 액체상으로의 C1-탄소 이동 속도의 현저한 증가를 허용할 수 있으며, 이때 상기 탄소는 2,3-BDO의 생성을 위한 탄소원으로서 미생물에 의해 흡수될 수 있다. 차례로 이는 체류 시간(투입된 기체 유량으로 나눈 생물반응기 중 액체 부피로서 정의된다)이, 생물반응기를 주변 압력보다는 승압에서 유지시킬 때 감소될 수 있음을 의미한다.
가압된 시스템의 사용은 필요한 생물반응기의 부피를 크게 감소시킬 수 있으며 결과적으로 발효 장비의 자본비를 감소시킬 수 있다. 일부의 경우에, 반응기 부피는 반응기 작동 압력의 증가에 선형 비례로 감소될 수 있다, 즉 10 대기압에서 작동되는 생물반응기는 1 대기압에서 작동되는 경우의 부피의 단지 1/10만이 필요하다.
기상 기질을 함유하는 C1-탄소 기질(예를 들어 메탄)의 도입 속도는 액체상 중의 C1-탄소 기질(예를 들어 메탄)의 농도가 제한이 되지 않도록 하는 것이 또한 바람직하다. 이는 C1-탄소 기질(예를 들어 메탄) 제한된 조건의 결과, 2,3-BDO 생성물(또는 다른 목적하는 생성물)이 배양에 의해 소비될 수도 있기 때문이다.
예비배양
전체를 통해 기재된 유전자 미생물의 다양한 균주의 예비배양은 전체를 통해 기재된 다중탄소 생성물, 예를 들어 2,3-BDO, 부타디엔, 및/또는 MEK의 역가의 증가를 유도할 수 있다.
예비배양은 배지에 항생제, 예를 들어 카나마이신, 탄소원, 예를 들어 메탄 또는 다른 C1 탄소, 및/또는 분자 스위치를 활성화하거나 억제하는 물질을 첨가함을 포함할 수 있다.
전형적으로, 예비배양을, 사용되는 미생물의 종에 따라, 240시간 미만의 시간 동안 수행할 수 있다. 예비배양은 생성물 역가를 효율적으로 증가시키기 위해서 충분한 바이오매스가 생성되게 한다. 일부의 경우에, 예비배양은 240시간 미만이다. 일부의 경우에, 예비배양은 220시간 미만이다. 일부의 경우에, 예비배양은 200시간 미만이다. 일부의 경우에, 예비배양은 180시간 미만이다. 일부의 경우에, 예비배양은 160시간 미만이다. 일부의 경우에, 예비배양은 140시간 미만이다. 일부의 경우에, 예비배양은 120시간 미만이다. 일부의 경우에, 예비배양은 100시간 미만이다. 일부의 경우에, 예비배양은 96시간 미만이다. 일부의 경우에, 예비배양은 90시간 미만이다. 일부의 경우에, 예비배양은 84시간 미만이다. 일부의 경우에, 예비배양은 78시간 미만이다. 일부의 경우에, 예비배양은 72시간 미만이다. 일부의 경우에, 예비배양은 68시간 미만이다. 일부의 경우에, 예비배양은 62시간 미만이다. 일부의 경우에, 예비배양은 56시간 미만이다. 일부의 경우에, 예비배양은 50시간 미만이다. 일부의 경우에, 예비배양은 48시간 미만이다. 일부의 경우에, 예비배양은 46시간 미만이다. 일부의 경우에, 예비배양은 44시간 미만이다. 일부의 경우에, 예비배양은 42시간 미만이다. 일부의 경우에, 예비배양은 40시간 미만이다. 일부의 경우에, 예비배양은 38시간 미만이다. 일부의 경우에, 예비배양은 36시간 미만이다. 일부의 경우에, 예비배양은 34시간 미만이다. 일부의 경우에, 예비배양은 32시간 미만이다. 일부의 경우에, 예비배양은 30시간 미만이다. 일부의 경우에, 예비배양은 28시간 미만이다. 일부의 경우에, 예비배양은 26시간 미만이다. 일부의 경우에, 예비배양은 24시간 미만이다. 일부의 경우에, 예비배양은 22시간 미만이다. 일부의 경우에, 예비배양은 20시간 미만이다. 일부의 경우에, 예비배양은 18시간 미만이다. 일부의 경우에, 예비배양은 16시간 미만이다. 일부의 경우에, 예비배양은 14시간 미만이다. 일부의 경우에, 예비배양은 12시간 미만이다. 일부의 경우에, 예비배양은 10시간 미만이다. 일부의 경우에, 예비배양은 8시간 미만이다. 일부의 경우에, 예비배양은 6시간 미만이다. 일부의 경우에, 예비배양은 4시간 미만이다. 일부의 경우에, 예비배양은 2시간 미만이다. 일부의 경우에, 예비배양은 1시간 미만이다. 일부의 경우에, 예비배양은 없다.
일부의 경우에, 예비배양은 240시간 내지 1시간이다. 일부의 경우에, 예비배양은 220시간 사이이다. 일부의 경우에, 예비배양은 200시간 내지 2시간이다. 일부의 경우에, 예비배양은 180시간 내지 4시간이다. 일부의 경우에, 예비배양은 160시간 내지 6시간이다. 일부의 경우에, 예비배양은 140시간 내지 8시간이다. 일부의 경우에, 예비배양은 120시간 내지 10시간이다. 일부의 경우에, 예비배양은 100시간 내지 12시간이다. 일부의 경우에, 예비배양은 96시간 내지 18시간이다. 일부의 경우에, 예비배양은 90시간 내지 24시간이다. 일부의 경우에, 예비배양은 84시간 내지 36시간이다. 일부의 경우에, 예비배양은 78시간 내지 40시간이다. 일부의 경우에, 예비배양은 72시간 내지 42시간이다. 일부의 경우에, 예비배양은 56시간 내지 44시간이다. 일부의 경우에, 예비배양은 50시간 내지 46시간이다.
분자 스위치를 활성화하거나 억제하는 물질을 예비배양물에 가하는 경우, 그 양은 다양할 수 있다. 예를 들어, 일부의 경우에, 분자 스위치를 활성화하거나 억제하는 물질이 희토 금속(예를 들어 란타늄)인 경우, 오직 통합된 유전자만을 포함하는 유전자 변형된 미생물은 희토 금속(예를 들어 란타늄)을 함유하는 어떠한 예비배양물도 필요로 하지 않는다. 그러나, 일부의 경우에, 이들 통합된 균주는 희토 금속(예를 들어 란타늄)을, 그러나 소량으로, 필요로 한다. 예를 들어, 통합된 균주의 예비배양에 필요한 희토 금속(예를 들어 란타늄)의 양은 25 μM 미만의 희토 금속(예를 들어 란타늄)을 필요로 할 수 있다. 일부의 경우에, 통합된 균주의 예비배양에 필요한 희토 금속(예를 들어 란타늄)의 양은 20 μM 미만을 필요로 할 수 있다. 통합된 균주의 예비배양에 필요한 희토 금속(예를 들어 란타늄)의 양은 15 μM 미만을 필요로 할 수 있다. 통합된 균주의 예비배양에 필요한 희토 금속(예를 들어 란타늄)의 양은 10 μM 미만을 필요로 할 수 있다. 통합된 균주의 예비배양에 필요한 희토 금속(예를 들어 란타늄)의 양은 7.5 μM 미만을 필요로 할 수 있다. 통합된 균주의 예비배양에 필요한 희토 금속(예를 들어 란타늄)의 양은 5 μM 미만을 필요로 할 수 있다. 통합된 균주의 예비배양에 필요한 희토 금속(예를 들어 란타늄)의 양은 2.5 μM 미만을 필요로 할 수 있다. 통합된 균주의 예비배양에 필요한 희토 금속(예를 들어 란타늄)의 양은 1 μM 미만을 필요로 할 수 있다.
그러나, 미생물이 에피솜 발현된 유전자(추가의 통합된 유전자 세트가 이미 미생물 중에 존재하든지 아니든지 간에)를 포함하는 경우, 생성을 최적화하기 위해 예비배양 동안 더 많은 희토 금속(예를 들어 란타늄)이 요구된다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 1 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 2.5 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 5.0 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 7.5 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 10 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 12.5 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 15 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 17.5 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 20 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 25 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 30 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 35 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 40 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 45 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 50 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 75 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다. 일부의 경우에, 이들 에피솜 균주는 예비배양물 중에 100 μM 초과의 희토 금속(예를 들어 란타늄)을 필요로 한다.
일부의 경우에, 생성을 최적화하기 위해 예비배양물에 요구되는 희토 금속(예를 들어 란타늄)의 양은 0.5 μM 내지 100 μM 범위의 희토 금속(예를 들어 란타늄)일 수 있다. 일부의 경우에, 생성을 최적화하기 위해 예비배양물에 0.5 μM 내지 50 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다. 다른 경우에, 생성을 최적화하기 위해 예비배양물에 1 μM 내지 20 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다. 일부의 경우에, 생성을 최적화하기 위해 예비배양물에 2 μM 내지 15 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다. 일부의 경우에, 생성을 최적화하기 위해 예비배양물에 3 μM 내지 12.5 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다. 일부의 경우에, 생성을 최적화하기 위해 예비배양물에 4 μM 내지 12 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다. 일부의 경우에, 생성을 최적화하기 위해 예비배양물에 5 μM 내지 11.5 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다. 일부의 경우에, 생성을 최적화하기 위해 예비배양물에 6 μM 내지 11 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다. 일부의 경우에, 생성을 최적화하기 위해 예비배양물에 7 μM 내지 10.5 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다. 일부의 경우에, 생성을 최적화하기 위해 예비배양물에 8 μM 내지 10 μM 범위의 희토 금속(예를 들어 란타늄)이 요구된다.
일부의 경우에, 다른 희토 금속, 예를 들어 세륨(Ce), 디스프로슘(Dy), 에르븀(Er), 유로피움(Eu), 가돌리늄(Gd), 홀뮴(Ho), 루테슘(Lu), 네오디뮴(Nd), 프라세오디뮴(Pr), 프로메티움(Pm), 사마륨(Sm), 스칸듐(Sc), 테르븀(Tb), 툴륨(Tm), 이터븀(Yb), 이트륨(Y), 또는 이들의 임의의 조합을 사용할 수 있다. 다른 경우에, 당, 예를 들어 IPTG 및 아라비노스를 사용할 수 있다.
발효 조건
pH를 사용되는 미생물을 기준으로 최적화할 수 있다. 예를 들어, 메탄의 목적하는 생성물로의 메탄영양체 발효 중에 사용되는 pH는 4 내지 10일 수 있다. 다른 예에서, pH는 5 내지 9; 6 내지 8; 6.1 내지 7.9; 6.2 내지 7.8; 6.3 내지 7.7; 6.4 내지 7.6; 또는 6.5 내지 7.5일 수 있다. 예를 들어 pH는 6.6 내지 7.4일 수 있다. 일부의 경우에, pH는 5 내지 9일 수 있다. 일부의 경우에, pH는 6 내지 8일 수 있다. 일부의 경우에, pH는 6.1 내지 7.9일 수 있다. 일부의 경우에, pH는 6.2 내지 7.8일 수 있다. 일부의 경우에, pH는 6.3 내지 7.7일 수 있다. 일부의 경우에, pH는 6.4 내지 7.6일 수 있다. 일부의 경우에, pH는 6.5 내지 7.5일 수 있다. 일부의 경우에, 메탄영양체의 발효에 사용되는 pH는 6 초과일 수 있다.
온도를 또한 사용되는 미생물을 기준으로 조절할 수 있다. 예를 들어, 메탄의 목적하는 생성물로의 메탄영양체 발효 동안 사용되는 온도는 30℃ 내지 45℃일 수 있다. 다른 예에서, 발효 온도는 30℃ 내지 45℃; 31℃ 내지 44℃; 32℃ 내지 43℃; 33℃ 내지 42℃; 34℃ 내지 41℃; 35℃ 내지 40℃일 수 있다. 예를 들어, 온도는 36℃ 내지 39℃(예를 들어, 36℃, 37℃, 38℃, 또는 39℃)일 수 있다. 일부의 경우에, 온도는 30℃ 내지 45℃(예를 들어, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 42℃, 43℃, 44℃, 또는 45℃)일 수 있다. 일부의 경우에, 온도는 31℃ 내지 44℃(예를 들어, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 42℃, 43℃, 또는 44℃)일 수 있다. 일부의 경우에, 온도는 32℃ 내지 43℃일 수 있다. 일부의 경우에, 온도는 33℃ 내지 42℃(예를 들어, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 또는 42℃)일 수 있다. 일부의 경우에, 온도는 34℃ 내지 41℃(예를 들어, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 또는 41℃)일 수 있다. 일부의 경우에, 온도는 35℃ 내지 40℃(예를 들어, 35℃, 36℃, 37℃, 38℃, 39℃, 또는 40℃)일 수 있다.
일부의 경우에, 온도는 1도의 1/10 이내일 수 있다. 예를 들어, 일부의 경우에, 발효 온도는 37.0℃, 37.1℃, 37.2℃, 37.3℃, 37.4℃, 37.5℃, 37.6℃, 37.7℃, 37.8℃, 37.9℃, 38.0℃, 38.1℃, 38.2℃, 38.3℃, 38.4℃, 38.5℃, 38.6℃, 38.7℃, 38.8℃, 38.9℃, 39.0℃, 39.1℃, 39.2℃, 39.3℃, 39.4℃, 39.5℃, 39.6℃, 39.7℃, 39.8℃, 39.9℃, 40.0℃, 40.1℃, 40.2℃, 40.3℃, 40.4℃, 40.5℃, 40.6℃, 40.7℃, 40.8℃, 40.9℃, 41.0℃, 41.1℃, 41.2℃, 41.3℃, 41.4℃, 41.5℃, 41.6℃, 41.7℃, 41.8℃, 41.9℃, 42.0℃, 42.1℃, 42.2℃, 42.3℃, 42.4℃, 42.5℃, 42.6℃, 42.7℃, 42.8℃, 42.9℃, 43.0℃, 43.1℃, 43.2℃, 43.3℃, 43.4℃, 43.5℃, 43.6℃, 43.7℃, 43.8℃, 43.9℃,44.0℃, 44.1℃, 44.2℃, 44.3℃, 44.4℃, 44.5℃, 44.6℃, 44.7℃, 44.8℃, 44.9℃, 45.0℃, 45.1℃, 45.2℃, 45.3℃, 45.4℃, 45.5℃, 45.6℃, 45.7℃, 45.8℃, 45.9℃, 46.0℃, 46.1℃, 46.2℃, 46.3℃, 46.4℃, 46.5℃, 46.6℃, 46.7℃, 46.8℃, 46.9℃, 47.0℃, 47.1℃, 47.2℃, 47.3℃, 47.4℃, 47.5℃, 47.6℃, 47.7℃, 47.8℃, 또는 47.9℃일 수 있다.
일부의 경우에, 발효 온도는 37.0℃ 내지 47.9℃일 수 있다. 일부의 경우에, 발효 온도는 37.1℃ 내지 47.8℃일 수 있다. 일부의 경우에, 발효 온도는 37.2℃ 내지 47.7℃일 수 있다. 일부의 경우에, 발효 온도는 37.3℃ 내지 47.6℃일 수 있다. 일부의 경우에, 발효 온도는 37.4℃ 내지 47.5℃일 수 있다. 일부의 경우에, 발효 온도는 37.5℃ 내지 47.4℃일 수 있다. 일부의 경우에, 발효 온도는 37.6℃ 내지 47.3℃일 수 있다. 일부의 경우에, 발효 온도는 37.7℃ 내지 47.2℃일 수 있다. 일부의 경우에, 발효 온도는 37.8℃ 내지 47.1℃일 수 있다. 일부의 경우에, 발효 온도는 37.9℃ 내지 47.0℃일 수 있다. 일부의 경우에, 발효 온도는 38.0℃ 내지 46.9℃일 수 있다. 일부의 경우에, 발효 온도는 38.1℃ 내지 46.8℃일 수 있다. 일부의 경우에, 발효 온도는 38.2℃ 내지 46.7℃일 수 있다. 일부의 경우에, 발효 온도는 38.3℃ 내지 46.6℃일 수 있다. 일부의 경우에, 발효 온도는 38.4℃ 내지 46.5℃일 수 있다. 일부의 경우에, 발효 온도는 38.5℃ 내지 46.4℃일 수 있다. 일부의 경우에, 발효 온도는 38.6℃ 내지 46.3℃일 수 있다. 일부의 경우에, 발효 온도는 38.7℃ 내지 46.2℃일 수 있다. 일부의 경우에, 발효 온도는 38.8℃ 내지 46.1℃일 수 있다. 일부의 경우에, 발효 온도는 38.9℃ 내지 46.0℃일 수 있다. 일부의 경우에, 발효 온도는 39.0℃ 내지 45.9℃일 수 있다. 일부의 경우에, 발효 온도는 39.1℃ 내지 45.8℃일 수 있다. 일부의 경우에, 발효 온도는 39.2℃ 내지 45.7℃일 수 있다. 일부의 경우에, 발효 온도는 39.3℃ 내지 45.6℃일 수 있다. 일부의 경우에, 발효 온도는 39.4℃ 내지 45.5℃일 수 있다. 일부의 경우에, 발효 온도는 39.5℃ 내지 45.4℃일 수 있다. 일부의 경우에, 발효 온도는 39.6℃ 내지 45.3℃일 수 있다. 일부의 경우에, 발효 온도는 39.7℃ 내지 45.2℃일 수 있다. 일부의 경우에, 발효 온도는 39.8℃ 내지 45.1℃일 수 있다. 일부의 경우에, 발효 온도는 39.9℃ 내지 45.0℃일 수 있다. 일부의 경우에, 발효 온도는 40.0℃ 내지 44.9℃일 수 있다. 일부의 경우에, 발효 온도는 40.1℃ 내지 44.8℃일 수 있다. 일부의 경우에, 발효 온도는 40.2℃ 내지 44.7℃일 수 있다. 일부의 경우에, 발효 온도는 40.3℃ 내지 44.6℃일 수 있다. 일부의 경우에, 발효 온도는 40.4℃ 내지 44.5℃일 수 있다. 일부의 경우에, 발효 온도는 40.5℃ 내지 44.4℃일 수 있다. 일부의 경우에, 발효 온도는 40.6℃ 내지 44.3℃일 수 있다. 일부의 경우에, 발효 온도는 40.7℃ 내지 44.2℃일 수 있다. 일부의 경우에, 발효 온도는 40.8℃ 내지 44.1℃일 수 있다. 일부의 경우에, 발효 온도는 40.9℃ 내지 44.0℃일 수 있다. 일부의 경우에, 발효 온도는 41.0℃ 내지 43.9℃일 수 있다. 일부의 경우에, 발효 온도는 41.1℃ 내지 43.8℃일 수 있다. 일부의 경우에, 발효 온도는 41.2℃ 내지 43.7℃일 수 있다. 일부의 경우에, 발효 온도는 41.3℃ 내지 43.6℃일 수 있다. 일부의 경우에, 발효 온도는 41.4℃ 내지 43.5℃일 수 있다. 일부의 경우에, 발효 온도는 41.5℃ 내지 43.4℃일 수 있다. 일부의 경우에, 발효 온도는 41.6℃ 내지 43.3℃일 수 있다. 일부의 경우에, 발효 온도는 41.7℃ 내지 43.2℃일 수 있다. 일부의 경우에, 발효 온도는 41.8℃ 내지 43.1℃일 수 있다. 일부의 경우에, 발효 온도는 41.9℃ 내지 43.0℃일 수 있다. 일부의 경우에, 발효 온도는 42.0℃ 내지 42.9℃일 수 있다. 일부의 경우에, 발효 온도는 42.1℃ 내지 42.8℃일 수 있다. 일부의 경우에, 발효 온도는 42.2℃ 내지 42.7℃일 수 있다. 일부의 경우에, 발효 온도는 42.3℃ 내지 42.6℃일 수 있다. 일부의 경우에, 발효 온도는 42.4℃ 내지 42.5℃일 수 있다.
산소 및 다른 기체, 예를 들어 기상 C1-탄소 기질(예를 들어 메탄)의 이용률은 수율 및 발효속도에 영향을 미칠 수 있다. 예를 들어, 산소 이용률을 고려할 때, 발효 배지내 용존산소(DO)의 퍼센트는 1% 내지 40%일 수 있다. 몇몇 경우에, DO 농도는 1.5% 내지 35%; 2% 내지 30%; 2.5% 내지 25%; 3% 내지 20%; 4% 내지 19%; 5% 내지 18%; 6% 내지 17%; 7% 내지 16%; 8% 내지 15%; 9% 내지 14%; 10% 내지 13%; 또는 11% 내지 12%일 수 있다. 예를 들어, 일부의 경우에 DO 농도는 2% 내지 30%일 수 있다. 다른 경우에, DO는 3% 내지 20%일 수 있다. 일부의 경우에, DO는 4% 내지 10%일 수 있다. 일부의 경우에, DO는 1.5% 내지 35%일 수 있다. 일부의 경우에, DO는 2.5% 내지 25%일 수 있다. 일부의 경우에, DO는 4% 내지 19%일 수 있다. 일부의 경우에, DO는 5% 내지 18%일 수 있다. 일부의 경우에, DO는 6% 내지 17%일 수 있다. 일부의 경우에, DO는 7% 내지 16%일 수 있다. 일부의 경우에, DO는 8% 내지 15%일 수 있다. 일부의 경우에, DO는 9% 내지 14%일 수 있다. 일부의 경우에, DO는 10% 내지 13%일 수 있다. 일부의 경우에, DO는 11% 내지 12%일 수 있다.
메탄영양체를 사용하는 경우, 메탄 물질의 유형은 수율과 발효 속도에 영향을 미칠 수 있다. 예를 들어, 전형적으로 85% 이상(예를 들어 90% 이상)의 메탄의 메탄 함량을 갖는 천연 가스를 사용할 수 있다. 천연 가스내의 다른 성분은 비제한적으로 에탄, 프로판, 이소-부탄, 노말-부탄, 이소-펜탄, 노말 펜탄, 헥산 플러스, 질소, 이산화 탄소, 산소, 수소 및 황화 수소를 포함할 수 있다.
"순수한" 메탄을 또한 사용할 수 있다. 상기 경우에, 메탄은 전형적으로 탱크로부터 나온다. 상기 탱크내에 함유된 메탄의 범위는 90% 이상의 메탄 함량일 수 있으며 나머지 기체는 다른 기체(예를 들어 이산화 탄소)이다. 예를 들어, 90% 초과의 메탄 함량을 갖는 기체를 발효 공정 동안 사용할 수 있다. 몇몇 경우에, 메탄 농도는 90%; 91%; 92%; 93%; 94%; 95%; 96%; 97%; 98%; 99%; 또는 99.9% 초과일 수 있다. 일부의 경우에, 메탄 농도는 90% 메탄일 수 있고 10%는 다른 기체(예를 들어 이산화 탄소)이다. 다른 예에서, 메탄 농도는 91% 메탄일 수 있고 9%는 다른 기체(예를 들어 이산화 탄소)이다. 일부의 경우에, 메탄 농도는 92% 메탄일 수 있고 8%는 다른 기체(예를 들어 이산화 탄소)이다. 일부의 경우에, 메탄 농도는 93% 메탄일 수 있고 7%는 다른 기체(예를 들어 이산화 탄소)이다. 일부의 경우에, 메탄 농도는 94% 메탄일 수 있고 6%는 다른 기체(예를 들어 이산화 탄소)이다. 일부의 경우에, 메탄 농도는 95% 메탄일 수 있고 5%는 다른 기체(예를 들어 이산화 탄소)이다. 다른 경우에, 메탄 농도는 96% 메탄일 수 있고 4%는 다른 기체(예를 들어 이산화 탄소)이다. 일부의 경우에, 메탄 농도는 97% 메탄일 수 있고 3%는 다른 기체(예를 들어 이산화 탄소)이다. 일부의 경우에, 메탄 농도는 98% 메탄일 수 있고 2%는 다른 기체(예를 들어 이산화 탄소)이다. 일부의 경우에, 메탄 농도는 99% 메탄일 수 있고 1%는 다른 기체(예를 들어 이산화 탄소)이다. 일부의 경우에, 메탄 농도는 99.9% 메탄일 수 있고 0.1%는 다른 기체(예를 들어 이산화 탄소)이다.
스위치가 사용되는 경우에, 배지는 상기 스위치를 유도하거나 억제하는 분자를 포함할 수 있다. 예를 들어, 란타늄 스위치가 본 명세서에 기재된 유전자 중 하나 이상의 발현을 억제하는데 사용되는 경우, 배지는 란타늄을 포함할 수 있고, 상기는 상기 스위치의 조절하에서 상기 하나 이상의 유전자의 발현을 억제할 것이다. 란타늄의 경우에 하기의 농도 중 어느 하나가 하나 이상의 유전자의 발현을 유효하게 억제할 수 있다: 0.1 μM; 0.5 μM; 1 μM; 2 μM; 3 μM; 4 μM; 5 μM; 6 μM; 7 μM; 8 μM; 9 μM; 10 μM; 12.5 μM; 15 μM; 17.5 μM; 20 μM; 25 μM; 50 μM; 100 μM 또는 그 이상. 하나의 경우에, 0.1 μM 란타늄을, 란타늄 스위치의 조절하에서 하나 이상의 유전자의 발현을 억제하는데 사용할 수 있다. 다른 경우에, 적어도 0.5 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 1 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 2 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 3 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 4 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 5 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 6 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 7 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 8 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 9 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 10 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 12.5 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 15 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 17.5 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 20 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 25 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 50 μM 란타늄을 사용할 수 있다. 다른 경우에, 적어도 100 μM 란타늄을 사용할 수 있다. 일부의 경우에, 0.5 μM 란타늄 내지 100 μM 란타늄의 범위가 유전자 발현을 유효하게 억제할 것이다. 일부의 경우에, 0.5 μM 란타늄 내지 50 μM 란타늄의 범위가 유전자 발현을 유효하게 억제할 것이다. 다른 경우에, 1 μM 란타늄 내지 20 μM 란타늄의 범위가 유전자 발현을 억제할 것이다. 일부의 경우에, 2 μM 란타늄 내지 15 μM 란타늄의 범위가 유전자 발현을 억제할 것이다. 일부의 경우에, 3 μM 란타늄 내지 12.5 μM 란타늄의 범위가 유전자 발현을 억제할 것이다. 일부의 경우에, 4 μM 란타늄 내지 12 μM 란타늄의 범위가 유전자 발현을 억제할 것이다. 일부의 경우에, 5 μM 란타늄 내지 11.5 μM 란타늄의 범위가 유전자 발현을 억제할 것이다. 일부의 경우에, 6 μM 란타늄 내지 11 μM 란타늄의 범위가 유전자 발현을 억제할 것이다. 일부의 경우에, 7 μM 란타늄 내지 10.5 μM 란타늄의 범위가 유전자 발현을 억제할 것이다. 일부의 경우에, 8 μM 란타늄 내지 10 μM 란타늄의 범위가 유전자 발현을 억제할 것이다.
일부의 경우에, 배지 중의 란타늄을 희석하여 하나 이상의 란타늄 억제된 유전자의 발현을 켤 수 있다. 예를 들어, 일부의 경우에, 란타늄 함유 배지의 희석은 1:1(1 부 란타늄 함유 배지 대 1 부 비-란타늄 함유 배지)일 수 있다. 일부의 경우에, 희석은 적어도 1:2; 1:3; 1:4; 1:5; 1:7.5; 1:10; 1:15; 1:20; 1:25; 1:30; 1:35; 1:40; 1:45; 1:50; 1:75; 1:100; 1:200; 1:300; 1:400; 1:500; 1:1,000; 또는 1:10,000일 수 있다. 예를 들어, 일부의 경우에, 1:2 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:3 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:4 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:5 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:7.5 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:10 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:15 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:20 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:25 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:30 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:35 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:40 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:45 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:50 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:75 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:100 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:200 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:300 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:400 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:500 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:1,000 희석을 사용할 수 있다. 일부의 경우에, 적어도 1:10,000 희석을 사용할 수 있다.
일부의 경우에, 미생물을 란타늄 함유 배지에서 증식시킬 수 있다. 이어서 배지를 희석하여 란타늄 억제된 유전자의 발현을 유효하게 켤 수 있다. 이어서 미생물을 목적하는 생성물, 예를 들어 2,3-BDO 및 아세토인(또는 전체를 통해 개시된 다른 것들)의 생성을 촉진하는 조건하에서 증식시킬 수 있다.
일부의 경우에, 다른 희토 금속을 사용할 수 있다. 예를 들어, 다른 희토 금속, 예를 들어 세륨(Ce), 디스프로슘(Dy), 에르븀(Er), 유로피움(Eu), 가돌리늄(Gd), 홀뮴(Ho), 루테슘(Lu), 네오디뮴(Nd), 프라세오디뮴(Pr), 프로메티움(Pm), 사마륨(Sm), 스칸듐(Sc), 테르븀(Tb), 툴륨(Tm), 이터븀(Yb), 이트륨(Y), 또는 이들의 임의의 조합을 사용하여 분자 스위치를 억제하거나 활성화할 수 있다.
생물반응기
발효 반응을 임의의 적합한 생물반응기에서 수행할 수 있다. 본 발명의 일부의 경우에, 생물반응기는 미생물을 배양하는 제1의 증식 반응기, 및 상기 증식 반응기로부터의 브로쓰가 공급되고 대부분의 발효 생성물(예를 들어 2,3-BDO)이 생성되는 제2의 발효 반응기를 포함할 수 있다.
생성물 회수
본 명세서에 개시된 미생물의 발효는 영양 배지 중에 목적하는 생성물(예를 들어 2,3-BDO, MEK, 및/또는 부타디엔) 및/또는 하나 이상의 부산물뿐만 아니라 미생물(예를 들어 유전자 변형된 메탄영양체)을 포함하는 발효 브로쓰를 생성시킬 수 있다.
본 명세서의 미생물 및 방법은 놀랍게도 높은 효율로, 다른 공지된 2,3-BDO 발효 공정보다 더 많은 2,3-BDO를 생성시킬 수 있다. 예를 들어, 본 명세서에 개시된 미생물 및 방법은 C1-탄소 기질(예를 들어 메탄)을 50% 초과의 비율로 전환시킬 수 있다. 이는 시스템내 C1-탄소의 적어도 50%가 생성물, 예를 들어 2,3-BDO로 전환됨을 의미한다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 60%, 70%, 80%, 81%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 60%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 70%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 80%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 81%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 82%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 83%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 84%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 85%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 86%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 87%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 88%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 89%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 90%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 91%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 92%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 93%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 94%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 95%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 96%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 97%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 98%일 수 있다. 일부의 경우에, C1-탄소 기질의 2,3-BDO로의 전환은 적어도 99%일 수 있다.
몇몇 방법에서 2,3-BDO를 생성시킬 때, 발효 브로쓰 중의 2,3-BDO의 농도는 적어도 1 g/L이다. 예를 들어, 발효 브로쓰 중에 생성된 2,3-BDO의 농도는 1 g/L 내지 5 g/L, 2 g/L 내지 6 g/L, 3 g/L 내지 7 g/L, 4 g/L 내지 8 g/L, 5 g/L 내지 9 g/L, 또는 6 g/L 내지 10 g/L일 수 있다. 일부의 경우에, 2,3-BDO의 농도는 적어도 9 g/L일 수 있다. 일부의 경우에, 2,3-BDO의 농도는 1 g/L 내지 5 g/L일 수 있다. 일부의 경우에, 2,3-BDO의 농도는 2 g/L 내지 6 g/L일 수 있다. 일부의 경우에, 2,3-BDO의 농도는 3 g/L 내지 7 g/L일 수 있다. 일부의 경우에, 2,3-BDO의 농도는 4 g/L 내지 8 g/L일 수 있다. 일부의 경우에, 2,3-BDO의 농도는 5 g/L 내지 9 g/L일 수 있다. 일부의 경우에, 2,3-BDO의 농도는 6 g/L 내지 10 g/L일 수 있다.
다른 경우에, 통상적으로 적어도 약간의 2,3-BDO를 생성시키는 미생물을 사용하는 경우, 유전자 변형 및 발효 후에, 상기 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 1.1X인 농도로 2,3-BDO를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는(예를 들어 변형되지 않은 및 상기 유전자 변형된 미생물과 동일한 종의 미생물에 의해 생성되는) 양의 적어도 2X, 3X, 4X, 5X, 6X, 7X, 8X, 9X, 10X, 15X, 20X, 25X, 30X, 35X, 40X, 45X, 50X, 60X, 70X, 80X, 90X 또는 100X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 2X, 3X, 4X, 5X, 10X, 25X, 50X, 및 또는 100X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 2X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 3X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 4X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 5X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 10X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 25X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 50X를 생성시킬 수 있다. 일부의 경우에, 유전자 변형된 미생물은 통상적으로 생성되는 양의 적어도 100X를 생성시킬 수 있다.
상기에 논의된 바와 같이, 몇몇 경우에 발효 반응에서 생성된 2,3-BDO를 발효 브로쓰로부터 직접 MEK, 부텐, 및/또는 부타디엔(또는 다른 생성물)으로 전환시킨다. 다른 경우에, 2,3-BDO를 MEK, 부텐 및/또는 부타디엔으로 전환시키기 전에 먼저 발효 브로쓰로부터 회수한다.
일부의 경우에, 2,3-BDO를 브로쓰의 일부로부터 연속적으로 제거하고 정제된 2,3-BDO로서 회수할 수 있다. 특정한 경우에, 2,3-BDO의 회수는 2,3-BDO를 함유하는 브로쓰의 제거된 부분을 분리 유닛을 통해 통과시켜 상기 브로쓰로부터 미생물(예를 들어 유전자 변형된 메탄영양체)을 분리시켜 무세포 2,3-BDO 함유 투과물을 생성시키고, 상기 미생물을 생물반응기로 복귀시킴을 포함한다. 이어서 무세포 2,3-BDO-함유 투과물을 보관하거나 또는 부텐, MEK 및/또는 부타디엔(또는 다른 목적하는 생성물)으로의 후속 전환에 사용할 수 있다.
발효 반응에서 생성된 2,3-BDO 및/또는 하나 이상의 다른 생성물 또는 부산물의 회수는 연속적으로 브로쓰의 일부를 제거하고 상기 브로쓰의 제거된 부분으로부터 별도로 2,3-BDO 및 하나 이상의 다른 생성물을 회수함을 포함할 수 있다. 일부의 경우에 2,3-BDO 및/또는 하나 이상의 다른 생성물의 회수는 2,3-BDO 및/또는 하나 이상의 다른 생성물을 함유하는 브로쓰의 제거된 부분을 분리 유닛을 통해 통과시켜 상기 2,3-BDO 및/또는 하나 이상의 다른 생성물로부터 미생물을 분리시켜 무세포 2,3-BDO 및 하나 이상의 다른 생성물-함유 투과물을 생성시키고 상기 미생물을 생물반응기로 복귀시킴을 포함한다.
상기의 경우에, 2,3-BDO 및 하나 이상의 다른 생성물의 회수는 먼저 2,3-BDO를 무세포 투과물로부터 제거한 다음 하나 이상의 다른 생성물을 상기 무세포 투과물로부터 제거함을 포함할 수 있다. 또한 이어서 무세포 투과물을 생물반응기로 복귀시킬 수 있다.
2,3-BDO, 또는 2,3-BDO를 함유하는 혼합된 생성물 스트림을 발효 브로쓰로부터 회수할 수 있다. 예를 들어, 사용될 수 있는 방법은 비제한적으로 분별 증류 또는 증발, 투석증발, 및 추출 발효를 포함할 수 있다. 추가의 예는: 전체 발효 브로쓰로부터 증기를 사용하는 회수; 증류와 병행된 역삼투; 2,3-BDO의 용매 추출을 수반하는 액체-액체 추출 기법; PEG/덱스트란 시스템에서 2,3-BDO의 수성 2-상 추출; 알콜 또는 에스테르, 예를 들어 에틸 아세테이트, 트리부틸포스페이트, 디에틸 에테르, n-부탄올, 도데칸올, 올레일 알콜, 및 에탄올/포스페이트 시스템을 사용하는 용매 추출; 친수성 용매 및 무기 염으로 구성된 수성 2-상 시스템을 포함한다. 문헌[Voloch, M., et al, (1985)] 및 미국특허 공개 출원 제 2012/0045807 호를 일반적으로 참조하시오.
일부의 경우에 용매에 노출시키기 전에 발효 브로쓰를, 2,3-BDO의 낮은 분배 계수 및 낮은 선택성으로 인해 증발 또는 미세여과 및 역삼투 모두에 의해 탈수시킨다. 염화 칼륨(KCl) 또는 탈수된 K2CO3를 사용하는 염석 또는 반발 추출이 또한, 아세톤-O 부탄올-에탄올 발효에서 부탄올의 추출에 대한 K2CO3의 염석 효과처럼 2,3-BDO(Syu 2001)의 회수에 대해 연구되었다. 발효 브로쓰로부터 물의 제거를 또한, 브로쓰 중의 2,3-BDO의 농도가, 포화된 KCl 또는 K2CO3 용액이라 하더라도 염석되기에 너무 낮기 때문에 염석 전에 시험하였다. 미국특허 공개 출원 제 2012/0045807 호를 일반적으로 참조하시오.
2,3-BDO를 회수하는 방법에 대한 더욱 추가의 예는 상기를 포름알데히드와 반응시켜 산 촉매하에서 포르말을 형성시키는 것이다. 2,3-BDO 포르말을 상부 오일상 중에 수집하고 산 메탄올과 반응되게 하여 2,3-BDO 및 메틸알을 형성시킨다. 메틸알은 메탄올과 포름알데히드로 가수분해될 수 있다. 미국특허 공개 출원 제 2012/0045807 호를 일반적으로 참조하시오.
추가의 예는 등명화된 브로쓰로부터 에탄올/2,3-BD의 추출을 위한 이온성 액체의 사용일 수 있다. 이온성 액체를 물성 변화를 위해 다수의 방식으로 맞출 수 있다. 상기 접근법의 장점은 이온성 액체가 휘발성이 아니라는 것이다. 일부는 수 민감성이나 다른 것들은 그렇지 않다.
앞서 에탄올 및 부탄올 발효에 사용된 투석증발 또는 진공막 증류를 사용하여 발효 브로쓰로부터의 추출물로서 수(water) 중에 2,3-BDO를 농축시킬 수 있다. 미세다공성 폴리테트라플루오로에틸렌(PTFE) 멤브레인을 통합된 공정에 사용하는 반면, 실리콘 멤브레인은 대개 투석증발성 에탄올 또는 부탄올 발효에 사용된다. 미국특허 공개 출원 제 2012/0045807 호를 일반적으로 참조하시오.
아세테이트 및 부티레이트를 포함한 산과 같은 부산물을 또한 당해 분야에 공지된 방법을 사용하여 발효 브로쓰로부터 회수할 수 있다. 예를 들어, 활성탄 필터 또는 전기투석을 수반하는 흡착 시스템을 사용할 수 있다.
본 발명의 몇몇 경우에, 2,3-BDO 및 부산물을 연속적으로 생물반응기로부터 브로쓰의 일부를 제거하고, 상기 브로쓰로부터 미생물 세포를 분리시키고(편의상, 예를 들어 여과에 의해), 2,3-BDO 및 임의로 다른 알콜 및 산을 상기 브로쓰로부터 회수함으로써 발효 브로쓰로부터 회수한다. 알콜을 편의상, 예를 들어 증류에 의해 회수할 수 있으며, 산을 예를 들어 활성탄상의 흡착에 의해 회수할 수 있다. 분리된 미생물 세포를 발효 생물반응기로 복귀시킬 수 있다. 알콜(들) 및 산(들)을 제거한 후에 남은 무세포 투과물을 또한 발효 생물반응기로 복귀시킬 수 있다. 추가적인 영양분을 무세포 투과물에 가하여, 상기를 생물반응기로 복귀시키기 전에 영양 배지를 보충할 수 있다.
또한, 브로쓰의 pH를 2,3-BDO 및/또는 부산물의 회수 중 조절한다면, 상기를 생물반응기로 복귀시키기 전에 pH를 발효 생물반응기 중의 브로쓰의 pH와 유사한 pH로 재-조절해야 할 것이다.
몇몇 경우에, 2,3-BDO를 연속적으로 발효 브로쓰 또는 생물반응기로부터 회수하고 부텐, 부타디엔 및 메틸 에틸 케톤 중 하나 이상으로의 화학적 전환을 위해 직접 공급한다. 예를 들어, 2,3-BDO를 부텐, 부타디엔 및 메틸 에틸 케톤 또는 다른 하류 화학적 생성물 중 하나 이상의 화학 합성에 적합한 하나 이상의 용기로 도관을 통해 직접 공급할 수 있다.
일부의 경우를 본 명세서에 도시하고 기재하였지만, 상기와 같은 경우는 단지 예로서 제공된다. 이제 다수의 변동, 변화 및 치환이 본 발명으로부터 이탈됨 없이 당해 분야의 숙련가들에게 떠오를 것이다. 본 명세서에 기재된 본 발명의 경우에 대한 다양한 대안이 본 발명의 실시에 사용될 것임은 물론이다.
도 1은 메탄(CH4)으로부터 2,3-BDO로의 대사 경로를 도시한다.
도 2는 72시간에 걸친 고-세포 밀도 발효 실험에서 조작된 균주의 수행능을 도시한다. 좌측에서 우측으로, 하기의 균주들을 시험하였다: XZ58(MF1904), XZ06(MF1905), XZ59(MF1906), 및 XZ08(MF1907). 2,3-BDO 및 아세토인 생성을 다양한 시점에서 시험하였다.
도 3은 균주 XZ58에서 2,3-BDO 경로 유전자 발현 카세트의 뉴클레오티드 서열(서열번호 15)을 도시한다. 5'에서 3' 방향으로 진행하여, 밑줄친 대문자 서열은 pBAD 프로모터를 나타낸다. g.Bsu AlsS(아세토락테이트 신타제) 유전자에 대한 개시자 ATG 및 종결자 TAA를 굵은 대문자로 나타내는 반면 암호화 영역은 소문자로 나타낸다. 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Kpn BudA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 이탤릭체 소문자로 나타낸다. 종결자 rrnB를 대문자로 나타낸 다음, pmxaF 프로모터를 밑줄친 이탤릭체 대문자로 나타낸다. g.Cau ButA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 굵은 이탤릭체 소문자로 나타낸다. 종결자 람다T0를 이탤릭체 대문자로 나타낸다.
도 4는 균주 XZ59에서 2,3-BDO 경로 유전자 발현 카세트의 뉴클레오티드 서열(서열번호 16)을 도시한다. 5'에서 3' 방향으로 진행하여, 밑줄친 대문자 서열은 pBAD 프로모터를 나타낸다. g.Bsu AlsS 유전자에 대한 개시자 ATG 및 종결자 TAA를 굵은 대문자로 나타내는 반면 암호화 영역은 소문자로 나타낸다. 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Kpn BudA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 이탤릭체 소문자로 나타낸다. 종결자 rrnB를 대문자로 나타낸 다음, pmxaF 프로모터를 밑줄친 이탤릭체 대문자로 나타낸다. g.Bsu ButA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 굵은 이탤릭체 소문자로 나타낸다. 종결자 람다T0를 이탤릭체 대문자로 나타낸다.
도 5는 균주 XZ06에서 2,3-BDO 경로 유전자 발현 카세트의 뉴클레오티드 서열(서열번호 17)을 도시한다. 5'에서 3' 방향으로 진행하여, 밑줄친 대문자 서열은 pBAD 프로모터를 나타낸다. g.Bsu AlsS 유전자에 대한 개시자 ATG 및 종결자 TAA를 굵은 대문자로 나타내는 반면 암호화 영역은 소문자로 나타낸다. 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Kpn BudA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 이탤릭체 소문자로 나타내고, 이어서 추가적인 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Cau ButA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 굵은 이탤릭체 소문자로 나타낸다. 종결자 rrnB를 대문자로 나타낸다.
도 6은 균주 XZ08에서 2,3-BDO 경로 유전자 발현 카세트의 뉴클레오티드 서열(서열번호 18)을 도시한다. 5'에서 3' 방향으로 진행하여, 밑줄친 대문자 서열은 pBAD 프로모터를 나타낸다. g.Bsu AlsS 유전자에 대한 개시자 ATG 및 종결자 TAA를 굵은 대문자로 나타내는 반면 암호화 영역은 소문자로 나타낸다. 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Kpn BudA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 이탤릭체 소문자로 나타내고, 이어서 추가적인 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Bsu ButA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 굵은 이탤릭체 소문자로 나타낸다. 종결자 rrnB를 대문자로 나타낸다.
도 7A 및 7B. 도 7A는 란타늄 함유 배지의 희석에 이어서 96시간 후에 21개의 상이한 균주의 아세토인 및 2,3-BDO 생성을 나타낸다. 균주 및 상기 균주의 유전자형을 표 3 및 4에 나열한다. 균주 1 내지 21에 대해서, 생성 역가를, 배양물의 신선한 배지로의 1:10(10X) 희석 후 96시간째에 측정한 반면, 균주 22 내지 42의 경우엔 생성 역가를 1:50(50X) 희석 후에 측정하였다. 균주 22 내지 27은, 2,3-BDO 생성 단계에 앞서 적은 희석이 가해진 균주에 비해, 높은 수준의 2,3-BDO를 생성시켰다. 도 7B는 란타늄 함유 배지의 희석에 이어서 120시간 후에 21개의 상이한 균주의 아세토인 및 2,3-BDO 생성을 나타낸다. 균주 및 상기 균주의 유전자형을 표 3 및 4에 나열한다. 균주 1 내지 21에 대해서, 생성 역가를, 배양물의 신선한 배지로의 1:10(10X) 희석 후 120시간째에 측정한 반면, 균주 22 내지 42의 경우엔 생성 역가를 1:50(50X) 희석 후에 측정하였다. 균주 22 내지 27은, 2,3-BDO 생성 단계에 앞서 적은 희석이 가해진 균주에 비해, 높은 수준의 2,3-BDO를 생성시켰다.
도 8은 바실러스 리케니포르미스(Bacillus licheniformis) AlsS를 발현하는 균주가 현저하게 개선된 2,3-BDO 역가를 나타내었음을 도시한다. 바실러스 리케니포르미스 AlsS를 발현하는 하나의 균주(XZ562)에서 2,3-BDO 역가는 발효 실시에 걸쳐 XZ58 균주(도 3에 기재됨)보다 평균 44.6% 증가하였다. 또 다른 생물학적 복제물(XZ561)이 또한 XZ58 균주에 비해 현저하게 더 높은 평균 2,3-BDO 역가를 생성시켰다.
도 9는 42℃ 또는 37℃에서 발효된 2,3-BDO를 생성하도록 유전자 조작된 7개의 메탄영양체 균주의 2,3-BDO 역가를 도시한다. 보이는 바와 같이, 모든 균주는 42℃에서 배양시 보다 높은 2,3-BDO 역가를 생성시켰다. 균주 MBC2122는 37℃에 비해 42℃에서 대략적으로 50% 더 많은 2,3-BDO를 생성시켰다.
도 10은 45℃ 또는 37℃에서 발효된 2,3-BDO를 생성하도록 유전자 조작된 3개의 메탄영양체 균주의 2,3-BDO 역가를 도시한다. 보이는 바와 같이, 모든 균주는 45℃에서 배양시 보다 낮은 2,3-BDO 역가를 생성시켰다. 상기 균주의 대부분은 37℃에 비해 45℃에서 대략적으로 50% 적은 2,3-BDO를 생성시켰다. 에피솜 균주 MBC1322는 37℃ 및 45℃ 모두에서 항생제 선택압과 함께 보다 양호하게 수행하였으며, 이는 안정성 문제를 가리킨다. 이와 상반되게, 통합된 균주는 선택압 없이 그의 생산성을 유지할 수 있었다.
도 11은 37℃, 41℃, 43℃, 45℃, 및 47℃에서 발효된 2,3-BDO를 생성하도록 유전자 조작된 메탄영양체 균주의 생산성(2,3-BDO/OD 비)을 도시한다. 최고의 생산성은 41℃의 온도에서 관찰되었다.
도 12는 진탕병 실험에서 에피솜 벡터내에 2,3-BDO 경로 효소의 추가적인 사본을 함유하는 메탄영양체 균주(균주 B 및 C)가 단독 통합된 균주(균주 A)에 비해 3배 이상 많은 2,3-BDO를 생성시켰음을 도시한다. 균주 B 및 균주 C를 37℃에서 48시간 동안 카나마이신의 존재하에 10 μM 란타늄 중에서 예비배양하였다. 균주 A를 카나마이신 첨가 없음을 제외하고 동일한 조건하에서 예비배양하였다. 48시간 후에, 란타늄을 50배(50X)까지 희석하였으며 2,3-BDO 역가를 96시간 후에 측정하였다.
도 13은 2,3-BDO 경로 효소를 암호화하는 유전자의 에피솜 발현시 상기 유전자를 갖는 메탄영양체 균주(균주 D)의 예비배양(진탕병 실험에서) 효과를 도시한다. 메탄영양체 균주를 10 uM, 3 uM 및 1 uM 란타늄 중에서 예비배양하였다. 생성 배지를 후속적으로 50배까지 희석하였다. 보다 높은 란타늄 농도는 에피솜 발현된 메탄영양체 균주에 대해 보다 높은 2,3BDO 역가를 생성시켰다.
도 14는 2,3-BDO 경로 효소를 암호화하는 유전자의 메탄영양체 게놈내로의 통합시 상기 유전자를 갖는 메탄영양체 균주(균주 A)의 예비배양(진탕병 실험에서) 효과를 도시한다. 상기 균주를 35 μM, 10 μM, 3 μM, 1 μM 및 0 μM 란타늄 중에서 예비배양하였다. 생성 배지를 후속적으로 50배(50X)까지 희석하였다. 상기 균주를 보다 낮은 란타늄 농도로 예비배양시 2,3-BDO 생성 수준이 증가하였다.
도 15는 진탕병 실험에서 도 12로부터의 2개 균주(균주 B 및 C)의 상이한 란타늄 농도(10 μM, 3 μM, 및 1 μM)에서의 예비배양 효과를 도시한다. 상기 두 균주 모두 2,3-BDO 경로 효소의 통합 발현된 및 에피솜 발현된 사본을 모두 함유하였다. 일반적으로, 에피솜 발현된 2,3-BDO 경로 효소를 갖는 균주가 10 μM 란타늄 중에서 예비배양시 더 높은 2,3-BDO 역가를 생성시킨다.
도 16은 균주 A, B, C 및 D의 유전자형의 요약을 도시한다.
도 2는 72시간에 걸친 고-세포 밀도 발효 실험에서 조작된 균주의 수행능을 도시한다. 좌측에서 우측으로, 하기의 균주들을 시험하였다: XZ58(MF1904), XZ06(MF1905), XZ59(MF1906), 및 XZ08(MF1907). 2,3-BDO 및 아세토인 생성을 다양한 시점에서 시험하였다.
도 3은 균주 XZ58에서 2,3-BDO 경로 유전자 발현 카세트의 뉴클레오티드 서열(서열번호 15)을 도시한다. 5'에서 3' 방향으로 진행하여, 밑줄친 대문자 서열은 pBAD 프로모터를 나타낸다. g.Bsu AlsS(아세토락테이트 신타제) 유전자에 대한 개시자 ATG 및 종결자 TAA를 굵은 대문자로 나타내는 반면 암호화 영역은 소문자로 나타낸다. 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Kpn BudA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 이탤릭체 소문자로 나타낸다. 종결자 rrnB를 대문자로 나타낸 다음, pmxaF 프로모터를 밑줄친 이탤릭체 대문자로 나타낸다. g.Cau ButA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 굵은 이탤릭체 소문자로 나타낸다. 종결자 람다T0를 이탤릭체 대문자로 나타낸다.
도 4는 균주 XZ59에서 2,3-BDO 경로 유전자 발현 카세트의 뉴클레오티드 서열(서열번호 16)을 도시한다. 5'에서 3' 방향으로 진행하여, 밑줄친 대문자 서열은 pBAD 프로모터를 나타낸다. g.Bsu AlsS 유전자에 대한 개시자 ATG 및 종결자 TAA를 굵은 대문자로 나타내는 반면 암호화 영역은 소문자로 나타낸다. 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Kpn BudA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 이탤릭체 소문자로 나타낸다. 종결자 rrnB를 대문자로 나타낸 다음, pmxaF 프로모터를 밑줄친 이탤릭체 대문자로 나타낸다. g.Bsu ButA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 굵은 이탤릭체 소문자로 나타낸다. 종결자 람다T0를 이탤릭체 대문자로 나타낸다.
도 5는 균주 XZ06에서 2,3-BDO 경로 유전자 발현 카세트의 뉴클레오티드 서열(서열번호 17)을 도시한다. 5'에서 3' 방향으로 진행하여, 밑줄친 대문자 서열은 pBAD 프로모터를 나타낸다. g.Bsu AlsS 유전자에 대한 개시자 ATG 및 종결자 TAA를 굵은 대문자로 나타내는 반면 암호화 영역은 소문자로 나타낸다. 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Kpn BudA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 이탤릭체 소문자로 나타내고, 이어서 추가적인 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Cau ButA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 굵은 이탤릭체 소문자로 나타낸다. 종결자 rrnB를 대문자로 나타낸다.
도 6은 균주 XZ08에서 2,3-BDO 경로 유전자 발현 카세트의 뉴클레오티드 서열(서열번호 18)을 도시한다. 5'에서 3' 방향으로 진행하여, 밑줄친 대문자 서열은 pBAD 프로모터를 나타낸다. g.Bsu AlsS 유전자에 대한 개시자 ATG 및 종결자 TAA를 굵은 대문자로 나타내는 반면 암호화 영역은 소문자로 나타낸다. 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Kpn BudA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 이탤릭체 소문자로 나타내고, 이어서 추가적인 리보솜 결합 부위 rbsGTW001을 박스로 된 대문자 텍스트로 나타낸다. g.Bsu ButA 유전자에 대한 개시자 ATG 및 종결자 TGA를 굵은 이탤릭체 대문자로 나타내는 반면 암호화 영역은 굵은 이탤릭체 소문자로 나타낸다. 종결자 rrnB를 대문자로 나타낸다.
도 7A 및 7B. 도 7A는 란타늄 함유 배지의 희석에 이어서 96시간 후에 21개의 상이한 균주의 아세토인 및 2,3-BDO 생성을 나타낸다. 균주 및 상기 균주의 유전자형을 표 3 및 4에 나열한다. 균주 1 내지 21에 대해서, 생성 역가를, 배양물의 신선한 배지로의 1:10(10X) 희석 후 96시간째에 측정한 반면, 균주 22 내지 42의 경우엔 생성 역가를 1:50(50X) 희석 후에 측정하였다. 균주 22 내지 27은, 2,3-BDO 생성 단계에 앞서 적은 희석이 가해진 균주에 비해, 높은 수준의 2,3-BDO를 생성시켰다. 도 7B는 란타늄 함유 배지의 희석에 이어서 120시간 후에 21개의 상이한 균주의 아세토인 및 2,3-BDO 생성을 나타낸다. 균주 및 상기 균주의 유전자형을 표 3 및 4에 나열한다. 균주 1 내지 21에 대해서, 생성 역가를, 배양물의 신선한 배지로의 1:10(10X) 희석 후 120시간째에 측정한 반면, 균주 22 내지 42의 경우엔 생성 역가를 1:50(50X) 희석 후에 측정하였다. 균주 22 내지 27은, 2,3-BDO 생성 단계에 앞서 적은 희석이 가해진 균주에 비해, 높은 수준의 2,3-BDO를 생성시켰다.
도 8은 바실러스 리케니포르미스(Bacillus licheniformis) AlsS를 발현하는 균주가 현저하게 개선된 2,3-BDO 역가를 나타내었음을 도시한다. 바실러스 리케니포르미스 AlsS를 발현하는 하나의 균주(XZ562)에서 2,3-BDO 역가는 발효 실시에 걸쳐 XZ58 균주(도 3에 기재됨)보다 평균 44.6% 증가하였다. 또 다른 생물학적 복제물(XZ561)이 또한 XZ58 균주에 비해 현저하게 더 높은 평균 2,3-BDO 역가를 생성시켰다.
도 9는 42℃ 또는 37℃에서 발효된 2,3-BDO를 생성하도록 유전자 조작된 7개의 메탄영양체 균주의 2,3-BDO 역가를 도시한다. 보이는 바와 같이, 모든 균주는 42℃에서 배양시 보다 높은 2,3-BDO 역가를 생성시켰다. 균주 MBC2122는 37℃에 비해 42℃에서 대략적으로 50% 더 많은 2,3-BDO를 생성시켰다.
도 10은 45℃ 또는 37℃에서 발효된 2,3-BDO를 생성하도록 유전자 조작된 3개의 메탄영양체 균주의 2,3-BDO 역가를 도시한다. 보이는 바와 같이, 모든 균주는 45℃에서 배양시 보다 낮은 2,3-BDO 역가를 생성시켰다. 상기 균주의 대부분은 37℃에 비해 45℃에서 대략적으로 50% 적은 2,3-BDO를 생성시켰다. 에피솜 균주 MBC1322는 37℃ 및 45℃ 모두에서 항생제 선택압과 함께 보다 양호하게 수행하였으며, 이는 안정성 문제를 가리킨다. 이와 상반되게, 통합된 균주는 선택압 없이 그의 생산성을 유지할 수 있었다.
도 11은 37℃, 41℃, 43℃, 45℃, 및 47℃에서 발효된 2,3-BDO를 생성하도록 유전자 조작된 메탄영양체 균주의 생산성(2,3-BDO/OD 비)을 도시한다. 최고의 생산성은 41℃의 온도에서 관찰되었다.
도 12는 진탕병 실험에서 에피솜 벡터내에 2,3-BDO 경로 효소의 추가적인 사본을 함유하는 메탄영양체 균주(균주 B 및 C)가 단독 통합된 균주(균주 A)에 비해 3배 이상 많은 2,3-BDO를 생성시켰음을 도시한다. 균주 B 및 균주 C를 37℃에서 48시간 동안 카나마이신의 존재하에 10 μM 란타늄 중에서 예비배양하였다. 균주 A를 카나마이신 첨가 없음을 제외하고 동일한 조건하에서 예비배양하였다. 48시간 후에, 란타늄을 50배(50X)까지 희석하였으며 2,3-BDO 역가를 96시간 후에 측정하였다.
도 13은 2,3-BDO 경로 효소를 암호화하는 유전자의 에피솜 발현시 상기 유전자를 갖는 메탄영양체 균주(균주 D)의 예비배양(진탕병 실험에서) 효과를 도시한다. 메탄영양체 균주를 10 uM, 3 uM 및 1 uM 란타늄 중에서 예비배양하였다. 생성 배지를 후속적으로 50배까지 희석하였다. 보다 높은 란타늄 농도는 에피솜 발현된 메탄영양체 균주에 대해 보다 높은 2,3BDO 역가를 생성시켰다.
도 14는 2,3-BDO 경로 효소를 암호화하는 유전자의 메탄영양체 게놈내로의 통합시 상기 유전자를 갖는 메탄영양체 균주(균주 A)의 예비배양(진탕병 실험에서) 효과를 도시한다. 상기 균주를 35 μM, 10 μM, 3 μM, 1 μM 및 0 μM 란타늄 중에서 예비배양하였다. 생성 배지를 후속적으로 50배(50X)까지 희석하였다. 상기 균주를 보다 낮은 란타늄 농도로 예비배양시 2,3-BDO 생성 수준이 증가하였다.
도 15는 진탕병 실험에서 도 12로부터의 2개 균주(균주 B 및 C)의 상이한 란타늄 농도(10 μM, 3 μM, 및 1 μM)에서의 예비배양 효과를 도시한다. 상기 두 균주 모두 2,3-BDO 경로 효소의 통합 발현된 및 에피솜 발현된 사본을 모두 함유하였다. 일반적으로, 에피솜 발현된 2,3-BDO 경로 효소를 갖는 균주가 10 μM 란타늄 중에서 예비배양시 더 높은 2,3-BDO 역가를 생성시킨다.
도 16은 균주 A, B, C 및 D의 유전자형의 요약을 도시한다.
실시예
실시예 1: 메탄영양체의 유전 공학
2,3-BDO를 생성하도록 메탄영양체를 조작하기 위해서, 우리는 엠.캅술라투스로 시작하여 바실러스 서브틸리스, 클로스트리디움 아우토에타노게늄, 클렙시엘라 뉴모니아에, 및 파에니바실러스 폴리믹사로부터 다수의 2,3-BDO 생합성 유전자를 시험하였다. 하기 표 1은 시험된 유전자 및 유전자 기원을 나타낸다.
경로의 첫 번째 유전자, AlsS(피루베이트 2 분자를 2-아세토락테이트로 전환시키는 효소를 암호화한다)에 대해서, 우리는 바실러스 서브틸리스 및 클로스트리디움 아우토에타노게늄으로부터의 AlsS 상동체를 시험하였다. 경로의 두 번째 유전자, BudA(2-아세토락테이트를 아세토인으로 전환시키는 효소를 암호화한다)에 대해서, 우리는 클로스트리디움 아우토에타노게늄 및 클렙시엘라 뉴모니아에로부터의 BudA 상동체를 시험하였다. 경로의 세 번째 유전자, ButA(아세토인을, 환원된 보조인자로서 NAD(P)H를 사용하여 2,3-BDO로 전환시키는 효소를 암호화한다)에 대해서, 우리는 클로스트리디움 아우토에타노게늄(NADPH-의존성), 바실러스 서브틸리스(NADH-의존성), 및 파에니바실러스 폴리믹사(NADH-의존성)로부터의 ButA 상동체를 시험하였다.
우리는 표 2(하기 실시예 2에서)에 나타낸 바와 같이, 3-유전자 2,3-BDO 경로에서 변화를 함유하는 48개의 상이한 광범위한 숙주 플라스미드를 생성시켰다. 표 2는 생성된 조작된 균주의 유전자형을 나타낸다.
실시예 2: 2,3-BDO 생산성
우리는 상기 언급한 플라스미드(실시예 1에서)를 형질전환성 메탄영양체 균주, RL83A내로 형질전환시키고, 탄소원으로서 메탄을 사용하여 소규모 미세적정 플레이트 발효에서 2,3-BDO 생성에 대해 74개의 생성 균주(생물학적 복제 균주 포함)를 평가하였다.
표 2에 나타낸 바와 같이, AlsS 유전자를 구성적으로 발현한 구조물은 2,3-BDO의 형질전환체가 아니거나 상기를 생성시키지 않았으며, 이는 AlsS 유전자가 강하고 구성적으로 발현될 때 부정적인 영향이 존재하였음을 암시한다. 결과는 가장 많은 2,3-BDO를 생성시킨 균주가 유전자 조합 BsuAlsA-KpnBudA-CauButA 또는 BsuAlsA-KpnBudA-BsuButA를 함유하였음을 보였다(표 2).
1차 미세플레이트 분석으로부터의 결과를 확인하기 위해서, 우리는 4개의 상위 균주, XZ58 및 XZ06(BsuAlsA-KpnBudA-CauButA), XZ59 및 XZ08(BsuAlsA-KpnBudA-BsuButA)을 1 L 생물반응기에서 고 세포-밀도 발효 실험에서 평가하였다. 도 2에 도시된 바와 같이, 균주 XZ58 및 XZ06은 끝에서 두 번째 생성물 아세토인의 생성없이, 각각 9.3 g/L 및 8.5 g/L의 2,3-BDO를 생성시켰다(도 2, 좌측 패널). 데이터는 NADPH-의존성 아세토인 리덕타제(CauButA)를 발현하는 균주가 아세토인 공-생성물 없이 오직 2,3-BDO만을 생성시킴을 입증한다. 대조적으로, NADH-의존성 아세토인 리덕타제를 발현하는 균주는 상당량의 2,3-BDO 전구체, 아세토인을 생성시켰다(도 2, 우측 패널). NADH-의존성 경로에서 아세토인의 2,3-BDO로의 비효율적인 전환은 엠. 캅술라투스에서 불충분한 효소 발현 또는 낮은 NADH 전구체 풀에 기인할 수 있었다.
실시예 3: 2,3-BDO 생성에 사용되는 유전자 스위치
2,3-BDO 생성을 특정한 시기에 유효하게 조절하기 위해서, 유전자 스위치 시스템을 실행하였다. 메탄영양체를 란타늄 "스위치"의 조절하에 놓인 유전자로 형질전환시켰다. 란타늄 스위치는 금속 란타늄의 존재하에서 유전자의 발현을 억제한다. 배지 중 란타늄의 제거 또는 희석시에, 억제된 유전자는 "스위치가 켜진다".
메탄영양체의 상이한 균주(균주 및 상기 균주의 유전자형을 나타내는 하기 표 3에 나타낸 바와 같이)를 10 μM 란타늄의 존재하에서 예비-배양하였다.
예비배양물을 ∼3 OD600으로 증식시킨 후에, 란타늄 함유 배지를 1:10(란타늄 함유 배지:비-란타늄 함유 배지) 또는 1:50의 비로 희석하였다. 96 또는 120시간 후에, 배양물을 2,3-BDO 및 아세토인(도 7A, 96시간) 또는 (도 7B, 120시간)의 생성에 대해 평가하였다. 하기 표 4에, 균주, 희석 수준, 96시간 후 아세토인 생성 역가, 96시간 후 2,3-BDO 생성 역가, 120시간 후 아세토인 생성 역가, 및 120시간 후 2,3-BDO 생성 역가를 나타낸다.
도 7A, 7B 및 표 4에 나타낸 바와 같이, 균주 XZ685, XZ686, XZ687, XZ688, XZ689, 및 XZ690(도 7A 및 7B에서 각각 22 내지 27로 지칭함)은 란타늄 함유 배지를 1:50(50X) 희석할 때 96시간 및 120시간 모두에서 2,3-BDO의 최고의 역가를 생성시켰다. 1:10 희석 프로토콜의 사용은 또한 2,3-BDO의 상당한 생성을 생성시켰으나, 역가는 96시간 및 120시간 모두에서 1:50 희석 프로토콜을 사용한 경우보다 더 낮았다. 균주 XZ697, XZ698, XZ699, XZ700, XZ701, 및 XZ702(도 7A 및 7B에서 각각 34 내지 39를 지칭함)는 96시간 및 120시간 모두에서 1:10 및 1:50 희석 모두에서 더 낮은 역가를 생성시켰다.
실시예 4: 아세토락테이트 신타제
표 5(하기)에 기재된 플라스미드를 형질전환성 메탄영양체 균주내로 형질전환시켰다. 생성 균주를 탄소원으로서 메탄을 사용하여 소규모 미세적정 플레이트 발효에서 2,3-BDO 생성 역가에 대해 시험하였다.
표 5 및 도 8에 나타낸 바와 같이, 바실러스 리케니포르미스 AlsS 유전자를 발현한 균주는 바실러스 서브틸리스 AlsS(실시예 2에 기재된 균주)를 발현한 균주보다 더 양호한 2,3-BDO 생성 역가를 나타내었다. 일례로, 오직 AlsS 유전자만의 치환을 갖는 균주(예를 들어 균주 XZ557)는 균주 XZ58에 비해 16.1% 이하의 2,3-BDO 생성 역가의 증가를 나타내었다. 또 다른 예에서, 오직 Kpn.BudA 유전자에 대한 리보솜 결합 부위만의 치환을 갖는 균주인 XZ546 균주는 균주 XZ58에 비해 2,3-BDO 역가의 증가를 사실상 나타내지 않았다. 그러나, 현저하게, rbs.GTW0001 대신에 Kpn.BudA에 대해 rbs.Mca.MxaF를 함유하고 바실러스 리케니포르미스 AlsS 유전자를 발현한 균주(예를 들어 균주 XZ562)는 균주 XZ58에 비해, 44.6% 이하의 2,3-BDO 역가의 현저한 증가를 나타내었다.
실시예 5: 발효 중 온도
때때로 플라스미드 발현 균주 중에 존재하는 불안정성을 방지하기 위해서, 우리는 Glgc 유전자좌에서 염색체에 통합된 2,3-BDO 경로 유전자를 갖는 균주를 생성시켰다. 총 21개의 균주가 생성되었다.
균주 중 7개를 37℃ 및 42℃에서 2,3-BDO를 생성시키는 그들의 능력에 대해 진탕병 중에서 시험하였다. 발효는 96시간의 기간에 걸쳐 발생하였다. 균주의 유전자형을 하기 표 6에 나타낸다.
도 9에서 보이는 바와 같이, 시험된 모든 균주는 42℃에서 발효가 발생했을 때 현저하게 더 많은 2,3-BDO를 생성시켰다. 일부 균주, 예를 들어 MBC2122는 37℃에서보다 42℃에서 2,3-BDO 량의 대략 2배를 생성시켰다.
균주 중 3개를 항생제 선택압의 존재 및 부재하에 45℃에서 발효시 추가로 시험하였다. 37℃에서 배양된 동일한 균주에 비해, 45℃에서 발효된 균주는 현저하게 더 적게 2,3-BDO를 생성시켰다. 도 10을 참조하시오. 에피솜 균주 MBC1322는 37℃ 및 45℃ 모두에서 항생제 선택압의 존재하에서 더 양호하게 수행하였으며, 이는 안정성 문제를 가리킨다. 상반되게, 통합된 균주는 선택압 없이 그의 생산성을 유지할 수 있었다.
추가로 시험을 37℃, 41℃, 43℃, 45℃, 및 47℃에서 수행하였다. 2,3-BDO 역가 및 OD 분배량을 계산하였다. 도 11에서 보이는 바와 같이, 최상의 생산성은 41℃의 온도에서 관찰되었다.
실시예 6: 추가적인 유전자 사본
에피솜 벡터 내에 2,3-BDO 경로 효소의 추가적인 사본을 함유하는 메탄영양체 균주(균주 B 및 C)는 진탕병 실험에서 단독으로 통합된 균주(균주 A)에 비해 증가된 2,3-BDO를 생성시켰다. 균주 B 및 균주 C를 48시간 동안 37℃에서 카나마이신의 존재하에 10 μM 란타늄 중에서 예비배양하였다. 균주 A를 카나마이신을 첨가하지 않음을 제외하고 동일한 조건에서 예비배양하였다. 48시간 후에, 란타늄을 50배(50X)까지 희석하고, 2,3-BDO 역가를 96시간 후에 측정하였다. 도 12에서 보이는 바와 같이, 에피솜 벡터내에 2,3-BDO 경로 효소의 추가적인 사본을 함유하는 균주(균주 B 및 C)는 단독으로 통합된 균주(균주 A)에 비해 3배 넘게 많은 2,3-BDO를 생성시켰다.
실시예 7: 예비배양
예비배양의 효과를 에피솜 및 통합 균주 모두뿐만 아니라 에피솜 발현된 2,3-BDO 경로 유전자 및 상기 유전자의 통합된 사본을 모두 갖는 균주에서 시험하였다.
도 13에서 보이는 바와 같이, 2,3-BDO 경로 효소를 암호화하는 유전자가 에피솜 발현된 메탄영양체 균주(균주 D)의 예비배양(진탕 병에서) 효과. 메탄영양체 균주를 예비-배양 동안 10 uM, 3 uM 및 1 uM 란타늄 중에서 예비배양하였다. 생산 배지를 나중에 50배까지 희석하였다. 보다 높은 란타늄 농도는 에피솜 발현된 균주에 대해서 더 높은 2,3BDO 역가를 생성시켰다.
도 14에서 보이는 바와 같이, 2,3-BDO 경로 효소를 암호화하는 유전자가 메탄영양체의 게놈내에 통합된 메탄영양체 균주의 예비배양(진탕 병에서) 효과. 메탄영양체 균주(균주 A)를 35 μM, 10 μM, 3 μM, 1 μM 및 0 μM 란타늄 중에서 예비배양하였다. 생산 배지를 나중에 50배(50X)까지 희석하였다. 2,3-BDO 생성의 수준은 균주를 보다 낮은 농도의 란타늄과 예비배양했을 때 증가하였다.
도 15에서 보이는 바와 같이, 진탕병 실험에서 도 12로부터의 2개의 균주(균주 B 및 C)의 상이한 란타늄 농도(10 μM, 3 μM, 및 1 μM)에서의 예비배양 효과를 나타낸다. 2개의 균주는 모두 2,3-BDO 경로 효소의 하나의 통합된 사본 및 에피솜 발현된 사본을 함유한다. 일반적으로, 에피솜 발현된 2,3-BDO 경로 효소를 갖는 균주는 10 μM 란타늄 중에서 예비배양시 더 높은 2,3-BDO 역가를 생성시킨다.
SEQUENCE LISTING
<110> INTREXON CORPORATION
<120> METHODS AND MICROORGANISMS FOR MAKING 2,3-BUTANEDIOL AND
DERIVATIVES THEREOF FROM C1 CARBONS
<130> IPA190976-US-D1
<150> US 62/451,819
<151> 2017-01-30
<150> US 62/504,626
<151> 2017-05-11
<150> US 62/512,312
<151> 2017-05-30
<150> US 62/588,985
<151> 2017-11-21
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 571
<212> PRT
<213> Bacillus subtilis
<400> 1
Met Leu Thr Lys Ala Thr Lys Glu Gln Lys Ser Leu Val Lys Asn Arg
1 5 10 15
Gly Ala Glu Leu Val Val Asp Cys Leu Val Glu Gln Gly Val Thr His
20 25 30
Val Phe Gly Ile Pro Gly Ala Lys Ile Asp Ala Val Phe Asp Ala Leu
35 40 45
Gln Asp Lys Gly Pro Glu Ile Ile Val Ala Arg His Glu Gln Asn Ala
50 55 60
Ala Phe Met Ala Gln Ala Val Gly Arg Leu Thr Gly Lys Pro Gly Val
65 70 75 80
Val Leu Val Thr Ser Gly Pro Gly Ala Ser Asn Leu Ala Thr Gly Leu
85 90 95
Leu Thr Ala Asn Thr Glu Gly Asp Pro Val Val Ala Leu Ala Gly Asn
100 105 110
Val Ile Arg Ala Asp Arg Leu Lys Arg Thr His Gln Ser Leu Asp Asn
115 120 125
Ala Ala Leu Phe Gln Pro Ile Thr Lys Tyr Ser Val Glu Val Gln Asp
130 135 140
Val Lys Asn Ile Pro Glu Ala Val Thr Asn Ala Phe Arg Ile Ala Ser
145 150 155 160
Ala Gly Gln Ala Gly Ala Ala Phe Val Ser Phe Pro Gln Asp Val Val
165 170 175
Asn Glu Val Thr Asn Thr Lys Asn Val Arg Ala Val Ala Ala Pro Lys
180 185 190
Leu Gly Pro Ala Ala Asp Asp Ala Ile Ser Ala Ala Ile Ala Lys Ile
195 200 205
Gln Thr Ala Lys Leu Pro Val Val Leu Val Gly Met Lys Gly Gly Arg
210 215 220
Pro Glu Ala Ile Lys Ala Val Arg Lys Leu Leu Lys Lys Val Gln Leu
225 230 235 240
Pro Phe Val Glu Thr Tyr Gln Ala Ala Gly Thr Leu Ser Arg Asp Leu
245 250 255
Glu Asp Gln Tyr Phe Gly Arg Ile Gly Leu Phe Arg Asn Gln Pro Gly
260 265 270
Asp Leu Leu Leu Glu Gln Ala Asp Val Val Leu Thr Ile Gly Tyr Asp
275 280 285
Pro Ile Glu Tyr Asp Pro Lys Phe Trp Asn Ile Asn Gly Asp Arg Thr
290 295 300
Ile Ile His Leu Asp Glu Ile Ile Ala Asp Ile Asp His Ala Tyr Gln
305 310 315 320
Pro Asp Leu Glu Leu Ile Gly Asp Ile Pro Ser Thr Ile Asn His Ile
325 330 335
Glu His Asp Ala Val Lys Val Glu Phe Ala Glu Arg Glu Gln Lys Ile
340 345 350
Leu Ser Asp Leu Lys Gln Tyr Met His Glu Gly Glu Gln Val Pro Ala
355 360 365
Asp Trp Lys Ser Asp Arg Ala His Pro Leu Glu Ile Val Lys Glu Leu
370 375 380
Arg Asn Ala Val Asp Asp His Val Thr Val Thr Cys Asp Ile Gly Ser
385 390 395 400
His Ala Ile Trp Met Ser Arg Tyr Phe Arg Ser Tyr Glu Pro Leu Thr
405 410 415
Leu Met Ile Ser Asn Gly Met Gln Thr Leu Gly Val Ala Leu Pro Trp
420 425 430
Ala Ile Gly Ala Ser Leu Val Lys Pro Gly Glu Lys Val Val Ser Val
435 440 445
Ser Gly Asp Gly Gly Phe Leu Phe Ser Ala Met Glu Leu Glu Thr Ala
450 455 460
Val Arg Leu Lys Ala Pro Ile Val His Ile Val Trp Asn Asp Ser Thr
465 470 475 480
Tyr Asp Met Val Ala Phe Gln Gln Leu Lys Lys Tyr Asn Arg Thr Ser
485 490 495
Ala Val Asp Phe Gly Asn Ile Asp Ile Val Lys Tyr Ala Glu Ser Phe
500 505 510
Gly Ala Thr Gly Leu Arg Val Glu Ser Pro Asp Gln Leu Ala Asp Val
515 520 525
Leu Arg Gln Gly Met Asn Ala Glu Gly Pro Val Ile Ile Asp Val Pro
530 535 540
Val Asp Tyr Ser Asp Asn Ile Asn Leu Ala Ser Asp Lys Leu Pro Lys
545 550 555 560
Glu Phe Gly Glu Leu Met Lys Thr Lys Ala Leu
565 570
<210> 2
<211> 1713
<212> DNA
<213> Bacillus subtilis
<400> 2
atgaccaagg ccaccaagga acagaaaagc ctggtcaaga accgcggtgc tgaactggtt 60
gtggactgcc tcgtggaaca gggcgtgacc catgtcttcg gcatcccggg cgccaagatc 120
gacgccgtct tcgacgccct gcaggataaa ggtccggaaa tcatcgtggc acgccatgag 180
cagaacgcag ccttcatggc ccaggccgtc ggtcggctga cgggtaagcc cggcgtggtg 240
ctggtcacct ccggtccggg agcctcgaac ctggccacgg gactgctcac cgccaacacc 300
gaaggcgacc cggtggtcgc cctggccggt aatgtcatcc gggcggatcg cctgaagcgc 360
acccatcagt ccctggataa cgcggccctg ttccagccaa tcaccaaata tagtgtcgaa 420
gtgcaggatg tgaagaacat cccggaagcc gtcaccaatg cgttccgaat cgcgtccgcc 480
ggccaagcag gggcagcatt cgtgagcttc ccccaggacg tggtcaatga agtgaccaac 540
accaaaaacg tcagagccgt agccgccccg aagctgggcc ctgcagcaga tgacgccatc 600
tccgctgcca tcgcgaagat ccagaccgca aagctgccgg tcgtgctggt cggaatgaag 660
ggcggacgcc cggaggccat caaggccgtg cgtaaactgc tgaagaaggt gcagctaccg 720
ttcgtggaaa cctaccaggc cgccggcacc ctgagtcggg acttggaaga ccagtatttc 780
ggccgtatcg gcctgttccg caaccagccg ggcgacctgc tcctggaaca agccgatgtg 840
gtgctgacca tcggctacga cccgatcgaa tatgacccga agttctggaa catcaatggc 900
gaccgcacga tcatccatct ggacgaaatc atcgccgaca tcgaccatgc ctatcagccg 960
gacctggaac tgatcggcga catcccgagc accatcaacc acatcgaaca cgatgccgtg 1020
aaggtggaat ttgccgaacg cgaacagaag atcctgtcgg acctgaagca gtatatgcat 1080
gagggcgaac aggtgcctgc cgactggaag tcggacagag cccatccgct ggaaatcgtg 1140
aaggaactgc gtaacgccgt cgacgaccat gtcaccgtca cctgcgatat cggcagccat 1200
gccatttgga tgagccgcta cttccggagc tatgaaccgc tgaccctgat gatctccaac 1260
ggtatgcaga ccctcggcgt cgccctcccg tgggccatcg gcgcaagtct ggtgaagccg 1320
ggcgaaaaag tggtcagcgt gtccggcgac ggcggcttcc tgttctccgc tatggaactg 1380
gaaaccgcgg tccgcctgaa ggccccgatc gtgcatatcg tgtggaacga cagcacctac 1440
gacatggtcg ccttccagca gctgaaaaag tacaaccgca ccagcgccgt ggacttcggc 1500
aatatcgaca tcgtgaagta tgccgaatcc ttcggagcca ccggactgcg cgtggaatcc 1560
ccggaccagc tggcggacgt tctgcgtcag ggcatgaatg ccgaaggtcc cgtgattatc 1620
gatgtgcccg tcgactacag cgacaacatc aacctggcct cggacaaatt gccgaaggag 1680
ttcggcgaac tgatgaaaac aaaagcacta taa 1713
<210> 3
<211> 556
<212> PRT
<213> Clostridium autoethanogenum
<400> 3
Met Asn Arg Asp Ile Lys Lys Glu Val Gln Leu Asn Thr Ala Gln Met
1 5 10 15
Leu Val Lys Cys Leu Glu Ala Glu Gly Val Lys Tyr Ile Phe Gly Ile
20 25 30
Pro Gly Glu Glu Asn Leu Glu Ile Met Asn Ala Ile Ser Asp Ser Thr
35 40 45
Ile Glu Phe Ile Thr Thr Arg His Glu Gln Gly Ala Ala Phe Met Ala
50 55 60
Asp Val Tyr Gly Arg Leu Thr Gly Lys Ala Gly Val Cys Leu Ser Thr
65 70 75 80
Leu Gly Pro Gly Ala Thr Asn Leu Val Thr Gly Val Ala Asp Ala Asp
85 90 95
Ser Asp Gly Ala Pro Val Val Ala Ile Thr Gly Gln Val Gly Thr Glu
100 105 110
Arg Met His Ile Thr Ser His Gln Phe Leu Asp Leu Cys Lys Met Phe
115 120 125
Glu Pro Ile Thr Lys Arg Ser Lys Gln Ile Val Arg Pro Asp Thr Val
130 135 140
Ser Glu Ile Ile Arg Leu Val Phe Lys Tyr Ala Glu Ser Glu Lys Pro
145 150 155 160
Gly Ala Cys His Ile Asp Leu Pro Val Asn Ile Ala Lys Met Pro Val
165 170 175
Gly Ala Leu Glu Lys Pro Leu Glu Lys Lys Ile Pro Pro Lys Glu His
180 185 190
Ala Asp Leu Ser Thr Ile Glu Glu Ala Ala Ser Glu Ile Phe Lys Ala
195 200 205
Lys Asn Pro Ile Ile Leu Ala Gly Ser Gly Ala Ile Arg Gly Asn Ser
210 215 220
Ser Lys Ala Val Thr Glu Phe Ala Thr Lys Leu Lys Ile Pro Val Ile
225 230 235 240
Asn Thr Met Met Ala Lys Gly Ile Ile Pro Met Asp Asn Lys Tyr Ser
245 250 255
Met Trp Thr Ile Gly Ile Pro Gln Lys Asp Tyr Val Asn Lys Ile Ile
260 265 270
Glu Glu Ala Asp Leu Val Ile Thr Ile Gly Tyr Asp Ile Val Glu Tyr
275 280 285
Ala Pro Ser Lys Trp Asn Ile Asn Gly Asp Ile Lys Ile Val His Ile
290 295 300
Asp Ala Arg Pro Ser His Ile Asn Lys Leu Tyr Gln Pro Ile Val Glu
305 310 315 320
Val Val Gly Asp Ile Ser Asp Ala Leu Tyr Asn Ile Leu Arg Arg Thr
325 330 335
Ser Ser Lys Asp Glu Pro Val Lys Ala Leu Glu Ile Lys Ser Glu Met
340 345 350
Leu Ala Glu His Glu Ser Tyr Ala Asn Asp Asn Ala Phe Pro Met Lys
355 360 365
Pro Gln Arg Ile Leu Asn Asp Val Arg Lys Val Met Gly Pro His Asp
370 375 380
Ile Val Ile Ser Asp Val Gly Ala His Lys Met Trp Ile Ala Arg His
385 390 395 400
Tyr Asn Cys Tyr Glu Pro Asn Thr Cys Ile Ile Ser Asn Gly Phe Ala
405 410 415
Thr Met Gly Ile Gly Val Pro Gly Ala Ile Ala Ala Lys Leu Ile Asn
420 425 430
Pro Asp Lys Lys Val Leu Ala Ile Val Gly Asp Gly Gly Phe Met Met
435 440 445
Asn Asn Gln Glu Leu Glu Thr Ala Leu Arg Ile Lys Thr Pro Ile Val
450 455 460
Val Leu Ile Phe Asn Asp Ser Asn Tyr Gly Leu Ile Lys Trp Lys Gln
465 470 475 480
Glu Glu His Tyr Gly Lys Ser Cys Tyr Val Asp Phe Thr Asn Pro Asp
485 490 495
Phe Val Lys Leu Ala Glu Ser Met Tyr Ala Lys Gly Tyr Arg Val Glu
500 505 510
Lys Ala Glu Asp Leu Ile Pro Thr Leu Glu Glu Ala Phe Lys Gln Asn
515 520 525
Val Pro Ala Val Ile Asp Cys Gln Val Asp Tyr Gly Glu Asn Ile Lys
530 535 540
Leu Thr Lys His Leu Lys Glu Val Tyr Glu Asn Met
545 550 555
<210> 4
<211> 1671
<212> DNA
<213> Clostridium autoethanogenum
<400> 4
atgaatcggg atatcaagaa agaggtgcag ctcaacacgg cccagatgct ggtcaagtgt 60
ctggaagccg agggcgtcaa gtatatcttc ggcatcccgg gcgaggagaa tctcgaaatc 120
atgaacgcca tctcggattc cacgatcgag ttcatcacca cccgccatga acagggcgcg 180
gccttcatgg ccgacgtgta cggccggctg accggcaagg cgggcgtgtg tctgagcacc 240
ctcggccccg gcgcgaccaa cctggtcacc ggcgtggccg acgccgactc cgacggcgcc 300
cccgtggtcg cgatcaccgg ccaggtgggc acggagcgga tgcacatcac ctcccatcag 360
ttcctcgacc tctgcaagat gttcgagccg atcaccaagc ggagcaagca gatcgtccgc 420
ccggacacgg tgtcggagat catccgcctg gtgttcaagt acgccgaaag cgaaaagccc 480
ggcgcctgtc atatcgacct gccggtcaac atcgccaaga tgcccgtcgg cgccctggag 540
aagccgctgg agaaaaaaat cccgccgaag gaacacgcgg acctgtccac catcgaggaa 600
gcggcgtccg agatcttcaa ggccaaaaac cccatcatcc tggccggcag cggcgccatc 660
cgcggcaaca gcagcaaggc ggtcaccgag ttcgccacca agctgaagat ccccgtcatc 720
aacacgatga tggccaaggg catcatcccg atggacaaca agtatagcat gtggaccatc 780
ggcatccccc agaaggacta tgtgaacaag atcatcgaag aggccgacct ggtcatcacc 840
atcggctacg acatcgtgga atatgccccg tcgaaatgga acatcaacgg cgacatcaag 900
atcgtccata tcgacgcccg cccctcgcac atcaacaaac tctaccagcc catcgtggag 960
gtggtcggcg acatcagcga cgcgctgtat aacatcctgc gccgcaccag ctcgaaagac 1020
gagccggtca aggcgctgga gatcaagtcg gaaatgctgg cggagcacga gtcctacgcg 1080
aacgacaatg cgttcccgat gaagccgcag cgcatcctca acgatgtgcg caaagtcatg 1140
ggcccgcacg acatcgtgat ctccgatgtg ggcgcccata aaatgtggat cgcccgccac 1200
tataactgct acgagccgaa tacctgcatc atctcgaacg gcttcgccac gatgggcatc 1260
ggcgtcccgg gcgcgatcgc cgccaaactc atcaacccgg ataagaaggt cctggccatc 1320
gtcggcgacg gcggcttcat gatgaataac caggaactgg agacggcgct gcgcatcaaa 1380
acgcccatcg tggtcctcat cttcaacgac tccaattacg gcctcatcaa gtggaagcag 1440
gaggagcatt atggcaaatc gtgctatgtg gacttcacca acccggactt cgtgaagctg 1500
gccgagagca tgtacgccaa aggctatcgc gtggagaaag ccgaggatct gatcccgacc 1560
ctcgaagagg ccttcaagca gaatgtcccg gcggtcatcg actgccaggt ggactatggc 1620
gagaatatca agctcaccaa gcacctcaag gaggtctatg aaaacatgtg a 1671
<210> 5
<211> 239
<212> PRT
<213> Clostridium autoethanogenum
<400> 5
Met Asp Asp Glu Val Lys Val Pro Asn His Ile Tyr Gln Met Ser Thr
1 5 10 15
Ile Asn Ala Leu Val Ser Gly Leu Tyr Asp Gly Cys Val Ser Leu Ser
20 25 30
Lys Leu Leu Lys Lys Gly Asn Phe Gly Ile Gly Thr Phe Lys Gly Leu
35 40 45
Asp Gly Glu Leu Thr Leu Leu Asn Gly Thr Phe Tyr Arg Thr Lys Pro
50 55 60
Asp Gly Ser Val Tyr Val Cys Ser Lys Asn Val Ser Val Pro Phe Ala
65 70 75 80
Val Val Thr Glu Leu Glu Asn Tyr Asn Thr Tyr Asn Ile Gln Asn Arg
85 90 95
Thr Ser Tyr Glu Asp Ile Arg Lys Glu Leu Asp Ser Phe Ile Glu Ser
100 105 110
Lys Asn Ile Phe Tyr Ala Phe Tyr Met Glu Gly Lys Phe Asn Tyr Val
115 120 125
Lys Thr Arg Thr Val Val Lys Gln Asn Met Pro Tyr Lys Pro Met Ala
130 135 140
Glu Val Val Lys Asp Gln Pro Met Phe Glu Tyr Asn Gly Val Asp Gly
145 150 155 160
Tyr Val Val Gly Phe Arg Cys Pro Asp Tyr Val Glu Gly Leu Asn Val
165 170 175
Pro Gly Tyr His Phe His Phe Ile Asn Lys Asp Lys Lys Phe Gly Gly
180 185 190
His Ile Ser Glu Phe Ser Ile Glu Asn Ala Lys Val Tyr Val Gln Asn
195 200 205
Cys Ser Cys Phe Arg Met Glu Leu Pro Lys Asn Glu Ser Phe Tyr Asn
210 215 220
Met Glu Val Gln Asp Arg Asn Asp Glu Ile Thr Ser Val Glu Lys
225 230 235
<210> 6
<211> 720
<212> DNA
<213> Clostridium autoethanogenum
<400> 6
atggatgatg aggtgaaagt cccgaaccac atctaccaga tgtcgaccat caatgccctg 60
gtcagcggcc tctacgacgg ctgtgtgtcg ctctcgaagc tcctgaaaaa gggcaatttc 120
ggcatcggca cgttcaaggg cctggatggc gagctgaccc tcctgaacgg cacgttctat 180
cgcaccaaac cggatggctc cgtgtacgtg tgcagcaaga acgtgagcgt ccccttcgcg 240
gtcgtcaccg agctggagaa ctacaatacc tataacatcc agaatcgcac ctcctatgag 300
gacatccgca aggagctgga ctcgttcatc gagtcgaaga acatcttcta tgccttctat 360
atggaaggca aattcaacta cgtcaaaacc cgcaccgtcg tgaagcagaa catgccgtac 420
aagccgatgg ccgaggtggt caaagaccag ccgatgttcg aatacaacgg cgtcgatggc 480
tacgtcgtcg gcttccggtg cccggattat gtggaaggcc tcaatgtgcc cggctaccat 540
ttccacttca tcaacaagga caaaaagttc ggcggccaca tctccgagtt ctcgatcgag 600
aacgccaaag tctacgtcca gaactgctcc tgtttccgca tggagctccc gaagaatgag 660
agcttctaca acatggaggt ccaggaccgc aacgacgaaa tcacgtccgt ggagaaatga 720
<210> 7
<211> 259
<212> PRT
<213> Klebsiella pneumoniae
<400> 7
Met Asn His Ser Ala Glu Cys Thr Cys Glu Glu Ser Leu Cys Glu Thr
1 5 10 15
Leu Arg Ala Phe Ser Ala Gln His Pro Glu Ser Val Leu Tyr Gln Thr
20 25 30
Ser Leu Met Ser Ala Leu Leu Ser Gly Val Tyr Glu Gly Ser Thr Thr
35 40 45
Ile Ala Asp Leu Leu Lys His Gly Asp Phe Gly Leu Gly Thr Phe Asn
50 55 60
Glu Leu Asp Gly Glu Leu Ile Ala Phe Ser Ser Gln Val Tyr Gln Leu
65 70 75 80
Arg Ala Asp Gly Ser Ala Arg Lys Ala Gln Pro Glu Gln Lys Thr Pro
85 90 95
Phe Ala Val Met Thr Trp Phe Gln Pro Gln Tyr Arg Lys Thr Phe Asp
100 105 110
His Pro Val Ser Arg Gln Gln Leu His Glu Val Ile Asp Gln Gln Ile
115 120 125
Pro Ser Asp Asn Leu Phe Cys Ala Leu Arg Ile Asp Gly His Phe Arg
130 135 140
His Ala His Thr Arg Thr Val Pro Arg Gln Thr Pro Pro Tyr Arg Ala
145 150 155 160
Met Thr Asp Val Leu Asp Asp Gln Pro Val Phe Arg Phe Asn Gln Arg
165 170 175
Glu Gly Val Leu Val Gly Phe Arg Thr Pro Gln His Met Gln Gly Ile
180 185 190
Asn Val Ala Gly Tyr His Glu His Phe Ile Thr Asp Asp Arg Lys Gly
195 200 205
Gly Gly His Leu Leu Asp Tyr Gln Leu Asp His Gly Val Leu Thr Phe
210 215 220
Gly Glu Ile His Lys Leu Met Ile Asp Leu Pro Ala Asp Ser Ala Phe
225 230 235 240
Leu Gln Ala Asn Leu His Pro Asp Asn Leu Asp Ala Ala Ile Arg Ser
245 250 255
Val Glu Ser
<210> 8
<211> 780
<212> DNA
<213> Klebsiella pneumoniae
<400> 8
atgaaccact cggccgaatg cacctgcgaa gagagcctct gcgaaaccct ccgggccttc 60
tcggcccagc acccggagag cgtcctgtac cagacgagcc tgatgtcggc gctgctgtcg 120
ggcgtgtatg aaggctcgac gaccatcgcc gacctgctga agcatggcga cttcggcctg 180
ggcaccttca atgaactgga cggcgagctc atcgccttca gctcgcaggt gtatcagctc 240
cgggccgatg gctccgcccg gaaggcccag cccgaacaga agaccccgtt cgccgtgatg 300
acctggttcc agccgcagta tcggaagacc ttcgaccacc ccgtgagccg ccagcagctc 360
cacgaggtga tcgaccagca gatcccgagc gacaacctct tctgcgccct gcgcatcgac 420
ggccatttcc gccacgcgca tacccgcacc gtcccgcggc agaccccgcc ctaccgcgcc 480
atgaccgatg tcctggatga ccagccggtc ttccggttca accagcgcga gggcgtcctg 540
gtcggcttcc gcaccccgca gcacatgcag ggcatcaacg tcgcgggcta tcatgaacac 600
ttcatcaccg atgatcgcaa gggcggcggc cacctcctcg actaccagct ggaccacggc 660
gtcctgacct tcggcgaaat ccataagctg atgatcgacc tccccgccga cagcgccttc 720
ctgcaggcga atctgcatcc ggacaacctc gatgccgcca tccgctccgt cgagtcgtga 780
<210> 9
<211> 357
<212> PRT
<213> Clostridium autoethanogenum
<400> 9
Met Lys Ala Val Leu Trp Tyr Asp Lys Lys Asp Val Arg Val Glu Glu
1 5 10 15
Ile Glu Glu Pro Lys Val Lys Glu Asn Ala Val Lys Ile Lys Val Lys
20 25 30
Trp Cys Gly Ile Cys Gly Ser Asp Leu His Glu Tyr Leu Gly Gly Pro
35 40 45
Ile Phe Ile Pro Val Gly Thr Pro His Pro Leu Ser Lys Ser Thr Ala
50 55 60
Pro Val Val Leu Gly His Glu Phe Ser Gly Glu Val Val Glu Ile Gly
65 70 75 80
Ser Lys Val Thr Lys Phe Lys Ala Gly Asp Arg Val Ile Val Glu Pro
85 90 95
Ile Val Ala Cys Gly Lys Cys Pro Ala Cys Leu Glu Gly Lys Tyr Asn
100 105 110
Leu Cys Glu Ala Leu Gly Phe His Gly Leu Cys Gly Ser Gly Gly Gly
115 120 125
Phe Ala Glu Tyr Thr Val Phe Pro Glu Asp Phe Val His Lys Ile Pro
130 135 140
Asp Thr Met Asp Tyr Glu Gln Ala Ala Leu Val Glu Pro Met Ala Val
145 150 155 160
Ala Leu His Ser Leu Arg Val Gly Asn Phe Thr Thr Gly Asn Thr Ala
165 170 175
Leu Val Leu Gly Ala Gly Pro Ile Gly Leu Ala Thr Ile Gln Cys Leu
180 185 190
Lys Ala Ser Gly Ala Arg Ile Val Ile Val Phe Gln Arg Lys Ser Val
195 200 205
Arg Gln Glu Tyr Ala Lys Lys Phe Gly Ala Asp Val Val Leu Asp Pro
210 215 220
Asn Glu Val Asp Val Ile Glu Glu Ile Lys Lys Leu Thr Gly Gly Val
225 230 235 240
Gly Val Asp Thr Ser Phe Glu Thr Thr Gly Ala Asn Val Gly Ile Asn
245 250 255
Thr Ala Ile Gln Ala Leu Lys Tyr Glu Gly Thr Ala Val Ile Thr Ser
260 265 270
Val Trp Glu Lys Asn Ala Glu Ile Asn Pro Asn Asp Leu Val Phe Thr
275 280 285
Glu Lys Lys Val Val Gly Thr Leu Ala Tyr Arg His Glu Phe Pro Ser
290 295 300
Thr Ile Ala Leu Met Asn Asp Gly Arg Ile Lys Thr Asp Gly Tyr Ile
305 310 315 320
Thr Lys Arg Ile Ala Leu Glu Asp Ile Val Lys Glu Gly Phe Glu Thr
325 330 335
Leu Thr Gly Pro Glu Lys Lys Lys His Val Lys Ile Ile Val Thr Pro
340 345 350
Asp Lys Ser Leu Leu
355
<210> 10
<211> 1074
<212> DNA
<213> Clostridium autoethanogenum
<400> 10
atgaaggccg tcctgtggta cgacaaaaag gatgtccgcg tggaagaaat cgaggaaccg 60
aaggtgaaag aaaacgccgt gaagatcaaa gtcaagtggt gcggcatctg cggctcggac 120
ctgcatgagt atctcggcgg cccgatcttc atcccggtcg gcacccccca cccgctgtcg 180
aagagcaccg cgcccgtcgt gctgggccac gagttctcgg gcgaagtggt ggagatcggc 240
agcaaagtga ccaagttcaa ggcgggcgac cgcgtcatcg tggaaccgat cgtcgcctgc 300
ggcaaatgcc cggcctgcct ggaaggcaag tacaatctgt gcgaggcgct gggcttccac 360
ggcctgtgcg gcagcggcgg cggcttcgcc gagtacacgg tgttcccgga agatttcgtg 420
cacaagatcc ccgacacgat ggattatgaa caggccgcgc tggtggagcc gatggcggtc 480
gcgctgcact ccctgcgggt gggcaacttc accacgggca acaccgccct ggtcctgggc 540
gcgggcccga tcggcctggc caccatccag tgcctcaaag cgtcgggcgc ccggatcgtc 600
atcgtcttcc agcgcaaatc ggtgcggcag gaatacgcca agaagttcgg cgcggacgtg 660
gtcctcgacc cgaatgaggt ggacgtgatc gaggaaatca aaaagctgac cggcggcgtg 720
ggcgtggaca cgagcttcga aaccaccggc gccaacgtcg gcatcaacac cgcgatccag 780
gcgctgaaat atgagggcac cgccgtcatc acctccgtct gggagaagaa cgccgagatc 840
aatccgaacg acctggtctt caccgaaaag aaggtcgtcg gcaccctcgc gtaccggcac 900
gagttcccgt cgaccatcgc cctgatgaac gacggccgca tcaagaccga tggctatatc 960
accaagcgga tcgccctgga agacatcgtc aaggagggct tcgaaaccct gaccggcccg 1020
gagaagaaaa agcacgtcaa aatcatcgtc acgcccgata aaagcctcct gtga 1074
<210> 11
<211> 350
<212> PRT
<213> Bacillus subtilis
<400> 11
Met Lys Ala Leu Leu Trp His Asn Gln Arg Asp Val Arg Val Glu Glu
1 5 10 15
Val Pro Glu Pro Ala Val Arg Ser Gly Ala Val Lys Ile Lys Val Lys
20 25 30
Trp Cys Gly Ile Cys Gly Thr Asp Leu His Glu Tyr Leu Ala Gly Pro
35 40 45
Ile Phe Ile Pro Thr Glu Glu His Pro Leu Thr His Val Lys Ala Pro
50 55 60
Val Ile Leu Gly His Glu Phe Ser Gly Glu Val Val Glu Ile Gly Glu
65 70 75 80
Gly Val Thr Asn His Lys Val Gly Asp Arg Val Val Val Glu Pro Ile
85 90 95
Tyr Ser Cys Gly Lys Cys Glu Ala Cys Lys His Gly His Tyr Asn Val
100 105 110
Cys Glu Gln Leu Val Phe His Gly Leu Gly Gly Asp Gly Gly Gly Phe
115 120 125
Ser Glu Tyr Thr Val Val Pro Ala Asp Met Val His His Ile Pro Asp
130 135 140
Glu Met Thr Tyr Glu Gln Gly Ala Leu Val Glu Pro Ala Ala Val Ala
145 150 155 160
Val His Ala Val Arg Gln Ser Lys Leu Lys Glu Gly Glu Ala Val Ala
165 170 175
Val Phe Gly Cys Gly Pro Ile Gly Leu Leu Val Ile Gln Ala Ala Lys
180 185 190
Ala Ala Gly Ala Thr Pro Val Ile Ala Val Glu Leu Ser Lys Glu Arg
195 200 205
Gln Glu Leu Ala Lys Leu Ala Gly Ala Asp Tyr Val Leu Asn Pro Ala
210 215 220
Glu Gln Asp Val Val Ala Glu Ile Arg Asn Leu Thr Asn Gly Leu Gly
225 230 235 240
Val Asn Val Ser Phe Glu Val Thr Gly Val Glu Val Val Leu Arg Gln
245 250 255
Ala Ile Glu Ser Thr Ser Phe Glu Gly Gln Thr Val Ile Val Ser Val
260 265 270
Trp Glu Lys Asp Ala Thr Ile Thr Pro Asn Asn Leu Val Leu Lys Glu
275 280 285
Lys Glu Val Val Gly Ile Leu Gly Tyr Arg His Ile Phe Pro Ser Val
290 295 300
Ile Lys Leu Ile Ser Ser Gly Gln Ile Gln Ala Glu Lys Leu Ile Thr
305 310 315 320
Lys Lys Ile Thr Val Asp Gln Val Val Glu Glu Gly Phe Glu Ala Leu
325 330 335
Val Lys Asp Lys Lys Gln Val Lys Ile Leu Val Ser Pro Lys
340 345 350
<210> 12
<211> 1053
<212> DNA
<213> Bacillus subtilis
<400> 12
atgaaagccc tgctgtggca taaccagcgc gacgtgcggg tggaagaggt cccggagccc 60
gccgtccgca gcggcgcggt gaaaatcaaa gtgaaatggt gcggcatctg tggcaccgac 120
ctgcatgaat atctggccgg ccccatcttc atcccgacgg aggaacatcc gctgacgcac 180
gtcaaggccc cggtcatcct cggccatgag ttcagcggcg aggtggtgga gatcggcgaa 240
ggcgtcacca atcacaaagt cggcgatcgc gtggtcgtcg aaccgatcta ctcgtgcggc 300
aagtgtgagg cgtgcaagca cggccactat aatgtctgcg agcagctggt gttccacggc 360
ctgggcggcg acggcggcgg cttctcggag tacaccgtgg tgccggcgga tatggtccac 420
cacatcccgg atgaaatgac ctacgagcag ggcgccctgg tcgagccggc cgccgtggcg 480
gtgcacgcgg tgcgccagag caaactcaag gagggcgaag ccgtggccgt cttcggctgc 540
ggcccgatcg gcctgctggt catccaggcg gccaaagcgg cgggcgcgac ccccgtcatc 600
gcggtcgagc tgtcgaagga acgccaggag ctcgccaagc tggcgggcgc ggattatgtc 660
ctgaaccccg ccgaacagga cgtggtggcg gaaatccgga acctgaccaa cggcctgggc 720
gtcaacgtct ccttcgaggt caccggcgtg gaagtcgtcc tgcggcaggc gatcgaatcg 780
acctcgttcg agggccagac ggtcatcgtg tcggtctggg agaaggacgc caccatcacg 840
cccaataatc tggtcctgaa agagaaggaa gtggtcggca tcctcggcta ccggcatatc 900
ttcccgtccg tcatcaagct gatctcgtcg ggccagatcc aggccgagaa actcatcacc 960
aagaagatca cggtggacca ggtggtcgaa gaaggcttcg aagcgctggt caaggataag 1020
aagcaggtga agatcctcgt gtcgccgaag tga 1053
<210> 13
<211> 350
<212> PRT
<213> Paenibacillus polymyxa
<400> 13
Met Gln Ala Leu Arg Trp His Gly Ile Lys Asp Leu Arg Leu Glu Asn
1 5 10 15
Ile Glu Gln Pro Ala Ala Leu Pro Gly Lys Val Lys Ile Lys Val Glu
20 25 30
Trp Cys Gly Ile Cys Gly Ser Asp Leu His Glu Tyr Val Ala Gly Pro
35 40 45
Ile Phe Ile Pro Glu Asn Ala Gln His Pro Leu Thr Gly Glu Lys Ser
50 55 60
Pro Ile Val Met Gly His Glu Phe Ser Gly Gln Phe Phe Asp Phe Gly
65 70 75 80
Glu Gly Val Thr Lys Ile Gln Val Gly Asp Arg Glu Val Val Glu Pro
85 90 95
Val Phe Ala Cys Gly Glu Cys Asp Ala Cys Arg Gln Gly Lys Tyr Asn
100 105 110
Leu Cys Asp Lys Met Gly Phe Leu Gly Leu Ala Gly Gly Gly Gly Gly
115 120 125
Phe Ser Glu Tyr Val Ala Ala Asp Glu His Met Val His Lys Ile Pro
130 135 140
Glu Ser Val Ser Phe Glu Gln Gly Ala Leu Val Glu Pro Ser Ala Val
145 150 155 160
Ala Leu Tyr Ala Val Arg Gln Ile Gln Leu Lys Val Asp Asp Lys Ala
165 170 175
Val Val Phe Gly Ala Gly Pro Ile Gly Leu Leu Val Ile Glu Ala Leu
180 185 190
Asn Ala Ser Gly Ala Ser Glu Ile Tyr Ala Glu Glu Leu Ser Glu Glu
195 200 205
Arg Thr Ala Lys Ala Glu Asp Leu Gly Ala Ile Val Leu Asp Pro Asn
210 215 220
Thr Tyr Asp Val Val Glu Glu Leu His Lys Arg Thr Asn Gly Gly Val
225 230 235 240
Tyr Val Pro Tyr Glu Val Thr Glu Val Pro Pro Val Leu Thr Gln Ala
245 250 255
Ile Glu Ser Ala Lys Ile Ser Gly Glu Ile Met Ile Val Ile Ile Phe
260 265 270
Glu Lys Glu Ala Leu Ile Lys Pro Asn Asn Ile Val Met Asn Glu Arg
275 280 285
Asn Leu Thr Gly Leu Ile Cys Tyr Asp Asp Val Phe Pro Ala Leu Ile
290 295 300
Ser Leu Met Glu Asn Gly Tyr Phe Pro Ala Asp Lys Leu Val Ile Lys
305 310 315 320
Arg Ile Lys Leu Val Asp Val Ile Glu Ala Ala Phe Glu Ser Leu Leu
325 330 335
Ile Glu Glu Tyr Gln Val Thr Ile Leu Val Ser Pro His Ala
340 345 350
<210> 14
<211> 1053
<212> DNA
<213> Paenibacillus polymyxa
<400> 14
atgcaggcgc tgcgctggca cggcatcaag gacctgcggc tggagaacat cgagcagccc 60
gccgccctcc cgggcaaggt gaagatcaag gtggaatggt gcggcatctg cggcagcgac 120
ctgcatgaat atgtcgccgg cccgatcttc atccccgaaa acgcgcagca tccgctcacg 180
ggcgagaagt cgcccatcgt gatgggccat gagttctccg gccagttctt cgacttcggc 240
gaaggcgtga cgaaaatcca ggtgggcgac cgcgaagtgg tggagccggt cttcgcgtgt 300
ggcgaatgcg atgcgtgccg gcagggcaaa tataacctgt gcgataagat gggcttcctg 360
ggcctggccg gcggcggcgg cggcttctcg gaatatgtcg ccgcggatga gcatatggtg 420
cacaaaatcc ccgagtccgt gtccttcgaa cagggcgccc tggtcgagcc gtccgccgtc 480
gccctctacg cggtccgcca gatccagctg aaggtcgatg acaaggcggt ggtcttcggc 540
gccggcccca tcggcctgct cgtcatcgaa gcgctgaacg ccagcggcgc gagcgaaatc 600
tatgcggaag agctcagcga agagcgcacc gccaaagccg aagacctggg cgccatcgtg 660
ctcgacccca acacgtacga tgtcgtcgag gaactccata agcgcacgaa tggcggcgtc 720
tacgtcccct atgaggtcac ggaagtcccg cccgtgctga cccaggccat cgagtccgcc 780
aagatctccg gcgaaatcat gatcgtcatc atcttcgaaa aggaggccct catcaagccg 840
aacaacatcg tcatgaatga acggaacctg acgggcctga tctgctacga cgatgtgttc 900
ccggccctga tctccctcat ggagaatggc tacttccccg ccgacaagct ggtcatcaaa 960
cggatcaagc tggtggatgt catcgaagcg gccttcgagt cgctcctgat cgaggagtac 1020
caggtgacca tcctcgtgtc gccgcacgcc tga 1053
<210> 15
<211> 4672
<212> DNA
<213> Strain XZ58
<400> 15
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg tttttttggg 300
ctaacaggag gaattaacca tgaccaaggc caccaaggaa cagaaaagcc tggtcaagaa 360
ccgcggtgct gaactggttg tggactgcct cgtggaacag ggcgtgaccc atgtcttcgg 420
catcccgggc gccaagatcg acgccgtctt cgacgccctg caggataaag gtccggaaat 480
catcgtggca cgccatgagc agaacgcagc cttcatggcc caggccgtcg gtcggctgac 540
gggtaagccc ggcgtggtgc tggtcacctc cggtccggga gcctcgaacc tggccacggg 600
actgctcacc gccaacaccg aaggcgaccc ggtggtcgcc ctggccggta atgtcatccg 660
ggcggatcgc ctgaagcgca cccatcagtc cctggataac gcggccctgt tccagccaat 720
caccaaatat agtgtcgaag tgcaggatgt gaagaacatc ccggaagccg tcaccaatgc 780
gttccgaatc gcgtccgccg gccaagcagg ggcagcattc gtgagcttcc cccaggacgt 840
ggtcaatgaa gtgaccaaca ccaaaaacgt cagagccgta gccgccccga agctgggccc 900
tgcagcagat gacgccatct ccgctgccat cgcgaagatc cagaccgcaa agctgccggt 960
cgtgctggtc ggaatgaagg gcggacgccc ggaggccatc aaggccgtgc gtaaactgct 1020
gaagaaggtg cagctaccgt tcgtggaaac ctaccaggcc gccggcaccc tgagtcggga 1080
cttggaagac cagtatttcg gccgtatcgg cctgttccgc aaccagccgg gcgacctgct 1140
cctggaacaa gccgatgtgg tgctgaccat cggctacgac ccgatcgaat atgacccgaa 1200
gttctggaac atcaatggcg accgcacgat catccatctg gacgaaatca tcgccgacat 1260
cgaccatgcc tatcagccgg acctggaact gatcggcgac atcccgagca ccatcaacca 1320
catcgaacac gatgccgtga aggtggaatt tgccgaacgc gaacagaaga tcctgtcgga 1380
cctgaagcag tatatgcatg agggcgaaca ggtgcctgcc gactggaagt cggacagagc 1440
ccatccgctg gaaatcgtga aggaactgcg taacgccgtc gacgaccatg tcaccgtcac 1500
ctgcgatatc ggcagccatg ccatttggat gagccgctac ttccggagct atgaaccgct 1560
gaccctgatg atctccaacg gtatgcagac cctcggcgtc gccctcccgt gggccatcgg 1620
cgcaagtctg gtgaagccgg gcgaaaaagt ggtcagcgtg tccggcgacg gcggcttcct 1680
gttctccgct atggaactgg aaaccgcggt ccgcctgaag gccccgatcg tgcatatcgt 1740
gtggaacgac agcacctacg acatggtcgc cttccagcag ctgaaaaagt acaaccgcac 1800
cagcgccgtg gacttcggca atatcgacat cgtgaagtat gccgaatcct tcggagccac 1860
cggactgcgc gtggaatccc cggaccagct ggcggacgtt ctgcgtcagg gcatgaatgc 1920
cgaaggtccc gtgattatcg atgtgcccgt cgactacagc gacaacatca acctggcctc 1980
ggacaaattg ccgaaggagt tcggcgaact gatgaaaaca aaagcactat aaaaaggagg 2040
tacgtatgaa ccactcggcc gaatgcacct gcgaagagag cctctgcgaa accctccggg 2100
ccttctcggc ccagcacccg gagagcgtcc tgtaccagac gagcctgatg tcggcgctgc 2160
tgtcgggcgt gtatgaaggc tcgacgacca tcgccgacct gctgaagcat ggcgacttcg 2220
gcctgggcac cttcaatgaa ctggacggcg agctcatcgc cttcagctcg caggtgtatc 2280
agctccgggc cgatggctcc gcccggaagg cccagcccga acagaagacc ccgttcgccg 2340
tgatgacctg gttccagccg cagtatcgga agaccttcga ccaccccgtg agccgccagc 2400
agctccacga ggtgatcgac cagcagatcc cgagcgacaa cctcttctgc gccctgcgca 2460
tcgacggcca tttccgccac gcgcataccc gcaccgtccc gcggcagacc ccgccctacc 2520
gcgccatgac cgatgtcctg gatgaccagc cggtcttccg gttcaaccag cgcgagggcg 2580
tcctggtcgg cttccgcacc ccgcagcaca tgcagggcat caacgtcgcg ggctatcatg 2640
aacacttcat caccgatgat cgcaagggcg gcggccacct cctcgactac cagctggacc 2700
acggcgtcct gaccttcggc gaaatccata agctgatgat cgacctcccc gccgacagcg 2760
ccttcctgca ggcgaatctg catccggaca acctcgatgc cgccatccgc tccgtcgagt 2820
cgtgatttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 2880
ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 2940
cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 3000
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 3060
ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca 3120
acggcccgga gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca 3180
gaaggccatc ctgacggatg gcctttttgc gtttcgaggt tcaggcgaaa ccgcagactc 3240
aagggcgctt gctcccggga aagatcgtat tagtttgcct cgatcggcgg tccttgtgac 3300
agggagatat tcccgacgga tccggggcat tcgagcggaa ccgcccgccg tgggagtttt 3360
tccagcgagc attcgagagt ttttcaaggc ggcttcgagg ggttattccg taacgccgcc 3420
gacatgatct gtcccagaat ctccgccgct gttcgtagag cgccgatgca gggtcggcat 3480
caatcattct tggaggagac acatgaaggc cgtcctgtgg tacgacaaaa aggatgtccg 3540
cgtggaagaa atcgaggaac cgaaggtgaa agaaaacgcc gtgaagatca aagtcaagtg 3600
gtgcggcatc tgcggctcgg acctgcatga gtatctcggc ggcccgatct tcatcccggt 3660
cggcaccccc cacccgctgt cgaagagcac cgcgcccgtc gtgctgggcc acgagttctc 3720
gggcgaagtg gtggagatcg gcagcaaagt gaccaagttc aaggcgggcg accgcgtcat 3780
cgtggaaccg atcgtcgcct gcggcaaatg cccggcctgc ctggaaggca agtacaatct 3840
gtgcgaggcg ctgggcttcc acggcctgtg cggcagcggc ggcggcttcg ccgagtacac 3900
ggtgttcccg gaagatttcg tgcacaagat ccccgacacg atggattatg aacaggccgc 3960
gctggtggag ccgatggcgg tcgcgctgca ctccctgcgg gtgggcaact tcaccacggg 4020
caacaccgcc ctggtcctgg gcgcgggccc gatcggcctg gccaccatcc agtgcctcaa 4080
agcgtcgggc gcccggatcg tcatcgtctt ccagcgcaaa tcggtgcggc aggaatacgc 4140
caagaagttc ggcgcggacg tggtcctcga cccgaatgag gtggacgtga tcgaggaaat 4200
caaaaagctg accggcggcg tgggcgtgga cacgagcttc gaaaccaccg gcgccaacgt 4260
cggcatcaac accgcgatcc aggcgctgaa atatgagggc accgccgtca tcacctccgt 4320
ctgggagaag aacgccgaga tcaatccgaa cgacctggtc ttcaccgaaa agaaggtcgt 4380
cggcaccctc gcgtaccggc acgagttccc gtcgaccatc gccctgatga acgacggccg 4440
catcaagacc gatggctata tcaccaagcg gatcgccctg gaagacatcg tcaaggaggg 4500
cttcgaaacc ctgaccggcc cggagaagaa aaagcacgtc aaaatcatcg tcacgcccga 4560
taaaagcctc ctgtgagact cctgttgata gatccagtaa tgacctcaga actccatctg 4620
gatttgttca gaacgctcgg ttgccgccgg gcgtttttta ttggtgagaa tc 4672
<210> 16
<211> 4651
<212> DNA
<213> Strain XZ59
<400> 16
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg tttttttggg 300
ctaacaggag gaattaacca tgaccaaggc caccaaggaa cagaaaagcc tggtcaagaa 360
ccgcggtgct gaactggttg tggactgcct cgtggaacag ggcgtgaccc atgtcttcgg 420
catcccgggc gccaagatcg acgccgtctt cgacgccctg caggataaag gtccggaaat 480
catcgtggca cgccatgagc agaacgcagc cttcatggcc caggccgtcg gtcggctgac 540
gggtaagccc ggcgtggtgc tggtcacctc cggtccggga gcctcgaacc tggccacggg 600
actgctcacc gccaacaccg aaggcgaccc ggtggtcgcc ctggccggta atgtcatccg 660
ggcggatcgc ctgaagcgca cccatcagtc cctggataac gcggccctgt tccagccaat 720
caccaaatat agtgtcgaag tgcaggatgt gaagaacatc ccggaagccg tcaccaatgc 780
gttccgaatc gcgtccgccg gccaagcagg ggcagcattc gtgagcttcc cccaggacgt 840
ggtcaatgaa gtgaccaaca ccaaaaacgt cagagccgta gccgccccga agctgggccc 900
tgcagcagat gacgccatct ccgctgccat cgcgaagatc cagaccgcaa agctgccggt 960
cgtgctggtc ggaatgaagg gcggacgccc ggaggccatc aaggccgtgc gtaaactgct 1020
gaagaaggtg cagctaccgt tcgtggaaac ctaccaggcc gccggcaccc tgagtcggga 1080
cttggaagac cagtatttcg gccgtatcgg cctgttccgc aaccagccgg gcgacctgct 1140
cctggaacaa gccgatgtgg tgctgaccat cggctacgac ccgatcgaat atgacccgaa 1200
gttctggaac atcaatggcg accgcacgat catccatctg gacgaaatca tcgccgacat 1260
cgaccatgcc tatcagccgg acctggaact gatcggcgac atcccgagca ccatcaacca 1320
catcgaacac gatgccgtga aggtggaatt tgccgaacgc gaacagaaga tcctgtcgga 1380
cctgaagcag tatatgcatg agggcgaaca ggtgcctgcc gactggaagt cggacagagc 1440
ccatccgctg gaaatcgtga aggaactgcg taacgccgtc gacgaccatg tcaccgtcac 1500
ctgcgatatc ggcagccatg ccatttggat gagccgctac ttccggagct atgaaccgct 1560
gaccctgatg atctccaacg gtatgcagac cctcggcgtc gccctcccgt gggccatcgg 1620
cgcaagtctg gtgaagccgg gcgaaaaagt ggtcagcgtg tccggcgacg gcggcttcct 1680
gttctccgct atggaactgg aaaccgcggt ccgcctgaag gccccgatcg tgcatatcgt 1740
gtggaacgac agcacctacg acatggtcgc cttccagcag ctgaaaaagt acaaccgcac 1800
cagcgccgtg gacttcggca atatcgacat cgtgaagtat gccgaatcct tcggagccac 1860
cggactgcgc gtggaatccc cggaccagct ggcggacgtt ctgcgtcagg gcatgaatgc 1920
cgaaggtccc gtgattatcg atgtgcccgt cgactacagc gacaacatca acctggcctc 1980
ggacaaattg ccgaaggagt tcggcgaact gatgaaaaca aaagcactat aaaaaggagg 2040
tacgtatgaa ccactcggcc gaatgcacct gcgaagagag cctctgcgaa accctccggg 2100
ccttctcggc ccagcacccg gagagcgtcc tgtaccagac gagcctgatg tcggcgctgc 2160
tgtcgggcgt gtatgaaggc tcgacgacca tcgccgacct gctgaagcat ggcgacttcg 2220
gcctgggcac cttcaatgaa ctggacggcg agctcatcgc cttcagctcg caggtgtatc 2280
agctccgggc cgatggctcc gcccggaagg cccagcccga acagaagacc ccgttcgccg 2340
tgatgacctg gttccagccg cagtatcgga agaccttcga ccaccccgtg agccgccagc 2400
agctccacga ggtgatcgac cagcagatcc cgagcgacaa cctcttctgc gccctgcgca 2460
tcgacggcca tttccgccac gcgcataccc gcaccgtccc gcggcagacc ccgccctacc 2520
gcgccatgac cgatgtcctg gatgaccagc cggtcttccg gttcaaccag cgcgagggcg 2580
tcctggtcgg cttccgcacc ccgcagcaca tgcagggcat caacgtcgcg ggctatcatg 2640
aacacttcat caccgatgat cgcaagggcg gcggccacct cctcgactac cagctggacc 2700
acggcgtcct gaccttcggc gaaatccata agctgatgat cgacctcccc gccgacagcg 2760
ccttcctgca ggcgaatctg catccggaca acctcgatgc cgccatccgc tccgtcgagt 2820
cgtgatttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 2880
ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 2940
cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 3000
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 3060
ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca 3120
acggcccgga gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca 3180
gaaggccatc ctgacggatg gcctttttgc gtttcgaggt tcaggcgaaa ccgcagactc 3240
aagggcgctt gctcccggga aagatcgtat tagtttgcct cgatcggcgg tccttgtgac 3300
agggagatat tcccgacgga tccggggcat tcgagcggaa ccgcccgccg tgggagtttt 3360
tccagcgagc attcgagagt ttttcaaggc ggcttcgagg ggttattccg taacgccgcc 3420
gacatgatct gtcccagaat ctccgccgct gttcgtagag cgccgatgca gggtcggcat 3480
caatcattct tggaggagac acatgaaagc cctgctgtgg cataaccagc gcgacgtgcg 3540
ggtggaagag gtcccggagc ccgccgtccg cagcggcgcg gtgaaaatca aagtgaaatg 3600
gtgcggcatc tgtggcaccg acctgcatga atatctggcc ggccccatct tcatcccgac 3660
ggaggaacat ccgctgacgc acgtcaaggc cccggtcatc ctcggccatg agttcagcgg 3720
cgaggtggtg gagatcggcg aaggcgtcac caatcacaaa gtcggcgatc gcgtggtcgt 3780
cgaaccgatc tactcgtgcg gcaagtgtga ggcgtgcaag cacggccact ataatgtctg 3840
cgagcagctg gtgttccacg gcctgggcgg cgacggcggc ggcttctcgg agtacaccgt 3900
ggtgccggcg gatatggtcc accacatccc ggatgaaatg acctacgagc agggcgccct 3960
ggtcgagccg gccgccgtgg cggtgcacgc ggtgcgccag agcaaactca aggagggcga 4020
agccgtggcc gtcttcggct gcggcccgat cggcctgctg gtcatccagg cggccaaagc 4080
ggcgggcgcg acccccgtca tcgcggtcga gctgtcgaag gaacgccagg agctcgccaa 4140
gctggcgggc gcggattatg tcctgaaccc cgccgaacag gacgtggtgg cggaaatccg 4200
gaacctgacc aacggcctgg gcgtcaacgt ctccttcgag gtcaccggcg tggaagtcgt 4260
cctgcggcag gcgatcgaat cgacctcgtt cgagggccag acggtcatcg tgtcggtctg 4320
ggagaaggac gccaccatca cgcccaataa tctggtcctg aaagagaagg aagtggtcgg 4380
catcctcggc taccggcata tcttcccgtc cgtcatcaag ctgatctcgt cgggccagat 4440
ccaggccgag aaactcatca ccaagaagat cacggtggac caggtggtcg aagaaggctt 4500
cgaagcgctg gtcaaggata agaagcaggt gaagatcctc gtgtcgccga agtgagactc 4560
ctgttgatag atccagtaat gacctcagaa ctccatctgg atttgttcag aacgctcggt 4620
tgccgccggg cgttttttat tggtgagaat c 4651
<210> 17
<211> 4302
<212> DNA
<213> Strain XZ06
<400> 17
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg tttttttggg 300
ctaacaggag gaattaacca tgaccaaggc caccaaggaa cagaaaagcc tggtcaagaa 360
ccgcggtgct gaactggttg tggactgcct cgtggaacag ggcgtgaccc atgtcttcgg 420
catcccgggc gccaagatcg acgccgtctt cgacgccctg caggataaag gtccggaaat 480
catcgtggca cgccatgagc agaacgcagc cttcatggcc caggccgtcg gtcggctgac 540
gggtaagccc ggcgtggtgc tggtcacctc cggtccggga gcctcgaacc tggccacggg 600
actgctcacc gccaacaccg aaggcgaccc ggtggtcgcc ctggccggta atgtcatccg 660
ggcggatcgc ctgaagcgca cccatcagtc cctggataac gcggccctgt tccagccaat 720
caccaaatat agtgtcgaag tgcaggatgt gaagaacatc ccggaagccg tcaccaatgc 780
gttccgaatc gcgtccgccg gccaagcagg ggcagcattc gtgagcttcc cccaggacgt 840
ggtcaatgaa gtgaccaaca ccaaaaacgt cagagccgta gccgccccga agctgggccc 900
tgcagcagat gacgccatct ccgctgccat cgcgaagatc cagaccgcaa agctgccggt 960
cgtgctggtc ggaatgaagg gcggacgccc ggaggccatc aaggccgtgc gtaaactgct 1020
gaagaaggtg cagctaccgt tcgtggaaac ctaccaggcc gccggcaccc tgagtcggga 1080
cttggaagac cagtatttcg gccgtatcgg cctgttccgc aaccagccgg gcgacctgct 1140
cctggaacaa gccgatgtgg tgctgaccat cggctacgac ccgatcgaat atgacccgaa 1200
gttctggaac atcaatggcg accgcacgat catccatctg gacgaaatca tcgccgacat 1260
cgaccatgcc tatcagccgg acctggaact gatcggcgac atcccgagca ccatcaacca 1320
catcgaacac gatgccgtga aggtggaatt tgccgaacgc gaacagaaga tcctgtcgga 1380
cctgaagcag tatatgcatg agggcgaaca ggtgcctgcc gactggaagt cggacagagc 1440
ccatccgctg gaaatcgtga aggaactgcg taacgccgtc gacgaccatg tcaccgtcac 1500
ctgcgatatc ggcagccatg ccatttggat gagccgctac ttccggagct atgaaccgct 1560
gaccctgatg atctccaacg gtatgcagac cctcggcgtc gccctcccgt gggccatcgg 1620
cgcaagtctg gtgaagccgg gcgaaaaagt ggtcagcgtg tccggcgacg gcggcttcct 1680
gttctccgct atggaactgg aaaccgcggt ccgcctgaag gccccgatcg tgcatatcgt 1740
gtggaacgac agcacctacg acatggtcgc cttccagcag ctgaaaaagt acaaccgcac 1800
cagcgccgtg gacttcggca atatcgacat cgtgaagtat gccgaatcct tcggagccac 1860
cggactgcgc gtggaatccc cggaccagct ggcggacgtt ctgcgtcagg gcatgaatgc 1920
cgaaggtccc gtgattatcg atgtgcccgt cgactacagc gacaacatca acctggcctc 1980
ggacaaattg ccgaaggagt tcggcgaact gatgaaaaca aaagcactat aaaaaggagg 2040
tacgtatgaa ccactcggcc gaatgcacct gcgaagagag cctctgcgaa accctccggg 2100
ccttctcggc ccagcacccg gagagcgtcc tgtaccagac gagcctgatg tcggcgctgc 2160
tgtcgggcgt gtatgaaggc tcgacgacca tcgccgacct gctgaagcat ggcgacttcg 2220
gcctgggcac cttcaatgaa ctggacggcg agctcatcgc cttcagctcg caggtgtatc 2280
agctccgggc cgatggctcc gcccggaagg cccagcccga acagaagacc ccgttcgccg 2340
tgatgacctg gttccagccg cagtatcgga agaccttcga ccaccccgtg agccgccagc 2400
agctccacga ggtgatcgac cagcagatcc cgagcgacaa cctcttctgc gccctgcgca 2460
tcgacggcca tttccgccac gcgcataccc gcaccgtccc gcggcagacc ccgccctacc 2520
gcgccatgac cgatgtcctg gatgaccagc cggtcttccg gttcaaccag cgcgagggcg 2580
tcctggtcgg cttccgcacc ccgcagcaca tgcagggcat caacgtcgcg ggctatcatg 2640
aacacttcat caccgatgat cgcaagggcg gcggccacct cctcgactac cagctggacc 2700
acggcgtcct gaccttcggc gaaatccata agctgatgat cgacctcccc gccgacagcg 2760
ccttcctgca ggcgaatctg catccggaca acctcgatgc cgccatccgc tccgtcgagt 2820
cgtgaaaagg aggtacgtat gaaggccgtc ctgtggtacg acaaaaagga tgtccgcgtg 2880
gaagaaatcg aggaaccgaa ggtgaaagaa aacgccgtga agatcaaagt caagtggtgc 2940
ggcatctgcg gctcggacct gcatgagtat ctcggcggcc cgatcttcat cccggtcggc 3000
accccccacc cgctgtcgaa gagcaccgcg cccgtcgtgc tgggccacga gttctcgggc 3060
gaagtggtgg agatcggcag caaagtgacc aagttcaagg cgggcgaccg cgtcatcgtg 3120
gaaccgatcg tcgcctgcgg caaatgcccg gcctgcctgg aaggcaagta caatctgtgc 3180
gaggcgctgg gcttccacgg cctgtgcggc agcggcggcg gcttcgccga gtacacggtg 3240
ttcccggaag atttcgtgca caagatcccc gacacgatgg attatgaaca ggccgcgctg 3300
gtggagccga tggcggtcgc gctgcactcc ctgcgggtgg gcaacttcac cacgggcaac 3360
accgccctgg tcctgggcgc gggcccgatc ggcctggcca ccatccagtg cctcaaagcg 3420
tcgggcgccc ggatcgtcat cgtcttccag cgcaaatcgg tgcggcagga atacgccaag 3480
aagttcggcg cggacgtggt cctcgacccg aatgaggtgg acgtgatcga ggaaatcaaa 3540
aagctgaccg gcggcgtggg cgtggacacg agcttcgaaa ccaccggcgc caacgtcggc 3600
atcaacaccg cgatccaggc gctgaaatat gagggcaccg ccgtcatcac ctccgtctgg 3660
gagaagaacg ccgagatcaa tccgaacgac ctggtcttca ccgaaaagaa ggtcgtcggc 3720
accctcgcgt accggcacga gttcccgtcg accatcgccc tgatgaacga cggccgcatc 3780
aagaccgatg gctatatcac caagcggatc gccctggaag acatcgtcaa ggagggcttc 3840
gaaaccctga ccggcccgga gaagaaaaag cacgtcaaaa tcatcgtcac gcccgataaa 3900
agcctcctgt gatttcagcc tgatacagat taaatcagaa cgcagaagcg gtctgataaa 3960
acagaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc cgaactcaga 4020
agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag tagggaactg 4080
ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 4140
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gggagcggat ttgaacgttg 4200
cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa 4260
ttaagcagaa ggccatcctg acggatggcc tttttgcgtt tc 4302
<210> 18
<211> 4281
<212> DNA
<213> Strain XZ08
<400> 18
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg tttttttggg 300
ctaacaggag gaattaacca tgaccaaggc caccaaggaa cagaaaagcc tggtcaagaa 360
ccgcggtgct gaactggttg tggactgcct cgtggaacag ggcgtgaccc atgtcttcgg 420
catcccgggc gccaagatcg acgccgtctt cgacgccctg caggataaag gtccggaaat 480
catcgtggca cgccatgagc agaacgcagc cttcatggcc caggccgtcg gtcggctgac 540
gggtaagccc ggcgtggtgc tggtcacctc cggtccggga gcctcgaacc tggccacggg 600
actgctcacc gccaacaccg aaggcgaccc ggtggtcgcc ctggccggta atgtcatccg 660
ggcggatcgc ctgaagcgca cccatcagtc cctggataac gcggccctgt tccagccaat 720
caccaaatat agtgtcgaag tgcaggatgt gaagaacatc ccggaagccg tcaccaatgc 780
gttccgaatc gcgtccgccg gccaagcagg ggcagcattc gtgagcttcc cccaggacgt 840
ggtcaatgaa gtgaccaaca ccaaaaacgt cagagccgta gccgccccga agctgggccc 900
tgcagcagat gacgccatct ccgctgccat cgcgaagatc cagaccgcaa agctgccggt 960
cgtgctggtc ggaatgaagg gcggacgccc ggaggccatc aaggccgtgc gtaaactgct 1020
gaagaaggtg cagctaccgt tcgtggaaac ctaccaggcc gccggcaccc tgagtcggga 1080
cttggaagac cagtatttcg gccgtatcgg cctgttccgc aaccagccgg gcgacctgct 1140
cctggaacaa gccgatgtgg tgctgaccat cggctacgac ccgatcgaat atgacccgaa 1200
gttctggaac atcaatggcg accgcacgat catccatctg gacgaaatca tcgccgacat 1260
cgaccatgcc tatcagccgg acctggaact gatcggcgac atcccgagca ccatcaacca 1320
catcgaacac gatgccgtga aggtggaatt tgccgaacgc gaacagaaga tcctgtcgga 1380
cctgaagcag tatatgcatg agggcgaaca ggtgcctgcc gactggaagt cggacagagc 1440
ccatccgctg gaaatcgtga aggaactgcg taacgccgtc gacgaccatg tcaccgtcac 1500
ctgcgatatc ggcagccatg ccatttggat gagccgctac ttccggagct atgaaccgct 1560
gaccctgatg atctccaacg gtatgcagac cctcggcgtc gccctcccgt gggccatcgg 1620
cgcaagtctg gtgaagccgg gcgaaaaagt ggtcagcgtg tccggcgacg gcggcttcct 1680
gttctccgct atggaactgg aaaccgcggt ccgcctgaag gccccgatcg tgcatatcgt 1740
gtggaacgac agcacctacg acatggtcgc cttccagcag ctgaaaaagt acaaccgcac 1800
cagcgccgtg gacttcggca atatcgacat cgtgaagtat gccgaatcct tcggagccac 1860
cggactgcgc gtggaatccc cggaccagct ggcggacgtt ctgcgtcagg gcatgaatgc 1920
cgaaggtccc gtgattatcg atgtgcccgt cgactacagc gacaacatca acctggcctc 1980
ggacaaattg ccgaaggagt tcggcgaact gatgaaaaca aaagcactat aaaaaggagg 2040
tacgtatgaa ccactcggcc gaatgcacct gcgaagagag cctctgcgaa accctccggg 2100
ccttctcggc ccagcacccg gagagcgtcc tgtaccagac gagcctgatg tcggcgctgc 2160
tgtcgggcgt gtatgaaggc tcgacgacca tcgccgacct gctgaagcat ggcgacttcg 2220
gcctgggcac cttcaatgaa ctggacggcg agctcatcgc cttcagctcg caggtgtatc 2280
agctccgggc cgatggctcc gcccggaagg cccagcccga acagaagacc ccgttcgccg 2340
tgatgacctg gttccagccg cagtatcgga agaccttcga ccaccccgtg agccgccagc 2400
agctccacga ggtgatcgac cagcagatcc cgagcgacaa cctcttctgc gccctgcgca 2460
tcgacggcca tttccgccac gcgcataccc gcaccgtccc gcggcagacc ccgccctacc 2520
gcgccatgac cgatgtcctg gatgaccagc cggtcttccg gttcaaccag cgcgagggcg 2580
tcctggtcgg cttccgcacc ccgcagcaca tgcagggcat caacgtcgcg ggctatcatg 2640
aacacttcat caccgatgat cgcaagggcg gcggccacct cctcgactac cagctggacc 2700
acggcgtcct gaccttcggc gaaatccata agctgatgat cgacctcccc gccgacagcg 2760
ccttcctgca ggcgaatctg catccggaca acctcgatgc cgccatccgc tccgtcgagt 2820
cgtgaaaagg aggtacgtat gaaagccctg ctgtggcata accagcgcga cgtgcgggtg 2880
gaagaggtcc cggagcccgc cgtccgcagc ggcgcggtga aaatcaaagt gaaatggtgc 2940
ggcatctgtg gcaccgacct gcatgaatat ctggccggcc ccatcttcat cccgacggag 3000
gaacatccgc tgacgcacgt caaggccccg gtcatcctcg gccatgagtt cagcggcgag 3060
gtggtggaga tcggcgaagg cgtcaccaat cacaaagtcg gcgatcgcgt ggtcgtcgaa 3120
ccgatctact cgtgcggcaa gtgtgaggcg tgcaagcacg gccactataa tgtctgcgag 3180
cagctggtgt tccacggcct gggcggcgac ggcggcggct tctcggagta caccgtggtg 3240
ccggcggata tggtccacca catcccggat gaaatgacct acgagcaggg cgccctggtc 3300
gagccggccg ccgtggcggt gcacgcggtg cgccagagca aactcaagga gggcgaagcc 3360
gtggccgtct tcggctgcgg cccgatcggc ctgctggtca tccaggcggc caaagcggcg 3420
ggcgcgaccc ccgtcatcgc ggtcgagctg tcgaaggaac gccaggagct cgccaagctg 3480
gcgggcgcgg attatgtcct gaaccccgcc gaacaggacg tggtggcgga aatccggaac 3540
ctgaccaacg gcctgggcgt caacgtctcc ttcgaggtca ccggcgtgga agtcgtcctg 3600
cggcaggcga tcgaatcgac ctcgttcgag ggccagacgg tcatcgtgtc ggtctgggag 3660
aaggacgcca ccatcacgcc caataatctg gtcctgaaag agaaggaagt ggtcggcatc 3720
ctcggctacc ggcatatctt cccgtccgtc atcaagctga tctcgtcggg ccagatccag 3780
gccgagaaac tcatcaccaa gaagatcacg gtggaccagg tggtcgaaga aggcttcgaa 3840
gcgctggtca aggataagaa gcaggtgaag atcctcgtgt cgccgaagtg atttcagcct 3900
gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 3960
tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 4020
tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 4080
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 4140
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 4200
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 4260
cggatggcct ttttgcgttt c 4281
<210> 19
<211> 572
<212> PRT
<213> Bacillus licheniformis
<400> 19
Met Asn Asn Val Ala Ala Lys Asn Glu Thr Leu Thr Val Arg Gly Ala
1 5 10 15
Glu Leu Val Val Asp Ser Leu Ile Gln Gln Gly Val Thr His Val Phe
20 25 30
Gly Ile Pro Gly Ala Lys Ile Asp Ala Val Phe Asp Val Leu Lys Asp
35 40 45
Lys Gly Pro Glu Leu Ile Val Cys Arg His Glu Gln Asn Ala Ala Phe
50 55 60
Met Ala Ala Ala Val Gly Arg Leu Thr Gly Lys Pro Gly Val Cys Leu
65 70 75 80
Val Thr Ser Gly Pro Gly Ala Ser Asn Leu Ala Thr Gly Leu Val Thr
85 90 95
Ala Asn Thr Glu Gly Asp Pro Val Val Ala Leu Ala Gly Ala Val Lys
100 105 110
Arg Ala Asp Arg Leu Lys Lys Thr His Gln Ser Met Asp Asn Ala Ala
115 120 125
Leu Phe Gln Pro Ile Thr Lys Tyr Ser Ala Glu Val Glu Asp Ala Asn
130 135 140
Asn Ile Pro Glu Ala Val Thr Asn Ala Phe Arg Ala Ala Ala Ser Gly
145 150 155 160
Gln Ala Gly Ala Ala Phe Leu Ser Phe Pro Gln Asp Val Thr Ala Gly
165 170 175
Pro Ala Thr Ala Lys Pro Val Lys Thr Met Pro Ala Pro Lys Leu Gly
180 185 190
Ala Ala Ser Asp Glu Gln Ile Ser Ala Ala Ile Ala Lys Ile His Asn
195 200 205
Ala Asn Leu Pro Val Val Leu Val Gly Met Lys Gly Gly Arg Pro Glu
210 215 220
Ala Ile Glu Ala Val Arg Arg Leu Leu Arg Lys Val Lys Leu Pro Phe
225 230 235 240
Val Glu Thr Tyr Gln Ala Ala Gly Thr Leu Ser His Asp Leu Glu Asp
245 250 255
Gln Tyr Phe Gly Arg Ile Gly Leu Phe Arg Asn Gln Pro Gly Asp Met
260 265 270
Leu Leu Glu Lys Ala Asp Val Val Leu Thr Val Gly Tyr Asp Pro Ile
275 280 285
Glu Tyr Asp Pro Val Phe Trp Asn Gly Lys Gly Glu Arg Ser Val Ile
290 295 300
His Leu Asp Glu Ile Gln Ala Asp Ile Asp His Asp Tyr Gln Pro Glu
305 310 315 320
Ile Glu Leu Ile Gly Asp Ile Ala Glu Thr Leu Asn His Ile Glu His
325 330 335
Asp Ser Leu Pro Val Ser Ile Asp Glu Ser Phe Ala Pro Val Leu Asp
340 345 350
Tyr Leu Lys Lys Ala Leu Glu Glu Gln Ser Glu Pro Pro Lys Glu Thr
355 360 365
Lys Thr Asp Leu Val His Pro Leu Gln Ile Val Arg Asp Leu Arg Glu
370 375 380
Leu Leu Ser Asp Asp Ile Thr Val Thr Cys Asp Ile Gly Ser His Ala
385 390 395 400
Ile Trp Met Ser Arg Tyr Phe Arg Thr Tyr Arg Pro His Gly Leu Leu
405 410 415
Ile Ser Asn Gly Met Gln Thr Leu Gly Val Ala Leu Pro Trp Ala Ile
420 425 430
Ala Ala Thr Leu Val Asn Pro Gly Gln Lys Val Val Ser Val Ser Gly
435 440 445
Asp Gly Gly Phe Leu Phe Ser Ala Met Glu Leu Glu Thr Ala Val Arg
450 455 460
Leu Lys Ala Pro Ile Val His Ile Val Trp Asn Asp Ser Thr Tyr Asp
465 470 475 480
Met Val Ala Phe Gln Gln Glu Met Lys Tyr Lys Arg Thr Ser Gly Val
485 490 495
Asp Phe Gly Gly Ile Asp Ile Val Lys Tyr Ala Glu Ser Phe Gly Ala
500 505 510
Lys Gly Leu Arg Val Asn Ser Pro Asp Glu Leu Ala Glu Val Leu Lys
515 520 525
Ala Gly Leu Asp Ala Glu Gly Pro Val Val Ile Asp Ile Pro Val Asp
530 535 540
Tyr Ser Asp Asn Ile His Leu Ala Asp Gln Arg Phe Pro Lys Lys Phe
545 550 555 560
Glu Glu His Phe Asn Lys Glu Ala Ser Lys Gln Ser
565 570
<210> 20
<211> 1719
<212> DNA
<213> Bacillus licheniformis
<400> 20
atgaataacg tcgcggccaa gaacgaaacc ctgaccgtcc ggggcgccga actcgtggtg 60
gatagcctga tccagcaggg cgtgacccat gtcttcggca tcccgggcgc caaaatcgac 120
gcggtcttcg acgtgctgaa ggataagggc cccgaactga tcgtctgccg ccatgagcag 180
aacgcggcct tcatggccgc cgccgtcggc cgcctgacgg gcaagccggg cgtctgcctg 240
gtcacctccg gcccgggcgc ctcgaatctc gcgaccggcc tggtcaccgc gaacacggaa 300
ggcgacccgg tggtcgccct ggcgggcgcc gtgaagcggg cggatcggct gaagaagacg 360
caccagtcga tggataacgc cgccctgttc cagcccatca cgaagtacag cgcggaggtg 420
gaagacgcga acaacatccc ggaggccgtg acgaacgcct tccgcgccgc ggcgtccggc 480
caggccggcg cggccttcct cagcttcccc caggatgtca ccgccggccc ggccaccgcc 540
aagccggtca aaaccatgcc cgccccgaag ctgggcgccg cgagcgatga acagatctcc 600
gccgcgatcg cgaagatcca caacgcgaat ctgccggtgg tcctcgtggg catgaagggc 660
ggccggccgg aagccatcga agccgtgcgc cgcctgctcc gcaaggtcaa gctcccgttc 720
gtggaaacct accaggcggc cggcacgctg tcgcacgatc tggaggatca gtacttcggc 780
cggatcggcc tgttccggaa ccagccgggc gacatgctcc tggaaaaggc cgacgtggtc 840
ctgaccgtgg gctacgaccc gatcgagtac gatccggtgt tctggaatgg caaaggcgaa 900
cgctcggtca tccacctcga cgaaatccag gccgatatcg atcacgacta ccagcccgag 960
atcgaactca tcggcgacat cgcggaaacc ctcaatcaca tcgagcatga ctcgctgccg 1020
gtgtccatcg acgaatcctt cgcgcccgtg ctcgactatc tcaagaaggc gctcgaagaa 1080
cagtcggagc ccccgaagga aacgaagacc gatctggtcc acccgctcca gatcgtgcgc 1140
gacctgcgcg agctgctctc cgatgacatc accgtcacct gcgacatcgg cagccacgcc 1200
atctggatgt cccgctattt ccgcacctat cgcccgcatg gcctcctgat ctccaacggc 1260
atgcagacgc tgggcgtcgc cctgccgtgg gcgatcgccg cgaccctggt gaacccgggc 1320
cagaaggtgg tgtcggtcag cggcgatggc ggcttcctct tctccgcgat ggaactcgaa 1380
accgccgtcc gcctcaaggc gccgatcgtg cacatcgtgt ggaacgactc cacgtacgac 1440
atggtcgcgt tccagcagga aatgaagtac aagcgcacct ccggcgtcga tttcggcggc 1500
atcgacatcg tcaagtatgc ggaatccttc ggcgccaaag gcctccgcgt gaatagcccc 1560
gatgaactgg ccgaggtcct gaaggccggc ctcgacgcgg agggcccggt ggtcatcgac 1620
atccccgtcg actactcgga taacatccac ctggccgacc agcgcttccc gaagaagttc 1680
gaggagcact tcaacaagga agcgtcgaag cagtcctga 1719
Claims (146)
- 이종 아세토인 리덕타제를 포함하는, C1 탄소를 2,3-BDO로 전환시킬 수 있는 유전자 변형된 미생물.
- (i) 이종 아세토인 리덕타제, (ii) 이종 알파-아세토락테이트 데카복실라제, 및 (iii) 이종 아세토락테이트 신타제를 포함하는, C1 탄소를 2,3-BDO로 전환시킬 수 있는 유전자 변형된 미생물.
- 제1항에 있어서, 이종 알파-아세토락테이트 데카복실라제 또는 이종 아세토락테이트 신타제를 추가로 포함하는 유전자 변형된 미생물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제 및 이종 아세토락테이트 신타제를 포함하는 유전자 변형된 미생물.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제 및 이종 알파-아세토락테이트 데카복실라제를 포함하는 유전자 변형된 미생물.
- 제2항 내지 제5항 중 어느 한 항에 있어서, 이종 아세토락테이트 신타제가 비-구성적으로 발현되는 유전자 변형된 미생물.
- 제2항 내지 제6항 중 어느 한 항에 있어서, 이종 아세토락테이트 신타제가 서열번호 1 또는 19에 적어도 90% 일치하는 아미노산 서열을 포함하는 유전자 변형된 미생물.
- 제2항 내지 제7항 중 어느 한 항에 있어서, 이종 알파-아세토락테이트 데카복실라제가 서열번호 7에 적어도 90% 일치하는 아미노산 서열을 포함하는 유전자 변형된 미생물.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제가 NADPH-의존성인 유전자 변형된 미생물.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제가 서열번호 9에 적어도 90% 일치하는 아미노산 서열을 포함하는 유전자 변형된 미생물.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제가 그람 양성 세균 아세토인 리덕타제인 유전자 변형된 미생물.
- 제11항에 있어서, 그람 양성 세균이 클로스트리디움(Clostridium) 또는 바실러스(Bacillus) 속으로부터 유래하는 유전자 변형된 미생물.
- 제12항에 있어서, 그람 양성 세균이 클로스트리디움 아우토에타노게늄(Clostridium autoethanogenum) 또는 바실러스 서브틸리스(Bacillus subtilis)인 유전자 변형된 미생물.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 메탄영양체인 유전자 변형된 미생물.
- 제14항에 있어서, 메탄영양체(methanotroph)가 메틸로박터(Methylobacter), 메틸로미크로비움(Methylomicrobium), 메틸로모나스(Methylomonas), 메틸로칼듐(Methylocaldum), 메틸로코커스(Methylococcus), 메틸로소마(Methylosoma), 메틸로사르시나(Methylosarcina), 메틸로써무스(Methylothermus), 메틸로할로비우스(Methylohalobius), 메틸로가에아(Methylogaea), 메틸로불륨(Methylovulum), 크레노트릭스(Crenothrix), 클로노트릭스(Clonothrix), 메틸로스파에라(Methylosphaera), 메틸로카프사(Methylocapsa), 메틸로셀라(Methylocella), 메틸로시누스(Methylosinus), 메틸로시스티스(Methylocystis), 또는 메틸로아시도필룸(Methyloacidophilum) 속으로부터 유래하는 유전자 변형된 미생물.
- 제15항에 있어서, 메탄영양체가 메틸로코커스(Methylococcus)인 유전자 변형된 미생물.
- 제16항에 있어서, 메틸로코커스가 메틸로코커스 캅술라투스(Methylococcus capsulatus)인 유전자 변형된 미생물.
- 제1항 내지 제17항 중 어느 한 항에 있어서, C1 탄소가 일산화탄소(CO), 이산화탄소(CO2), 메탄(CH4), 또는 이들의 임의의 조합인 유전자 변형된 미생물.
- 제1항 내지 제18항 중 어느 한 항에 있어서, C1 탄소가 CH4인 유전자 변형된 미생물.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 37℃에서 동일한 유기체에 비해 42℃에서 더 많은 양의 2,3-BDO를 생성시키는 유전자 변형된 미생물.
- 제1항 내지 제20항 중 어느 한 항에 있어서, 45℃에서 동일한 유기체에 비해 42℃에서 더 많은 양의 2,3-BDO를 생성시키는 유전자 변형된 미생물.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 45℃에서 동일한 유기체에 비해 37℃에서 더 많은 양의 2,3-BDO를 생성시키는 유전자 변형된 미생물.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제, 이종 알파-아세토락테이트 데카복실라제, 및/또는 이종 아세토락테이트 신타제를 암호화하는 이종 유전자가 미생물의 게놈내에 통합된 유전자 변형된 미생물.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제, 이종 알파-아세토락테이트 데카복실라제, 및/또는 이종 아세토락테이트 신타제를 암호화하는 이종 유전자가 에피솜 벡터상에서 발현된 유전자 변형된 미생물.
- 제23항 또는 제24항에 있어서, 이종 아세토락테이트 신타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'인 유전자 변형된 미생물.
- 제23항 내지 제25항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 3'인 유전자 변형된 미생물.
- 제23항 내지 제26항 중 어느 한 항에 있어서, 이종 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아닌 유전자 변형된 미생물.
- 제23항 내지 제27항 중 어느 한 항에 있어서, 이종 아세토인 리덕타제, 이종 알파-아세토락테이트 데카복실라제, 및/또는 이종 아세토락테이트 신타제를 암호화하는 이종 유전자가 스위치의 조절하에 있는 유전자 변형된 미생물.
- 제28항에 있어서, 스위치가 희토 금속 스위치인 유전자 변형된 미생물.
- 제29항에 있어서, 희토 금속이 란타늄, 세륨, 프라세오디뮴, 및/또는 네오디뮴인 유전자 변형된 미생물.
- 제30항에 있어서, 희토 금속이 란타늄인 유전자 변형된 미생물.
- 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 또는 아세토락테이트 신타제를 암호화하는 2개 이상의 유전자를 포함하는 벡터.
- 제32항에 있어서, 아세토락테이트 신타제를 암호화하는 유전자가 벡터상의 임의의 다른 유전자와 관련하여 5'인 벡터.
- 제32항 또는 제33항에 있어서, 아세토인 리덕타제를 암호화하는 유전자가 벡터상의 임의의 다른 유전자와 관련하여 3'인 벡터.
- 제32항 내지 제34항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자가 벡터상의 임의의 다른 유전자와 관련하여 5'도 3'도 아닌 벡터.
- 제32항 내지 제35항 중 어느 한 항에 있어서, 아세토인 리덕타제를 암호화하는 유전자를 포함하며, 상기 아세토인 리덕타제를 암호화하는 유전자가 서열번호 10에 적어도 85% 일치하는 뉴클레오티드 서열을 포함하는 벡터.
- 제32항 내지 제36항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자를 포함하며, 상기 알파-아세토락테이트 데카복실라제를 암호화하는 유전자가 서열번호 8에 적어도 86% 일치하는 뉴클레오티드 서열을 포함하는 벡터.
- 제32항 내지 제37항 중 어느 한 항에 있어서, 아세토락테이트 신타제를 암호화하는 유전자를 포함하며, 상기 아세토락테이트 신타제를 암호화하는 유전자가 서열번호 2에 적어도 85% 일치하거나 서열번호 20에 적어도 60% 일치하는 뉴클레오티드 서열을 포함하는 벡터.
- 제32항 내지 제38항 중 어느 한 항에 있어서, 메탄영양체내에서 활성인 프로모터를 추가로 포함하는 벡터.
- 제32항 내지 제39항 중 어느 한 항에 있어서, 통합 벡터인 벡터.
- 제32항 내지 제40항 중 어느 한 항에 있어서, 에피솜 벡터인 벡터.
- 미생물을, 아세토인 리덕타제를 암호화하는 유전자를 포함하는 이종 핵산으로 형질전환시킴을 포함하는, C1 탄소를 2,3-BDO로 전환시킬 수 있는 유전자 변형된 미생물의 제조 방법.
- 제42항에 있어서, 유전자 변형된 미생물을, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 유전자를 포함하는 이종 핵산으로 형질전환시킴을 추가로 포함하는 방법.
- 제42항 또는 제43항에 있어서, 아세토인 리덕타제가 NADPH-의존성인 방법.
- 제42항 내지 제44항 중 어느 한 항에 있어서, 아세토인 리덕타제가 그람 양성 세균 아세토인 리덕타제인 방법.
- 제42항 내지 제45항 중 어느 한 항에 있어서, NADPH-의존성 아세토인 리덕타제가 서열번호 5에 적어도 90% 일치하는 아미노산 서열을 포함하는 방법.
- 제43항 내지 제46항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제가 서열번호 7에 적어도 90% 일치하는 아미노산 서열을 포함하는 방법.
- 제43항 내지 제47항 중 어느 한 항에 있어서, 아세토락테이트 신타제가 서열번호 1 또는 19에 적어도 90% 일치하는 아미노산 서열을 포함하는 방법.
- 제42항 내지 제48항 중 어느 한 항에 있어서, C1 탄소가 메탄인 방법.
- 제42항 내지 제49항 중 어느 한 항에 있어서, 미생물이 메탄영양체인 방법.
- 제42항 내지 제50항 중 어느 한 항에 있어서, 미생물이 37℃에서 동일한 미생물에 비해 42℃에서 더 많은 양의 2,3-BDO를 생성시키는 방법.
- 제42항 내지 제51항 중 어느 한 항에 있어서, 미생물이 45℃에서 동일한 미생물에 비해 42℃에서 더 많은 양의 2,3-BDO를 생성시키는 방법.
- 제42항 내지 제52항 중 어느 한 항에 있어서, 미생물이 45℃에서 동일한 미생물에 비해 37℃에서 더 많은 양의 2,3-BDO를 생성시키는 방법.
- 제42항 내지 제53항 중 어느 한 항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 유전자를 미생물의 게놈내에 통합 벡터에 의해 통합시키는 방법.
- 제42항 내지 제54항 중 어느 한 항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 유전자를 에피솜 벡터상에서 발현시키는 방법.
- 제54항 또는 제55항에 있어서, 아세토락테이트 신타제를 암호화하는 유전자가 임의의 다른 이종 유전자와 관련하여 5'인 방법.
- 제54항 내지 제56항 중 어느 한 항에 있어서, 아세토인 리덕타제를 암호화하는 유전자가 임의의 다른 이종 유전자와 관련하여 3'인 방법.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자가 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아닌 방법.
- 제42항 내지 제58항 중 어느 한 항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 유전자 중 하나 이상이 스위치의 조절하에 있는 방법.
- 제59항에 있어서, 스위치가 아라비노스 스위치인 방법.
- 제59항에 있어서, 스위치가 희토 금속 스위치의 조절하에 있는 방법.
- 제42항 내지 제61항 중 어느 한 항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제가 유전자 변형된 미생물에 대해 이종성인 방법.
- a) 유전자 변형된 미생물을 C1 탄소와 접촉시키는 단계로서, 상기 미생물이
i. 아세토인 리덕타제;
ii. 알파-아세토락테이트 데카복실라제;
iii. AlsS; 또는
iv. 이들의 임의의 조합
을 암호화하는 적어도 하나의 이종 유전자를 포함하는 단계; 및
b) 상기 미생물을 증식시켜 2,3-BDO를 생성시키는 단계를 포함하는, 2,3-BDO의 제조 방법. - 제63항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합시키는 방법.
- 제63항 또는 제64항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시키는 방법.
- 제64항 또는 제65항에 있어서, 아세토락테이트 신타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'인 방법.
- 제64항 내지 제66항 중 어느 한 항에 있어서, 아세토인 리덕타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 3'인 방법.
- 제64항 내지 제67항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아닌 방법.
- 제63항 내지 제68항 중 어느 한 항에 있어서, 미생물이 메탄영양체인 방법.
- 제63항 내지 제69항 중 어느 한 항에 있어서, C1 탄소가 메탄인 방법.
- 제63항 내지 제70항 중 어느 한 항에 있어서, 미생물을 32℃ 내지 49℃의 온도에서 증식시키는 방법.
- 제63항 내지 제71항 중 어느 한 항에 있어서, 적어도 하나의 이종 유전자가 스위치의 조절하에 있는 방법.
- 제72항에 있어서, 스위치가 희토 금속 스위치인 방법.
- 제73항에 있어서, 희토 금속 스위치가 란타늄 스위치인 방법.
- 제63항 내지 제74항 중 어느 한 항에 있어서, 2,3-BDO를 생성시키기 위해 미생물을 증식시키기 전에 상기 미생물을 적어도 1 μM 란타늄을 함유하는 배지와 접촉시킴을 추가로 포함하는 방법.
- 제75항에 있어서, 2,3-BDO를 생성시키기 위해 미생물을 증식시키기 전에 배지에서 란타늄을 희석시킴을 추가로 포함하는 방법.
- a) 유전자 변형된 미생물을 C1 탄소와 접촉시키는 단계로서, 상기 미생물이 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자를 포함하는 단계; 및
b) 상기 미생물을 증식시켜 아세토인을 생성시키는 단계를 포함하는, 아세토인의 제조 방법. - 제77항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합시키는 방법.
- 제77항 또는 제78항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시키는 방법.
- 제77항 내지 제79항 중 어느 한 항에 있어서, 미생물이 메탄영양체인 방법.
- 제77항 또는 제80항에 있어서, C1 탄소가 메탄인 방법.
- 제77항 내지 제81항 중 어느 한 항에 있어서, 미생물을 32℃ 내지 49℃의 온도에서 증식시키는 방법.
- 제77항 내지 제82항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자가 스위치의 조절하에 있는 방법.
- 제83항에 있어서, 스위치가 희토 금속 스위치인 방법.
- 제84항에 있어서, 희토 금속이 란타늄, 세륨, 프라세오디뮴 및/또는 네오디뮴인 방법.
- 제85항에 있어서, 희토 금속 스위치가 란타늄 스위치인 방법.
- 제86항에 있어서, 아세토인을 생성시키기 위해 미생물을 증식시키기 전에 상기 미생물을 적어도 1 μM 란타늄을 함유하는 배지와 접촉시킴을 추가로 포함하는 방법.
- 제87항에 있어서, 아세토인을 생성시키기 위해 미생물을 증식시키기 전에 배지에서 란타늄을 희석시킴을 추가로 포함하는 방법.
- a) 유전자 변형된 미생물을 C1 탄소 기질과 접촉시키는 단계로서, 상기 미생물이
i. NADPH-의존성 아세토인 리덕타제;
ii. 알파-아세토락테이트 데카복실라제(budA);
iii. AlsS; 또는
iv. 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함하는 단계; 및
b) 상기 미생물을 증식시켜 2,3-BDO를 생성시키는 단계; 및
c) 상기 (b)로부터의 2,3-BDO를 촉매와 접촉시켜 부타디엔을 생성시키는 단계를 포함하는, 부타디엔의 제조 방법. - 제89항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합 벡터에 의해 통합시키는 방법.
- 제89항 또는 제90항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시키는 방법.
- 제90항 또는 제91항에 있어서, 아세토락테이트 신타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'인 방법.
- 제90항 내지 제92항 중 어느 한 항에 있어서, 아세토인 리덕타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 3'인 방법.
- 제90항 내지 제93항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아닌 방법.
- 제89항 내지 제94항 중 어느 한 항에 있어서, 미생물이 메탄영양체인 방법.
- 제89항 또는 제95항에 있어서, C1 탄소가 메탄인 방법.
- 제89항 내지 제96항 중 어느 한 항에 있어서, 미생물을 32℃ 내지 49℃의 온도에서 증식시키는 방법.
- 제89항 내지 제97항 중 어느 한 항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 하나 이상의 이종 유전자가 스위치의 조절하에 있는 방법.
- 제98항에 있어서, 스위치가 희토 금속 스위치인 방법.
- 제99항에 있어서, 희토 금속 스위치가 란타늄 스위치인 방법.
- 제89항 내지 제100항 중 어느 한 항에 있어서, 2,3-BDO를 생성시키기 위해 미생물을 증식시키기 전에 상기 미생물을 적어도 1 μM 란타늄을 함유하는 배지와 접촉시킴을 추가로 포함하는 방법.
- 제101항에 있어서, 2,3-BDO를 생성시키기 위해 미생물을 증식시키기 전에 배지에서 란타늄을 희석시킴을 추가로 포함하는 방법.
- 제89항 내지 제102항 중 어느 한 항에 있어서, (b)로부터의 2,3-BDO를 (c)에 앞서 단리하는 방법.
- 제89항 내지 제103항 중 어느 한 항에 있어서, 촉매가 2,3-BDO를 탈수시킬 수 있는 방법.
- 제89항 내지 제104항 중 어느 한 항에 있어서, 촉매가 SiO2-지지된 세슘 이수소 포스페이트(CsH2PO4) 촉매인 방법.
- a) 유전자 변형된 미생물을 C1 탄소 기질과 접촉시키는 단계로서, 상기 미생물이
i. NADPH-의존성 아세토인 리덕타제;
ii. 알파-아세토락테이트 데카복실라제(budA);
iii. AlsS; 또는
iv. 이들의 임의의 조합을 암호화하는 적어도 하나의 이종 유전자를 포함하는 단계; 및
b) 상기 미생물을 증식시켜 2,3-BDO를 생성시키는 단계; 및
c) 상기 (b)로부터의 2,3-BDO를 촉매와 접촉시켜 메틸 에틸 케톤을 생성시키는 단계를 포함하는, 메틸 에틸 케톤(MEK)의 제조 방법. - 제106항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 미생물의 게놈내에 통합 벡터에 의해 통합시키는 방법.
- 제106항 또는 제107항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 에피솜 벡터상에서 발현시키는 방법.
- 제107항 또는 제108항에 있어서, 아세토락테이트 신타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'인 방법.
- 제107항 내지 제109항 중 어느 한 항에 있어서, 아세토인 리덕타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 3'인 방법.
- 제107항 내지 제110항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아닌 방법.
- 제106항 내지 제111항 중 어느 한 항에 있어서, 미생물을 32℃ 내지 49℃의 온도에서 증식시키는 방법.
- 제106항 내지 제112항 중 어느 한 항에 있어서, 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자(들)가 스위치의 조절하에 있는 방법.
- 제113항에 있어서, 스위치가 희토 금속 스위치인 방법.
- 제113항 또는 제114항에 있어서, 희토 금속이 란타늄인 방법.
- 제106항 내지 제115항 중 어느 한 항에 있어서, 2,3-BDO를 생성시키기 위해 미생물을 증식시키기 전에 상기 미생물을 적어도 1 μM 란타늄을 함유하는 배지와 접촉시킴을 추가로 포함하는 방법.
- 106항 내지 제116항 중 어느 한 항에 있어서, 2,3-BDO를 생성시키기 위해 미생물을 증식시키기 전에 배지에서 란타늄을 희석시킴을 추가로 포함하는 방법.
- 제106항 내지 제117항 중 어느 한 항에 있어서, (b)로부터의 2,3-BDO를 (c)에 앞서 단리하는 방법.
- 제106항 내지 제118항 중 어느 한 항에 있어서, 촉매가 고체 산 촉매인 방법.
- 서열번호 2에 적어도 84% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산.
- 서열번호 4에 적어도 88% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산.
- 서열번호 6에 적어도 85% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산.
- 서열번호 8에 적어도 85% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산.
- 서열번호 10에 적어도 85% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산.
- 서열번호 12에 적어도 85% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산.
- 서열번호 14에 적어도 85% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산.
- 서열번호 20에 적어도 60% 일치하는 뉴클레오티드 서열을 포함하는 단리된 다중핵산.
- 아세토인 리덕타제를 암호화하는 이종 유전자를 포함하는, C1 탄소를 2,3-BDO로 전환시킬 수 있는 유전자 변형된 미생물.
- 제128항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자를 추가로 포함하는 유전자 변형된 미생물.
- 제128항 또는 제129항에 있어서, 아세토인 리덕타제를 암호화하는 이종 유전자, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자가 미생물의 게놈내에 통합 벡터에 의해 통합된 유전자 변형된 미생물.
- 제128항 내지 제130항 중 어느 한 항에 있어서, 아세토인 리덕타제를 암호화하는 이종 유전자, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자, 및/또는 아세토락테이트 신타제를 암호화하는 이종 유전자가 에피솜 벡터상에서 발현된 유전자 변형된 미생물.
- 제130항 또는 제131항에 있어서, 아세토락테이트 신타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'인 유전자 변형된 미생물.
- 제130항 내지 제132항 중 어느 한 항에 있어서, 아세토인 리덕타제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 3'인 유전자 변형된 미생물.
- 제130항 내지 제133항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 이종 유전자가 임의의 다른 이종 유전자와 관련하여 5'도 3'도 아닌 유전자 변형된 미생물.
- 제128항 내지 제134항 중 어느 한 항에 있어서, 이종 유전자(들) 중 적어도 하나가 스위치의 조절하에 있는 유전자 변형된 미생물.
- 제135항에 있어서, 스위치가 유도성 스위치인 유전자 변형된 미생물.
- 제136항에 있어서, 유도성 스위치가 아라비노스 스위치인 유전자 변형된 미생물.
- 제135항에 있어서, 스위치가 억제성 스위치인 유전자 변형된 미생물.
- 제138항에 있어서, 억제성 스위치가 희토 금속 스위치인 유전자 변형된 미생물.
- 아세토인 리덕타제, 알파-아세토락테이트 데카복실라제 및/또는 아세토락테이트 신타제를 암호화하는 하나 이상의 유전자를 포함하는 벡터로서, 상기 하나 이상의 유전자가 스위치의 조절하에 있는 벡터.
- 제140항에 있어서, 아세토락테이트 신타제를 암호화하는 유전자가 벡터상의 임의의 다른 유전자와 관련하여 5'인 벡터.
- 제140항 또는 제141항에 있어서, 아세토인 리덕타제를 암호화하는 유전자가 벡터상의 임의의 다른 유전자와 관련하여 3'인 벡터.
- 제140항 내지 제142항 중 어느 한 항에 있어서, 알파-아세토락테이트 데카복실라제를 암호화하는 유전자가 벡터상의 임의의 다른 유전자와 관련하여 5'도 3'도 아닌 벡터.
- 제140항 내지 제143항 중 어느 한 항에 있어서, 스위치가 유도성 스위치 또는 억제성 스위치인 벡터.
- 제144항에 있어서, 유도성 스위치를 포함하고, 상기 유도성 스위치가 아라비노스 스위치인 벡터.
- 제144항에 있어서, 억제성 스위치를 포함하고, 상기 억제성 스위치가 희토 금속 스위치인 벡터.
Applications Claiming Priority (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762451819P | 2017-01-30 | 2017-01-30 | |
US62/451,819 | 2017-01-30 | ||
US201762504626P | 2017-05-11 | 2017-05-11 | |
US62/504,626 | 2017-05-11 | ||
US201762512312P | 2017-05-30 | 2017-05-30 | |
US62/512,312 | 2017-05-30 | ||
US201762588985P | 2017-11-21 | 2017-11-21 | |
US62/588,985 | 2017-11-21 | ||
KR1020197024829A KR102525517B1 (ko) | 2017-01-30 | 2018-01-30 | C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물 |
PCT/US2018/015909 WO2018140928A1 (en) | 2017-01-30 | 2018-01-30 | Methods and microorganisms for making 2,3-butanediol and derivatives thereof from c1 carbons |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197024829A Division KR102525517B1 (ko) | 2017-01-30 | 2018-01-30 | C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230142696A true KR20230142696A (ko) | 2023-10-11 |
Family
ID=62978733
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197024829A KR102525517B1 (ko) | 2017-01-30 | 2018-01-30 | C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물 |
KR1020237013483A KR20230142696A (ko) | 2017-01-30 | 2018-01-30 | C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197024829A KR102525517B1 (ko) | 2017-01-30 | 2018-01-30 | C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물 |
Country Status (14)
Country | Link |
---|---|
US (5) | US11198877B2 (ko) |
EP (2) | EP3574092A4 (ko) |
KR (2) | KR102525517B1 (ko) |
CN (1) | CN110475850B (ko) |
AU (2) | AU2018213387B2 (ko) |
BR (1) | BR112019015754A2 (ko) |
CA (2) | CA3052072A1 (ko) |
IL (2) | IL268337B2 (ko) |
MA (1) | MA47381A (ko) |
MX (1) | MX2019009032A (ko) |
PH (2) | PH12019501768A1 (ko) |
SG (3) | SG11201907012VA (ko) |
WO (2) | WO2018140936A1 (ko) |
ZA (3) | ZA201905094B (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11421235B2 (en) | 2017-04-28 | 2022-08-23 | Precigen, Inc. | Methods and microorganisms for the fermentation of methane to multi-carbon compounds |
DE112018006599T5 (de) * | 2018-08-24 | 2020-09-10 | Jiangsu Academy Of Agricultural Sciences | Gegen Pyrimidinylsalicylat-Herbizid resistentes Rapsgen und dessen Verwendung |
KR102481504B1 (ko) * | 2019-04-16 | 2022-12-27 | 경희대학교 산학협력단 | 2,3-부탄디올 생산용 메탄자화균 형질전환체 |
KR20210045752A (ko) | 2019-10-17 | 2021-04-27 | 경희대학교 산학협력단 | 1,3-부탄다이올 생산용 형질전환 메탄자화균 및 이의 용도 |
CN114731793A (zh) * | 2022-04-07 | 2022-07-12 | 中山大学 | 一种降低稻田土壤甲烷排放的方法 |
CN115058374B (zh) * | 2022-05-24 | 2023-08-01 | 天津大学前沿技术研究院有限公司 | 一种利用丙酮酸合成乙偶姻的重组运动发酵单胞菌及其构建方法与应用 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE377649T1 (de) | 2000-03-24 | 2007-11-15 | Xoma Technology Ltd | Verfahren und zelle zur expression von rekombinanten proteinprodukten |
EP2287179A3 (en) | 2004-01-09 | 2011-05-18 | Novozymes A/S | Increased bacillus YweA expression |
US8962298B2 (en) | 2006-05-02 | 2015-02-24 | Butamax Advanced Biofuels Llc | Recombinant host cell comprising a diol dehydratase |
US20080014619A1 (en) * | 2006-07-12 | 2008-01-17 | Lixuan Lisa Huang | Method of production of para-hydroxycinnamic acid |
CN102015995B (zh) * | 2008-03-03 | 2014-10-22 | 焦耳无限科技公司 | 产生碳基目的产物的二氧化碳固定工程微生物 |
WO2013102147A2 (en) | 2011-12-30 | 2013-07-04 | Butamax (Tm) Advanced Biofuels Llc | Genetic switches for butanol production |
US20150315599A1 (en) * | 2012-12-07 | 2015-11-05 | Ginkgo Bioworks, Inc | Methods and Systems for Methylotrophic Production of Organic Compounds |
WO2014092562A1 (en) * | 2012-12-11 | 2014-06-19 | Photanol B.V. | Synthesis of acetoin, 2,3-butanediol and 2-butanol by cyanobacteria by heterologous expression of a catabolic pathway |
US9267158B2 (en) * | 2013-03-14 | 2016-02-23 | Intrexon Corporation | Biological production of multi-carbon compounds from methane |
CA2950304A1 (en) | 2014-06-18 | 2015-12-23 | Calysta, Inc. | Nucleic acids and vectors for use with methanotrophic bacteria |
JP6862349B2 (ja) * | 2014-12-08 | 2021-04-21 | ランザテク・ニュージーランド・リミテッド | 発酵経路を経由するフラックスの増大を示す組み換え微生物体 |
US10858661B2 (en) * | 2017-01-10 | 2020-12-08 | University-Industry Cooperation Group Of Kyung Hee University | Use of Methylomonas sp. DH-1 strain and its transformants |
US11421235B2 (en) | 2017-04-28 | 2022-08-23 | Precigen, Inc. | Methods and microorganisms for the fermentation of methane to multi-carbon compounds |
-
2018
- 2018-01-30 BR BR112019015754A patent/BR112019015754A2/pt unknown
- 2018-01-30 KR KR1020197024829A patent/KR102525517B1/ko active IP Right Grant
- 2018-01-30 SG SG11201907012VA patent/SG11201907012VA/en unknown
- 2018-01-30 AU AU2018213387A patent/AU2018213387B2/en active Active
- 2018-01-30 WO PCT/US2018/015925 patent/WO2018140936A1/en unknown
- 2018-01-30 IL IL268337A patent/IL268337B2/en unknown
- 2018-01-30 WO PCT/US2018/015909 patent/WO2018140928A1/en unknown
- 2018-01-30 AU AU2018213395A patent/AU2018213395B2/en active Active
- 2018-01-30 SG SG10202107750TA patent/SG10202107750TA/en unknown
- 2018-01-30 EP EP18745386.5A patent/EP3574092A4/en active Pending
- 2018-01-30 CA CA3052072A patent/CA3052072A1/en active Pending
- 2018-01-30 SG SG11201907008RA patent/SG11201907008RA/en unknown
- 2018-01-30 CA CA3052046A patent/CA3052046A1/en active Pending
- 2018-01-30 US US16/481,811 patent/US11198877B2/en active Active
- 2018-01-30 MX MX2019009032A patent/MX2019009032A/es unknown
- 2018-01-30 KR KR1020237013483A patent/KR20230142696A/ko not_active Application Discontinuation
- 2018-01-30 EP EP18744512.7A patent/EP3574081A4/en active Pending
- 2018-01-30 CN CN201880023046.1A patent/CN110475850B/zh active Active
- 2018-01-30 MA MA047381A patent/MA47381A/fr unknown
- 2018-01-30 US US16/481,799 patent/US11111496B2/en active Active
-
2019
- 2019-07-29 IL IL268339A patent/IL268339A/en unknown
- 2019-07-30 PH PH12019501768A patent/PH12019501768A1/en unknown
- 2019-07-30 PH PH12019501767A patent/PH12019501767A1/en unknown
- 2019-07-31 ZA ZA2019/05094A patent/ZA201905094B/en unknown
- 2019-07-31 ZA ZA2019/05095A patent/ZA201905095B/en unknown
-
2021
- 2021-07-30 ZA ZA2021/05423A patent/ZA202105423B/en unknown
- 2021-07-31 US US17/444,188 patent/US11939584B2/en active Active
- 2021-11-08 US US17/454,060 patent/US12091667B2/en active Active
-
2024
- 2024-02-20 US US18/582,362 patent/US20240263182A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102525517B1 (ko) | C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물 | |
US12018310B2 (en) | Methods and microorganisms for making 1,4-butanediol and derivatives thereof from C1 carbons | |
US20230051667A1 (en) | Methods and microorganisms for the fermentation of methane to multi-carbon compounds | |
CN108350040A (zh) | 用于精细化学品的改进生产的重组微生物 | |
KR20120047276A (ko) | 발효에 의한 생화학물질의 생산을 위한 돌연변이체 메틸글리옥살 신타제 (mgs) | |
CA3047841A1 (en) | Xylitol producing metschnikowia species | |
RU2817144C2 (ru) | Способы и микроорганизмы для получения 2,3-бутандиола и его производных из c1-углеродных соединений | |
US9670493B2 (en) | Low-phosphate repressible promoter | |
WO2015141705A1 (ja) | 耐酸耐塩性付与方法と耐酸耐塩性酵母を用いた有用物質生産 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |